--- comments: true --- # PaddleOCR模型列表(CPU/GPU) PaddleOCR 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。 ## [文本检测模块](./module_usage/text_detection.md)
模型 检测Hmean(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
PP-OCRv5_server_det - - / - - / - 101 PP-OCRv5_server_det.yaml 推理模型/训练模型
PP-OCRv5_mobile_det - - / - - / - 20 PP-OCRv5_mobile_det.yaml 推理模型/训练模型
PP-OCRv4_server_det 82.56 83.34 / 80.91 442.58 / 442.58 109 PP-OCRv4_server_det.yaml 推理模型/训练模型
PP-OCRv4_mobile_det 77.35 8.79 / 3.13 51.00 / 28.58 4.7 PP-OCRv4_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_mobile_det 78.68 8.44 / 2.91 27.87 / 27.87 2.1 PP-OCRv3_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_server_det 80.11 65.41 / 13.67 305.07 / 305.07 102.1 PP-OCRv3_server_det.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的中英文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 593 张图片。 ## [印章文本检测模块](./module_usage/seal_text_detection.md)
模型名称 检测Hmean(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 yaml 文件 模型下载链接
PP-OCRv4_mobile_seal_det 96.47 7.82 / 3.09 48.28 / 23.97 4.7M PP-OCRv4_mobile_seal_det.yaml 推理模型/训练模型
PP-OCRv4_server_seal_det 98.21 74.75 / 67.72 382.55 / 382.55 108.3 M PP-OCRv4_server_seal_det.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的印章数据集,包含500印章图像。 ## [文本识别模块](./module_usage/text_recognition.md) * 中文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
PP-OCRv5_server_rec 86.38 8.45/2.36 122.69/122.69 81 M PP-OCRv5_server_rec.yaml 推理模型/训练模型
PP-OCRv5_mobile_rec 81.29 1.46/5.43 5.32/91.79 16 M PP-OCRv5_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec_doc 81.53 6.65 / 2.38 32.92 / 32.92 74.7 M PP-OCRv4_server_rec_doc.yaml 推理模型/训练模型
PP-OCRv4_mobile_rec 78.74 4.82 / 1.20 16.74 / 4.64 10.6 M PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec 80.61 6.58 / 2.43 33.17 / 33.17 71.2 M PP-OCRv4_server_rec.yaml 推理模型/训练模型
PP-OCRv3_mobile_rec 72.96 5.87 / 1.19 9.07 / 4.28 9.2 M PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。

模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
ch_SVTRv2_rec 68.81 8.08 / 2.74 50.17 / 42.50 73.9 M ch_SVTRv2_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务A榜。

模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
ch_RepSVTR_rec 65.07 5.93 / 1.62 20.73 / 7.32 22.1 M ch_RepSVTR_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一:OCR端到端识别任务B榜。

* 英文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
en_PP-OCRv4_mobile_rec 70.39 4.81 / 0.75 16.10 / 5.31 6.8 M en_PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
en_PP-OCRv3_mobile_rec 70.69 5.44 / 0.75 8.65 / 5.57 7.8 M en_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的英文数据集。

* 多语言识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml 文件 模型下载链接
korean_PP-OCRv3_mobile_rec 60.21 5.40 / 0.97 9.11 / 4.05 8.6 M korean_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
japan_PP-OCRv3_mobile_rec 45.69 5.70 / 1.02 8.48 / 4.07 8.8 M japan_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
chinese_cht_PP-OCRv3_mobile_rec 82.06 5.90 / 1.28 9.28 / 4.34 9.7 M chinese_cht_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
te_PP-OCRv3_mobile_rec 95.88 5.42 / 0.82 8.10 / 6.91 7.8 M te_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ka_PP-OCRv3_mobile_rec 96.96 5.25 / 0.79 9.09 / 3.86 8.0 M ka_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ta_PP-OCRv3_mobile_rec 76.83 5.23 / 0.75 10.13 / 4.30 8.0 M ta_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
latin_PP-OCRv3_mobile_rec 76.93 5.20 / 0.79 8.83 / 7.15 7.8 M latin_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
arabic_PP-OCRv3_mobile_rec 73.55 5.35 / 0.79 8.80 / 4.56 7.8 M arabic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
cyrillic_PP-OCRv3_mobile_rec 94.28 5.23 / 0.76 8.89 / 3.88 7.9 M cyrillic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
devanagari_PP-OCRv3_mobile_rec 96.44 5.22 / 0.79 8.56 / 4.06 7.9 M devanagari_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的多语种数据集。

## [公式识别模块](./module_usage/formula_recognition.md)
模型 En-BLEU(%) Zh-BLEU(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
UniMERNet 85.91 43.50 2266.96/- -/- 1.53 G UniMERNet.yaml 推理模型/训练模型
PP-FormulaNet-S 87.00 45.71 202.25/- -/- 224 M PP-FormulaNet-S.yaml 推理模型/训练模型
PP-FormulaNet-L 90.36 45.78 1976.52/- -/- 695 M PP-FormulaNet-L.yaml 推理模型/训练模型
PP-FormulaNet_plus-S 88.71 53.32 191.69/- -/- 248 M PP-FormulaNet_plus-S.yaml 推理模型/训练模型
PP-FormulaNet_plus-M 91.45 89.76 1301.56/- -/- 592 M PP-FormulaNet_plus-M.yaml 推理模型/训练模型
PP-FormulaNet_plus-L 92.22 90.64 1745.25/- -/- 698 M PP-FormulaNet_plus-L.yaml 推理模型/训练模型
LaTeX_OCR_rec 74.55 39.96 1244.61/- -/- 99 M LaTeX_OCR_rec.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX 内部自建公式识别测试集。LaTeX_OCR_rec在LaTeX-OCR公式识别测试集的BLEU score为 0.8821。 ## [表格结构识别模块](./module_usage/table_structure_recognition.md)
模型 精度(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
SLANet 59.52 103.08 / 103.08 197.99 / 197.99 6.9 M SLANet.yaml 推理模型/训练模型
SLANet_plus 63.69 140.29 / 140.29 195.39 / 195.39 6.9 M SLANet_plus.yaml 推理模型/训练模型
SLANeXt_wired 69.65 -- -- -- SLANeXt_wired.yaml 推理模型/训练模型
SLANeXt_wireless SLANeXt_wireless.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX 内部自建高难度中文表格识别数据集。 ## [表格单元格检测模块](./module_usage/table_cells_detection.md)
模型 mAP(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
RT-DETR-L_wired_table_cell_det 82.7 35.00 / 10.45 495.51 / 495.51 124M RT-DETR-L_wired_table_cell_det.yaml 推理模型/训练模型
RT-DETR-L_wireless_table_cell_det RT-DETR-L_wireless_table_cell_det.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。

## [表格分类模块](./module_usage/table_classification.md)
模型 Top1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 (M) yaml文件 模型下载链接
PP-LCNet_x1_0_table_cls 94.2 2.35 / 0.47 4.03 / 1.35 6.6M PP-LCNet_x1_0_table_cls.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。

## [文本图像矫正模块](./module_usage/text_image_unwarping.md)
模型名称 MS-SSIM (%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小 yaml 文件 模型下载链接
UVDoc 54.40 16.27 / 7.76 176.97 / 80.60 30.3 M UVDoc.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX自建的图像矫正数据集 ## [版面区域检测模块](./module_usage/layout_detection.md) * 版面检测模型,包含20个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、表格、图和表标题(图标题、表格标题和图表标题)、印章、图表、侧栏文本和参考文献内容
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PP-DocLayout_plus-L 83.2 34.6244 / 10.3945 510.57 / - 126.01 PP-DocLayout_plus-L.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1300 张文档类型图片。 * 文档图像版面子模块检测,包含1个 版面区域 类别,能检测多栏的报纸、杂志的每个子文章的文本区域:
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PP-DocBlockLayout 95.9 34.6244 / 10.3945 510.57 / - 123 M PP-DocBlockLayout.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的版面子区域检测数据集,包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1000 张文档类型图片。 * 版面检测模型,包含23个常见的类别:文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、图表标题、表格、表格标题、印章、图表标题、图表、页眉图像、页脚图像、侧栏文本
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PP-DocLayout-L 90.4 34.6244 / 10.3945 510.57 / - 123.76 PP-DocLayout-L.yaml 推理模型/训练模型
PP-DocLayout-M 75.2 13.3259 / 4.8685 44.0680 / 44.0680 22.578 PP-DocLayout-M.yaml 推理模型/训练模型
PP-DocLayout-S 70.9 8.3008 / 2.3794 10.0623 / 9.9296 4.834 PP-DocLayout-S.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 500 张文档类型图片。 * 表格版面检测模型
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PicoDet_layout_1x_table 97.5 8.02 / 3.09 23.70 / 20.41 7.4 M PicoDet_layout_1x_table.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面表格区域检测数据集,包含中英文 7835 张带有表格的论文文档类型图片。 * 3类版面检测模型,包含表格、图像、印章
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PicoDet-S_layout_3cls 88.2 8.99 / 2.22 16.11 / 8.73 4.8 PicoDet-S_layout_3cls.yaml 推理模型/训练模型
PicoDet-L_layout_3cls 89.0 13.05 / 4.50 41.30 / 41.30 22.6 PicoDet-L_layout_3cls.yaml 推理模型/训练模型
RT-DETR-H_layout_3cls 95.8 114.93 / 27.71 947.56 / 947.56 470.1 RT-DETR-H_layout_3cls.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 1154 张文档类型图片。 * 5类英文文档区域检测模型,包含文字、标题、表格、图片以及列表
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PicoDet_layout_1x 97.8 9.03 / 3.10 25.82 / 20.70 7.4 PicoDet_layout_1x.yaml 推理模型/训练模型
注:以上精度指标的评估集是 [PubLayNet](https://developer.ibm.com/exchanges/data/all/publaynet/) 的评估数据集,包含英文文档的 11245 张图片。 * 17类区域检测模型,包含17个版面常见类别,分别是:段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 mAP(0.5)(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PicoDet-S_layout_17cls 87.4 9.11 / 2.12 15.42 / 9.12 4.8 PicoDet-S_layout_17cls.yaml 推理模型/训练模型
PicoDet-L_layout_17cls 89.0 13.50 / 4.69 43.32 / 43.32 22.6 PicoDet-L_layout_17cls.yaml 推理模型/训练模型
RT-DETR-H_layout_17cls 98.3 115.29 / 104.09 995.27 / 995.27 470.2 RT-DETR-H_layout_17cls.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 892 张文档类型图片。 ## [文档图像方向分类模块](./module_usage/doc_img_orientation_classification.md)
模型 Top-1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PP-LCNet_x1_0_doc_ori 99.06 2.31 / 0.43 3.37 / 1.27 7 PP-LCNet_x1_0_doc_ori.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。 ## [文本行方向分类模块](./module_usage/doc_img_orientation_classification.md)
模型 Top-1 Acc(%) GPU推理耗时(ms)
[常规模式 / 高性能模式]
CPU推理耗时(ms)
[常规模式 / 高性能模式]
模型存储大小(M) yaml文件 模型下载链接
PP-LCNet_x1_0_doc_ori 99.06 2.31 / 0.43 3.37 / 1.27 7 PP-LCNet_x0_25_textline_ori.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。 ## [文档类视觉语言模型模块](./module_usage/doc_vlm.md)
模型 模型参数尺寸(B) 模型存储大小(GB) yaml文件 模型下载链接
PP-DocBee-2B 2 4.2 PP-DocBee-2B.yaml 推理模型
PP-DocBee-7B 7 15.8 PP-DocBee-7B.yaml 推理模型
PP-DocBee2-3B 3 7.6 推理模型