You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

44 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments
true

PaddleOCR模型列表CPU/GPU

PaddleOCR 内置了多条产线,每条产线都包含了若干模块,每个模块包含若干模型,具体使用哪些模型,您可以根据下边的 benchmark 数据来选择。如您更考虑模型精度,请选择精度较高的模型,如您更考虑模型推理速度,请选择推理速度较快的模型,如您更考虑模型存储大小,请选择存储大小较小的模型。

文本检测模块

模型 检测Hmean% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M) yaml 文件 模型下载链接
PP-OCRv5_server_det - - / - - / - 101 PP-OCRv5_server_det.yaml 推理模型/训练模型
PP-OCRv5_mobile_det - - / - - / - 20 PP-OCRv5_mobile_det.yaml 推理模型/训练模型
PP-OCRv4_server_det 82.56 83.34 / 80.91 442.58 / 442.58 109 PP-OCRv4_server_det.yaml 推理模型/训练模型
PP-OCRv4_mobile_det 77.35 8.79 / 3.13 51.00 / 28.58 4.7 PP-OCRv4_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_mobile_det 78.68 8.44 / 2.91 27.87 / 27.87 2.1 PP-OCRv3_mobile_det.yaml 推理模型/训练模型
PP-OCRv3_server_det 80.11 65.41 / 13.67 305.07 / 305.07 102.1 PP-OCRv3_server_det.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的中英文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 593 张图片。

印章文本检测模块

模型名称 检测Hmean% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 yaml 文件 模型下载链接
PP-OCRv4_mobile_seal_det 96.47 7.82 / 3.09 48.28 / 23.97 4.7M PP-OCRv4_mobile_seal_det.yaml 推理模型/训练模型
PP-OCRv4_server_seal_det 98.21 74.75 / 67.72 382.55 / 382.55 108.3 M PP-OCRv4_server_seal_det.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的印章数据集包含500印章图像。

文本识别模块

  • 中文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml 文件 模型下载链接
PP-OCRv5_server_rec 86.38 8.45/2.36 122.69/122.69 81 M PP-OCRv5_server_rec.yaml 推理模型/训练模型
PP-OCRv5_mobile_rec 81.29 1.46/5.43 5.32/91.79 16 M PP-OCRv5_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec_doc 81.53 6.65 / 2.38 32.92 / 32.92 74.7 M PP-OCRv4_server_rec_doc.yaml 推理模型/训练模型
PP-OCRv4_mobile_rec 78.74 4.82 / 1.20 16.74 / 4.64 10.6 M PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
PP-OCRv4_server_rec 80.61 6.58 / 2.43 33.17 / 33.17 71.2 M PP-OCRv4_server_rec.yaml 推理模型/训练模型
PP-OCRv3_mobile_rec 72.96 5.87 / 1.19 9.07 / 4.28 9.2 M PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的中文数据集,覆盖街景、网图、文档、手写多个场景,其中文本识别包含 8367 张图片。

模型 识别 Avg Accuracy(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml 文件 模型下载链接
ch_SVTRv2_rec 68.81 8.08 / 2.74 50.17 / 42.50 73.9 M ch_SVTRv2_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一OCR端到端识别任务A榜。

模型 识别 Avg Accuracy(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml 文件 模型下载链接
ch_RepSVTR_rec 65.07 5.93 / 1.62 20.73 / 7.32 22.1 M ch_RepSVTR_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR算法模型挑战赛 - 赛题一OCR端到端识别任务B榜。

  • 英文识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml 文件 模型下载链接
en_PP-OCRv4_mobile_rec 70.39 4.81 / 0.75 16.10 / 5.31 6.8 M en_PP-OCRv4_mobile_rec.yaml 推理模型/训练模型
en_PP-OCRv3_mobile_rec 70.69 5.44 / 0.75 8.65 / 5.57 7.8 M en_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的英文数据集。

  • 多语言识别模型
模型 识别 Avg Accuracy(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml 文件 模型下载链接
korean_PP-OCRv3_mobile_rec 60.21 5.40 / 0.97 9.11 / 4.05 8.6 M korean_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
japan_PP-OCRv3_mobile_rec 45.69 5.70 / 1.02 8.48 / 4.07 8.8 M japan_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
chinese_cht_PP-OCRv3_mobile_rec 82.06 5.90 / 1.28 9.28 / 4.34 9.7 M chinese_cht_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
te_PP-OCRv3_mobile_rec 95.88 5.42 / 0.82 8.10 / 6.91 7.8 M te_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ka_PP-OCRv3_mobile_rec 96.96 5.25 / 0.79 9.09 / 3.86 8.0 M ka_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
ta_PP-OCRv3_mobile_rec 76.83 5.23 / 0.75 10.13 / 4.30 8.0 M ta_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
latin_PP-OCRv3_mobile_rec 76.93 5.20 / 0.79 8.83 / 7.15 7.8 M latin_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
arabic_PP-OCRv3_mobile_rec 73.55 5.35 / 0.79 8.80 / 4.56 7.8 M arabic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
cyrillic_PP-OCRv3_mobile_rec 94.28 5.23 / 0.76 8.89 / 3.88 7.9 M cyrillic_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型
devanagari_PP-OCRv3_mobile_rec 96.44 5.22 / 0.79 8.56 / 4.06 7.9 M devanagari_PP-OCRv3_mobile_rec.yaml 推理模型/训练模型

注:以上精度指标的评估集是 PaddleOCR 自建的多语种数据集。

公式识别模块

模型 En-BLEU(%) Zh-BLEU(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
UniMERNet 85.91 43.50 2266.96/- -/- 1.53 G UniMERNet.yaml 推理模型/训练模型
PP-FormulaNet-S 87.00 45.71 202.25/- -/- 224 M PP-FormulaNet-S.yaml 推理模型/训练模型
PP-FormulaNet-L 90.36 45.78 1976.52/- -/- 695 M PP-FormulaNet-L.yaml 推理模型/训练模型
PP-FormulaNet_plus-S 88.71 53.32 191.69/- -/- 248 M PP-FormulaNet_plus-S.yaml 推理模型/训练模型
PP-FormulaNet_plus-M 91.45 89.76 1301.56/- -/- 592 M PP-FormulaNet_plus-M.yaml 推理模型/训练模型
PP-FormulaNet_plus-L 92.22 90.64 1745.25/- -/- 698 M PP-FormulaNet_plus-L.yaml 推理模型/训练模型
LaTeX_OCR_rec 74.55 39.96 1244.61/- -/- 99 M LaTeX_OCR_rec.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX 内部自建公式识别测试集。LaTeX_OCR_rec在LaTeX-OCR公式识别测试集的BLEU score为 0.8821。

表格结构识别模块

模型 精度(% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
SLANet 59.52 103.08 / 103.08 197.99 / 197.99 6.9 M SLANet.yaml 推理模型/训练模型
SLANet_plus 63.69 140.29 / 140.29 195.39 / 195.39 6.9 M SLANet_plus.yaml 推理模型/训练模型
SLANeXt_wired 69.65 -- -- -- SLANeXt_wired.yaml 推理模型/训练模型
SLANeXt_wireless SLANeXt_wireless.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX 内部自建高难度中文表格识别数据集。

表格单元格检测模块

模型 mAP(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 (M) yaml 文件 模型下载链接
RT-DETR-L_wired_table_cell_det 82.7 35.00 / 10.45 495.51 / 495.51 124M RT-DETR-L_wired_table_cell_det.yaml 推理模型/训练模型
RT-DETR-L_wireless_table_cell_det RT-DETR-L_wireless_table_cell_det.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格单元格检测数据集。

表格分类模块

模型 Top1 Acc(%) GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 (M) yaml文件 模型下载链接
PP-LCNet_x1_0_table_cls 94.2 2.35 / 0.47 4.03 / 1.35 6.6M PP-LCNet_x1_0_table_cls.yaml 推理模型/训练模型

注:以上精度指标测量自 PaddleX 内部自建表格分类数据集。

文本图像矫正模块

模型名称 MS-SSIM % GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小 yaml 文件 模型下载链接
UVDoc 54.40 16.27 / 7.76 176.97 / 80.60 30.3 M UVDoc.yaml 推理模型/训练模型
注:以上精度指标测量自 PaddleX自建的图像矫正数据集

版面区域检测模块

  • 版面检测模型包含20个常见的类别文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、表格、图和表标题图标题、表格标题和图表标题、印章、图表、侧栏文本和参考文献内容
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PP-DocLayout_plus-L 83.2 34.6244 / 10.3945 510.57 / - 126.01 PP-DocLayout_plus-L.yaml 推理模型/训练模型

以上精度指标的评估集是自建的版面区域检测数据集包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1300 张文档类型图片。

  • 文档图像版面子模块检测包含1个 版面区域 类别,能检测多栏的报纸、杂志的每个子文章的文本区域:
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PP-DocBlockLayout 95.9 34.6244 / 10.3945 510.57 / - 123 M PP-DocBlockLayout.yaml 推理模型/训练模型

以上精度指标的评估集是自建的版面子区域检测数据集包含中英文论文、杂志、报纸、研报、PPT、试卷、课本等 1000 张文档类型图片。

  • 版面检测模型包含23个常见的类别文档标题、段落标题、文本、页码、摘要、目录、参考文献、脚注、页眉、页脚、算法、公式、公式编号、图像、图表标题、表格、表格标题、印章、图表标题、图表、页眉图像、页脚图像、侧栏文本
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PP-DocLayout-L 90.4 34.6244 / 10.3945 510.57 / - 123.76 PP-DocLayout-L.yaml 推理模型/训练模型
PP-DocLayout-M 75.2 13.3259 / 4.8685 44.0680 / 44.0680 22.578 PP-DocLayout-M.yaml 推理模型/训练模型
PP-DocLayout-S 70.9 8.3008 / 2.3794 10.0623 / 9.9296 4.834 PP-DocLayout-S.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 500 张文档类型图片。

  • 表格版面检测模型
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PicoDet_layout_1x_table 97.5 8.02 / 3.09 23.70 / 20.41 7.4 M PicoDet_layout_1x_table.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面表格区域检测数据集,包含中英文 7835 张带有表格的论文文档类型图片。
  • 3类版面检测模型包含表格、图像、印章
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PicoDet-S_layout_3cls 88.2 8.99 / 2.22 16.11 / 8.73 4.8 PicoDet-S_layout_3cls.yaml 推理模型/训练模型
PicoDet-L_layout_3cls 89.0 13.05 / 4.50 41.30 / 41.30 22.6 PicoDet-L_layout_3cls.yaml 推理模型/训练模型
RT-DETR-H_layout_3cls 95.8 114.93 / 27.71 947.56 / 947.56 470.1 RT-DETR-H_layout_3cls.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 1154 张文档类型图片。
  • 5类英文文档区域检测模型包含文字、标题、表格、图片以及列表
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PicoDet_layout_1x 97.8 9.03 / 3.10 25.82 / 20.70 7.4 PicoDet_layout_1x.yaml 推理模型/训练模型
注:以上精度指标的评估集是 [PubLayNet](https://developer.ibm.com/exchanges/data/all/publaynet/) 的评估数据集,包含英文文档的 11245 张图片。
  • 17类区域检测模型包含17个版面常见类别分别是段落标题、图片、文本、数字、摘要、内容、图表标题、公式、表格、表格标题、参考文献、文档标题、脚注、页眉、算法、页脚、印章
模型 mAP(0.5)% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M yaml文件 模型下载链接
PicoDet-S_layout_17cls 87.4 9.11 / 2.12 15.42 / 9.12 4.8 PicoDet-S_layout_17cls.yaml 推理模型/训练模型
PicoDet-L_layout_17cls 89.0 13.50 / 4.69 43.32 / 43.32 22.6 PicoDet-L_layout_17cls.yaml 推理模型/训练模型
RT-DETR-H_layout_17cls 98.3 115.29 / 104.09 995.27 / 995.27 470.2 RT-DETR-H_layout_17cls.yaml 推理模型/训练模型
注:以上精度指标的评估集是 PaddleOCR 自建的版面区域检测数据集,包含中英文论文、杂志和研报等常见的 892 张文档类型图片。

文档图像方向分类模块

模型 Top-1 Acc% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M) yaml文件 模型下载链接
PP-LCNet_x1_0_doc_ori 99.06 2.31 / 0.43 3.37 / 1.27 7 PP-LCNet_x1_0_doc_ori.yaml 推理模型/训练模型
注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。

文本行方向分类模块

模型 Top-1 Acc% GPU推理耗时ms
[常规模式 / 高性能模式]
CPU推理耗时ms
[常规模式 / 高性能模式]
模型存储大小M) yaml文件 模型下载链接
PP-LCNet_x1_0_doc_ori 99.06 2.31 / 0.43 3.37 / 1.27 7 PP-LCNet_x0_25_textline_ori.yaml 推理模型/训练模型

注:以上精度指标的评估集是自建的数据集,覆盖证件和文档等多个场景,包含 1000 张图片。

文档类视觉语言模型模块

模型 模型参数尺寸B 模型存储大小GB yaml文件 模型下载链接
PP-DocBee-2B 2 4.2 PP-DocBee-2B.yaml 推理模型
PP-DocBee-7B 7 15.8 PP-DocBee-7B.yaml 推理模型
PP-DocBee2-3B 3 7.6 推理模型