You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

25 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments
true

PP-OCR系列模型列表V42023年8月1日更新

说明

  1. V4版模型相比V3版模型在模型精度上有进一步提升

  2. V3版模型相比V2版模型在模型精度上有进一步提升

  3. 2.0+版模型和1.1版模型 的主要区别在于动态图训练vs.静态图训练,模型性能上无明显差距。

  4. 本文档提供的是PPOCR自研模型列表更多基于公开数据集的算法介绍与预训练模型可以参考算法概览文档

PaddleOCR提供的可下载模型包括推理模型训练模型预训练模型nb模型,模型区别说明如下:

模型类型 模型格式 简介
推理模型 inference.pdmodel、inference.pdiparams 用于预测引擎推理,详情
训练模型、预训练模型 *.pdparams、*.pdopt、*.states 训练过程中保存的模型的参数、优化器状态和训练中间信息,多用于模型指标评估和恢复训练
nb模型 *.nb 经过飞桨Paddle-Lite工具优化后的模型适用于移动端/IoT端等端侧部署场景需使用飞桨Paddle Lite部署

各个模型的关系如下面的示意图所示。

1. 文本检测模型

1.1 中文检测模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
PP-OCRv4_mobile_det 【最新】原始超轻量模型,支持中英文、多语种文本检测 PP-OCRv4_mobile_det.yml 4.70M 推理模型 / 训练模型
PP-OCRv4_server_det 【最新】原始高精度模型,支持中英文、多语种文本检测 PP-OCRv4_server_det.yml 110M 推理模型 / 训练模型

| PP-OCRv3_mobile_det | 原始超轻量模型,支持中英文、多语种文本检测 | PP-OCRv3_mobile_det.yml | 1.1M | 推理模型 / 训练模型 / nb模型 | | PP-OCRv3_server_det | 原始高精度模型,支持中英文、多语种文本检测 | PP-OCRv3_server_det.yml | 3.80M | 推理模型 / 训练模型 |

1.2 英文检测模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
en_PP-OCRv3_det_slim 【最新】slim量化版超轻量模型支持英文、数字检测 PP-OCRv3_det_cml.yml 1.1M 推理模型 / 训练模型 / nb模型
en_PP-OCRv3_det 【最新】原始超轻量模型,支持英文、数字检测 PP-OCRv3_det_cml.yml 3.8M 推理模型 / 训练模型
  • 注:英文检测模型与中文检测模型结构完全相同,只有训练数据不同,在此仅提供相同的配置文件。

1.3 多语言检测模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
ml_PP-OCRv3_det_slim 【最新】slim量化版超轻量模型支持多语言检测 PP-OCRv3_det_cml.yml 1.1M 推理模型 / 训练模型 / nb模型
ml_PP-OCRv3_det 【最新】原始超轻量模型,支持多语言检测 PP-OCRv3_det_cml.yml 3.8M 推理模型 / 训练模型
  • 注:多语言检测模型与中文检测模型结构完全相同,只有训练数据不同,在此仅提供相同的配置文件。

2. 文本识别模型

2.1 中文识别模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
PP-OCRv4_mobile_rec 【最新】超轻量模型,支持中英文、数字识别 PP-OCRv4_mobile_rec_distill.yml 10M 推理模型 / 训练模型
PP-OCRv4_server_rec 【最新】高精度模型,支持中英文、数字识别 PP-OCRv4_server_rec.yml 88M 推理模型 / 训练模型
PP-OCRv4_server_rec_doc 【最新】高精度模型支持中英文、数字识别支持1.5万+字符和部分生僻字识别 PP-OCRv4_server_rec_doc.yml 75M 推理模型 / 训练模型
PP-OCRv3_mobile_rec_slim slim量化版超轻量模型支持中英文、数字识别 PP-OCRv3_mobile_rec_distillation.yml 4.9M 推理模型 / 训练模型 / nb模型
PP-OCRv3_mobile_rec 原始超轻量模型,支持中英文、数字识别 PP-OCRv3_mobile_rec_distillation.yml 12.4M 推理模型 / 训练模型
ch_PP-OCRv2_rec_slim slim量化版超轻量模型支持中英文、数字识别 ch_PP-OCRv2_rec.yml 9.0M 推理模型 / 训练模型
ch_PP-OCRv2_rec 原始超轻量模型,支持中英文、数字识别 ch_PP-OCRv2_rec_distillation.yml 8.50M 推理模型 / 训练模型
ch_ppocr_mobile_slim_v2.0_rec slim裁剪量化版超轻量模型支持中英文、数字识别 rec_chinese_lite_train_v2.0.yml 6.0M 推理模型 / 训练模型
ch_ppocr_mobile_v2.0_rec 原始超轻量模型,支持中英文、数字识别 rec_chinese_lite_train_v2.0.yml 5.20M 推理模型 / 训练模型 / 预训练模型
ch_ppocr_server_v2.0_rec 通用模型,支持中英文、数字识别 rec_chinese_common_train_v2.0.yml 94.8M 推理模型 / 训练模型 / 预训练模型

说明: 训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型在真实应用场景中有着更好的表现预训练模型则是直接基于全量真实数据与合成数据训练得到更适合用于在自己的数据集上finetune。

2.2 英文识别模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
en_PP-OCRv4_mobile_rec 【最新】原始超轻量模型,支持英文、数字识别 en_PP-OCRv4_mobile_rec.yml 9.7M 推理模型 / 训练模型
en_PP-OCRv3_mobile_rec_slim slim量化版超轻量模型支持英文、数字识别 en_PP-OCRv3_mobile_rec.yml 3.2M 推理模型 / 训练模型 / nb模型
en_PP-OCRv3_mobile_rec 原始超轻量模型,支持英文、数字识别 en_PP-OCRv3_mobile_rec.yml 9.6M 推理模型 / 训练模型
en_number_mobile_slim_v2.0_rec slim裁剪量化版超轻量模型支持英文、数字识别 rec_en_number_lite_train.yml 2.7M 推理模型 / 训练模型
en_number_mobile_v2.0_rec 原始超轻量模型,支持英文、数字识别 rec_en_number_lite_train.yml 2.6M 推理模型 / 训练模型

注意: 所有英文识别模型的字典文件均为ppocr/utils/en_dict.txt

2.3 多语言识别模型(更多语言持续更新中...

模型名称 字典文件 模型简介 配置文件 推理模型大小 下载地址
korean_PP-OCRv3_mobile_rec ppocr/utils/dict/korean_dict.txt 韩文识别 korean_PP-OCRv3_mobile_rec.yml 11.0M 推理模型 / 训练模型
japan_PP-OCRv3_mobile_rec ppocr/utils/dict/japan_dict.txt 日文识别 japan_PP-OCRv3_mobile_rec.yml 11.0M 推理模型 / 训练模型
chinese_cht_PP-OCRv3_mobile_rec ppocr/utils/dict/chinese_cht_dict.txt 中文繁体识别 chinese_cht_PP-OCRv3_mobile_rec.yml 12.0M 推理模型 / 训练模型
te_PP-OCRv3_mobile_rec ppocr/utils/dict/te_dict.txt 泰卢固文识别 te_PP-OCRv3_mobile_rec.yml 9.6M 推理模型 / 训练模型
ka_PP-OCRv3_mobile_rec ppocr/utils/dict/ka_dict.txt 卡纳达文识别 ka_PP-OCRv3_mobile_rec.yml 9.9M 推理模型 / 训练模型
ta_PP-OCRv3_mobile_rec ppocr/utils/dict/ta_dict.txt 泰米尔文识别 ta_PP-OCRv3_mobile_rec.yml 9.6M 推理模型 / 训练模型
latin_PP-OCRv3_mobile_rec ppocr/utils/dict/latin_dict.txt 拉丁文识别 latin_PP-OCRv3_mobile_rec.yml 9.7M 推理模型 / 训练模型
arabic_PP-OCRv3_mobile_rec ppocr/utils/dict/arabic_dict.txt 阿拉伯字母 arabic_PP-OCRv3_mobile_rec.yml 9.6M 推理模型 / 训练模型
cyrillic_PP-OCRv3_mobile_rec ppocr/utils/dict/cyrillic_dict.txt 斯拉夫字母 cyrillic_PP-OCRv3_mobile_rec.yml 9.6M 推理模型 / 训练模型
devanagari_PP-OCRv3_mobile_rec ppocr/utils/dict/devanagari_dict.txt 梵文字母 devanagari_PP-OCRv3_mobile_rec.yml 9.9M 推理模型 / 训练模型

查看完整语种列表与使用教程请参考: 多语言模型

3. 文本方向分类模型

模型名称 模型简介 配置文件 推理模型大小 下载地址
ch_ppocr_mobile_slim_v2.0_cls slim量化版模型对检测到的文本行文字角度分类 cls_mv3.yml 2.1M 推理模型 / 训练模型 / nb模型
ch_ppocr_mobile_v2.0_cls 原始分类器模型,对检测到的文本行文字角度分类 cls_mv3.yml 1.38M 推理模型 / 训练模型

4. Paddle-Lite 模型

Paddle-Lite 是一个高性能、轻量级、灵活性强且易于扩展的深度学习推理框架它可以对inference模型进一步优化得到适用于移动端/IoT端等端侧部署场景的nb模型。一般建议基于量化模型进行转换因为可以将模型以INT8形式进行存储与推理从而进一步减小模型大小提升模型速度。

本节主要列出PP-OCRv2以及更早版本的检测与识别nb模型最新版本的nb模型可以直接从上面的模型列表中获得。

模型版本 模型简介 模型大小 检测模型 文本方向分类模型 识别模型 Paddle-Lite版本
PP-OCRv2 蒸馏版超轻量中文OCR移动端模型 11.0M 下载地址 下载地址 下载地址 v2.10
PP-OCRv2(slim) 蒸馏版超轻量中文OCR移动端模型 4.6M 下载地址 下载地址 下载地址 v2.10
PP-OCRv2 蒸馏版超轻量中文OCR移动端模型 11.0M 下载地址 下载地址 下载地址 v2.9
PP-OCRv2(slim) 蒸馏版超轻量中文OCR移动端模型 4.9M 下载地址 下载地址 下载地址 v2.9
V2.0 ppocr_v2.0超轻量中文OCR移动端模型 7.8M 下载地址 下载地址 下载地址 v2.9
V2.0(slim) ppocr_v2.0超轻量中文OCR移动端模型 3.3M 下载地址 下载地址 下载地址 v2.9