You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.
PP-Structure 系列模型列表
1. 版面分析模型
模型名称
模型简介
推理模型大小
下载地址
dict path
picodet_lcnet_x1_0_fgd_layout
基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型,可以划分文字、标题、表格、图片以及列表 5类区域
9.7M
推理模型 / 训练模型
PubLayNet dict
ppyolov2_r50vd_dcn_365e_publaynet
基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型
221.0M
推理模型 / 训练模型
同上
picodet_lcnet_x1_0_fgd_layout_cdla
CDLA数据集训练的中文版面分析模型, 可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式 10类区域
9.7M
推理模型 / 训练模型
CDLA dict
picodet_lcnet_x1_0_fgd_layout_table
表格数据集训练的版面分析模型,支持中英文文档表格区域的检测
9.7M
推理模型 / 训练模型
Table dict
ppyolov2_r50vd_dcn_365e_tableBank_word
基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型,支持英文文档表格区域的检测
221.0M
推理模型
同上
ppyolov2_r50vd_dcn_365e_tableBank_latex
基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型, 支持英文文档表格区域的检测
221.0M
推理模型
同上
2. OCR和表格识别模型
2.1 OCR
模型名称
模型简介
推理模型大小
下载地址
en_ppocr_mobile_v2.0_table_det
PubTabNet数据集训练的英文表格场景的文字检测
4.7M
推理模型 / 训练模型
en_ppocr_mobile_v2.0_table_rec
PubTabNet数据集训练的英文表格场景的文字识别
6.9M
推理模型 / 训练模型
如需要使用其他OCR模型, 可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir
, rec_model_dir
两个字段即可。
2.2 表格识别模型
模型名称
模型简介
推理模型大小
下载地址
en_ppocr_mobile_v2.0_table_structure
基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型
6.8M
推理模型 / 训练模型
en_ppstructure_mobile_v2.0_SLANet
基于SLANet在PubTabNet数据集上训练的英文表格识别模型
9.2M
推理模型 / 训练模型
ch_ppstructure_mobile_v2.0_SLANet
基于SLANet的中文表格识别模型
9.3M
推理模型 / 训练模型
3. KIE模型
在XFUND_zh数据集上, 不同模型的精度与V100 GPU上速度信息如下所示。
模型名称
模型简介
推理模型大小
精度(hmean)
预测耗时(ms)
下载地址
ser_VI-LayoutXLM_xfund_zh
基于VI-LayoutXLM在xfund中文数据集上训练的SER模型
1.1G
93.19%
15.49
推理模型 / 训练模型
re_VI-LayoutXLM_xfund_zh
基于VI-LayoutXLM在xfund中文数据集上训练的RE模型
1.1G
83.92%
15.49
推理模型 / 训练模型
ser_LayoutXLM_xfund_zh
基于LayoutXLM在xfund中文数据集上训练的SER模型
1.4G
90.38%
19.49
推理模型 / 训练模型
re_LayoutXLM_xfund_zh
基于LayoutXLM在xfund中文数据集上训练的RE模型
1.4G
74.83%
19.49
推理模型 / 训练模型
ser_LayoutLMv2_xfund_zh
基于LayoutLMv2在xfund中文数据集上训练的SER模型
778.0M
85.44%
31.46
推理模型 / 训练模型
re_LayoutLMv2_xfund_zh
基于LayoutLMv2在xfun中文数据集上训练的RE模型
765.0M
67.77%
31.46
推理模型 coming soon / 训练模型
ser_LayoutLM_xfund_zh
基于LayoutLM在xfund中文数据集上训练的SER模型
430.0M
77.31%
-
推理模型 / 训练模型
注: 上述预测耗时信息仅包含了inference模型的推理耗时, 没有统计预处理与后处理耗时, 测试环境为V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4
。
在wildreceipt数据集上, SDMGR模型精度与下载地址如下所示。
模型名称
模型简介
模型大小
精度
下载地址
SDMGR
关键信息提取模型
78.0M
86.70%
推理模型 coming soon / 训练模型