You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

11 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments hide
true
toc

PP-Structure 系列模型列表

1. 版面分析模型

模型名称 模型简介 推理模型大小 下载地址 dict path
picodet_lcnet_x1_0_fgd_layout 基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 9.7M 推理模型 / 训练模型 PubLayNet dict
ppyolov2_r50vd_dcn_365e_publaynet 基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型 221.0M 推理模型 / 训练模型 同上
picodet_lcnet_x1_0_fgd_layout_cdla CDLA数据集训练的中文版面分析模型可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式10类区域 9.7M 推理模型 / 训练模型 CDLA dict
picodet_lcnet_x1_0_fgd_layout_table 表格数据集训练的版面分析模型,支持中英文文档表格区域的检测 9.7M 推理模型 / 训练模型 Table dict
ppyolov2_r50vd_dcn_365e_tableBank_word 基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型,支持英文文档表格区域的检测 221.0M 推理模型 同上
ppyolov2_r50vd_dcn_365e_tableBank_latex 基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型支持英文文档表格区域的检测 221.0M 推理模型 同上

2. OCR和表格识别模型

2.1 OCR

模型名称 模型简介 推理模型大小 下载地址
en_ppocr_mobile_v2.0_table_det PubTabNet数据集训练的英文表格场景的文字检测 4.7M 推理模型 / 训练模型
en_ppocr_mobile_v2.0_table_rec PubTabNet数据集训练的英文表格场景的文字识别 6.9M 推理模型 / 训练模型

如需要使用其他OCR模型可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir, rec_model_dir两个字段即可。

2.2 表格识别模型

模型名称 模型简介 推理模型大小 下载地址
en_ppocr_mobile_v2.0_table_structure 基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型 6.8M 推理模型 / 训练模型
en_ppstructure_mobile_v2.0_SLANet 基于SLANet在PubTabNet数据集上训练的英文表格识别模型 9.2M 推理模型 / 训练模型
ch_ppstructure_mobile_v2.0_SLANet 基于SLANet的中文表格识别模型 9.3M 推理模型 / 训练模型

3. KIE模型

在XFUND_zh数据集上不同模型的精度与V100 GPU上速度信息如下所示。

模型名称 模型简介 推理模型大小 精度(hmean) 预测耗时(ms) 下载地址
ser_VI-LayoutXLM_xfund_zh 基于VI-LayoutXLM在xfund中文数据集上训练的SER模型 1.1G 93.19% 15.49 推理模型 / 训练模型
re_VI-LayoutXLM_xfund_zh 基于VI-LayoutXLM在xfund中文数据集上训练的RE模型 1.1G 83.92% 15.49 推理模型 / 训练模型
ser_LayoutXLM_xfund_zh 基于LayoutXLM在xfund中文数据集上训练的SER模型 1.4G 90.38% 19.49 推理模型 / 训练模型
re_LayoutXLM_xfund_zh 基于LayoutXLM在xfund中文数据集上训练的RE模型 1.4G 74.83% 19.49 推理模型 / 训练模型
ser_LayoutLMv2_xfund_zh 基于LayoutLMv2在xfund中文数据集上训练的SER模型 778.0M 85.44% 31.46 推理模型 / 训练模型
re_LayoutLMv2_xfund_zh 基于LayoutLMv2在xfun中文数据集上训练的RE模型 765.0M 67.77% 31.46 推理模型 coming soon / 训练模型
ser_LayoutLM_xfund_zh 基于LayoutLM在xfund中文数据集上训练的SER模型 430.0M 77.31% - 推理模型 / 训练模型
  • 上述预测耗时信息仅包含了inference模型的推理耗时没有统计预处理与后处理耗时测试环境为V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4

在wildreceipt数据集上SDMGR模型精度与下载地址如下所示。

模型名称 模型简介 模型大小 精度 下载地址
SDMGR 关键信息提取模型 78.0M 86.70% 推理模型 coming soon / 训练模型