11 KiB

Raw Permalink Blame History Unescape Escape

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments

hide

true

toc

PP-Structure 系列模型列表

1. 版面分析模型

模型名称	模型简介	推理模型大小	下载地址	dict path
picodet_lcnet_x1_0_fgd_layout	基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型，可以划分文字、标题、表格、图片以及列表5类区域	9.7M	推理模型 / 训练模型	PubLayNet dict
ppyolov2_r50vd_dcn_365e_publaynet	基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型	221.0M	推理模型 / 训练模型	同上
picodet_lcnet_x1_0_fgd_layout_cdla	CDLA数据集训练的中文版面分析模型，可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式10类区域	9.7M	推理模型 / 训练模型	CDLA dict
picodet_lcnet_x1_0_fgd_layout_table	表格数据集训练的版面分析模型，支持中英文文档表格区域的检测	9.7M	推理模型 / 训练模型	Table dict
ppyolov2_r50vd_dcn_365e_tableBank_word	基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型，支持英文文档表格区域的检测	221.0M	推理模型	同上
ppyolov2_r50vd_dcn_365e_tableBank_latex	基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型，支持英文文档表格区域的检测	221.0M	推理模型	同上

2. OCR和表格识别模型

2.1 OCR

模型名称	模型简介	推理模型大小	下载地址
en_ppocr_mobile_v2.0_table_det	PubTabNet数据集训练的英文表格场景的文字检测	4.7M	推理模型 / 训练模型
en_ppocr_mobile_v2.0_table_rec	PubTabNet数据集训练的英文表格场景的文字识别	6.9M	推理模型 / 训练模型

如需要使用其他OCR模型，可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir, rec_model_dir两个字段即可。

2.2 表格识别模型

模型名称	模型简介	推理模型大小	下载地址
en_ppocr_mobile_v2.0_table_structure	基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型	6.8M	推理模型 / 训练模型
en_ppstructure_mobile_v2.0_SLANet	基于SLANet在PubTabNet数据集上训练的英文表格识别模型	9.2M	推理模型 / 训练模型
ch_ppstructure_mobile_v2.0_SLANet	基于SLANet的中文表格识别模型	9.3M	推理模型 / 训练模型

3. KIE模型

在XFUND_zh数据集上，不同模型的精度与V100 GPU上速度信息如下所示。

模型名称	模型简介	推理模型大小	精度(hmean)	预测耗时(ms)	下载地址
ser_VI-LayoutXLM_xfund_zh	基于VI-LayoutXLM在xfund中文数据集上训练的SER模型	1.1G	93.19%	15.49	推理模型 / 训练模型
re_VI-LayoutXLM_xfund_zh	基于VI-LayoutXLM在xfund中文数据集上训练的RE模型	1.1G	83.92%	15.49	推理模型 / 训练模型
ser_LayoutXLM_xfund_zh	基于LayoutXLM在xfund中文数据集上训练的SER模型	1.4G	90.38%	19.49	推理模型 / 训练模型
re_LayoutXLM_xfund_zh	基于LayoutXLM在xfund中文数据集上训练的RE模型	1.4G	74.83%	19.49	推理模型 / 训练模型
ser_LayoutLMv2_xfund_zh	基于LayoutLMv2在xfund中文数据集上训练的SER模型	778.0M	85.44%	31.46	推理模型 / 训练模型
re_LayoutLMv2_xfund_zh	基于LayoutLMv2在xfun中文数据集上训练的RE模型	765.0M	67.77%	31.46	推理模型 coming soon / 训练模型
ser_LayoutLM_xfund_zh	基于LayoutLM在xfund中文数据集上训练的SER模型	430.0M	77.31%	-	推理模型 / 训练模型

注：上述预测耗时信息仅包含了inference模型的推理耗时，没有统计预处理与后处理耗时，测试环境为V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4。

在wildreceipt数据集上，SDMGR模型精度与下载地址如下所示。

模型名称	模型简介	模型大小	精度	下载地址
SDMGR	关键信息提取模型	78.0M	86.70%	推理模型 coming soon / 训练模型

11 KiB Raw Permalink Blame History Unescape Escape