PaddleOCR

11 KiB

Raw Permalink Blame History Unescape Escape

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments

hide

true

toc

1. 低代码全流程开发简介

飞桨低代码开发工具 PaddleX，依托于 PaddleOCR 的先进技术，支持了 OCR 领域的低代码全流程开发能力。通过低代码开发，可实现简单且高效的模型使用、组合与定制。这将显著减少模型开发的时间消耗，降低其开发难度，大大加快模型在行业中的应用和推广速度。特色如下：

🎨 模型丰富一键调用：将文本图像智能分析、通用 OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的48个模型整合为 10 条模型产线，通过极简的Python API一键调用，快速体验模型效果。此外，同一套API，也支持图像分类、目标检测、图像分割、时序预测等共计200+模型，形成30+单功能模块，方便开发者进行模型组合使用。
🚀 提高效率降低门槛：提供基于统一命令和图形界面两种方式，实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外，对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等，进行模型开发时，都可以无缝切换。

说明：PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程，其中包含能够独立完成某类任务的单模型（单功能模块）组合。

2. OCR相关能力支持

PaddleX 中 OCR 相关的 10 条产线均支持本地快速推理，部分产线支持在线体验，您可以快速体验各个产线的预训练模型效果，如果您对产线的预训练模型效果满意，可以直接对产线进行高性能推理/服务化部署/端侧部署，如果不满意，您也可以使用产线的二次开发能力，提升效果。完整的产线开发流程请参考PaddleX产线使用概览或各产线使用教程。

此外，PaddleX为开发者提供了基于云端图形化开发界面的全流程开发工具, 详细请参考教程《零门槛开发产业级AI模型》

模型产线	在线体验	快速推理	高性能推理	服务化部署	端侧部署	二次开发	星河零代码产线
文档图像预处理	🚧	✅	🚧	✅	🚧	✅	🚧
通用OCR	链接	✅	✅	✅	✅	✅	✅
通用表格识别	链接	✅	✅	✅	🚧	✅	✅
通用表格识别v2	🚧	✅	🚧	✅	🚧	✅	🚧
公式识别	链接	✅	✅	✅	🚧	✅	✅
印章文本识别	链接	✅	✅	✅	🚧	✅	✅
通用版面解析	🚧	✅	✅	✅	🚧	✅	🚧
通用版面解析v2	🚧	✅	🚧	✅	🚧	🚧	🚧
文档场景信息抽取v3	链接	✅	✅	✅	🚧	✅	✅
文档场景信息抽取v4	🚧	✅	✅	✅	🚧	✅	🚧

❗注：以上功能均基于GPU/CPU实现。PaddleX还可在昆仑芯、昇腾、寒武纪和海光等主流硬件上进行快速推理和二次开发。下表详细列出了模型产线的支持情况，具体支持的模型列表请参阅模型列表(NPU) // 模型列表(XPU) // 模型列表(MLU) // 模型列表DCU。同时我们也在适配更多的模型，并在主流硬件上推动高性能和服务化部署的实施。

🚀 国产化硬件能力支持

模型产线	昇腾 910B	昆仑芯 R200/R300	寒武纪 MLU370X8	海光 Z100/K100AI
通用OCR	✅	✅	✅	✅
通用表格识别	✅	🚧	🚧	🚧

3. OCR相关模型产线列表和教程

文档图像预处理产线: 使用教程
通用OCR产线: 使用教程
通用表格识别产线: 使用教程
通用表格识别v2产线: 使用教程
通用版面解析产线: 使用教程
通用版面解析v2产线: 使用教程
公式识别: 使用教程
印章文本识别: 使用教程
文档场景信息抽取v3产线: 使用教程
文档场景信息抽取v4产线: 使用教程

4. OCR相关单功能模块列表和教程

文本检测模块: 使用教程
印章文本检测模块: 使用教程
文本行方向分类模块: 使用教程
文本识别模块: 使用教程
公式识别模块: 使用教程
表格结构识别模块: 使用教程
文本图像矫正模块: 使用教程
版面区域检测模块: 使用教程
文档图像方向分类模块: 使用教程
表格单元格检测模块: 使用教程
表格分类模块: 使用教程

11 KiB Raw Permalink Blame History Unescape Escape

1. 低代码全流程开发简介

2. OCR相关能力支持

3. OCR相关模型产线列表和教程

4. OCR相关单功能模块列表和教程

11 KiB

Raw Permalink Blame History Unescape Escape