You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

11 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments hide
true
toc

1. 低代码全流程开发简介

飞桨低代码开发工具 PaddleX,依托于 PaddleOCR 的先进技术,支持了 OCR 领域的低代码全流程开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。这将显著减少模型开发的时间消耗降低其开发难度,大大加快模型在行业中的应用和推广速度。特色如下:

  • 🎨 模型丰富一键调用:将文本图像智能分析、通用 OCR、通用版面解析、通用表格识别、公式识别、印章文本识别涉及的48个模型整合为 10 条模型产线,通过极简的Python API一键调用快速体验模型效果。此外同一套API也支持图像分类、目标检测、图像分割、时序预测等共计200+模型形成30+单功能模块,方便开发者进行模型组合使用。

  • 🚀 提高效率降低门槛:提供基于统一命令图形界面两种方式,实现模型简洁高效的使用、组合与定制。支持高性能推理、服务化部署和端侧部署等多种部署方式。此外,对于各种主流硬件如英伟达GPU、昆仑芯、昇腾、寒武纪和海光等,进行模型开发时,都可以无缝切换

说明PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程其中包含能够独立完成某类任务的单模型单功能模块组合。

2. OCR相关能力支持

PaddleX 中 OCR 相关的 10 条产线均支持本地快速推理,部分产线支持在线体验,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行高性能推理/服务化部署/端侧部署,如果不满意,您也可以使用产线的二次开发能力,提升效果。完整的产线开发流程请参考PaddleX产线使用概览或各产线使用教程。

此外PaddleX为开发者提供了基于云端图形化开发界面的全流程开发工具, 详细请参考教程《零门槛开发产业级AI模型》

模型产线 在线体验 快速推理 高性能推理 服务化部署 端侧部署 二次开发 星河零代码产线
文档图像预处理 🚧 🚧 🚧 🚧
通用OCR 链接
通用表格识别 链接 🚧
通用表格识别v2 🚧 🚧 🚧 🚧
公式识别 链接 🚧
印章文本识别 链接 🚧
通用版面解析 🚧 🚧 🚧
通用版面解析v2 🚧 🚧 🚧 🚧 🚧
文档场景信息抽取v3 链接 🚧
文档场景信息抽取v4 🚧 🚧 🚧

以上功能均基于GPU/CPU实现。PaddleX还可在昆仑芯、昇腾、寒武纪和海光等主流硬件上进行快速推理和二次开发。下表详细列出了模型产线的支持情况具体支持的模型列表请参阅 模型列表(NPU) // 模型列表(XPU) // 模型列表(MLU) // 模型列表DCU。同时我们也在适配更多的模型,并在主流硬件上推动高性能和服务化部署的实施。

🚀 国产化硬件能力支持

模型产线 昇腾 910B 昆仑芯 R200/R300 寒武纪 MLU370X8 海光 Z100/K100AI
通用OCR
通用表格识别 🚧 🚧 🚧

3. OCR相关模型产线列表和教程

4. OCR相关单功能模块列表和教程