PaddleOCR

14 KiB

Raw Permalink Blame History Unescape Escape

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments

hide

true

navigation

toc

紹介

PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。

📣 最新アップデート

🔥2022.8.24 リリース PaddleOCR release/2.6
- PP-Structurev2がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、レイアウトの復旧さらに1 行のコマンドをPDFへ転換、そして Wordに変換可能。
- レイアウト分析の最適化：モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
- 表認識最適化：3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
- キー情報抽出最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
🔥2022.7 リリース OCR scene application collection
- デジタルチューブ、液晶画面、ナンバープレート、手書き認識モデル、高精度 SVTR モデルなど、9つの垂直モデルをリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
🔥2022.5.9 リリース PaddleOCR release/2.5
- PP-OCRv3リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
- PPOCRLabelv2リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
- インタラクティブな電子書籍 "OCR に没入"、をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
もっと

🌟 PaddleOCRとは？

PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション PP-OCR や PP-Structure を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。

⚡ 今すぐトライアル

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr

Python環境がない場合は環境の準備に従ってください。チュートリアルから始めることをお勧めします。

📚 電子書籍：OCRに入る

OCRに没入

👫コミュニティー

他国の開発者の方は PaddleOCR Discussions を国際的なコミュニティプラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。

🛠️ シリーズモデル式一覧

モデル紹介	モデル名	推奨のシーン	検出モデル	認識モデル
日本語超軽量 PP-OCRv3 モデル(14.8M)	japan_PP-OCRv3_xx	モバイル & サーバー	推論モデル/トレーニングモデル	推論モデル/トレーニングモデル
英語超軽量PP-OCRv3モデル（13.4M）	en_PP-OCRv3_xx	モバイル & サーバー	推論モデル / トレーニングモデル	推論モデル / トレーニングモデル
中国語と英語の超軽量 PP-OCRv3 モデル（16.2M）	ch_PP-OCRv3_xx	モバイル & サーバー	推論モデル / トレーニングモデル	推論モデル / トレーニングモデル

その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズモデルのダウンロード] (../doc_en/models_list_en.md)をご参照ください。
新しい言語のリクエストについては、新しい言語_リクエストのガイドラインを参照してください。
構造文書分析モデルについては、PP-Structure modelsをご参照ください。