You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

14 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments hide
true
navigation
toc

Chat

紹介

PaddleOCR は、さまざまな言語で、優れた最先端かつ実用的な OCR ツールを作成することを目的とし、ユーザーがより優れたモデルをトレーニングし、実践的に対応できるようになるために役立つAIOCRです。

📣 最新アップデート

  • 🔥2022.8.24 リリース PaddleOCR release/2.6

    • PP-Structurev2がリリース。機能と使いやすさがアップグレード、中国語のさまざまな文字に適応、 レイアウトの復旧 さらに1 行のコマンドをPDFへ転換、そして Wordに変換可能。
    • レイアウト分析 の最適化:モデルのストレージが 95% 削減、速度が 11 倍向上、平均 CPU 時間コストはわずか 41 ミリ秒です。
    • 表認識 最適化3つの最適化戦略設計、モデルの精度が従来より同時間比が 6% 向上。
    • キー情報抽出 最適化:視覚に依存しないモデル構造設計、語彙の実態識別精度が 2.8% 向上、関係抽出の精度が 9.1% 向上。
  • 🔥2022.7 リリース OCR scene application collection

    • デジタルチューブ、液晶画面、ナンバー プレート、手書き認識モデル、高精度 SVTR モデルなど、9つの垂直モデルをリリース、一般、製造、金融、運輸業界の主要な OCR 垂直アプリケーションをカバー。
  • 🔥2022.5.9 リリース PaddleOCR release/2.5

    • PP-OCRv3リリース: 同等の速度で、中国語の識別効果は PP-OCRv2 より 5% 向上、英語の識別効果は 11% 向上し、80 言語の多言語モデルの平均認識精度は 5% 以上向上。
    • PPOCRLabelv2リリース: 表認識タスク、キー情報抽出タスク、イレギュラーテキスト画像のアノテーション機能を追加。
    • インタラクティブな電子書籍 "OCR に没入"、 をリリース。 OCRフルスタック技術の最先端の理論とコードの実践をカバー。
  • もっと

🌟 PaddleOCRとは

PaddleOCRは、OCRに関連するさまざまな最先端のアルゴリズムに対応する、産業用の機能モデル/ソリューション PP-OCRPP-Structure を開発。これに基づき、データの生成、モデルのトレーニング、圧縮、推論、展開の全プロセスを実行可能。

今すぐトライアル

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=japan # change for i18n abbr

Python環境がない場合は 環境の準備に従ってください。チュートリアル から始めることをお勧めします。

📚 電子書籍:OCRに入る

👫コミュニティー

他国の開発者の方は PaddleOCR Discussions を国際的なコミュニティ プラットフォームとして使用します。みなさんのアイデアや質問がある場合、ここで英語で話し合うことができます。

🛠️ シリーズ モデル式一覧

モデル紹介 モデル名 推奨のシーン 検出モデル 認識モデル
日本語超軽量 PP-OCRv3 モデル(14.8M) japan_PP-OCRv3_xx モバイル & サーバー 推論モデル/トレーニングモデル 推論モデル/トレーニングモデル
英語超軽量PP-OCRv3モデル13.4M en_PP-OCRv3_xx モバイル & サーバー 推論モデル / トレーニングモデル 推論モデル / トレーニングモデル
中国語と英語の超軽量 PP-OCRv3 モデル16.2M ch_PP-OCRv3_xx モバイル & サーバー 推論モデル / トレーニングモデル 推論モデル / トレーニングモデル
  • その他のモデルのダウンロード (多言語を含む) については、[PP-OCR シリーズ モデルのダウンロード] (../doc_en/models_list_en.md)をご参照ください。
  • 新しい言語のリクエストについては、 新しい言語_リクエストのガイドラインを参照してください。
  • 構造文書分析モデルについては、PP-Structure modelsをご参照ください。

📖 チュートリアル

🇺🇳 新しい言語リクエストのガイドライン

新言語モデルをリクエストしたい場合、多言語モデルのアップグレードへの投票で投票してください。投票結果に応じて定期的にモデルがアップグレードされます。友達を招待して一緒に投票しましょう!

シナリオに基づいて新しい言語モデルをトレーニング する必要がある場合は、多言語モデル トレーニング プロジェクト のチュートリアルがデータセットの準備にご利用でき、 プロセス全体を段階的に表示することができます。

元の多言語 OCR 開発計画 には、まだ多くの有用なコーパスと辞書が表示されています

👀 ビジュアリゼーション more

PP-OCRv3 多言語モデル
PP-OCRv3 英語 モデル
PP-OCRv3 中国語 モデル
PP-Structurev2 1. レイアウト分析+テーブル認識
2. SER (セマンティックエンティティ認識)
3. RE (関係抽出)

📄 ライセンス

このプロジェクトは以下の場所でリリースされています Apache 2.0 license