You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

18 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments hide
true
navigation
toc

Chat

Введение

PaddleOCR стремится создавать многоязычные, потрясающие, передовые и практичные инструменты OCR, которые помогают пользователям обучать лучшие модели и применять их на практике

📣 Последние обновления

  • 🔥2022.8.24 Выпуск PaddleOCR Выпуск /2.6
    • Выпускать PP-Structurev2с полностью обновленными функциями и производительностью, адаптированными для китайских сцен и новой поддержкой pаспознавание таблиц Восстановление макета и однострочная команда для преобразования PDF в Word;
    • Анализ макета оптимизация: память модели уменьшена на 95%, а скорость увеличена в 11 раз, а среднее время процессорного времени составляет всего 41 мс;
    • Распознавание таблиц оптимизация: разработано 3 стратегии оптимизации, а точность модели улучшена на 6% при сопоставимых затратах времени;
    • Извлечение ключевой информации оптимизация: разработана визуально независимая структура модели, точность распознавания семантической сущности увеличена на 2,8%, а точность извлечения отношения увеличена на 9,1%.
  • 🔥2022.7 Выпуск Коллекция приложений сцены OCR
  • Выпуск 9 вертикальных моделей, таких как цифровая трубка, ЖК-экран, номерной знак, модель распознавания рукописного ввода, высокоточная модель SVTR и т. д., охватывающих основные вертикальные приложения OCR в целом, производственной, финансовой и транспортной отраслях.
  • 🔥2022.5.9 Выпуск PaddleOCR Выпуск /2.5
  • Выпускать PP-OCRv3: При сопоставимой скорости эффект китайской сцены улучшен на 5% по сравнению с ПП-OCRRv2, эффект английской сцены улучшен на 11%, а средняя точность распознавания 80 языковых многоязычных моделей улучшена более чем на 5%.
  • Выпускать PPOCRLabelv2: Добавьте функцию аннотации для задачи распознавания таблиц, задачи извлечения ключевой информации и изображения неправильного текста.
    • Выпустить интерактивную электронную книгу "Погружение в OCR", охватывает передовую теорию и практику кодирования технологии полного стека OCR.
  • подробнее

🌟 Функции

PaddleOCR поддерживает множество передовых алгоритмов, связанных с распознаванием текста, и разработала промышленные модели/решения. PP-OCR и PP-Structure на этой основе и пройти весь процесс производства данных, обучения модели, сжатия, логического вывода и развертывания.

Быстрый опыт

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=ru

Если у вас нет среды Python, выполните Подготовка среды. Мы рекомендуем вам начать с Учебники.

📚 Электронная книга: Погружение в OCR

👫 Сообщество

Что касается международных разработчиков, мы рассматриваем Обсуждения PaddleOCR как нашу платформу для международного сообщества. Все идеи и вOCRосы можно обсудить здесь на английском языке.

🛠️ Список моделей серии ПП -OCR

Введение модели Название модели Рекомендуемая сцена Модель обнаружения Модель распознавания
Ру́сский язы́к:Ру́сский язы́к Сверхлегкая модель PP-OCRv3 (13.4M) cyrillic_PP-OCRv3_xx Мобильный и сервер модель вывода/обученный модель модель вывода/обученный модель
Английский сверхлегкая модель PP-OCRv3 (13,4 Мб) en_PP-OCRv3_xx Мобильный и сервер модель вывода / обученный модель вывод модель / обученный модель
Сверхлегкая китайская и английская модель PP-OCRv3 (16,2M) ch_PP-OCRv3_xx Мобильный и сервер вывод модель / обученный модель вывод модель / обученный модель

📖 Учебники

🇺🇳 Руководство по запросам на новый язык

Если вы хотите запросить новую языковую модель, проголосуйте в Голосуйте за обновление многоязычной модели. Мы будем регулярно обновлять модель по результату. Пригласите друзей проголосовать вместе!

Если вам нужно обучить новую языковую модель на основе вашего сценария, учебное пособие в Проекте обучения многоязычной модели поможет вам подготовить набор данных и показать вам весь процесс шаг за шагом.

Оригинальный Многоязычный план разработки OCR по-прежнему показывает вам много полезных корпусов и словарей.

👀 Визуализация больше

PP-OCRv3 Многоязычная модель
PP-OCRv3 Aнглийская модель
PP-OCRv3 Kитайская модель
PP-Structurev2 1. анализ макета + распознавание таблиц
2. SER (Семантическое распознавание объектов)
3. RE (Извлечение отношений)

📄 Лицензия

Этот проект выпущен под Apache 2.0 license