PaddleOCR

21 KiB

Raw Permalink Blame History Unescape Escape

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments

hide

true

navigation

toc

प्रस्तावना

पैडलओसीआर का उद्देश्य बहुभाषी,शानदार , ओसीआर और व्यावहारिक ओसीआरउपकरण बनाना है जो यूजर्स को बेहतर मॉडलों के लिए प्रशिक्षित करने और उन्हें व्यवहार में लागू करने में मदद करते हैं।

📣 हाल के अद्यतन

🔥2022.8.24 रिलीज Paddleओसीआर रिलीज/2.6
- रिलीज PP-Structurev2，फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए लेआउट रिकवरी और पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड;
- लेआउट एनालाइस ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है;
- टेबल रिकोगनाइजेशन ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है;
- की इंफॉर्मेशन एक्स्ट्रेक्शन ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है।
🔥2022.7 रिलीज ओसीआर दृश्य आवेदन संग्रह
- रिलीज 9 वर्टिकल मॉडल जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं।
🔥2022.5.9 रिलीज Paddleओसीआर रिलीज/2.5
- रिलीज PP-OCRv3: तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है।
- रिलीज़ PPOCRLabelv2: टेबल टेबल रिकोगनाइजेशन टास्क की इंफॉर्मेशन एक्स्ट्रेक्शन टास्क और अनियमित टेक्सट इमेज के लिए एनोटेशन फ़ंक्शन एड करे।
- इंटरएक्टिव ई-बुक जारी करें "ओसीआर में गोता लगाएँ", ओसीआर पूर्ण स्टैक तकनीक के अत्याधुनिक सिद्धांत और कोड प्रेक्टिस को कवर करता है।
और अधिक

🌟 विशेषताएँ

Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान PP- OCR और PP-Structure इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती।

⚡ शीघ्र अनुभव

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=hi

यदि आपके पास पायथन एनवायरनमेंट नहीं है, कृपया फॉलो कीजिए एनवायरनमेंट प्रिपेरेशन. हम अनुशंसा करते हैं कि आप इसके साथ शुरुआत करें ट्यूटोरियल.

📚 ई-बुक: ओसीआर में गोता लगाएँ

ओसीआर में गोता लगाएँ

👫 समुदाय

अंतरराष्ट्रीय डेवलपर्स के लिए, हम सम्मान करते हैं [पैडलओसीआर चर्चाएँ] (https://github.com/PaddlePaddle/PaddleOCR/discussions) हमारे अंतरराष्ट्रीय कम्युनिटी मंच के रूप में। यहां सभी विचारों और प्रश्नों पर अंग्रेजी में चर्चा की जा सकती है।

🛠️ PP-ओसीआर श्रृंखला मॉडल सूची

मॉडल प्रस्तावना	मॉडल नाम	रिकमेंडिड सीन	डिटेक्शन मॉडल	रिकोगनाइजेशन मॉडल
हिन्दी：हिन्दी अल्ट्रा-लाइटवेट PP-OCRv3 सिस्टम (9.9M)	devanagari_PP-OCRv3_xx	मोबाइल और सर्वर	इन्फरन्स मॉडल / प्रशिक्षितमॉडल	इन्फरन्समॉडल / प्रशिक्षित मॉडल
इंग्लिश अल्ट्रा- लाइट वेट PP-OCRv3 मॉडल （13.4M）	en_PP-OCRv3_xx	मोबाइल और सर्वर	इन्फरन्स मॉडल / प्रशिक्षितमॉडल	इन्फरन्समॉडल / प्रशिक्षित मॉडल
चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-OCRv3 मॉडल（16.2M）	ch_PP-OCRv3_xx	मोबाइल और सर्वर	इन्फरन्स मॉडल / प्रशिक्षित मॉडल	प्रशिक्षित मॉडल / प्रशिक्षित मॉडल

अधिक मॉडल डाउनलोड (एकाधिक भाषाओं सहित) के लिए, कृपया PP-ओसीआर सीरीज मॉडल डाउनलोड देखें।
एक नए भाषा अनुरोध के लिए, कृपया नई भाषा अनुरोधों के लिए दिशानिर्देश.
स्ट्रक्चर मॉडल डोकोमेंट एनालाइज के लिए, कृपया देखें PP-Structure models.

📖 ट्यूटोरियल

🇺🇳 नई भाषा अनुरोधों के लिए संयुक्त राष्ट्र दिशानिर्देश

अगर आप एक नए भाषा मॉडल का अनुरोध करना चाहते हैं, तो कृपया बहुभाषी मॉडल अपग्रेड के लिए वोट करें में वोट करें। हम नियमित रूप से परिणाम के अनुसार मॉडल को अपग्रेड करेंगे। अपने दोस्तों को एक साथ वोट करने के लिए आमंत्रित करें!

यदि आपको एक नए भाषा मॉडल को प्रशिक्षित करने अपने परिदृश्य के आधार पर, तो यह बहुभाषी मॉडल ट्रेनिंग प्रोजेक्ट ट्रेनिंग ट्यूटोरियल आपको डेटासेट तैयार करने में मदद करेगा और आपको स्टेप बाए स्टेप पूरा प्रोसेस दिखाएगा

मूल बहुभाषी ओसीआर विकास योजना अभी भी आपको बहुत सारे उपयोगी संग्रह और शब्दकोश दिखाता है