You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

21 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

comments hide
true
navigation
toc

Chat

प्रस्तावना

पैडलओसीआर का उद्देश्य बहुभाषी,शानदार , ओसीआर और व्यावहारिक ओसीआरउपकरण बनाना है जो यूजर्स को बेहतर मॉडलों के लिए प्रशिक्षित करने और उन्हें व्यवहार में लागू करने में मदद करते हैं।

📣 हाल के अद्यतन

  • 🔥2022.8.24 रिलीज Paddleओसीआर रिलीज/2.6

    • रिलीज PP-Structurev2,फंक्शन और परफॉरमेंस के साथ पूरी तरह से उन्नत, चायनीज शीन्स के अनुकूल, और मदद के लिए लेआउट रिकवरी और पीडीएफ को वर्ड में बदलने के लिए वन लाइन कमांड;
    • लेआउट एनालाइस ऑप्टिमाइजेशन: मॉडल स्टोरेज में 95% की कमी, जबकि स्पीड में 11 गुना वृद्धि , और एवरेज CPU स टाइम-कॉस्ट केवल 41ms है;
    • टेबल रिकोगनाइजेशन ऑप्टिमाइजेशन: 3 ऑप्टिमाइज़ेशन के तरीके डिजाइन किए गए हैं, और तुलनात्मक समय की खपत के तहत मॉडल सटीकता में 6% का सुधार हुआ है;
    • की इंफॉर्मेशन एक्स्ट्रेक्शन ऑप्टिमाइजेशन : एक बिजुवल-स्वतंत्र मॉडल संरचना डिजाइन की गई है, सिमेंटिक एन्टाइटी रिकग्निशन की सटीकता में 2.8% की वृद्धि हुई है, और रिलेशन एक्सट्रैक्शन की सटीकता में 9.1% की वृद्धि हुई है।
  • 🔥2022.7 रिलीज ओसीआर दृश्य आवेदन संग्रह

    • रिलीज 9 वर्टिकल मॉडल जैसे कि डिजिटल ट्यूब, एलसीडी स्क्रीन, लाइसेंस प्लेट, हस्तलेखन पहचान मॉडल, उच्च-सटीक एसवीटीआर मॉडल, आदि, जो सामान्य रूप से मुख्य ओसीआर वर्टिकल अनुप्रयोगों, विनिर्माण, वित्त और परिवहन उद्योगों को कवर करते हैं।
  • 🔥2022.5.9 रिलीज Paddleओसीआर रिलीज/2.5

    • रिलीज PP-OCRv3: तुलनात्मक स्पीड के साथ, चाइनीज शीन्स का प्रभाव PP-ओसीआर v2 की तुलना में 5% की और वृद्धि हुयी है इंगलिस शीन्स के प्रभाव में 11% का सुधार हुआ है, और 80 भाषाओं के बहुभाषी मॉडलों की औसत पहचान सटीकता में 5% से अधिक सुधार हुआ है।

    • रिलीज़ PPOCRLabelv2: टेबल टेबल रिकोगनाइजेशन टास्क की इंफॉर्मेशन एक्स्ट्रेक्शन टास्क और अनियमित टेक्सट इमेज के लिए एनोटेशन फ़ंक्शन एड करे।

    • इंटरएक्टिव ई-बुक जारी करें "ओसीआर में गोता लगाएँ", ओसीआर पूर्ण स्टैक तकनीक के अत्याधुनिक सिद्धांत और कोड प्रेक्टिस को कवर करता है।

  • और अधिक

🌟 विशेषताएँ

Paddleओसीआर से संबंधित विभिन्न प्रकार के अत्याधुनिक एल्गोरिथ्म को सपोर्ट करता है, और विकसित औद्योगिक विशेष रुप से प्रदर्शित मॉडल/समाधान PP- OCR और PP-Structure इस आधार पर और डेटा प्रोडक्शन की पूरी प्रोसेस के माध्यम से प्राप्त करें, मॉडल ट्रेनिंग, दबाव, अनुमान और तैनाती।

शीघ्र अनुभव

pip3 install paddlepaddle # for gpu user please install paddlepaddle-gpu
pip3 install paddleocr
paddleocr --image_dir /your/test/image.jpg --lang=hi

यदि आपके पास पायथन एनवायरनमेंट नहीं है, कृपया फॉलो कीजिए एनवायरनमेंट प्रिपेरेशन. हम अनुशंसा करते हैं कि आप इसके साथ शुरुआत करें ट्यूटोरियल.

📚 ई-बुक: ओसीआर में गोता लगाएँ

👫 समुदाय

अंतरराष्ट्रीय डेवलपर्स के लिए, हम सम्मान करते हैं [पैडलओसीआर चर्चाएँ] (https://github.com/PaddlePaddle/PaddleOCR/discussions) हमारे अंतरराष्ट्रीय कम्युनिटी मंच के रूप में। यहां सभी विचारों और प्रश्नों पर अंग्रेजी में चर्चा की जा सकती है।

🛠️ PP-ओसीआर श्रृंखला मॉडल सूची

मॉडल प्रस्तावना मॉडल नाम रिकमेंडिड सीन डिटेक्शन मॉडल रिकोगनाइजेशन मॉडल
हिन्दी:हिन्दी अल्ट्रा-लाइटवेट PP-OCRv3 सिस्टम (9.9M) devanagari_PP-OCRv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षितमॉडल इन्फरन्समॉडल / प्रशिक्षित मॉडल
इंग्लिश अल्ट्रा- लाइट वेट PP-OCRv3 मॉडल 13.4M en_PP-OCRv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षितमॉडल इन्फरन्समॉडल / प्रशिक्षित मॉडल
चाइनीस और इंग्लिश अल्ट्रा- लाइट वेट PP-OCRv3 मॉडल16.2M ch_PP-OCRv3_xx मोबाइल और सर्वर इन्फरन्स मॉडल / प्रशिक्षित मॉडल प्रशिक्षित मॉडल / प्रशिक्षित मॉडल

📖 ट्यूटोरियल

🇺🇳 नई भाषा अनुरोधों के लिए संयुक्त राष्ट्र दिशानिर्देश

अगर आप एक नए भाषा मॉडल का अनुरोध करना चाहते हैं, तो कृपया बहुभाषी मॉडल अपग्रेड के लिए वोट करें में वोट करें। हम नियमित रूप से परिणाम के अनुसार मॉडल को अपग्रेड करेंगे। अपने दोस्तों को एक साथ वोट करने के लिए आमंत्रित करें!

यदि आपको एक नए भाषा मॉडल को प्रशिक्षित करने अपने परिदृश्य के आधार पर, तो यह बहुभाषी मॉडल ट्रेनिंग प्रोजेक्ट ट्रेनिंग ट्यूटोरियल आपको डेटासेट तैयार करने में मदद करेगा और आपको स्टेप बाए स्टेप पूरा प्रोसेस दिखाएगा

मूल बहुभाषी ओसीआर विकास योजना अभी भी आपको बहुत सारे उपयोगी संग्रह और शब्दकोश दिखाता है

👀 विज़ुअलाइज़ेशन अधिक

PP-OCRv3 बहुभाषी मॉडल
PP-OCRv3 अंग्रेजी मॉडल
PP-OCRv3 चीनी मॉडल
PP-Structurev2 1. लेआउट एनालाइस + टेबल रिकोगनाइजेशन
2. SER (सिमेंटिक एंटिटी रिकोगनाइजेशन)
3. RE (रिलेशन एक्सट्रैक्शन)

📄 लाइसेंस

इस प्रोजेक्ट को इन परियोजना के तहत जारी किया गया है Apache 2.0 license