PDF ProGuide
  • EnglishEnglish
  • DeutschGerman
  • EspañolSpanish
  • FrançaisFrench
  • ItalianoItalian
  • PolskiPolish
  • PortuguêsPortuguese
  • TürkçeTurkish
  • РусскийRussian
  • हिन्दीHindi
  • 日本語Japanese
  • 简体中文Chinese
    (Simplified)
Open the tool
होमगाइडस्कैन की हुई PDF पर OCR करें

PDF Pro OCR टूल से स्कैन की हुई PDF पर OCR कैसे करें — पेजों की छवियों को वास्तविक टेक्स्ट में बदलें।

2 मिनट पढ़ें 🎯 आसान 🛠 PDF Pro OCR

एक स्कैन की हुई PDF दस्तावेज़ जैसी दिखती है, लेकिन कंप्यूटर के लिए यह सिर्फ तस्वीरों का ढेर है — आप कोई नाम नहीं चुन सकते, इनवॉइस नंबर नहीं खोज सकते, या स्क्रीन रीडर से नहीं पढ़वा सकते। OCR वह चरण है जो उन तस्वीरों से वास्तविक, चुनने योग्य टेक्स्ट निकालता है। यह गाइड पाँच चरणों में पूरा काम पूरी तरह आपके ब्राउज़र टैब में करती है।

आपको क्या चाहिए

पाँच चरण

1

OCR टूल खोलें

PDF Pro OCR टूल पर जाएँ। पेज Tesseract पहचान इंजन के साथ WebAssembly के रूप में बंडल होकर लोड होता है, आपके CPU पर चलने के लिए तैयार। कोई साइनअप नहीं, कोई ईमेल-कन्फ़र्म वॉल नहीं, कोई दैनिक पेज काउंटर नहीं — और आपका स्कैन भेजने के लिए कोई अपलोड एंडपॉइंट नहीं।

2

अपनी स्कैन की हुई PDF चुनें

फ़ाइल को ड्रॉप ज़ोन पर खींचें या ब्राउज़ करने के लिए क्लिक करें। टूल इसे सीधे आपकी डिस्क से पढ़ता है और हर पेज का थंबनेल ग्रिड रेंडर करता है। यहीं टूल चुपचाप आपके पेजों को दो समूहों में बाँटता है: जिन पेजों में पहले से वास्तविक टेक्स्ट लेयर है, और केवल-इमेज पेज जिन्हें पूर्ण पहचान पास की ज़रूरत होगी।

3

पहचान भाषा चुनें

वह भाषा चुनें जो आपके दस्तावेज़ से मेल खाती हो। इंजन लैटिन-स्क्रिप्ट भाषाओं के साथ-साथ सिरिलिक, ग्रीक और अधिक को पहचानता है — और सही भाषा चुनना सबसे बड़ा सटीकता लाभ है जो आपके हाथ में है। किसी भाषा के पहले उपयोग पर, एक छोटी डेटा फ़ाइल (कुछ MB) डाउनलोड होती है और कैश हो जाती है, इसलिए उस भाषा में अगला रन तुरंत शुरू होता है।

4

OCR चलाएँ

OCR चलाएँ पर क्लिक करें। टूल आपके पेजों से दो गति से गुज़रता है: जिस पेज में पहले से वास्तविक टेक्स्ट लेयर है वह तुरंत और सटीक निकाला जाता है, जबकि केवल-इमेज पेज आपके CPU पर धीमे पहचान पास से गुज़रते हैं। एक प्रगति संकेतक दिखाता है कि कौन सा पेज पढ़ा जा रहा है — फ़ोटो वाले पेजों का लंबा स्कैन सबसे धीमा मामला है, इसलिए थोड़ा इंतज़ार करें।

5

निकाला गया टेक्स्ट कॉपी करें या सेव करें

जब पास पूरा हो जाए, परिणाम वास्तविक, चुनने योग्य टेक्स्ट है — पेज की एक और तस्वीर नहीं। इसे चुनें, क्लिपबोर्ड पर कॉपी करें, या सेव करें, फिर किसी दस्तावेज़ में पेस्ट करें, खोजें, या अनुवादक या सारांशकर्ता को दें। कुछ भी साइनअप या अपग्रेड के पीछे बंद नहीं है; पहचाना गया टेक्स्ट दिखते ही आपका है।

निकाला गया टेक्स्ट कॉपी करें

सामान्य गलतियाँ और सावधानियाँ

समस्या निवारण

कुछ पेज तुरंत क्यों पूरे हुए और कुछ में बहुत ज़्यादा समय क्यों लगा?

क्योंकि उन्हें अलग तरह से हैंडल किया गया। जिन पेजों में पहले से वास्तविक टेक्स्ट लेयर है वे OCR पूरी तरह छोड़ते हैं और तेज़, सटीक निष्कर्षण से गुज़रते हैं। केवल सच्चे केवल-इमेज पेज आपके CPU पर धीमे पहचान पास से गुज़रते हैं — इसलिए एक मिश्रित PDF दिखाई देते तरह से तेज़ और धीमी होती रहेगी।

पहचाने गए टेक्स्ट में त्रुटियाँ हैं। सटीकता कैसे सुधारें?

सटीकता लगभग पूरी तरह स्कैन पर निर्भर करती है। लगभग 300 DPI पर तेज़, सीधा और अच्छी रोशनी में फिर से स्कैन करें, सुनिश्चित करें कि पहचान भाषा दस्तावेज़ से मेल खाती है, और शुरू करने से पहले तिरछे पेजों को सीधा करें। साफ़ स्कैन पर मुद्रित टेक्स्ट बहुत अच्छी तरह पहचाना जाता है; कम कंट्रास्ट और धुंधलापन नुकसान करते हैं।

क्या मेरी स्कैन की गई फ़ाइल सर्वर पर अपलोड होती है?

नहीं। Tesseract इंजन आपके ब्राउज़र के अंदर चलता है, इसलिए स्कैन सीधे आपके डिवाइस से पढ़ी जाती है और कभी नहीं जाती। यदि आप इसकी पुष्टि करना चाहते हैं, तो DevTools खोलें, Network टैब पर जाएँ, और OCR चलाएँ — आपको शून्य फ़ाइल अपलोड दिखेंगे।

मेरा दस्तावेज़ दो भाषाओं में है। कौन सी चुनूँ?

दस्तावेज़ की प्रमुख भाषा चुनें और दूसरी पकड़ने के लिए वैकल्पिक अंग्रेज़ी पास जोड़ें। वास्तव में आधे-आधे पेज के लिए, वह संयोजन आमतौर पर किसी एक भाषा को अकेले चलाने से बेहतर होता है।

क्या ब्राउज़र बड़ा बहु-पेज स्कैन हैंडल कर सकता है?

हाँ — कोई कृत्रिम पेज सीमा नहीं है, क्योंकि पहचान आपके CPU का समय लेती है, सर्वर बिल नहीं। वास्तविक सीमा आपके ब्राउज़र की मेमोरी है, एक आधुनिक लैपटॉप पर लगभग 500 MB। कुछ-सौ-पेज स्कैन बस अधिक समय लेता है; फ़ोन पर, छोटे दस्तावेज़ों तक सीमित रहें।

स्कैन पर OCR करने के लिए तैयार हैं?

ब्राउज़र OCR टूल खोलें और अपनी स्कैन की हुई PDF को ऊपर के पाँच चरणों से चलाएँ।

टूल खोलें →

सभी संपादकीय गाइड