ब्राउज़र-साइड पार्सिंग · फ़ाइल बाइनरी स्थानीय रहती है

Summarize a PDF whose binary never leaves आपके ब्राउज़र।

केवल निकाले गए टेक्स्ट अनुच्छेद जाते हैं — फ़ाइल स्वयं कभी नहीं।

pdf.js स्थानीय रूप से पार्स करता है। AI संश्लेषण केवल टेक्स्ट अनुच्छेदों पर सर्वर-साइड चलता है।

✔ File bytes never upload ✔ Embedded fonts & images stay local ✔ Verifiable in DevTools

यह पेज गोपनीयता को एक तकनीकी दावे के रूप में मानता है जिसे आप सत्यापित कर सकते हैं। PDF को आपके ब्राउज़र में pdf.js द्वारा पार्स किया जाता है; फ़ाइल बाइनरी, एम्बेडेड फ़ॉन्ट और इमेज कभी नेटवर्क से नहीं गुज़रते। जब आप सारांश ट्रिगर करते हैं, AI को भेजे गए अनुरोध में केवल संश्लेषण के लिए आवश्यक निकाले गए टेक्स्ट अनुच्छेद होते हैं — दस्तावेज़ स्वयं नहीं।

यदि आप NDA-बाध्य सामग्री या विनियमित रिकॉर्ड संभालते हैं, तो खतरे के मॉडल से फ़ाइल अपलोड हटाना एक सार्थक कमी है: PDF की कोई सर्वर-साइड प्रति नहीं, कोई होल्डिंग विंडो नहीं, दस्तावेज़ का कोई तृतीय-पक्ष भंडारण नहीं। इसे जोड़ें end-to-end encrypted transfer जब आपको सारांश के साथ मूल साझा करना हो।

shieldफ़ाइल ब्राउज़र में रहती है filter_altText passages only verified_userDevTools-verifiable policyGDPR-friendlier

Why "no upload" actually matters

गोपनीयता एक सौंदर्यशास्त्र नहीं है — यह एक बाधा है। ये वे स्थितियाँ हैं जहाँ PDF अपलोड करना कोई समझौता नहीं है, यह बिल्कुल अस्वीकार्य है।

gavel
NDA-bound documents
M&A ड्राफ्ट, टर्म शीट, सोर्स-कोड समीक्षाएँ, आपूर्तिकर्ता अनुबंध। NDA में संभवतः «कोई तृतीय-पक्ष प्रोसेसर नहीं» लिखा है — SaaS सारांशकर्ता पर अपलोड करना इसका उल्लंघन है। इन-ब्राउज़र सारांश फ़ाइल को अपलोड सीमा से बाहर रखता है।
balance
Regulated industries
स्वास्थ्य सेवा, वित्त, कानूनी और सार्वजनिक क्षेत्र के कार्यप्रवाह में कठोर नियम हैं कि व्यक्तिगत रूप से पहचान योग्य या विशेषाधिकार प्राप्त डेटा कहाँ भेजा जा सकता है। केवल-स्थानीय प्रसंस्करण नियामक प्रश्न को पूरी तरह से हटा देता है — कोई DPA नहीं, कोई उप-प्रोसेसर सूची नहीं।
work
Sensitive client work
मुकदमेबाजी रणनीति मेमो, मुआवज़ा ग्रिड, बोर्ड डेक। एक ऑडिट-रहित सर्वर द्वारा अस्थायी प्रति भी रखने का जोखिम पेशेवर है, सैद्धांतिक नहीं। ज़ीरो-अपलोड होल्डिंग अवधि को हटाता है।
do_not_disturb_on
वे फ़ाइलें जो आप किसी अन्य के सर्वर पर नहीं रख सकते
केवल-आंतरिक शोध, प्रकाशन-पूर्व पांडुलिपियाँ, सुरक्षा ऑडिट, वर्गीकृत अनुलग्नक। यदि नीति कहती है «डिवाइस नहीं छोड़ना चाहिए», तो सर्वर-साइड सारांश विकल्प नहीं है — इन-ब्राउज़र ही एकमात्र अनुपालक पथ है।

यह सत्यापित करने के लिए कि फ़ाइल बाइनरी अपलोड नहीं होती

इसे सुरक्षा ऑडिट की तरह मानें। तीन चरण, तीस सेकंड — आप स्वयं अनुरोध पेलोड जाँचें।

1
Open DevTools → Network
Press F12 (or Cmd+Option+I macOS पर) और क्लिक करें Network tab. Use the Fetch/XHR फ़िल्टर करें ताकि स्टैटिक-एसेट शोर आपको विचलित न करे। खाली लॉग से शुरू करने के लिए क्लियर (⊘) बटन क्लिक करें।
2
अपनी PDF डालें और सारांशकर्ता चलाएं
Open the summarizer, एक फ़ाइल डालें, और सारांशित करें पर क्लिक करें। फ़ाइल डालने से कोई अपलोड नहीं होता — pdf.js इसे स्थानीय रूप से पार्स करता है। सारांशित करें पर क्लिक करने से AI एंडपॉइंट पर एक अनुरोध भेजा जाता है।
3
Inspect the request payload
Network पैनल में सारांशित अनुरोध पर क्लिक करें और खोलें Payload टैब। आप निकाले गए टेक्स्ट अनुच्छेद देखेंगे — कभी भी आपके PDF के आकार का बाइनरी ब्लॉब नहीं। पेलोड आकार कुछ KB होगा चाहे आपने 2 MB या 200 MB दस्तावेज़ का सारांश किया हो।
Elements Console Sources Network Performance
Recording · Filter: Fetch/XHR · Preserve log
NameStatusTypeTime
filter_alt
/api/summarize · 4.2 KB payload
extracted text passages only · file binary not transmitted
1 request · 4.2 KB sent File bytes: 0

आपके ब्राउज़र में क्या चलता है बनाम सर्वर-साइड

चार चरण क्लाइंट-साइड चलते हैं; एक होस्टेड LLM पर चलता है। यह विभाजन जानबूझकर है और सीमा ही एकमात्र चीज़ है जो नेटवर्क पर जाती है।

description
PDF parsing
pdf.js आपके टैब में स्थानीय रूप से पेज, फ़ॉन्ट और कंटेंट स्ट्रीम पढ़ता है।
format_align_left
Text extraction
ग्लिफ़ रन को पेज-पोजीशन मेटाडेटा के साथ साफ पैराग्राफ में पुनः प्रवाहित किया जाता है।
grid_view
Chunk & select
सारांश के लिए आवश्यक अनुच्छेद क्लाइंट-साइड चुने जाते हैं; बाकी कभी नहीं जाते।
cloud
AI synthesis (server)
चयनित टेक्स्ट अनुच्छेद एक होस्टेड LLM (Anthropic Claude) को भेजे जाते हैं। PDF बाइनरी नहीं।
summarize
Output rendering
सारांश टैब में स्थानीय स्रोत स्थितियों से जुड़े पेज उद्धरणों के साथ तैयार किया जाता है।
verified
File bytes uploaded
0
memoryकेवल नारंगी बॉक्स आपके डिवाइस से बाहर जाता है — और यह टेक्स्ट अनुच्छेद ले जाता है, कभी फ़ाइल बाइनरी, फ़ॉन्ट या इमेज नहीं।

क्लाउड अपलोड बनाम इन-ब्राउज़र

एक ही अंतिम परिणाम — आपके PDF का सारांश — बहुत अलग खतरे के मॉडल वाले दो आर्किटेक्चर द्वारा उत्पादित।

cloud_uploadCloud upload summarizer
  • पूर्ण PDF बाइनरी सार्वजनिक इंटरनेट पर एक ऐसे सर्वर तक जाती है जिसे आप नियंत्रित नहीं करते।
  • एक सर्वर-साइड प्रक्रिया फ़ाइल को (संक्षेप में भी) उस स्टोरेज में रखती है जिसे आप ऑडिट नहीं कर सकते।
  • एम्बेडेड फ़ॉन्ट, इमेज और मेटाडेटा दस्तावेज़ टेक्स्ट के साथ जाते हैं।
  • फ़ाइल-प्रतिधारण विंडो, एक्सेस लॉग और उल्लंघन एक्सपोज़र सभी बाइनरी पर लागू होते हैं।
  • प्रदाता दस्तावेज़ का फ़ाइलनाम, आकार और संरचना देखता है, केवल सामग्री नहीं।
verified_userPDF Pro · text-passages-only
  • PDF बाइनरी ब्राउज़र टैब में रहती है — pdf.js इसे स्थानीय रूप से पार्स करता है।
  • फ़ाइल की कोई सर्वर-साइड प्रति कभी मौजूद नहीं होती। बनाए रखने या लीक करने के लिए कुछ भी नहीं है।
  • एम्बेडेड फ़ॉन्ट, इमेज और मेटाडेटा कभी नेटवर्क पर नहीं जाते।
  • अनुरोधित सारांश के लिए आवश्यक केवल निकाले गए टेक्स्ट अनुच्छेद AI को भेजे जाते हैं।
  • पेज उद्धरण आपके ब्राउज़र में स्थानीय स्रोत स्थितियों से प्राप्त होते हैं, फिर AI की बुलेट से वापस जोड़े जाते हैं।
  • टैब बंद करने से पार्स किया गया PDF मेमोरी से रिलीज़ होता है — फ़ाइल का कोई सर्वर-साइड ट्रेस नहीं है।

जब फ़ाइल बाइनरी को स्थानीय रखना महत्वपूर्ण हो

कुछ वर्कफ़्लो पूरे दस्तावेज़ — फ़ॉन्ट, इमेज, एम्बेडेड मेटाडेटा — को उसके सादे टेक्स्ट से अधिक संवेदनशील मानते हैं। ये वे संदर्भ हैं जहाँ फ़ाइल-बनाम-अनुच्छेद का अंतर एक आवश्यकता है।

lockDocuments whose binary is sensitive
ऐसे PDF जिनके एम्बेडेड फ़ॉन्ट, इमेज या मेटाडेटा स्रोत सिस्टम, वॉटरमार्क या आंतरिक चिह्न प्रकट करते हैं — तब भी जब गद्य स्वयं साझा करने योग्य हो। बाइनरी को ब्राउज़र में रखने से वह फिंगरप्रिंट किसी तृतीय-पक्ष सर्वर तक नहीं पहुँचता।
routerBandwidth-constrained networks
कॉफ़ी-शॉप या इन-फ्लाइट कनेक्शन पर 200 MB बाइंडर अपलोड होने में मिनट लगते हैं। स्थानीय रूप से पार्स करने और केवल टेक्स्ट अनुच्छेद भेजने से स्रोत-फ़ाइल आकार की परवाह किए बिना यह कुछ KB पेलोड तक कम हो जाता है।
policyNDA-bound material
जब NDA दस्तावेज़ को प्रसारित करने से मना करता है लेकिन सारांश पर चुप है, तो फ़ाइल-स्थानीय-रहती है आर्किटेक्चर आपको समझौते के अक्षर के भीतर रहने देता है: PDF की कोई प्रति किसी तृतीय पक्ष तक नहीं पहुँचती, केवल संश्लेषण के लिए आवश्यक टेक्स्ट।

Related privacy-first PDF tools

ये सभी PDF बाइनरी को ब्राउज़र में रखते हैं। कुछ पूरी तरह से क्लाइंट-साइड हैं (कंप्रेस, कन्वर्ट); AI टूल केवल निकाले गए टेक्स्ट अनुच्छेद भेजते हैं।

Frequently asked questions

क्या मैं वास्तव में सत्यापित कर सकता हूँ कि फ़ाइल अपलोड नहीं होती?
हाँ। Chrome DevTools (F12) खोलें, Network टैब पर जाएं, फ़िल्टर करें Fetch/XHR, और लॉग साफ़ करें। PDF डालें summarizer। फ़ाइल डालने से कोई अपलोड नहीं होता — pdf.js इसे टैब के अंदर पार्स करता है। जब आप सारांशित करें क्लिक करते हैं, परिणामी अनुरोध पर क्लिक करें और खोलें Payload टैब: आप निकाले गए टेक्स्ट अनुच्छेद देखेंगे, आपके PDF के आकार का बाइनरी ब्लॉब नहीं। पेलोड आकार स्रोत-फ़ाइल आकार की परवाह किए बिना कुछ KB है, जो प्रमाण है कि बाइनरी स्थानीय रही।
क्या सारांशकर्ता को इंटरनेट कनेक्शन की आवश्यकता है?
एक बार पेज कैश हो जाने पर आप PDF को ऑफ़लाइन लोड और पार्स कर सकते हैं, लेकिन सारांश के लिए कनेक्शन आवश्यक है। AI संश्लेषण एक होस्टेड LLM (Anthropic Claude) पर सर्वर-साइड चलता है, इसलिए निकाले गए टेक्स्ट अनुच्छेदों को API तक नेटवर्क राउंड-ट्रिप करनी होती है। फ़ाइल बाइनरी नहीं — केवल वह टेक्स्ट जिसे AI सारांश लिखने के लिए चाहिए।
AI मॉडल के बारे में क्या — क्या वह सर्वर-होस्टेड नहीं है?
हाँ — सारांश लिखने वाला LLM होस्टेड है (Anthropic Claude API के माध्यम से)। जो नहीं है not होस्टेड वह है PDF पार्सिंग, टेक्स्ट निष्कर्षण, चंकिंग और उद्धरण लिंकिंग — वे pdf.js के माध्यम से आपके ब्राउज़र में चलती हैं। गोपनीयता का दावा सटीक और सीमित है: आपका PDF बाइनरी, एम्बेडेड फ़ॉन्ट और इमेज कभी हमारे सर्वर या AI प्रदाता तक नहीं जाते। केवल अनुरोधित सारांश के लिए आवश्यक निकाले गए टेक्स्ट अनुच्छेद नेटवर्क पार करते हैं। यदि आपकी चिंता «क्या फ़ाइल स्वयं किसी तृतीय पक्ष तक पहुँचती है» है, तो उत्तर नहीं है।
फ़ाइल डालने से पहले पेज लोड होने में एक पल क्यों लगता है?
वह देरी ब्राउज़र द्वारा pdf.js और पेज एसेट को स्थानीय कैश में लाने की है। पहली लोडिंग के बाद, नए PDF को पार्स करना तुरंत होता है — केवल AI संश्लेषण कॉल (जो निकाला गया टेक्स्ट ले जाती है, फ़ाइल नहीं) को नेटवर्क की ज़रूरत है।
क्या फ़ाइल साइज़ की कोई सीमा है?
कोई सर्वर-साइड अपलोड सीमा नहीं है क्योंकि फ़ाइल बाइनरी कभी अपलोड नहीं होती। व्यावहारिक सीमा आपके डिवाइस की उपलब्ध मेमोरी है, क्योंकि pdf.js PDF को टेक्स्ट निकालने के लिए टैब में लोड करता है। एक सामान्य लैपटॉप 200–400 पेज PDF को आराम से संभालता है; लंबे दस्तावेज़ों को प्रति अध्याय सारांशित करना सबसे अच्छा है। मोबाइल ब्राउज़र में कड़ी मेमोरी सीमाएँ हैं, इसलिए बहुत लंबे PDF को डेस्कटॉप पर संसाधित करना सबसे अच्छा है। सारांशकर्ता स्रोत-फ़ाइल आकार के आधार पर थ्रॉटल या अस्वीकार नहीं करेगा — यह प्रति माह AI सारांश कॉल की संख्या मापता है।

फ़ाइल अपलोड किए बिना अपनी PDF सारांशित करें।

सारांशकर्ता खोलें, एक फ़ाइल डालें, सारांश पढ़ें। फिर DevTools खोलें, अनुरोध पेलोड जाँचें, और पुष्टि करें: टेक्स्ट अनुच्छेद, बाइनरी नहीं।

summarizeOpen the Summarizer