Browser-Side Parsing · File Binary Stays Local

Summarize a PDF whose binary never leaves your browser.

Viaggiano solo i brani di testo estratti — mai il file stesso.

pdf.js esegue il parsing localmente. La sintesi AI viene eseguita lato server solo sui brani di testo.

✔ File bytes never upload ✔ Embedded fonts & images stay local ✔ Verifiable in DevTools

Questa pagina tratta la privacy come un'affermazione tecnica che puoi verificare. Il PDF viene analizzato da pdf.js nel tuo browser; il file binario, i font incorporati e le immagini non attraversano mai la rete. Quando avvii il riepilogo, la richiesta inviata all'AI contiene solo i brani di testo estratti necessari per la sintesi — non il documento stesso.

Se gestisci materiale soggetto a NDA o documenti regolamentati, rimuovere il caricamento del file dal modello di minaccia è la riduzione significativa: nessuna copia lato server del PDF, nessuna finestra di conservazione, nessuna archiviazione del documento da parte di terzi. Abbinalo a end-to-end encrypted transfer quando hai bisogno di condividere l'originale insieme al riepilogo.

shieldFile stays in browser filter_altText passages only verified_userDevTools-verifiable policyGDPR-friendlier

Why "no upload" actually matters

La privacy non è un'estetica — è un vincolo. Queste sono le situazioni in cui caricare il PDF non è un compromesso, è inaccettabile.

gavel
NDA-bound documents
Bozze di M&A, term sheet, revisioni del codice sorgente, contratti con fornitori. L'NDA probabilmente specifica «nessun processore di terze parti» — il caricamento su un riepilogatore SaaS lo viola. Il riepilogo nel browser mantiene il file fuori dal perimetro di caricamento.
balance
Regulated industries
I flussi di lavoro nel settore sanitario, finanziario, legale e pubblico hanno regole rigide su dove possono essere inviati dati personali o riservati. L'elaborazione solo locale elimina completamente la questione normativa — nessun DPA, nessun elenco di sub-responsabili.
work
Sensitive client work
Memo di strategia legale, griglie di compensazione, presentazioni per il consiglio. Il rischio che un server non verificato conservi anche solo una copia transitoria è professionale, non teorico. Il caricamento zero elimina il periodo di conservazione.
do_not_disturb_on
File che non puoi mettere sul server di qualcun altro
Ricerche solo interne, manoscritti pre-pubblicazione, audit di sicurezza, allegati riservati. Se la policy dice «non deve lasciare il dispositivo», il riepilogo lato server è escluso — il browser è l'unico percorso conforme.

Come verificare che il file binario non venga caricato

Trattalo come un audit di sicurezza. Tre passaggi, trenta secondi — controlli tu stesso il payload della richiesta.

1
Open DevTools → Network
Press F12 (or Cmd+Option+I su macOS) e clicca su Network tab. Use the Fetch/XHR filtro così il rumore degli asset statici non ti distrae. Clicca il pulsante cancella (⊘) per iniziare con un log vuoto.
2
Carica il tuo PDF e avvia il riepilogatore
Open the summarizer, carica un file e clicca su riassumi. Il caricamento del file non attiva alcun upload — pdf.js lo analizza localmente. Cliccando su riassumi viene inviata una richiesta all'endpoint AI.
3
Inspect the request payload
Clicca la richiesta di riepilogo nel pannello Network e apri la Payload scheda. Vedrai i brani di testo estratti — mai un blob binario delle dimensioni del tuo PDF. La dimensione del payload sarà di pochi KB indipendentemente dal fatto che tu abbia riassunto un documento da 2 MB o 200 MB.
Elements Console Sources Network Performance
Recording · Filter: Fetch/XHR · Preserve log
NameStatusTypeTime
filter_alt
/api/summarize · 4.2 KB payload
extracted text passages only · file binary not transmitted
1 request · 4.2 KB sent File bytes: 0

Cosa viene eseguito nel tuo browser vs lato server

Quattro fasi vengono eseguite lato client; una viene eseguita su un LLM ospitato. La suddivisione è intenzionale e il confine è l'unica cosa che viaggia sulla rete.

description
PDF parsing
pdf.js legge le pagine, i font e i flussi di contenuto localmente nella tua scheda.
format_align_left
Text extraction
Le sequenze di glifi vengono ridisposte in paragrafi puliti con metadati di posizione nella pagina.
grid_view
Chunk & select
I brani necessari per il riepilogo vengono selezionati lato client; il resto non viaggia mai.
cloud
AI synthesis (server)
I brani di testo selezionati vengono inviati a un LLM ospitato (Anthropic Claude). Il file PDF binario no.
summarize
Output rendering
Il riepilogo viene composto nella scheda con citazioni di pagina collegate alle posizioni sorgente locali.
verified
File bytes uploaded
0
memorySolo il riquadro arancione lascia il tuo dispositivo — e trasporta brani di testo, mai il file binario, font o immagini.

Cloud upload vs in-browser

Stesso risultato finale — un riepilogo del tuo PDF — prodotto da due architetture con modelli di minaccia molto diversi.

cloud_uploadCloud upload summarizer
  • Il file PDF binario completo attraversa la rete pubblica verso un server che non controlli.
  • Un processo lato server conserva il file (anche brevemente) in uno storage che non puoi verificare.
  • Font incorporati, immagini e metadati viaggiano insieme al testo del documento.
  • Finestre di conservazione dei file, log di accesso ed esposizione alle violazioni si applicano tutti al binario.
  • Il provider vede il nome del file del documento, le dimensioni e la struttura, non solo il suo contenuto.
verified_userPDF Pro · text-passages-only
  • Il file PDF binario rimane nella scheda del browser — pdf.js lo analizza localmente.
  • Non esiste mai una copia lato server del file. Non c'è nulla da conservare o far trapelare.
  • Font incorporati, immagini e metadati non viaggiano mai sulla rete.
  • Solo i brani di testo estratti necessari per il riepilogo richiesto vengono inviati all'AI.
  • Le citazioni di pagina vengono ricavate nel tuo browser dalle posizioni sorgente locali, poi collegate ai punti elenco dell'AI.
  • Chiudendo la scheda il PDF analizzato viene liberato dalla memoria — non c'è traccia lato server del file.

When keeping the file binary local matters

Alcuni flussi di lavoro trattano il documento completo — font, immagini, metadati incorporati — come più sensibile del suo testo normale. Questi sono i contesti in cui la distinzione file-vs-brani è un requisito.

lockDocuments whose binary is sensitive
PDF i cui font incorporati, immagini o metadati rivelano sistemi sorgente, filigrane o contrassegni interni — anche quando il testo stesso è condivisibile. Mantenere il binario nel browser impedisce a quella impronta digitale di raggiungere qualsiasi server di terze parti.
routerBandwidth-constrained networks
Un binder da 200 MB su una connessione in un bar o in volo richiede minuti per il caricamento prima che accada qualsiasi cosa. Il parsing locale e l'invio solo dei brani di testo riduce tutto a pochi KB di payload indipendentemente dalle dimensioni del file sorgente.
policyNDA-bound material
Quando un NDA vieta la trasmissione del documento stesso ma tace sui riepiloghi, l'architettura file-rimane-locale ti permette di restare nella lettera dell'accordo: nessuna copia del PDF raggiunge terze parti, solo il testo necessario per la sintesi.

Frequently asked questions

Can I really verify the file doesn't upload?
Sì. Apri Chrome DevTools (F12), passa alla scheda Network, filtra per Fetch/XHR, e cancella il log. Carica un PDF nel summarizer. Il caricamento del file non attiva alcun upload — pdf.js lo analizza all'interno della scheda. Quando clicchi su riassumi, clicca la richiesta risultante e apri la Payload scheda: vedrai i brani di testo estratti, non un blob binario delle dimensioni del tuo PDF. La dimensione del payload è di pochi KB indipendentemente dalle dimensioni del file sorgente, il che dimostra che il binario è rimasto in locale.
Il riepilogatore ha bisogno di una connessione internet?
Puoi caricare e analizzare un PDF offline una volta che la pagina è in cache, ma il riepilogo stesso richiede una connessione. La sintesi AI viene eseguita lato server su un LLM ospitato (Anthropic Claude), quindi i brani di testo estratti devono effettuare un round-trip di rete verso l'API. Il file binario no — solo il testo di cui l'AI ha bisogno per scrivere il riepilogo.
E il modello AI — non è ospitato su un server?
Sì — l'LLM che scrive il riepilogo è ospitato (Anthropic Claude tramite API). Ciò che not non è ospitato è il parsing PDF, l'estrazione del testo, la suddivisione e il collegamento delle citazioni — questi vengono eseguiti nel tuo browser tramite pdf.js. L'affermazione sulla privacy è precisa e delimitata: il tuo file PDF binario, i font incorporati e le immagini non raggiungono mai i nostri server né il provider AI. Solo i brani di testo estratti necessari per il riepilogo richiesto attraversano la rete. Se la tua preoccupazione è «il file stesso raggiunge una terza parte», la risposta è no.
Perché la pagina impiega un momento a caricarsi prima che possa caricare un file?
Quel ritardo è il browser che scarica pdf.js e gli asset della pagina nella cache locale. Dopo il primo caricamento, l'analisi di un nuovo PDF è istantanea — solo la chiamata di sintesi AI (che trasporta il testo estratto, non il file) ha bisogno della rete.
Is there a file-size limit?
Non esiste un limite di caricamento lato server perché il file binario non viene mai caricato. Il limite pratico è la memoria disponibile del tuo dispositivo, poiché pdf.js carica il PDF nella scheda per estrarre il testo. Un laptop tipico gestisce comodamente PDF da 200–400 pagine; i documenti più lunghi è meglio riassumerli per capitolo. I browser mobili hanno limiti di memoria più stretti, quindi i PDF molto lunghi è meglio elaborarli su desktop. Il riepilogatore non limiterà né rifiuterà in base alle dimensioni del file sorgente — ciò che misura è il numero di chiamate di riepilogo AI al mese.

Riassumi il tuo PDF senza caricare il file.

Apri il riepilogatore, carica un file, leggi il riepilogo. Poi apri DevTools, ispeziona il payload della richiesta e conferma: brani di testo, non il binario.

summarizeOpen the Summarizer