Does the summarizer need an internet connection?

You can load and parse the PDF offline once the page is cached, but the summary itself requires a connection because the AI synthesis runs server-side on a hosted LLM (Anthropic Claude). When you click summarize, the extracted text passages are sent to the API and the response comes back to your browser for rendering. The file binary stays local; the text passages do not.

What about the AI model — isn't it server-hosted?

Yes — the LLM that writes the summary is hosted (Anthropic Claude via API). What is not hosted is the PDF parsing, text extraction, and citation linking — those run in your browser via pdf.js. The privacy claim is precise: your PDF binary, embedded fonts, and images never travel to our servers or the AI provider. Only the extracted text passages required for the requested summary are sent over the wire.

Why does the page take a moment to load before I can drop a file?

That delay is the browser fetching pdf.js and the page assets into local cache. After first load, parsing a new PDF is instant — only the AI synthesis call (which carries the extracted text) needs the network.

Browser-Side Parsing · File Binary Stays Local

Summarize a PDF whose binary never leaves your browser.

Viaggiano solo i brani di testo estratti — mai il file stesso.

pdf.js esegue il parsing localmente. La sintesi AI viene eseguita lato server solo sui brani di testo.

✔ File bytes never upload ✔ Embedded fonts & images stay local ✔ Verifiable in DevTools

Questa pagina tratta la privacy come un'affermazione tecnica che puoi verificare. Il PDF viene analizzato da pdf.js nel tuo browser; il file binario, i font incorporati e le immagini non attraversano mai la rete. Quando avvii il riepilogo, la richiesta inviata all'AI contiene solo i brani di testo estratti necessari per la sintesi — non il documento stesso.

Se gestisci materiale soggetto a NDA o documenti regolamentati, rimuovere il caricamento del file dal modello di minaccia è la riduzione significativa: nessuna copia lato server del PDF, nessuna finestra di conservazione, nessuna archiviazione del documento da parte di terzi. Abbinalo a end-to-end encrypted transfer quando hai bisogno di condividere l'originale insieme al riepilogo.

shieldFile stays in browser filter_altText passages only verified_userDevTools-verifiable policyGDPR-friendlier

summarizeOpen the Summarizer Verify it yourself

Why "no upload" actually matters

La privacy non è un'estetica — è un vincolo. Queste sono le situazioni in cui caricare il PDF non è un compromesso, è inaccettabile.

gavel

NDA-bound documents

Bozze di M&A, term sheet, revisioni del codice sorgente, contratti con fornitori. L'NDA probabilmente specifica «nessun processore di terze parti» — il caricamento su un riepilogatore SaaS lo viola. Il riepilogo nel browser mantiene il file fuori dal perimetro di caricamento.

balance

Regulated industries

I flussi di lavoro nel settore sanitario, finanziario, legale e pubblico hanno regole rigide su dove possono essere inviati dati personali o riservati. L'elaborazione solo locale elimina completamente la questione normativa — nessun DPA, nessun elenco di sub-responsabili.

work

Sensitive client work

Memo di strategia legale, griglie di compensazione, presentazioni per il consiglio. Il rischio che un server non verificato conservi anche solo una copia transitoria è professionale, non teorico. Il caricamento zero elimina il periodo di conservazione.

do_not_disturb_on

File che non puoi mettere sul server di qualcun altro

Ricerche solo interne, manoscritti pre-pubblicazione, audit di sicurezza, allegati riservati. Se la policy dice «non deve lasciare il dispositivo», il riepilogo lato server è escluso — il browser è l'unico percorso conforme.

Come verificare che il file binario non venga caricato

Trattalo come un audit di sicurezza. Tre passaggi, trenta secondi — controlli tu stesso il payload della richiesta.

Open DevTools → Network

Press F12 (or Cmd+Option+I su macOS) e clicca su Network tab. Use the Fetch/XHR filtro così il rumore degli asset statici non ti distrae. Clicca il pulsante cancella (⊘) per iniziare con un log vuoto.

Carica il tuo PDF e avvia il riepilogatore

Open the summarizer, carica un file e clicca su riassumi. Il caricamento del file non attiva alcun upload — pdf.js lo analizza localmente. Cliccando su riassumi viene inviata una richiesta all'endpoint AI.

Inspect the request payload

Clicca la richiesta di riepilogo nel pannello Network e apri la Payload scheda. Vedrai i brani di testo estratti — mai un blob binario delle dimensioni del tuo PDF. La dimensione del payload sarà di pochi KB indipendentemente dal fatto che tu abbia riassunto un documento da 2 MB o 200 MB.

Elements Console Sources Network Performance

NameStatusTypeTime

filter_alt

/api/summarize · 4.2 KB payload

extracted text passages only · file binary not transmitted

1 request · 4.2 KB sent File bytes: 0

Cosa viene eseguito nel tuo browser vs lato server

Quattro fasi vengono eseguite lato client; una viene eseguita su un LLM ospitato. La suddivisione è intenzionale e il confine è l'unica cosa che viaggia sulla rete.

description

PDF parsing

pdf.js legge le pagine, i font e i flussi di contenuto localmente nella tua scheda.

→

format_align_left

Text extraction

Le sequenze di glifi vengono ridisposte in paragrafi puliti con metadati di posizione nella pagina.

→

grid_view

Chunk & select

I brani necessari per il riepilogo vengono selezionati lato client; il resto non viaggia mai.

cloud

AI synthesis (server)

I brani di testo selezionati vengono inviati a un LLM ospitato (Anthropic Claude). Il file PDF binario no.

→

summarize

Output rendering

Il riepilogo viene composto nella scheda con citazioni di pagina collegate alle posizioni sorgente locali.

verified

File bytes uploaded

memorySolo il riquadro arancione lascia il tuo dispositivo — e trasporta brani di testo, mai il file binario, font o immagini.

Cloud upload vs in-browser

Stesso risultato finale — un riepilogo del tuo PDF — prodotto da due architetture con modelli di minaccia molto diversi.

cloud_uploadCloud upload summarizer

Il file PDF binario completo attraversa la rete pubblica verso un server che non controlli.
Un processo lato server conserva il file (anche brevemente) in uno storage che non puoi verificare.
Font incorporati, immagini e metadati viaggiano insieme al testo del documento.
Finestre di conservazione dei file, log di accesso ed esposizione alle violazioni si applicano tutti al binario.
Il provider vede il nome del file del documento, le dimensioni e la struttura, non solo il suo contenuto.

verified_userPDF Pro · text-passages-only

Il file PDF binario rimane nella scheda del browser — pdf.js lo analizza localmente.
Non esiste mai una copia lato server del file. Non c'è nulla da conservare o far trapelare.
Font incorporati, immagini e metadati non viaggiano mai sulla rete.
Solo i brani di testo estratti necessari per il riepilogo richiesto vengono inviati all'AI.
Le citazioni di pagina vengono ricavate nel tuo browser dalle posizioni sorgente locali, poi collegate ai punti elenco dell'AI.
Chiudendo la scheda il PDF analizzato viene liberato dalla memoria — non c'è traccia lato server del file.

When keeping the file binary local matters

Alcuni flussi di lavoro trattano il documento completo — font, immagini, metadati incorporati — come più sensibile del suo testo normale. Questi sono i contesti in cui la distinzione file-vs-brani è un requisito.

lockDocuments whose binary is sensitive

PDF i cui font incorporati, immagini o metadati rivelano sistemi sorgente, filigrane o contrassegni interni — anche quando il testo stesso è condivisibile. Mantenere il binario nel browser impedisce a quella impronta digitale di raggiungere qualsiasi server di terze parti.

routerBandwidth-constrained networks

Un binder da 200 MB su una connessione in un bar o in volo richiede minuti per il caricamento prima che accada qualsiasi cosa. Il parsing locale e l'invio solo dei brani di testo riduce tutto a pochi KB di payload indipendentemente dalle dimensioni del file sorgente.

policyNDA-bound material

Quando un NDA vieta la trasmissione del documento stesso ma tace sui riepiloghi, l'architettura file-rimane-locale ti permette di restare nella lettera dell'accordo: nessuna copia del PDF raggiunge terze parti, solo il testo necessario per la sintesi.

Strumenti PDF orientati alla privacy correlati

Tutti questi mantengono il file PDF binario nel browser. Alcuni sono completamente lato client (comprimi, converti); gli strumenti AI inviano solo brani di testo estratti.

Domande frequenti

Can I really verify the file doesn't upload?

Sì. Apri Chrome DevTools (F12), passa alla scheda Network, filtra per Fetch/XHR, e cancella il log. Carica un PDF nel summarizer. Il caricamento del file non attiva alcun upload — pdf.js lo analizza all'interno della scheda. Quando clicchi su riassumi, clicca la richiesta risultante e apri la Payload scheda: vedrai i brani di testo estratti, non un blob binario delle dimensioni del tuo PDF. La dimensione del payload è di pochi KB indipendentemente dalle dimensioni del file sorgente, il che dimostra che il binario è rimasto in locale.

Il riepilogatore ha bisogno di una connessione internet?

Puoi caricare e analizzare un PDF offline una volta che la pagina è in cache, ma il riepilogo stesso richiede una connessione. La sintesi AI viene eseguita lato server su un LLM ospitato (Anthropic Claude), quindi i brani di testo estratti devono effettuare un round-trip di rete verso l'API. Il file binario no — solo il testo di cui l'AI ha bisogno per scrivere il riepilogo.

E il modello AI — non è ospitato su un server?

Sì — l'LLM che scrive il riepilogo è ospitato (Anthropic Claude tramite API). Ciò che not non è ospitato è il parsing PDF, l'estrazione del testo, la suddivisione e il collegamento delle citazioni — questi vengono eseguiti nel tuo browser tramite pdf.js. L'affermazione sulla privacy è precisa e delimitata: il tuo file PDF binario, i font incorporati e le immagini non raggiungono mai i nostri server né il provider AI. Solo i brani di testo estratti necessari per il riepilogo richiesto attraversano la rete. Se la tua preoccupazione è «il file stesso raggiunge una terza parte», la risposta è no.

Perché la pagina impiega un momento a caricarsi prima che possa caricare un file?

Quel ritardo è il browser che scarica pdf.js e gli asset della pagina nella cache locale. Dopo il primo caricamento, l'analisi di un nuovo PDF è istantanea — solo la chiamata di sintesi AI (che trasporta il testo estratto, non il file) ha bisogno della rete.

Is there a file-size limit?

Non esiste un limite di caricamento lato server perché il file binario non viene mai caricato. Il limite pratico è la memoria disponibile del tuo dispositivo, poiché pdf.js carica il PDF nella scheda per estrarre il testo. Un laptop tipico gestisce comodamente PDF da 200–400 pagine; i documenti più lunghi è meglio riassumerli per capitolo. I browser mobili hanno limiti di memoria più stretti, quindi i PDF molto lunghi è meglio elaborarli su desktop. Il riepilogatore non limiterà né rifiuterà in base alle dimensioni del file sorgente — ciò che misura è il numero di chiamate di riepilogo AI al mese.

Riassumi il tuo PDF senza caricare il file.

Apri il riepilogatore, carica un file, leggi il riepilogo. Poi apri DevTools, ispeziona il payload della richiesta e conferma: brani di testo, non il binario.

summarizeOpen the Summarizer