Browser-seitiges Parsing · Datei-Binärdatei bleibt lokal

Eine PDF zusammenfassen, deren Binärdatei den Browser nie verlässt.

Nur die extrahierten Textpassagen reisen — niemals die Datei selbst.

pdf.js parst lokal. Die KI-Synthese läuft serverseitig — nur auf den Textpassagen.

✔ Datei-Bytes werden nie hochgeladen ✔ Eingebettete Schriften & Bilder bleiben lokal ✔ In DevTools überprüfbar

Diese Seite behandelt Datenschutz als technische Aussage, die Sie überprüfen können. Die PDF wird von pdf.js in Ihrem Browser geparst; die Datei-Binärdatei, eingebettete Schriften und Bilder durchqueren das Netzwerk nie. Wenn Sie die Zusammenfassung auslösen, trägt die an die KI gesendete Anfrage nur die für die Synthese benötigten extrahierten Textpassagen — nicht das Dokument selbst.

Wenn Sie NDA-gebundenes Material oder regulierte Aufzeichnungen bearbeiten, ist die Entfernung des Datei-Uploads aus dem Bedrohungsmodell die sinnvolle Reduktion: keine serverseitige Kopie der PDF, kein Aufbewahrungsfenster, keine Drittanbieter-Speicherung des Dokuments. Kombinieren Sie es mit Ende-zu-Ende verschlüsselter Übertragung, wenn Sie das Original neben der Zusammenfassung teilen müssen.

shieldDatei bleibt im Browser filter_altNur Textpassagen verified_userDevTools-überprüfbar policyDSGVO-freundlicher

Warum „kein Upload" tatsächlich wichtig ist

Datenschutz ist keine Ästhetik — er ist eine Einschränkung. Das sind die Situationen, in denen das Hochladen der PDF kein Kompromiss, sondern ein Ausschlusskriterium ist.

gavel
NDA-gebundene Dokumente
M&A-Entwürfe, Term Sheets, Source-Code-Reviews, Lieferantenverträge. Das NDA nennt wahrscheinlich „keine Drittanbieter-Verarbeiter" — ein Upload zu einem SaaS-Zusammenfasser verletzt es. In-Browser-Zusammenfassung hält die Datei außerhalb der Upload-Grenze.
balance
Regulierte Branchen
Gesundheitswesen, Finanzen, Recht und öffentlicher Sektor haben harte Regeln, wohin personenbezogene oder privilegierte Daten gesendet werden dürfen. Nur-lokale Verarbeitung beseitigt die Regulator-Frage komplett — kein AVV, keine Auftragsverarbeiter-Liste.
work
Sensible Mandantenarbeit
Rechtsstreitstrategie-Memos, Vergütungsraster, Vorstands-Decks. Das Risiko eines ungeprüften Servers, der auch nur eine flüchtige Kopie hält, ist beruflich, nicht theoretisch. Zero-Upload entfernt die Aufbewahrungsperiode.
do_not_disturb_on
Dateien, die nicht auf fremde Server dürfen
Interne Forschung, Pre-Publication-Manuskripte, Sicherheitsaudits, klassifizierte Anhänge. Wenn die Richtlinie sagt „darf das Gerät nicht verlassen", ist serverseitige Zusammenfassung vom Tisch — In-Browser ist der einzige konforme Weg.

So überprüfen Sie, dass die Datei-Binärdatei nicht hochgeladen wird

Behandeln Sie es wie ein Sicherheitsaudit. Drei Schritte, dreißig Sekunden — Sie überprüfen die Anfrage-Payload selbst.

1
DevTools → Netzwerk öffnen
Drücken Sie F12 (oder Cmd+Option+I auf macOS) und klicken Sie auf den Tab Netzwerk. Verwenden Sie den Filter Fetch/XHR, damit statisches Asset-Rauschen Sie nicht ablenkt. Klicken Sie die Löschen-Schaltfläche (⊘), um mit einem leeren Log zu beginnen.
2
PDF ablegen und Zusammenfassung starten
Öffnen Sie die Zusammenfassung, legen Sie eine Datei ab und klicken Sie auf Zusammenfassen. Das Ablegen löst keinen Upload aus — pdf.js parst sie lokal. Klicken auf Zusammenfassen sendet eine Anfrage an den KI-Endpunkt.
3
Anfrage-Payload inspizieren
Klicken Sie die Zusammenfassen-Anfrage im Netzwerkpanel an und öffnen Sie den Tab Payload. Sie sehen die extrahierten Textpassagen — niemals einen binären Blob in der Größe Ihrer PDF. Die Payload-Größe wird einige KB betragen, unabhängig davon, ob Sie ein 2 MB- oder ein 200 MB-Dokument zusammengefasst haben.
Elemente Konsole Quellen Netzwerk Performance
Aufzeichnen · Filter: Fetch/XHR · Log behalten
NameStatusTypZeit
filter_alt
/api/summarize · 4,2 KB Payload
nur extrahierte Textpassagen · Datei-Binärdatei nicht übertragen
1 Anfrage · 4,2 KB gesendet Datei-Bytes: 0

Was im Browser läuft vs. serverseitig

Vier Stufen laufen clientseitig; eine läuft auf einem gehosteten LLM. Die Aufteilung ist beabsichtigt und die Grenze ist das einzige, was über das Netzwerk reist.

description
PDF-Parsing
pdf.js liest Seiten, Schriften und Inhaltsströme lokal in Ihrem Tab.
format_align_left
Textextraktion
Glyphenfolgen werden in saubere Absätze mit Seitenpositions-Metadaten umgeflossen.
grid_view
Auswählen & zerlegen
Für die Zusammenfassung benötigte Passagen werden clientseitig ausgewählt; der Rest reist nie.
cloud
KI-Synthese (Server)
Ausgewählte Textpassagen werden an ein gehostetes LLM (Anthropic Claude) gesendet. Die PDF-Binärdatei nicht.
summarize
Ausgabe-Rendering
Die Zusammenfassung wird im Tab erstellt, mit Seitenzitaten, die zurück zu lokalen Quellpositionen verlinken.
verified
Hochgeladene Datei-Bytes
0
memoryNur die orange Box verlässt Ihr Gerät — und sie trägt Textpassagen, niemals die Datei-Binärdatei, Schriften oder Bilder.

Cloud-Upload vs. im Browser

Gleiches Endergebnis — eine Zusammenfassung Ihrer PDF — produziert von zwei Architekturen mit sehr unterschiedlichen Bedrohungsmodellen.

cloud_uploadCloud-Upload-Zusammenfassung
  • Die komplette PDF-Binärdatei durchquert das öffentliche Internet zu einem Server, den Sie nicht kontrollieren.
  • Ein serverseitiger Prozess hält die Datei (auch kurz) in Speicher, den Sie nicht prüfen können.
  • Eingebettete Schriften, Bilder und Metadaten reisen mit dem Dokumenttext mit.
  • Aufbewahrungsfenster, Zugriffslogs und Breach-Exposition gelten alle für die Binärdatei.
  • Der Anbieter sieht Dateinamen, Größe und Struktur des Dokuments, nicht nur seinen Inhalt.
verified_userPDF Pro · nur Textpassagen
  • Die PDF-Binärdatei bleibt im Browser-Tab — pdf.js parst sie lokal.
  • Es existiert nie eine serverseitige Kopie der Datei. Es gibt nichts zu speichern oder zu leaken.
  • Eingebettete Schriften, Bilder und Metadaten reisen nie über das Netzwerk.
  • Nur die für die angeforderte Zusammenfassung benötigten extrahierten Textpassagen werden an die KI gesendet.
  • Seitenzitate werden in Ihrem Browser aus lokalen Quellpositionen abgeleitet und dann zurück zu den Bullets der KI verlinkt.
  • Das Schließen des Tabs gibt die geparste PDF aus dem Speicher frei — es gibt keine serverseitige Spur der Datei.

Wann das Behalten der Datei-Binärdatei lokal wichtig ist

Manche Workflows behandeln das vollständige Dokument — Schriften, Bilder, eingebettete Metadaten — als sensibler als seinen reinen Text. Das sind die Kontexte, in denen die Datei-vs.-Passagen-Unterscheidung die Anforderung ist.

lockDokumente, deren Binärdatei sensibel ist
PDFs, deren eingebettete Schriften, Bilder oder Metadaten Quellsysteme, Wasserzeichen oder interne Markierungen offenbaren — selbst wenn die Prosa selbst teilbar ist. Das Behalten der Binärdatei im Browser verhindert, dass dieser Fingerabdruck irgendeinen Drittanbieter-Server erreicht.
routerBandbreitenbeschränkte Netzwerke
Ein 200-MB-Ordner über eine Café- oder Inflight-Verbindung dauert Minuten zum Hochladen, bevor irgendetwas passiert. Lokal parsen und nur die Textpassagen senden reduziert das auf wenige KB Payload, unabhängig von der Quelldateigröße.
policyNDA-gebundenes Material
Wenn ein NDA das Übertragen des Dokuments selbst verbietet, aber zu Zusammenfassungen schweigt, lässt die Datei-bleibt-lokal-Architektur Sie im Wortlaut der Vereinbarung bleiben: Keine Kopie der PDF erreicht einen Dritten, nur der für die Synthese benötigte Text.

Häufig gestellte Fragen

Kann ich wirklich verifizieren, dass die Datei nicht hochgeladen wird?
Ja. Öffnen Sie Chrome DevTools (F12), wechseln Sie in den Netzwerk-Tab, filtern Sie nach Fetch/XHR und löschen Sie das Log. Legen Sie eine PDF in die Zusammenfassung. Das Ablegen der Datei löst keinen Upload aus — pdf.js parst sie im Tab. Wenn Sie auf Zusammenfassen klicken, klicken Sie die resultierende Anfrage an und öffnen den Tab Payload: Sie sehen die extrahierten Textpassagen, keinen binären Blob in der Größe Ihrer PDF. Die Payload-Größe ist wenige KB unabhängig von der Quelldateigröße — das ist der Beweis, dass die Binärdatei lokal blieb.
Benötigt die Zusammenfassung eine Internetverbindung?
Sie können eine PDF offline laden und parsen, sobald die Seite gecacht ist, aber die Zusammenfassung selbst benötigt eine Verbindung. Die KI-Synthese läuft serverseitig auf einem gehosteten LLM (Anthropic Claude), daher müssen die extrahierten Textpassagen einen Netzwerk-Roundtrip zur API machen. Die Datei-Binärdatei nicht — nur der Text, den die KI zum Schreiben der Zusammenfassung braucht.
Was ist mit dem KI-Modell — ist das nicht serverseitig?
Ja — das LLM, das die Zusammenfassung schreibt, ist gehostet (Anthropic Claude über API). Was nicht gehostet ist, sind PDF-Parsing, Textextraktion, Chunking und Zitatverknüpfung — die laufen in Ihrem Browser über pdf.js. Die Datenschutzaussage ist präzise und begrenzt: Ihre PDF-Binärdatei, eingebettete Schriften und Bilder reisen nie zu unseren Servern oder zum KI-Anbieter. Nur die für die angeforderte Zusammenfassung benötigten extrahierten Textpassagen überqueren die Leitung. Wenn Ihre Sorge ist „erreicht die Datei selbst einen Dritten", lautet die Antwort nein.
Warum braucht die Seite einen Moment zum Laden, bevor ich eine Datei ablegen kann?
Diese Verzögerung ist der Browser, der pdf.js und die Seitenressourcen in den lokalen Cache holt. Nach dem ersten Laden ist das Parsen einer neuen PDF sofort — nur der KI-Synthese-Aufruf (der den extrahierten Text trägt, nicht die Datei) benötigt das Netzwerk.
Gibt es eine Dateigrößenbegrenzung?
Es gibt keine serverseitige Upload-Obergrenze, weil die Datei-Binärdatei nie hochgeladen wird. Die praktische Grenze ist der verfügbare Speicher Ihres Geräts, da pdf.js die PDF zur Textextraktion in den Tab lädt. Ein typischer Laptop bewältigt 200–400-seitige PDFs problemlos; längere Dokumente lassen sich am besten kapitelweise zusammenfassen. Mobile Browser haben engere Speicherlimits, sehr lange PDFs verarbeitet man am besten auf dem Desktop. Die Zusammenfassung drosselt oder lehnt nicht aufgrund der Quelldateigröße ab — was sie misst, ist die Anzahl der KI-Zusammenfassungs-Aufrufe pro Monat.

Fassen Sie Ihre PDF zusammen, ohne die Datei hochzuladen.

Zusammenfassung öffnen, Datei ablegen, Zusammenfassung lesen. Dann DevTools öffnen, die Anfrage-Payload prüfen und bestätigen: Textpassagen, nicht die Binärdatei.

summarizeZusammenfassung öffnen