Parsowanie w przeglądarce · Plik binarny pozostaje lokalnie

Podsumuj PDF, którego plik binarny nigdy nie opuszcza Twojej przeglądarki.

Wędrują tylko wyodrębnione fragmenty tekstu — nigdy sam plik.

pdf.js parsuje lokalnie. Synteza AI działa po stronie serwera tylko na fragmentach tekstu.

✔ Bajty pliku nigdy nie są przesyłane ✔ Osadzone czcionki i obrazy pozostają lokalnie ✔ Weryfikowalne w DevTools

Ta strona traktuje prywatność jako twierdzenie techniczne, które możesz zweryfikować. PDF jest parsowany przez pdf.js w Twojej przeglądarce; plik binarny, osadzone czcionki i obrazy nigdy nie przekraczają sieci. Gdy uruchamiasz podsumowywanie, żądanie wysyłane do AI niesie tylko wyodrębnione fragmenty tekstu potrzebne do syntezy — nie sam dokument.

Jeśli zarządzasz materiałami pod NDA lub regulowanymi danymi, usunięcie przesyłania pliku z modelu zagrożeń to znacząca redukcja: brak kopii PDF po stronie serwera, brak okna przechowywania, brak zewnętrznego magazynu dokumentu. Połącz to z transferem z szyfrowaniem end-to-end, gdy potrzebujesz udostępnić oryginał obok podsumowania.

shieldPlik pozostaje w przeglądarce filter_altTylko fragmenty tekstu verified_userWeryfikowalne w DevTools policyBardziej zgodne z RODO

Dlaczego „bez przesyłania" naprawdę ma znaczenie

Prywatność to nie estetyka — to ograniczenie. Oto sytuacje, w których przesłanie PDF to nie kompromis, a wykluczenie.

gavel
Dokumenty pod NDA
Projekty M&A, term sheety, przeglądy kodu źródłowego, umowy z dostawcami. NDA zwykle zabrania „zewnętrznych przetwarzających" — przesyłanie do SaaS-owego narzędzia łamie ją. Podsumowywanie w przeglądarce trzyma plik poza granicą przesyłania.
balance
Branże regulowane
Workflow w opiece zdrowotnej, finansach, prawie i sektorze publicznym mają twarde zasady, gdzie można wysyłać dane osobowe lub uprzywilejowane. Przetwarzanie tylko lokalnie usuwa pytanie regulatora — bez DPA, bez listy podprzetwarzających.
work
Wrażliwe prace klienckie
Notatki strategii procesowej, siatki wynagrodzeń, prezentacje zarządu. Ryzyko, że nieaudytowany serwer trzyma nawet chwilową kopię, jest zawodowe, nie teoretyczne. Zero przesyłania usuwa okres przechowywania.
do_not_disturb_on
Pliki, których nie możesz umieścić na cudzym serwerze
Badania wewnętrzne, manuskrypty przed publikacją, audyty bezpieczeństwa, niejawne załączniki. Gdy polityka mówi „nie może opuścić urządzenia", podsumowywanie po stronie serwera odpada — w przeglądarce to jedyna zgodna ścieżka.

Jak zweryfikować, że plik binarny nie jest przesyłany

Potraktuj to jak audyt bezpieczeństwa. Trzy kroki, trzydzieści sekund — sam sprawdzasz ładunek żądania.

1
Otwórz DevTools → Sieć
Naciśnij F12 (lub Cmd+Option+I na macOS) i kliknij zakładkę Network. Użyj filtra Fetch/XHR, by szum aktywów statycznych Cię nie rozpraszał. Kliknij przycisk wyczyść (⊘), by zacząć z pustym logiem.
2
Wrzuć PDF i uruchom podsumowywanie
Otwórz podsumowywanie, wrzuć plik i kliknij podsumuj. Wrzucenie pliku nie uruchamia przesyłania — pdf.js parsuje go lokalnie. Kliknięcie „podsumuj" wysyła jedno żądanie do endpointu AI.
3
Sprawdź ładunek żądania
Kliknij żądanie podsumowania w panelu Network i otwórz zakładkę Payload. Zobaczysz wyodrębnione fragmenty tekstu — nigdy binarnego bloku wielkości Twojego PDF. Rozmiar ładunku będzie kilka KB niezależnie od tego, czy podsumowałeś 2 MB czy 200 MB dokument.
Elements Console Sources Network Performance
Nagrywanie · Filtr: Fetch/XHR · Zachowaj log
NazwaStatusTypCzas
filter_alt
/api/summarize · ładunek 4,2 KB
tylko wyodrębnione fragmenty tekstu · plik binarny nieprzesłany
1 żądanie · 4,2 KB wysłane Bajty pliku: 0

Co działa w Twojej przeglądarce vs po stronie serwera

Cztery etapy działają po stronie klienta; jeden na hostowanym LLM. Podział jest celowy, a granica to jedyna rzecz, która wędruje przez sieć.

description
Parsowanie PDF
pdf.js czyta strony, czcionki i strumienie treści lokalnie w Twojej karcie.
format_align_left
Ekstrakcja tekstu
Sekwencje glifów są przeformatowywane w czyste akapity z metadanymi pozycji na stronie.
grid_view
Dzielenie i wybór
Fragmenty potrzebne do podsumowania są wybierane po stronie klienta; reszta nigdy nie wędruje.
cloud
Synteza AI (serwer)
Wybrane fragmenty tekstu są wysyłane do hostowanego LLM (Anthropic Claude). Plik binarny PDF nie jest.
summarize
Renderowanie wyniku
Podsumowanie jest składane w karcie z cytowaniami stron prowadzącymi do lokalnych pozycji źródłowych.
verified
Przesłane bajty pliku
0
memoryTylko pomarańczowe pole opuszcza Twoje urządzenie — i niesie fragmenty tekstu, nigdy plik binarny, czcionek czy obrazów.

Przesyłanie do chmury vs w przeglądarce

Ten sam efekt końcowy — podsumowanie Twojego PDF — wytworzone przez dwie architektury o bardzo różnych modelach zagrożeń.

cloud_uploadPodsumowywanie z przesłaniem do chmury
  • Pełny plik binarny PDF przekracza publiczny internet do serwera, którego nie kontrolujesz.
  • Proces po stronie serwera trzyma plik (nawet chwilowo) w magazynie, którego nie możesz audytować.
  • Osadzone czcionki, obrazy i metadane wędrują wraz z tekstem dokumentu.
  • Okna retencji plików, logi dostępu i ekspozycja na wycieki dotyczą pliku binarnego.
  • Dostawca widzi nazwę pliku, rozmiar i strukturę dokumentu, nie tylko jego treść.
verified_userPDF Pro · tylko fragmenty tekstu
  • Plik binarny PDF pozostaje w karcie przeglądarki — pdf.js parsuje go lokalnie.
  • Kopia pliku po stronie serwera nigdy nie istnieje. Nie ma czego przechowywać ani co wyciekać.
  • Osadzone czcionki, obrazy i metadane nigdy nie wędrują przez sieć.
  • Do AI wysyłane są tylko wyodrębnione fragmenty tekstu potrzebne do podsumowania.
  • Cytowania stron są wyprowadzane w Twojej przeglądarce z lokalnych pozycji źródłowych, a potem łączone z punktami AI.
  • Zamknięcie karty zwalnia sparsowany PDF z pamięci — nie ma śladu pliku po stronie serwera.

Kiedy zachowanie pliku binarnego lokalnie ma znaczenie

Niektóre workflow traktują cały dokument — czcionki, obrazy, osadzone metadane — jako bardziej wrażliwy niż jego zwykły tekst. To konteksty, w których rozróżnienie plik-vs-fragmenty jest wymogiem.

lockDokumenty, których plik binarny jest wrażliwy
PDF-y, których osadzone czcionki, obrazy lub metadane ujawniają systemy źródłowe, znaki wodne lub wewnętrzne oznaczenia — nawet gdy sama proza jest do udostępnienia. Trzymanie pliku binarnego w przeglądarce zapobiega trafieniu tego odcisku do jakiegokolwiek zewnętrznego serwera.
routerSieci o ograniczonej przepustowości
200-megabajtowy segregator na połączeniu kawiarnianym lub w samolocie zajmuje minuty przesyłania, zanim cokolwiek się stanie. Parsowanie lokalnie i wysyłanie tylko fragmentów tekstu zwęża to do kilku KB ładunku niezależnie od rozmiaru pliku źródłowego.
policyMateriały pod NDA
Gdy NDA zabrania przesyłania samego dokumentu, ale milczy o podsumowaniach, architektura „plik pozostaje lokalnie" pozwala Ci pozostać w literze umowy: kopia PDF nie trafia do osób trzecich, tylko tekst potrzebny do syntezy.

Najczęściej zadawane pytania

Czy mogę naprawdę zweryfikować, że plik się nie przesyła?
Tak. Otwórz Chrome DevTools (F12), przełącz na zakładkę Network, filtruj po Fetch/XHR i wyczyść log. Wrzuć PDF do podsumowywania. Wrzucenie pliku nie uruchamia przesyłania — pdf.js parsuje go wewnątrz karty. Gdy klikniesz „podsumuj", kliknij powstałe żądanie i otwórz zakładkę Payload: zobaczysz wyodrębnione fragmenty tekstu, nie binarny blok wielkości Twojego PDF. Rozmiar ładunku to kilka KB niezależnie od rozmiaru pliku źródłowego, co jest dowodem, że plik binarny pozostał lokalnie.
Czy podsumowywanie potrzebuje połączenia z internetem?
Możesz wczytać i sparsować PDF offline, gdy strona jest w cache, ale samo podsumowanie wymaga połączenia. Synteza AI działa po stronie serwera na hostowanym LLM (Anthropic Claude), więc wyodrębnione fragmenty tekstu muszą zrobić sieciową rundę do API. Plik binarny tego nie robi — tylko tekst, którego AI potrzebuje, by napisać podsumowanie.
A model AI — czy nie jest hostowany na serwerze?
Tak — LLM, który pisze podsumowanie, jest hostowany (Anthropic Claude przez API). Tym, co nie jest hostowane, są parsowanie PDF, ekstrakcja tekstu, dzielenie i łączenie cytowań — działają one w Twojej przeglądarce dzięki pdf.js. Twierdzenie o prywatności jest precyzyjne i ograniczone: Twój plik binarny PDF, osadzone czcionki i obrazy nigdy nie wędrują do naszych serwerów ani do dostawcy AI. Przez sieć przechodzą tylko wyodrębnione fragmenty tekstu potrzebne do podsumowania. Jeśli Twoja troska to „czy sam plik trafia do osoby trzeciej", odpowiedź brzmi nie.
Dlaczego strona ładuje się chwilę, zanim mogę wrzucić plik?
Ta zwłoka to pobranie pdf.js i aktywów strony do lokalnego cache. Po pierwszym załadowaniu parsowanie nowego PDF jest natychmiastowe — tylko wywołanie syntezy AI (które niesie wyodrębniony tekst, nie plik) potrzebuje sieci.
Czy jest limit rozmiaru pliku?
Nie ma limitu przesyłania po stronie serwera, bo plik binarny nigdy nie jest przesyłany. Praktyczny pułap to dostępna pamięć Twojego urządzenia, ponieważ pdf.js wczytuje PDF do karty, by wyodrębnić tekst. Typowy laptop radzi sobie z PDF-ami 200-400 stron komfortowo; dłuższe dokumenty lepiej podsumowywać per rozdział. Przeglądarki mobilne mają węższe limity pamięci, więc bardzo długie PDF-y najlepiej przetwarzać na desktopie. Podsumowywanie nie ogranicza ani nie odrzuca po rozmiarze pliku źródłowego — mierzy liczbę miesięcznych wywołań AI.

Podsumuj PDF bez przesyłania pliku.

Otwórz podsumowywanie, wrzuć plik, przeczytaj podsumowanie. Potem otwórz DevTools, sprawdź ładunek żądania i potwierdź: fragmenty tekstu, nie plik binarny.

summarizeOtwórz podsumowywanie