Разбор в браузере · Бинарный файл остаётся локально

Резюме PDF, чей бинарник никогда не покидает браузер.

К ИИ идут только извлечённые текстовые фрагменты — никогда сам файл.

Разбор PDF в браузере + ИИ-синтез на сервере (Anthropic Claude) только по тексту.

✔ Байты файла никогда не загружаются ✔ Встроенные шрифты и изображения остаются локально ✔ Проверяемо в DevTools

На этой странице приватность — техническое заявление, которое вы можете проверить. PDF разбирается pdf.js в вашем браузере; бинарный файл, встроенные шрифты и изображения не пересекают сеть. Когда вы запускаете резюмирование, запрос к ИИ несёт только извлечённые текстовые фрагменты, нужные для синтеза, — а не сам документ.

Если вы работаете с материалами под NDA или регулируемыми записями, удаление загрузки файла из модели угроз — значимое снижение риска: ни серверной копии PDF, ни окна хранения, ни сторонних копий документа. Сочетайте с сквозно зашифрованной передачей, когда нужно поделиться оригиналом вместе с резюме.

shieldФайл остаётся в браузере filter_altТолько текстовые фрагменты verified_userПроверяемо в DevTools policyДружелюбнее к GDPR

Почему «без загрузки» действительно важно

Приватность — не эстетика, а ограничение. Вот ситуации, где загрузка PDF — не компромисс, а просто запрет.

gavel
Документы под NDA
Черновики M&A, term sheet'ы, ревью исходного кода, договоры с поставщиками. NDA, скорее всего, упоминает «без сторонних обработчиков» — загрузка в SaaS-резюмировщик нарушает его. Резюмирование в браузере оставляет файл за пределами зоны загрузки.
balance
Регулируемые отрасли
Медицина, финансы, юриспруденция, госсектор имеют жёсткие правила, куда можно отправлять персональные или привилегированные данные. Локальная обработка снимает вопрос регулятора целиком — никаких DPA и списков субпроцессоров.
work
Чувствительная клиентская работа
Меморандумы по судебной стратегии, сетки компенсаций, презентации совету директоров. Риск того, что неподтверждённый сервер хранит даже временную копию, — профессиональный, не теоретический. Без загрузки нет периода хранения.
do_not_disturb_on
Файлы, которые нельзя класть на чужой сервер
Внутренние исследования, рукописи до публикации, аудиты безопасности, классифицированные вложения. Если политика гласит «не должно покидать устройство» — серверное резюмирование исключено, единственный совместимый путь — в браузере.

Как проверить, что бинарный файл не загружается

Отнеситесь к этому как к аудиту безопасности. Три шага, тридцать секунд — вы сами проверяете полезную нагрузку запроса.

1
Откройте DevTools → Network
Нажмите F12 (или Cmd+Option+I на macOS) и кликните вкладку Network. Используйте фильтр Fetch/XHR, чтобы статические ассеты не отвлекали. Кликните «очистить» (⊘), чтобы начать с пустого лога.
2
Перетащите PDF и запустите резюмирование
Откройте резюмирование, перетащите файл, нажмите «резюмировать». Перетаскивание не вызывает загрузку — pdf.js разбирает локально. Клик по «резюмировать» отправляет один запрос на ИИ-эндпоинт.
3
Изучите полезную нагрузку
Кликните по запросу резюмирования в Network и откройте вкладку Payload. Вы увидите извлечённые текстовые фрагменты — а не двоичный блоб размером с ваш PDF. Размер payload будет в несколько КБ, независимо от того, резюмировали вы PDF на 2 МБ или на 200 МБ.
Elements Console Sources Network Performance
Запись · Фильтр: Fetch/XHR · Сохранять лог
ИмяСтатусТипВремя
filter_alt
/api/summarize · 4.2 КБ payload
только извлечённые фрагменты · бинарный файл не передаётся
1 запрос · 4.2 КБ отправлено Байт файла: 0

Что работает в браузере, а что на сервере

Четыре стадии — на стороне клиента; одна — на серверной LLM. Разделение намеренное, и через сеть идёт только эта граница.

description
Разбор PDF
pdf.js читает страницы, шрифты и потоки контента локально во вкладке.
format_align_left
Извлечение текста
Пробеги глифов перетекают в чистые абзацы с метаданными положения на странице.
grid_view
Чанк и выбор
Фрагменты, нужные для резюме, выбираются на клиенте; остальное никогда не передаётся.
cloud
ИИ-синтез (сервер)
Выбранные текстовые фрагменты идут на серверную LLM (Anthropic Claude). Бинарный PDF — нет.
summarize
Отрисовка результата
Резюме собирается во вкладке с цитатами на страницы, привязанными к локальным позициям источников.
verified
Загружено байт файла
0
memoryТолько оранжевый блок покидает устройство — и несёт текстовые фрагменты, никогда не сам файл, шрифты или изображения.

Облачная загрузка против локального разбора

Один и тот же результат — резюме PDF — производят две архитектуры с очень разными моделями угроз.

cloud_uploadОблачный резюмировщик
  • Полный бинарный PDF идёт через публичный интернет на сервер, который вы не контролируете.
  • Серверный процесс хранит файл (даже кратко) в хранилище, которое вы не можете аудировать.
  • Встроенные шрифты, изображения и метаданные путешествуют вместе с текстом документа.
  • Окна хранения, логи доступа, риски утечки — всё применимо к бинарнику.
  • Провайдер видит имя, размер и структуру документа, а не только содержимое.
verified_userPDF Pro · только текстовые фрагменты
  • Бинарный PDF остаётся во вкладке браузера — pdf.js разбирает его локально.
  • Серверной копии файла никогда не существует. Нечего хранить, нечему утекать.
  • Встроенные шрифты, изображения и метаданные никогда не идут по сети.
  • К ИИ идут только извлечённые текстовые фрагменты, нужные для запрошенного резюме.
  • Цитаты к источнику строятся в вашем браузере по локальным позициям и привязываются к пунктам ИИ.
  • Закрытие вкладки освобождает разобранный PDF из памяти — серверного следа файла нет.

Когда важно держать бинарник локально

Некоторые рабочие сценарии относятся к полному документу — шрифтам, изображениям, встроенным метаданным — как к более чувствительному, чем его текст. Вот контексты, где различие «файл против фрагментов» — это требование.

lockДокументы, чей бинарник чувствителен
PDF, чьи встроенные шрифты, изображения или метаданные раскрывают исходные системы, водяные знаки или внутренние пометки — даже если сам текст можно делиться. Хранение бинарника в браузере не даёт этому отпечатку дойти до стороннего сервера.
routerСети с ограниченной пропускной способностью
Папка на 200 МБ через кафе-Wi-Fi или борт самолёта — это минуты загрузки до того, как что-то начнётся. Локальный разбор и отправка только текстовых фрагментов ужимает это до нескольких КБ, независимо от размера исходника.
policyМатериалы под NDA
Когда NDA запрещает передачу самого документа, но молчит о резюме, архитектура «файл остаётся локально» позволяет вам остаться в букве соглашения: ни одна копия PDF не доходит до третьей стороны, передаётся только текст для синтеза.

Часто задаваемые вопросы

Можно ли действительно убедиться, что файл не загружается?
Да. Откройте Chrome DevTools (F12), вкладка Network, фильтр Fetch/XHR, очистите лог. Перетащите PDF в резюмировщик. Перетаскивание не вызывает загрузку — pdf.js разбирает внутри вкладки. Когда нажимаете «резюмировать», кликните по полученному запросу и откройте вкладку Payload: вы увидите извлечённые фрагменты, а не двоичный блоб размером с ваш PDF. Размер payload — несколько КБ независимо от размера исходника, что и есть доказательство, что бинарник остался локально.
Нужно ли инструменту интернет-соединение?
Можно загрузить и разобрать PDF офлайн, если страница уже в кэше, но само резюме требует подключения. ИИ-синтез работает на серверной LLM (Anthropic Claude), поэтому извлечённые текстовые фрагменты должны сделать сетевой круг к API. Бинарный файл — нет, только текст, нужный ИИ для написания резюме.
А ИИ-модель — она же серверная?
Да — LLM, которая пишет резюме, размещена на сервере (Anthropic Claude через API). Что не размещено — это разбор PDF, извлечение текста, чанкинг и проставление цитат: всё это работает в браузере через pdf.js. Заявление о приватности точное и ограниченное: ваш бинарный PDF, встроенные шрифты и изображения никогда не идут на наши серверы или к ИИ-провайдеру. По сети идут только извлечённые текстовые фрагменты, нужные для запрошенного резюме. Если ваш вопрос «доходит ли сам файл до третьей стороны», ответ — нет.
Почему страница загружается какое-то время, прежде чем можно перетащить файл?
Эта задержка — браузер загружает pdf.js и ассеты страницы в локальный кэш. После первой загрузки разбор нового PDF мгновенный — сети требует только вызов ИИ-синтеза (несущий извлечённый текст, не файл).
Есть ли ограничение по размеру файла?
Серверного лимита на загрузку нет, потому что бинарный файл не загружается. Практический потолок — доступная память устройства, поскольку pdf.js загружает PDF во вкладку для извлечения текста. Обычный ноутбук уверенно справляется с 200–400 страничными PDF; более длинные документы лучше резюмировать по главам. У мобильных браузеров память жёстче — очень длинные PDF лучше обрабатывать на десктопе. Резюмирование не отбрасывает файлы по размеру — оно меряет число вызовов ИИ в месяц.

Резюмируйте PDF без загрузки файла.

Откройте резюмирование, перетащите файл, прочитайте резюме. Затем откройте DevTools, изучите payload запроса и убедитесь: текстовые фрагменты, не бинарник.

summarizeОткрыть резюмирование