Summarize a PDF whose binary never leaves 你的浏览器。
只有提取的文本段落会传输——文件本身永远不会。
pdf.js在本地解析。AI合成仅在服务器端对文本段落运行。
✔ File bytes never upload
✔ Embedded fonts & images stay local
✔ Verifiable in DevTools
本页将隐私视为你可以验证的技术声明。PDF由你浏览器中的pdf.js解析;文件二进制、嵌入字体和图片从不经过网络传输。当你触发摘要时,发送给AI的请求只携带合成所需的提取文本段落——而非文档本身。
如果你处理受NDA约束的材料或受监管的记录,从威胁模型中去除文件上传是有意义的风险降低:服务器端没有PDF副本,没有保留窗口期,第三方不存储文档。配合使用 end-to-end encrypted transfer 当你需要在摘要旁共享原件时。
shield文件保留在浏览器中
filter_altText passages only
verified_userDevTools-verifiable
policyGDPR-friendlier
Why "no upload" actually matters
隐私不是美学——它是约束。这些是上传PDF不是一种权衡,而是根本不可行的情况。
NDA-bound documents
M&A草稿、条款清单、源代码审查、供应商合同。NDA可能规定"不得使用第三方处理商"——上传到SaaS摘要工具将违反该规定。浏览器内摘要使文件不进入上传边界。
Regulated industries
医疗、金融、法律和公共部门工作流程对个人身份信息或特权数据的传输地点有严格规定。仅本地处理完全消除了监管问题——无需DPA,无需子处理商列表。
Sensitive client work
诉讼策略备忘录、薪酬网格、董事会文件。未经审计的服务器持有哪怕是临时副本的风险是职业风险,而非理论上的。零上传消除了保留期。
不能放在他人服务器上的文件
仅限内部的研究、预发布手稿、安全审计、机密附件。如果政策规定"不得离开设备",服务器端摘要是不可行的——浏览器内摘要是唯一合规的路径。
如何验证文件二进制不会上传
像安全审计一样对待这件事。三个步骤,三十秒——你自己检查请求载荷。
1
Open DevTools → Network
Press F12 (or Cmd+Option+I 在macOS上)并点击 Network tab. Use the Fetch/XHR 过滤器,以避免静态资源噪音干扰。点击清除(⊘)按钮以空日志开始。
3
Inspect the request payload
在Network面板中点击摘要请求并打开 Payload 标签页。你将看到提取的文本段落——而非与你的PDF大小相当的二进制blob。无论你摘要的是2 MB还是200 MB的文档,载荷大小都将是几KB。
Elements
Console
Sources
Network
Performance
NameStatusTypeTime
filter_alt
/api/summarize · 4.2 KB payload
extracted text passages only · file binary not transmitted
1 request · 4.2 KB sent
File bytes: 0
浏览器中运行的内容 vs 服务器端运行的内容
四个阶段在客户端运行;一个在托管LLM上运行。这种划分是有意为之的,边界处传输的内容是唯一经过网络的东西。
description
PDF parsing
pdf.js在你的标签页中本地读取页面、字体和内容流。
→
format_align_left
Text extraction
字形序列被重新排版为带有页面位置元数据的整洁段落。
→
grid_view
Chunk & select
摘要所需的段落在客户端选取;其余部分从不传输。
cloud
AI synthesis (server)
选定的文本段落发送给托管LLM(Anthropic Claude)。PDF二进制文件不会。
→
summarize
Output rendering
摘要在标签页中生成,页面引用链接回本地来源位置。
verified
File bytes uploaded
0
memory只有橙色框的内容离开你的设备——它携带文本段落,而非文件二进制、字体或图片。
云端上传 vs 浏览器内处理
相同的最终结果——你的PDF摘要——由两种威胁模型截然不同的架构生成。
cloud_uploadCloud upload summarizer
- 完整的PDF二进制文件经由公共互联网传输到你无法控制的服务器。
- 服务器端进程在你无法审计的存储中持有文件(哪怕只是短暂的)。
- 嵌入字体、图片和元数据随文档文本一起传输。
- 文件保留窗口期、访问日志和泄露风险均适用于二进制文件。
- 提供商看到的是文档的文件名、大小和结构,而不仅仅是内容。
verified_userPDF Pro · text-passages-only
- PDF二进制文件保留在浏览器标签页中——pdf.js在本地解析。
- 服务器端从不存在文件副本。没有任何内容可供保留或泄露。
- 嵌入字体、图片和元数据从不经过网络传输。
- 只有所请求摘要所需的提取文本段落发送给AI。
- 页面引用在你的浏览器中从本地来源位置派生,然后链接回AI的要点。
- 关闭标签页会从内存中释放已解析的PDF——服务器端不留有任何文件痕迹。
保持文件二进制本地化很重要的场景
某些工作流程将完整文档——字体、图片、嵌入元数据——视为比纯文本更敏感。这些是文件与段落之区别成为必要条件的场景。
lockDocuments whose binary is sensitive
嵌入字体、图片或元数据揭示来源系统、水印或内部标记的PDF——即使文字本身可以共享。将二进制文件保留在浏览器中可防止该指纹到达任何第三方服务器。
routerBandwidth-constrained networks
在咖啡馆或机上网络连接下上传200 MB的文档在任何操作开始前需要几分钟。在本地解析并只发送文本段落可将载荷减少到几KB,与源文件大小无关。
policyNDA-bound material
当NDA禁止传输文档本身但对摘要保持沉默时,文件本地化架构让你保持在协议字面条款之内:没有PDF副本到达第三方,只有合成所需的文本。
Related privacy-first PDF tools
所有这些工具都将PDF二进制文件保留在浏览器中。部分工具完全在客户端运行(压缩、转换);AI工具只发送提取的文本段落。
Frequently asked questions
我真的可以验证文件不会上传吗?
可以。打开Chrome DevTools(F12),切换到Network标签页,按 Fetch/XHR过滤,并清除日志。将PDF拖入 summarizer。拖入文件不会触发上传——pdf.js在标签页内解析。点击摘要后,点击产生的请求并打开 Payload 标签页:你将看到提取的文本段落,而非与你的PDF大小相当的二进制blob。无论源文件大小如何,载荷大小均为几KB,这证明了二进制文件保留在本地。
摘要工具需要互联网连接吗?
页面缓存后你可以离线加载和解析PDF,但摘要本身需要连接。AI合成在托管LLM(Anthropic Claude)的服务器端运行,因此提取的文本段落需要通过网络往返到API。文件二进制不需要——只有AI生成摘要所需的文本需要。
What about the AI model — isn't it server-hosted?
是的——生成摘要的LLM是托管的(通过API的Anthropic Claude)。什么是 not 托管的是PDF解析、文本提取、分块和引用链接——这些通过pdf.js在你的浏览器中运行。隐私声明是精确且有边界的:你的PDF二进制文件、嵌入字体和图片从不传输到我们的服务器或AI提供商。只有所请求摘要所需的提取文本段落经过网络传输。如果你的担忧是"文件本身是否到达第三方",答案是否定的。
为什么页面需要片刻加载才能让我拖入文件?
该延迟是浏览器将pdf.js和页面资源获取到本地缓存。首次加载后,解析新PDF是即时的——只有AI合成调用(携带提取的文本,而非文件)需要网络。
有文件大小限制吗?
没有服务器端上传上限,因为文件二进制从不上传。实际上限是你设备的可用内存,因为pdf.js将PDF加载到标签页中以提取文本。典型笔记本电脑可舒适处理200–400页的PDF;较长的文档最好按章节摘要。移动浏览器的内存限制更紧,因此超长PDF最好在桌面端处理。摘要工具不会根据源文件大小进行限流或拒绝——它计量的是每月AI摘要调用次数。
在不上传文件的情况下摘要你的PDF。
打开摘要工具,拖入文件,阅读摘要。然后打开DevTools,检查请求载荷并确认:是文本段落,而非二进制文件。
summarizeOpen the Summarizer