ブラウザサイド解析 · ファイルバイナリはローカルに留まる

Summarize a PDF whose binary never leaves ブラウザに。

移動するのは抽出されたテキストパッセージのみ—ファイル自体は移動しません。

pdf.jsはローカルで解析します。AI合成はテキストパッセージのみをサーバーサイドで処理します。

✔ File bytes never upload ✔ Embedded fonts & images stay local ✔ Verifiable in DevTools

このページはプライバシーを検証可能な技術的主張として扱います。PDFはブラウザ内でpdf.jsによって解析され、ファイルバイナリ、埋め込みフォント、画像はネットワークを通過しません。要約をトリガーすると、AIに送信されるリクエストには合成に必要な抽出されたテキストパッセージのみが含まれ、文書自体は含まれません。

NDA拘束の資料や規制された記録を扱う場合、脅威モデルからファイルアップロードを排除することが意味のある削減です:PDFのサーバーサイドコピーなし、保持期間なし、文書のサードパーティストレージなし。 end-to-end encrypted transfer 要約と一緒に原本を共有する必要がある場合に組み合わせてください。

shieldファイルはブラウザに留まる filter_altText passages only verified_userDevTools-verifiable policyGDPR-friendlier

Why "no upload" actually matters

プライバシーは美学ではなく制約です。PDFのアップロードがトレードオフではなく、そもそも選択肢にならない状況があります。

gavel
NDA-bound documents
M&Aドラフト、タームシート、ソースコードレビュー、サプライヤー契約。NDAは「サードパーティプロセッサ不可」を規定していることが多く、SaaS要約ツールへのアップロードはそれに違反します。ブラウザ内要約はファイルをアップロード境界の外に保ちます。
balance
Regulated industries
ヘルスケア、金融、法務、公共部門のワークフローには、個人識別可能データや特権的データの送信先に関する厳しいルールがあります。ローカル専用処理により規制上の問題が完全になくなります—DPAなし、サブプロセッサリストなし。
work
Sensitive client work
訴訟戦略メモ、報酬グリッド、取締役会デッキ。監査されていないサーバーが一時的なコピーでも保持するリスクは、理論的ではなく専門的な問題です。ゼロアップロードにより保持期間がなくなります。
do_not_disturb_on
他者のサーバーに置けないファイル
社内限定の調査、出版前の原稿、セキュリティ監査、機密添付ファイル。ポリシーが「デバイスを離れてはならない」と規定している場合、サーバーサイドの要約は選択肢から外れます—ブラウザ内が唯一のコンプライアンス対応の方法です。

ファイルバイナリがアップロードされないことを確認する方法

セキュリティ監査のように扱ってください。3ステップ、30秒—リクエストペイロードを自分で確認します。

1
Open DevTools → Network
Press F12 (or Cmd+Option+I (macOSの場合)クリックして Network tab. Use the Fetch/XHR フィルターを適用して静的アセットのノイズを除外します。クリア(⊘)ボタンをクリックして空のログから開始します。
2
PDFをドロップして要約ツールを実行してください
Open the summarizer、ファイルをドロップして要約をクリックします。ファイルをドロップしてもアップロードは発生しません—pdf.jsがローカルで解析します。要約をクリックするとAIエンドポイントへの1つのリクエストが発生します。
3
Inspect the request payload
Networkパネルで要約リクエストをクリックして Payload タブを開きます。PDFのサイズと同じバイナリブロブではなく、抽出されたテキストパッセージが表示されます。ペイロードサイズは2MBか200MBのドキュメントを要約したかどうかに関わらず数KBになります。
Elements Console Sources Network Performance
Recording · Filter: Fetch/XHR · Preserve log
NameStatusTypeTime
filter_alt
/api/summarize · 4.2 KB payload
extracted text passages only · file binary not transmitted
1 request · 4.2 KB sent File bytes: 0

ブラウザ内で実行されるものとサーバーサイドで実行されるものの違い

4つのステージはクライアントサイドで実行され、1つはホストされたLLM上で実行されます。この分割は意図的なものであり、ネットワークを通過するのは境界部分のみです。

description
PDF parsing
pdf.jsはページ、フォント、コンテンツストリームをタブ内でローカルに読み取ります。
format_align_left
Text extraction
グリフランは、ページ位置メタデータを持つきれいな段落に再フローされます。
grid_view
Chunk & select
要約に必要なパッセージはクライアントサイドで選択され、残りはネットワークを通過しません。
cloud
AI synthesis (server)
選択されたテキストパッセージはホストされたLLM(Anthropic Claude)に送信されます。PDFバイナリは送信されません。
summarize
Output rendering
要約はローカルソース位置にリンクされたページ引用を含むタブ内で作成されます。
verified
File bytes uploaded
0
memoryデバイスを離れるのはオレンジのボックスのみ—そしてそれはテキストパッセージを運び、ファイルバイナリ、フォント、画像は運びません。

クラウドアップロード vs ブラウザ内処理

同じ最終結果—PDFの要約—が、脅威モデルが大きく異なる2つのアーキテクチャによって生成されます。

cloud_uploadCloud upload summarizer
  • 完全なPDFバイナリが、制御できないサーバーへパブリックインターネットを経由して送信されます。
  • サーバーサイドプロセスが(一時的にでも)監査できないストレージにファイルを保持します。
  • 埋め込みフォント、画像、メタデータが文書テキストと一緒に送信されます。
  • ファイル保持期間、アクセスログ、侵害リスクがすべてバイナリに適用されます。
  • プロバイダーはコンテンツだけでなく、ドキュメントのファイル名、サイズ、構造を見ます。
verified_userPDF Pro · text-passages-only
  • PDFバイナリはブラウザタブに留まります—pdf.jsがローカルで解析します。
  • ファイルのサーバーサイドコピーは存在しません。保持するものも漏洩するものも何もありません。
  • 埋め込みフォント、画像、メタデータはネットワークを通過しません。
  • 要求された要約に必要な抽出されたテキストパッセージのみがAIに送信されます。
  • ページ引用はローカルソース位置からブラウザ内で導き出され、AIの箇条書きにリンクバックされます。
  • タブを閉じると解析されたPDFがメモリから解放されます—ファイルのサーバーサイドの痕跡はありません。

ファイルバイナリをローカルに保持することが重要な場合

一部のワークフローでは、完全な文書(フォント、画像、埋め込みメタデータ)をプレーンテキストよりも機密性が高いものとして扱います。これらはファイル対パッセージの区別が要件となるコンテキストです。

lockDocuments whose binary is sensitive
埋め込みフォント、画像、またはメタデータがソースシステム、透かし、または内部マーキングを明らかにするPDF—散文自体が共有可能であっても。バイナリをブラウザに保持することで、そのフィンガープリントがサードパーティサーバーに届くのを防ぎます。
routerBandwidth-constrained networks
カフェや機内接続で200MBのバインダーをアップロードするには、何かが起こる前に数分かかります。ローカルで解析してテキストパッセージのみを送信することで、ソースファイルサイズに関わらず数KBのペイロードに圧縮されます。
policyNDA-bound material
NDAが文書自体の送信を禁止しているが要約については沈黙している場合、ファイルローカル保持アーキテクチャにより契約の文字通りの規定に従えます:PDFのコピーはサードパーティに届かず、合成に必要なテキストのみが送信されます。

Frequently asked questions

ファイルがアップロードされないことを本当に確認できますか?
はい。Chrome DevToolsを開き(F12)、Networkタブに切り替えて、フィルターを Fetch/XHRに設定し、ログをクリアしてください。PDFを summarizerにドロップします。ファイルをドロップしてもアップロードは発生しません—pdf.jsがタブ内で解析します。要約をクリックすると、結果のリクエストをクリックして Payload タブを開きます:PDFのサイズと同じバイナリブロブではなく、抽出されたテキストパッセージが表示されます。ペイロードサイズはソースファイルサイズに関わらず数KBであり、これがバイナリがローカルに留まった証拠です。
要約ツールにはインターネット接続が必要ですか?
ページがキャッシュされれば、オフラインでPDFを読み込んで解析できますが、要約自体には接続が必要です。AI合成はホストされたLLM(Anthropic Claude)上でサーバーサイドで実行されるため、抽出されたテキストパッセージはAPIへのネットワーク往復が必要です。ファイルバイナリは不要です—AIが要約を書くために必要なテキストのみです。
AIモデルはサーバーでホストされているのではないですか?
はい—要約を書くLLMはホストされています(API経由のAnthropic Claude)。 not ホストされていないのはPDF解析、テキスト抽出、チャンキング、引用リンク付けです—これらはpdf.jsを介してブラウザで実行されます。プライバシーの主張は正確で有界です:PDFバイナリ、埋め込みフォント、画像は当社のサーバーやAIプロバイダーには送信されません。要求された要約に必要な抽出されたテキストパッセージのみがネットワークを通過します。「ファイル自体がサードパーティに届くか」という懸念があれば、答えはいいえです。
ファイルをドロップできるようになるまでページの読み込みに時間がかかるのはなぜですか?
その遅延はブラウザがpdf.jsとページアセットをローカルキャッシュに取り込んでいるためです。初回読み込み後、新しいPDFの解析は即時です—AIの合成呼び出し(ファイルではなく抽出されたテキストを運ぶ)のみネットワークが必要です。
ファイルサイズ制限はありますか?
ファイルバイナリがアップロードされないため、サーバーサイドのアップロード上限はありません。実際の上限はデバイスの利用可能なメモリです。pdf.jsがテキスト抽出のためにPDFをタブに読み込むためです。一般的なノートPCは200〜400ページのPDFを問題なく処理できます;長い文書は章ごとに要約するのが最適です。モバイルブラウザのメモリ制限はより厳しいため、非常に長いPDFはデスクトップで処理するのが最適です。要約ツールはソースファイルサイズに基づいてスロットリングや拒否を行いません—計測するのは月次のAI要約呼び出し数です。

ファイルをアップロードせずにPDFを要約できます。

要約ツールを開き、ファイルをドロップして要約を読んでください。次にDevToolsを開き、リクエストペイロードを検査して確認します:バイナリではなく、テキストパッセージです。

summarizeOpen the Summarizer