Local PDF summarization · Page-cited output

60ページのPDFを開きました。こちらが 60-second version.

長い文書の認知コストを中心に構築された要約ツール — 研究論文、契約書、トランスクリプト、財務報告書 — ソースページへの引用付きで構造化されたキーポイントに凝縮されます。Less reading. Same understanding.

ブラウザ側の解析。すべての箇条書きに引用付き。ファイルはデバイスから出ません。

Why most summarizers fall short

信頼できない要約は原文を読むより悪いです。現場では3つの失敗パターンが繰り返し現れます — このツールはそれぞれに対して設計されています。

Failure 1
format_align_left

Generic LLM dump

文書全体が1つのプロンプトに詰め込まれ、モデルはエッセイ形式の段落を返します。構造なし、優先度なし、流し読みのパスなし。要約を線形に読む必要があります。

Failure 2
report

Hallucinated citations

箇条書きが関連コンテンツが12ページにあるのに「47ページ」を引用する — あるいは最悪の場合、ソースに全く存在しない引用を捏造します。検証可能な参照がなければ、すべての主張を原文と照らし合わせて再確認する必要があります。

Failure 3
cloud_upload

Slow upload roundtrips

PDFがサーバーに送信され、キューに入れられ、リモートで解析されてから要約がストリーミングされます。カフェの接続で200MBのバインダーの場合、最初のトークンが表示されるまで1分待つことになります。

How the summarizer works

4つのパス。PDFは常にデバイス上に留まります。抽出されたテキストセグメントのみが要約されます。

01
file_open

Parse locally

WebAssemblyがブラウザ内でページごとにテキスト層を抽出します。引用が正確に保たれるよう、レイアウト、見出し、ページネーションが保持されます。

02
grid_view

Chunk by section

見出し、改ページ、セマンティックな境界が文書をセクションに分割します。各チャンクにはページ範囲がメタデータとして含まれます。

03
auto_awesome

Distill key points

各セクションは核心的な主張に絞り込まれます。長い定型文は圧縮され、本質的な内容は残ります。ページ参照は各箇条書きに付随します。

04
list_alt

Assemble TL;DR

セクションの要約は、ランク付けされた単一のキーポイントリストに統合されます — コピー&ペースト可能で、ソースページへのクリック可能な引用付き。

使うべきタイミング this tool

流し読みのコストが高く、読み間違えのコストがさらに高い、長文・高密度・技術的なPDF。

science

Research papers

方法、結果、限界 — レビュアーが読む順序で抽出されます。引用は論文の関連セクションを指します。

Academic
gavel

Contracts & agreements

期間、費用、解除、補償、準拠法。重要な義務を特定できるよう、独立した箇条書きとして抽出されます。

Legal
forum

Meeting transcripts

Decisions, action items, owner, deadline. Filler conversation drops away; the durable outcomes stay.

Operations
trending_up

Financial reports

10-K、業績発表、年次報告書 — 変動した数値、変更されたガイダンス、新たに開示されたリスク。

Finance

The old way vs. our way

同じPDF、2つの「なるほど」への道。

Old way

Upload, wait, hope the summary holds up.
  • close何かが起こる前にPDFを知らないサーバーにアップロード
  • closeOne paragraph of prose — no skim path, no priorities
  • close引用が欠落または捏造されており、すぐに確認できない
  • close"Daily limit reached" after three documents
  • closeSign-up wall before the first summary renders

Our summarizer

Drop, distill, verify.
  • checkPDFはブラウザで解析 — バイナリはページの外に出ません
  • checkStructured key-points extraction — ranked bullets, scannable
  • checkすべての箇条書きにはソースにリンクするページ引用が付きます
  • checkより深い解析のためのロングフォームモード、フォローアップのためのPDFチャット
  • checkNo upload, no signup gate, no daily summary cap

TL;DRの後にさらに深く掘り下げる必要がありますか?こちらを開いてください: chat session against the same PDF — 質問は同じページ引用の規律で回答されます。

Three things this tool actually does

検証可能な主張のみ — DevToolsまたはソースPDFで確認できる機能。

memory

Local processing

PDF解析とチャンキングはブラウザ内のWebAssemblyで実行されます。ファイルバイナリはネットワークを経由しません。

cloud_off

No file upload

要約実行中にDevTools → Networkを開きます。PDFを含むリクエストボディは表示されません — 短いテキストセグメントのみです。

link

Source-cited output

各箇条書きは出典となる正確なページまたはページ範囲にリンクされているため、TL;DRのすべての主張を2回のクリックで検証できます。

同じブラウザファーストのモデルが他のツールを動かしています — アップロードせずにPDFを翻訳, compress a PDF locally, ブラウザ内でPDFをWordに変換、または機密ファイルを次を通じて送信: end-to-end encrypted transfer.

Questions about the summarizer

エッジケース、制限、通常は言及されない事項。

サマライザーはスキャンされたPDFで機能しますか?
OCR処理後のみです。スキャンされたPDFは画像の積み重ねです — 文字が認識されるまで要約するテキスト層がありません。まずブラウザ内でOCR処理を実行してから、サマライザーがキーポイントを抽出できます。OCRの信頼度が低い場合、TL;DRはコンテンツを捏造する代わりに不確実なパッセージにフラグを立てます。
入力PDFはどのくらいの長さまで対応できますか?
実用的な上限は高密度なテキストで約800ページ、または約40万トークンで、チャンキングされ段階的に凝縮されます。より長い文書はセクションに分割され、それぞれが個別に要約されてから最終的なTL;DRに統合されます。ブラウザのメモリが実際の制限です — 最新のノートパソコンは60ページのレポートを数秒で、600ページの法的バインダーを1分以内で処理します。
出典ページは引用されますか?
はい。TL;DRの各箇条書きには次のようなページ参照が付きます: p.12 or pp.34–37 生成元のパッセージへのポインタ付き。引用をクリックすると元のページにジャンプします。これが自動要約と幻覚的な言い換えを区別するものです — 各主張を2秒で検証できます。同じPDFに対するフリーフォームのフォローアップには、次に切り替えてください: chat-with-PDF.
ファイルはブラウザの外に出ますか?
PDF解析、テキスト抽出、チャンキングはWebAssemblyを介して完全にクライアント側で行われます。モデルコールは要約に必要な抽出されたテキストセグメントのみを伝達します — ファイルバイナリはデバイスを離れません。実行中にDevTools → Networkを開くとPDFのアップロードは表示されません。私たちの次と同じモデル: no-upload compressor and no-upload converter.
出力が期待より短い場合があるのはなぜですか?
優れた要約はページ数ではなく情報密度によって制限されます。定型文の多い200ページの契約書は、独自の内容が少ないため8つの箇条書きに圧縮されることがあります。サマライザーは詰め込みより簡潔さを優先します — より深い内容が必要な場合はロングフォームモードに切り替えるか、文書に対してチャットセッションを開いてください。長さの水増しが要約を読みにくくする原因です。

Stop reading the whole thing. Read the TL;DR.

PDFをドロップすると、ページ引用付きの構造化されたキーポイントセットが得られます — ブラウザ内で、数秒で、ファイルをどこにも送信せずに。

auto_awesomeOpen the summarizer — Free