PDF Proインラインコンバーターを使って、PDFを編集可能なWordドキュメントに変換する方法。
このガイドは、PDFをWordに変換して.docxを開き、段落をクリックしたとき、すべての行がそれぞれの小さなフレームにロックされていてカーソルがインラインに置けなかった経験がある方向けです。実際に編集できるドキュメントを作成する5つのステップを解説します。
必要なもの
- モダンなブラウザ(Chrome、Edge、Firefox、または過去2年以内のSafari)
- 変換したいPDFファイル(デバイス上にあるもの)
- 結果を開くためのMicrosoft Word、LibreOffice Writer、またはGoogle Docs
- 約2分(カーソルのテストを含む)
5つのステップ
編集可能なコンバーターを開く
PDF Proインラインコンバーターにアクセスしてください。単一ページとして読み込まれ、変換エンジンはブラウザで動作するため、ファイルはローカルで解析・再構築されます。アップロード不要、メール確認不要、アカウント不要です。
PDFをドロップしてコンバーターに解析させる
ファイルをドロップゾーンにドラッグするか、クリックして参照してください。コンバーターがPDFをローカルで解析し、3つのことを確認します。本物のテキストレイヤーがあるかどうか、参照されているフォントは何か、ドキュメントが構造化されているか(段落と見出し)または自由形式のレイアウトかどうかです。概要パネルが1〜2秒で表示されます。
PDFが画像のみの場合(スキャンまたはページの写真)、コンバーターがそれをフラグし、最初にOCRパスを推奨します。推奨をスキップしないでください。OCRなしのスキャンは、意味のある意味では編集できない画像で満たされたWordドキュメントに変換されます。
「インライン」レイアウトモードを選択する
コンバーターは2つのレイアウトモードを提供します。インラインは段落を本物のWord段落として再構築します。カーソルがインラインに置かれ、入力すると行が下に押し下げられ、段落スタイルを適用できます。フレームは浮動テキストボックスで元の座標を保持します。視覚的には忠実ですが、編集はストレスを感じます。編集作業の95%では、インラインが求めているものです。
PDFがスキャンの場合はOCRを確認する
ステップ2でPDFが画像のみとフラグされた場合、変換が実行される前にOCRパネルが表示されます。ドキュメントの言語を選択し(英語がデフォルトですが、80以上の言語に対応しています)、「OCRを実行」をクリックしてください。テキストはブラウザ内のローカルエンジンを使用して抽出され、レイアウトステップに渡されます。OCRはページ数によって10〜60秒追加されますが、編集可能なドキュメントと画像フォルダの違いです。
ダウンロードしてカーソルテストを実行する
「変換してダウンロード」をクリックしてください。.docxがダウンロードフォルダに保存されます。Wordで開いて、重要な1つのテストを実行してください。段落の中央をクリックして入力を始めます。カーソルがインラインに置かれてテキストが残りの行を前に押し進める場合、求めていたインライン出力が得られています。カーソルが細い青いフレームの内側に置かれてテキストがあふれる場合は、誤ってフレームモードになっています。インラインを選択して再実行してください。
変換して.docxをダウンロードよくある間違いと落とし穴
- フレームモードを選択して通常通り編集しようとする。フレームモードはアーカイブ品質の再現用であり、編集用ではありません。テキストを変更することが目的の場合は、常にインラインを選択してください。
- スキャンPDFでOCRをスキップする。OCRなしでは、「テキスト」はWordページに貼り付けられたピクセルにすぎません。見つけるべきテキストがないため、カーソルはそれを見つけられません。OCRを有効にして再実行してください。
- フォントが完全に一致すると思い込む。PDFがお使いのマシンにインストールされていないフォントを使用している場合、Wordが代替フォントを使用します。代替フォントは異なるメトリクスを持つため、改行が変わります。これはWordの動作であり、コンバーターのバグではありません。元のフォントをインストールするか、テキストの折り返しが変わることを受け入れてください。
- 複雑なテーブルを編集してセルが結合されてしまう。ソースPDFに結合または分割されたセルがあるテーブルは、正しく見えるがセルの境界が編集に抵抗するという形で表示されることがよくあります。表が多いPDFの場合は「テーブルのみ」モードを選択し、周囲の文章を手動で再構築してください。
- 受信者が使用するものとは異なるアプリで.docxを編集する。Google Docsはインラインモードの段落を完全にレンダリングしますが、一部の高度なスタイルはWordとは異なって処理されます。ファイルを送付する場合は、送付前に受信者が使用するアプリで開いてください。
トラブルシューティング
カーソルがテキストボックスに固定されています。どうすれば修正できますか?
フレームモード(またはデフォルトでそれを使用する別のツール)で変換しました。インラインを選択した状態でPDF Proインラインコンバーターで再実行してください。再生成された.docxには本物の段落が含まれます。フレームバージョンをすでに大幅に編集している場合は、すべてのボックスを選択してテキストをコピーし、新しいドキュメントにプレーンテキストとして貼り付けてからスタイルを再適用してください。
テーブルは正しく見えますが、セルを編集できません。何が問題ですか?
ソースに結合または分割されたセルがある可能性が高く、コンバーターがネストされたテーブルで視覚的構造を保持しています。テーブル内で右クリック→「テーブルのプロパティ」→「レイアウト」→ネストされたテーブルの内側にいるかどうかを確認してください。その場合は、「テーブルをテキストに変換」して単一レベルのテーブルとして再構築してください。
箇条書きと番号付きリストがプレーン段落になってしまいました。リスト書式を取り戻せますか?
PDFはリストのセマンティクスを保存しません。箇条書きと番号のグリフのレンダリングを保存します。コンバーターはリストの検出に最善を尽くしますが、ソースが珍しい箇条書き文字を使用している場合、検出が失敗します。Wordで対象の段落を選択し、箇条書き/番号付きリストスタイルを手動で適用してください。
.docxの改行がPDFと一致しません。
これはフォント置換の動作です。PDFがお使いのマシンにないフォントを使用していた場合、Wordが近いものに置き換えます。「近い」と言っても文字幅が異なるため、異なる箇所で行が折り返されます。元のフォントをインストールするか、編集可能なドキュメントとピクセル忠実な再現は異なる目標であることを受け入れてください。
PDFに段組みがあります。Wordドキュメントの順序が間違っています。
PDFの複数カラムレイアウトはテキスト位置のクラスタリングから推定されており、変わったカラム幅や浮動画像が推定を混乱させることがあります。コンバーターで「詳細設定」パネルを展開し、実行前に手動でカラム数を設定してください。本当に頑固なレイアウトの場合は、ページ分割ツールを使って1カラムずつ変換し、Wordで結合してください。
変換する準備はできましたか?
インラインコンバーターを開いて、上記の5ステップでファイルを処理してください。