So wenden Sie OCR auf eine gescannte PDF an – aus Bildern von Seiten echten Text gewinnen mit dem PDF Pro OCR-Tool.
Eine gescannte PDF sieht aus wie ein Dokument, für den Computer ist sie aber nur ein Stapel Bilder – Sie können keinen Namen markieren, keine Rechnungsnummer suchen und kein Screenreader kann sie vorlesen. OCR ist der Schritt, der echten, markierbaren Text wieder aus diesen Bildern herausholt. Diese Anleitung führt die ganze Aufgabe in fünf Schritten durch – komplett in Ihrem Browser-Tab.
Was Sie brauchen
- Einen modernen Browser (Chrome, Edge, Firefox oder Safari aus den letzten zwei Jahren)
- Die gescannte oder reine Bild-PDF, die Sie per OCR erkennen wollen, auf Ihrem Gerät
- Eine Vorstellung davon, in welcher Sprache das Dokument verfasst ist – das bestimmt die Genauigkeit
- Ein paar Minuten – reine Bildseiten erfordern einen langsameren Erkennungsdurchlauf, und die erste Nutzung einer Sprache lädt ein kleines Paket herunter
Die fünf Schritte
OCR-Tool öffnen
Rufen Sie das PDF Pro OCR-Tool auf. Die Seite lädt mit der als WebAssembly gebündelten Tesseract-Erkennungs-Engine, bereit zur Ausführung auf Ihrer CPU. Es gibt keine Anmeldung, keine E-Mail-Bestätigungs-Hürde, keinen täglichen Seitenzähler – und keinen Upload-Endpunkt, an den Ihr Scan gesendet wird.
Gescannte PDF auswählen
Ziehen Sie die Datei in die Ablagezone oder klicken Sie zum Durchsuchen. Das Tool liest sie direkt von Ihrer Festplatte und stellt ein Vorschauraster aller Seiten dar. Hier sortiert das Tool Ihre Seiten auch unauffällig in zwei Gruppen: Seiten, die bereits eine echte Textebene tragen, und reine Bildseiten, die den vollen Erkennungsdurchlauf benötigen.
Erkennungssprache wählen
Wählen Sie die Sprache, die zu Ihrem Dokument passt. Die Engine erkennt Sprachen in lateinischer Schrift sowie Kyrillisch, Griechisch und mehr – und die richtige Wahl ist der größte Hebel für die Genauigkeit, den Sie haben. Beim ersten Mal, wenn Sie eine bestimmte Sprache nutzen, wird eine kleine Datendatei (wenige MB) heruntergeladen und anschließend zwischengespeichert, sodass der nächste Durchlauf in dieser Sprache sofort startet.
OCR ausführen
Klicken Sie auf OCR ausführen. Das Tool arbeitet Ihre Seiten in zwei Geschwindigkeiten ab: Jede Seite, die bereits eine echte Textebene hat, wird sofort und exakt extrahiert, während reine Bildseiten den langsameren Erkennungsdurchlauf auf Ihrer CPU durchlaufen. Eine Fortschrittsanzeige zeigt, welche Seite gerade gelesen wird – ein langer Scan abfotografierter Seiten ist der langsamste Fall, geben Sie ihm also einen Moment.
Erkannten Text kopieren oder speichern
Wenn der Durchlauf abgeschlossen ist, ist das Ergebnis echter, markierbarer Text – kein weiteres Bild der Seite. Markieren Sie ihn, kopieren Sie ihn in die Zwischenablage oder speichern Sie ihn, und fügen Sie ihn dann in ein Dokument ein, durchsuchen Sie ihn oder übergeben Sie ihn einem Übersetzer oder Zusammenfasser. Nichts ist hinter einer Anmeldung oder einem Upgrade verschlossen; der erkannte Text gehört Ihnen in dem Moment, in dem er erscheint.
Erkannten Text kopierenHäufige Fehler & Fallstricke
- Perfektion von einem unscharfen Foto erwarten. Die OCR-Genauigkeit ist durch die Scan-Qualität begrenzt. Ein sauberer, gerader Scan von gedrucktem Text mit etwa 300 DPI wird sehr gut erkannt; ein schräg und bei schlechtem Licht aufgenommenes Handyfoto nicht. Scannen Sie neu, bevor Sie dem Tool die Schuld geben.
- Die falsche Erkennungssprache wählen. Ein Englisch-Durchlauf auf einem kyrillischen Dokument liefert selbstbewussten Unsinn. Passen Sie die Sprache an das Dokument an – das ist der günstigste Gewinn an Genauigkeit, den es gibt.
- Versuchen, Handschrift per OCR zu erkennen. Die Engine ist auf gedruckten Text abgestimmt. Handgeschriebene Notizen, Unterschriften und Schreibschrift bleiben unzuverlässig, egal wie sauber der Scan ist.
- Annehmen, der erste Durchlauf sei kaputt, weil er langsam ist. Beim ersten Mal, wenn Sie eine Sprache nutzen, wird ein wenige Megabyte großes Datenpaket heruntergeladen. Das ist ein einmaliger Aufwand – es wird zwischengespeichert, und spätere Durchläufe in dieser Sprache starten sofort.
- Eine lose Bilddatei einspeisen. Das Tool verarbeitet PDF-Dateien. Wenn Sie nur ein Foto haben, packen Sie es zuerst in eine PDF – der JPG-zu-PDF-Konverter erledigt das in Ihrem Browser – und führen Sie dann OCR auf der entstandenen PDF aus.
Fehlerbehebung
Warum wurden manche Seiten sofort fertig und andere brauchten viel länger?
Weil sie unterschiedlich behandelt wurden. Seiten, die bereits eine echte Textebene enthalten, überspringen OCR vollständig und durchlaufen eine schnelle, exakte Extraktion. Nur echte reine Bildseiten erhalten den langsameren Erkennungsdurchlauf auf Ihrer CPU – eine gemischte PDF wird also sichtbar schneller und langsamer, während sie arbeitet.
Der erkannte Text enthält Fehler. Wie verbessere ich die Genauigkeit?
Die Genauigkeit hängt fast vollständig vom Scan ab. Scannen Sie scharf, gerade und gut beleuchtet bei etwa 300 DPI neu, stellen Sie sicher, dass die Erkennungssprache zum Dokument passt, und entzerren Sie schräge Seiten, bevor Sie beginnen. Gedruckter Text auf einem sauberen Scan wird sehr gut erkannt; geringer Kontrast und Unschärfe sind das, was schadet.
Wird meine gescannte Datei auf einen Server hochgeladen?
Nein. Die Tesseract-Engine läuft in Ihrem Browser, sodass der Scan direkt von Ihrem Gerät gelesen wird und es niemals verlässt. Wenn Sie das bestätigen möchten, öffnen Sie die DevTools, wechseln Sie zum Tab Netzwerk und führen Sie OCR aus – Sie werden null Datei-Uploads sehen.
Mein Dokument ist in zwei Sprachen. Welche soll ich wählen?
Wählen Sie die dominante Sprache des Dokuments und fügen Sie den optionalen Englisch-Durchlauf hinzu, um die zweite zu erfassen. Bei einer Seite, die wirklich halb und halb ist, schlägt diese Kombination meist das alleinige Ausführen einer der beiden Sprachen.
Kann der Browser einen großen mehrseitigen Scan bewältigen?
Ja – es gibt keine künstliche Seitenobergrenze, denn die Erkennung kostet Ihre CPU-Zeit, nicht eine Serverrechnung. Die echte Grenze ist der Arbeitsspeicher Ihres Browsers, etwa 500 MB auf einem modernen Laptop. Ein Scan mit einigen hundert Seiten dauert einfach länger; bleiben Sie auf einem Smartphone bei kürzeren Dokumenten.
Bereit, einen Scan per OCR zu erkennen?
Öffnen Sie das Browser-OCR-Tool und führen Sie Ihre gescannte PDF durch die fünf Schritte oben.