Was ist eigentlich OCR? OCR steht für ‚Optical Character Recognition – also „optische Textzeichenerkennung“ – und macht genau das, was der Name sagt: Aus einem PDF-Dokument mit Text, der sich weder auswählen noch bearbeiten lässt, extrahieren OCR-Tools alle Buchstaben und liefern so bearbeitbare Textbausteine. Das ist besonders praktisch, wenn man etwa ein Dokument scannt, da sich der hier enthaltene Text nach erfolgreicher OCR auch durchsuchen lässt; große Dateien werden so plötzlich einfach zu handhaben.
Das Schöne dabei: Gute OCR-Tools schaffen es sogar, handschriftlich festgehaltene Notizen in PC-Text umzuwandeln. Möchte man beispielsweise die Aufzeichnungen aus der letzten Vorlesung noch weiter digital behalten, kann man durch die Formatierung in computerlesbaren Text viel Speicherplatz sparen, da ein textbasiertes PDF-Dokument deutlich weniger Megabyte in Anspruch nimmt als eine Bilddatei.
Ein weiterer Vorteil ist die Barrierefreiheit: Per Post empfangene Briefe lassen sich, einmal per OCR umgewandelt, ganz unkompliziert vom Computer vorlesen und ermöglichen so auch Menschen mit Sehstörungen das Erfassen von geschriebenen Texten.
Wie funktioniert OCR?
Wir schauen uns die Funktionsweise von PDF OCR mit PDFelement der Firma Wondershare an. Hier läuft das Ganze so ab, dass der Computer das gescannte Bild als TIF speichert und dann Reihe für Reihe abliest. Die hier erkannte Abfolge aus schwarzen und weißen beziehungsweise hellen und dunklen Bildbereichen gleicht das System jetzt mit einer Datenbank aus Schriftzeichen ab und fügt bei einem Match das jeweils passende direkt ein.
Wie wendet man OCR auf PDF-Dokumente an?
Wenn Sie nun damit anfangen möchten, ihre aufbewahrten Dokumente zu digitalisieren und in Text umzuwandeln, benötigen Sie vor Allem einen Scanner und einen PDF-Editor PDFelement von Wondershare. Sollte kein Scanner vorhanden sein kann auch die Handykamera Abhilfe schaffen; in diesem Fall sollte man jedoch auf eine möglichst helle, gleichmäßige Beleuchtung setzen und die Dokumente bildschirmfüllend aufnehmen, um die Qualität der Kamera vollkommen auszureizen.
Schritt 1: Starten Sie ihren Scanner, schließen Sie ihn an den Computer an und scannen Sie das gewünschte Dokument. Besitzer eines iPhones in Kombination mit einem aktuellen Mac können alternativ die Scannen-Funktion ihres Handys verwenden, die sich über einen Rechtsklick auf den Desktop und dann ‚Importieren von iPhone oder iPad‘ →‚Dokumente scannen‘ aufrufen lässt.
Schritt 2: Laden Sie eine PDF-Software ihrer Wahl aus dem Internet herunter; wir orientieren uns in diesem Beispiel an PDFelement der Firma wondershare. Öffnen Sie die Software und erstellen Sie über die Tastenkombination ‚Command + N‘ ein neues PDF-Dokument. Jetzt betätigen Sie die Taste ‚Bild hinzufügen‘ in der oberen Menüleiste und wählen dann das eben aufgenommene Dokument aus.
Schritt 3: Jetzt erscheint am oberen Dokumentrand eine Leiste, in der Sie das Programm fragt, ob sie eine OCR starten möchten. Klicken Sie hier auf ‚OCR durchführen‘. Sollte die Leiste nicht auftauchen, können Sie alternativ auch im ‚Bearbeiten‘-Tab der Menüleiste den Button ‚OCR‘ verwenden.
Schritt 4: Im letzten Schritt wählen Sie im sich jetzt öffnenden Pop-Up die Sprache des Dokuments und klicken auf ‚OK‘. Fertig! Bereits nach wenigen Sekunden ist der PRozess abgeschlossen.
Ihr seid interessiert? Dann gibt es jetzt von Wondershare auch die Jahresabo die Möglichkeit. Schaut gerne einmal auf der Webseite vorbei.
-> PDFelement fuer Mac Download