Lädt...

22. September 2016 1,380 Aufrufe

Gescanntes Dokument in Text umwandeln

Texterkennung aus gescannten Dokumenten und Bildern

Wenn Sie Texte aus eingescannten oder fotografierten Dokumenten wiederherstellen müssen, benötigen Sie eine OCR (Optical Character Recognition)-Lösung. Es gibt viele mobile Apps und Desktop-Software für diesen Zweck, aber Sie können sogar einige webbasierte Dienste finden, die es Ihnen ermöglichen, den Text aus gescannten PDFs oder Bildern bequem direkt über Ihren Webbrowser zu extrahieren.

Verwandte Erweiterungen:

OCR

OCR-SymbolMit der weit verbreiteten Nutzung von Digitalkameras in Smartphones verwenden viele Nutzer das Gerät, um schnell ein Foto von einem Dokument oder Notizen zu machen. Manchmal reicht das aus, aber was ist, wenn Sie den Text wiederherstellen müssen?

Nun, in diesem Fall müssen Sie nach einer Lösung suchen, die Bild- (gescanntes Dokument) zu Text- (Dokument) Konvertierung ermöglicht, die typischerweise als OCR - Optical Character Recognition bezeichnet wird.

OCR-Software funktioniert, indem sie das gescannte Dokument (Bild) analysiert und mit Schriftartdaten vergleicht, die in einer internen Datenbank gespeichert sind. Einige OCR-Lösungen verwenden auch eine Rechtschreibprüfung, um Wörter zu „korrigieren“, die nicht vollständig erkannt wurden. 100 % Genauigkeit ist höchstwahrscheinlich unmöglich, aber eine nahe Annäherung ist das allgemeine Ziel.

Sie finden professionelle OCR-Lösungen, diese sind jedoch in der Regel ziemlich teuer und für jemanden, der nur ein einzelnes Dokument wiederherstellen möchte, ziemlich unnötig. Glücklicherweise gibt es mehrere kostenlose Alternativen, und in diesem Artikel werden wir einige vorstellen.

Inhalt:

Texterkennung direkt auf Ihrem mobilen Gerät

Der bequemste Weg, den Text wiederherzustellen, wäre natürlich die Nutzung einer App direkt auf Ihrem Smartphone. Viele OCR-Apps existieren für alle mobilen Plattformen (Android, iOS, Windows Phone), leider variiert die Qualität dieser Anwendungen und die wirklich guten sind typischerweise kommerziell und für Gelegenheitsnutzer ziemlich teuer.

Durchsuchen Sie einfach Ihren Markt/App Store auf Ihrem Gerät und suchen Sie nach „OCR“-Apps. Es ist wenig sinnvoll, Tipps für die „besten“ Apps zu geben, da ständig neue hinzugefügt werden und was heute gut ist, morgen schon überholt sein kann.

Zum Beispiel gehören auf iOS einige der beliebtesten Apps Scanner Pro oder CamScanner Free, und ähnliche Apps finden Sie für Android im Google Market oder im Windows Store für Windows 10 Telefone.

Gescannten Text auf Ihrem Desktop-Computer konvertieren

Auf Desktop-Computern ist die Auswahl an OCR-Programmen oder -Services vielfältig. Viele Drucker-/Scanner-Hersteller (HP, Canon usw.) bieten grundlegende OCR-Software zu ihren Geräten an. Wenn Sie ein solches Gerät besitzen, prüfen Sie die CD/DVDs, die mitgeliefert wurden, denn eine davon enthält wahrscheinlich Software.

Abgesehen davon finden Sie mehrere dedizierte OCR-Lösungen, von kostenlosen bis hin zu sehr teuren Programmen, wie OmniPage, ABBYY FineReader, Adobe Acrobat usw. Natürlich erzielen die professionellen (und kostenpflichtigen) Programme wesentlich bessere Ergebnisse.

Online-Konvertierung von gescannten Dokumenten zu Text

Während Sie nach dedizierter Software suchen können, kann die Nutzung von Online-Diensten, die OCR-Konvertierung direkt in Ihrem Webbrowser durchführen, ein bequemerer Ansatz sein, um Texte aus Bildern oder gescannten Dokumenten wiederherzustellen.

Eine der bekanntesten Online-OCR-Websites ist onlineocr.net (siehe App-Liste am Ende des Artikels), und sie sollte für einfache Texterkennung aus Scans im PDF-Format oder in gängigen Grafikformaten (.jpg, .png, .tif, .gif usw.) mehr als ausreichend sein.

Eine interessante Option ist die OCR-Funktion in OneNote von Microsoft Office. Sie ist höchstwahrscheinlich für handschriftliche Notizen gedacht, sollte aber auch für kleine Dokumente nutzbar sein.

onlineocr.net

Die Website bietet einen kostenlosen OCR-Service (optische Zeichenerkennung) und ermöglicht Nutzern, ihre PDF-Dokumente und Bilddateien in Textformate umzuwandeln, die als .txt-, MS Word-Dokument (.docx) oder MS Excel-Tabelle (.xlsx) direkt über den Webbrowser durch Upload online gespeichert werden können.

Die Funktion arbeitet recht gut und bietet zudem weitere nützliche Features, zum Beispiel können Sie den erkannten Text in eine der 46 verfügbaren Sprachen übersetzen. So können Sie beispielsweise Text aus einem deutschen Dokument extrahieren und den Service nutzen, um ihn ins Englische zu übersetzen.

Der Service ist auf Dateien mit maximal 5 Megabyte begrenzt, und natürlich sollten Sie keine sensiblen Dokumente hochladen, da Sie diese an einen Drittanbieterserver senden – Vorsicht ist also geboten.

Wir haben es getestet und der Service arbeitet mit hoher Genauigkeit und hat keine Probleme mit Zeichen aus nicht-englischen Alphabeten.

Online OCR Konvertierung

Screenshot des kostenlosen Online-OCR-Services

Natürlich gibt es mehrere andere Websites, die dieselben OCR-Dienste anbieten. Wenn eine davon bei Ihren gescannten Dateien nicht gut funktioniert, probieren Sie weitere aus und sehen Sie, welche die besten Ergebnisse liefern.

Verwandte Artikel

28. Juni 2017

Wie extrahiert man Text aus einem Bild?

Viele Computerbenutzer, die mit Dokumenten arbeiten, stoßen früher oder später auf eine Situation, i...

Mehr lesen
10. Dezember 2013

Mehrere Dateien auf dem Mac gleichzeitig umbenennen

Wenn Sie eine große Anzahl digitaler Fotos sammeln, zum Beispiel von Ihrem letzten Urlaub, und diese...

Mehr lesen
11. Februar 2013

E-Books kostenlos konvertieren

Es gibt Hunderte verschiedener E-Book-Reader und Dutzende von E-Book-Dateiformaten auf dem Markt. Es...

Mehr lesen
11. Mai 2012

Wie man eine große Anzahl von Dateien schnell umbenennt

Jeder, der schon einmal eine große Menge an Dateien umbenennen musste, weiß, wie mühsam es ist, dies...

Mehr lesen