Texterkennung kostenlos

04. September 2012
Achim Wagenknecht Von Achim Wagenknecht, Freeware & Open Source, News & Trends, Linux, OpenOffice, Picasa, GIMP, Multimedia ...

Bücher, Briefe und Zeitschriften sind heute mit dem Smartphone schnell abfotografiert. Mit Tesseract wandeln Sie die Bilder sogar in Textdateien um.

Wer Texte abfotografiert, erhält den Text zunächst in Form einer Bilddatei. Diese können Sie jedoch nicht in einem Textprogramm weiter verarbeiten. Sie können den Text nicht umformatieren, Sie können keine Rechtschreibprüfung darauf anwenden, Sie können Textteile nicht umstellen oder neuen Text einfügen. Für die Windows-Volltextsuche ist es so, als wäre der Text gar nicht vorhanden. Das alles funktioniert erst, nachdem Sie den Text aus dem Bild in eine Textdatei umgewandelt haben.

Text aus Grafikdateien zu entnehmen und in eine Textdatei umzuwandeln, ist für Computer jedoch gar nicht so einfach. Die Programme, die das können, nennen sich „Open Character Recognition“ oder kurz OCR. Eins dieser Programme, Tesseract, befindet sich schon seit Jahren im Open Source, kann also kostenlos genutzt werden. Erst vor kurzem bekam Tesseract aber eine komfortable Benutzeroberfläche.

Das Programm besteht aus zwei Teilen, die getrennt installiert werden. Tesseract selbst ist die so genannte „Engine“, also der Motor, der die eigentliche Texterkennung durchführt. Dazu kommt die Benutzeroberfläche namens gImageReader.
Tesseract finden Sie bei Google Code unter code.google.com/p/tesseract-ocr/
gImageReader ist bei Sourceforge gespeichert: sourceforge.net/projects/gimagereader/

Kreuzen Sie bei der Installation von Tesseract gleich das deutsche Sprachpaket an. Es wird automatisch heruntergeladen und installiert. Den Ordner, in dem Tesseract installiert wird, kopieren Sie am besten gleich aus dem Installationsdialog in die Zwischenablage, dann können Sie ihn in die Konfiguration von gImageReader einfügen. Mit „Datei / Konfigurieren“ rufen Sie ein Dialogfeld auf, in das Sie den „Ordner der Tesseract enthält“ eintragen. Jetzt können Sie Bilddateien öffnen und die darin enthaltenen Texte erkennen lassen. Das funktioniert sehr gut, wenn die Texte ganz gerade abfotografiert wurden. Perspektivisch verzerrte oder gekrümmte Texte erkennt das Programm nicht. Die besten Ergebnisse erhalten Sie, wenn Sie Texte mit einem Flachbettscanner einlesen.

Erhalten Sie regelmäßig die wichtigsten Freeware-Tipps in Ihr Postfach!

Jetzt gratis per E-Mail

DDV Ehrencodex E-Mail-Marketing
  • Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters.
  • Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter.
  • Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Datenschutzgarantie:

Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters. Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter. Jederzeit abbestellbar durch einen Link im Newsletter.

Weitere Artikel zum Thema

Weitere Artikel

Mehr Strom aus Ihrer Solaranlage

Risikofaktor Android: 333 neue Schad-Apps pro Stunde!

Der beste Firefox aller Zeiten?


Die besten Linux- und OpenSource Tipps für Sie!

Jetzt gratis per E-Mail

  • die besten Tipps
  • völlig kostenlos
  • jederzeit abbestellbar
DDV Ehrencodex E-Mail-Marketing
  • Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters.
  • Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter.
  • Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Datenschutzgarantie:

Wir benötigen Ihre E-Mail-Adresse für die Zusendung des Newsletters. Wir geben Ihre E-Mail-Adresse garantiert nicht an Dritte weiter. Jederzeit abbestellbar durch einen Link im Newsletter.

Unsere Experten

Rudolf Ring twittert für @Computerwissen

Die von Ihnen eingegebene E-Mail Adresse ist nicht korrekt. Bitte korrgieren Sie Ihre Eingabe und klicken Sie auf "OK":

Bitte wählen Sie mindestens einen Newsletter aus und klicken Sie auf "OK"