OCR-Tool für Bilder unter Windows [Duplikat]

Es gibt ein paar OCR- Fragen auf dieser Seite, aber sie sind entweder nur für Linux oder nur für PDFs.

Ich suche also ein Tool, das Bilder mit Text in bearbeitbaren Text (.doc / .txt) umwandelt.

Es muss:

  • kostenlos oder relativ günstig sein (< £20)
  • so genau wie möglich sein
  • Bilder ignorieren
  • läuft auf Windows 7 64bit
  • unterstützt definitiv .jpeg- und .gif-Dateien
Tesseract kann genau das tun, was Sie wollen: softwarerecs.stackexchange.com/a/10029/2401
@Cornelius Das habe ich komplett übersehen! +1. Bitte stimmen Sie ab, um dies als Dupe zu schließen!
Diese Antwort bezieht sich auf die PDF-Ausgabe, kann aber auch reinen Text ausgeben.
Als OCR-Tool verwende ich Microsoft OneNote. Wenn Sie mit der rechten Maustaste auf ein Bild klicken, kann es den gesamten Text in Bildern kopieren und es hat auch die Möglichkeit, Text in Bildern zu suchen. Es ist kostenlos und genau und läuft unter Windows und unterstützt fast alle Bildformate. Bonuspunkt ist, dass es mehrere Sprachen unterstützt :) Englisch, Französisch, Spanisch auch

Antworten (1)

Die besten verfügbaren OCR-Tools für den persönlichen Gebrauch in Bezug auf die Genauigkeit sind Nuance OmniPage , ABBYY FineReader und Acrobat XI Pro . (Ich habe mir keine Benchmarks angesehen , aber ich hatte diesen Eindruck, als ich vor ein paar Jahren nach einem suchte). Aber sie kosten alle über 20 USD.

Tesseract wird meistens als die genaueste Open-Source-OCR-Engine angesehen. Es gibt mehrere Tesseract-GUIs . Andernfalls können Sie einige Bindungen verwenden, wie im folgenden Beispiel.

Beispiel :

Bild mit ImageMagick in TIF umwandeln:

#convert myimage.jpeg -auto-level -compress none myimage.tif

Python-Code zum Lesen von Daten aus myimage.tif (Tesseract benötigt TIFF als Eingabe):

from PIL import Image
from pytesser.pytesser import *

image_file = 'myimage.tif'
im = Image.open(image_file)
text = image_to_string(im)
text = image_file_to_string(image_file)
text = image_file_to_string(image_file, graceful_errors=True)
print "=====output=======\n"
print text

FYI: Vergleich von Software zur optischen Zeichenerkennung

Ich wusste nicht, dass Adobe XI Pro auch ein OCR-Programm ist, es kostet 18 £, also weniger als 20 £ …
Ich denke, das sind die monatlichen Kosten, sonst kostet es etwas mehr: amazon.com/Acrobat-Professional-XI-Windows-Download/dp/…
Dies ist eine doppelte Frage. Bitte stimmen Sie, um als Dupe zu schließen.
Sicher, sorry, habe die andere Frage nicht gesehen.
Ich auch nicht :)
Als OCR-Tool verwende ich Microsoft OneNote. Wenn Sie mit der rechten Maustaste auf ein Bild klicken, kann es den gesamten Text in Bildern kopieren und es hat auch die Möglichkeit, Text in Bildern zu suchen. Es ist kostenlos und genau und läuft unter Windows und unterstützt fast alle Bildformate. Bonuspunkt ist, dass es mehrere Sprachen unterstützt :) Englisch, Französisch, Spanisch auch