Ich habe sehr niedrig auflösende, fast verpixelte Bilder zur Bearbeitung. Die Zeichen können erkannt werden, wenn man hineinzoomt, und ein schneller Augenscan wird mit Hilfe eines grundlegenden englischen Grammatik- und Wortschatzsatzes durchgeführt. Ich habe viele ICRs und OCRs ausprobiert, aber keine hat sich als nützlich erwiesen. Gibt es OCR/s, die ich möglicherweise übersehen habe? PSDie Schreibschrift scheint das Problem zu sein.
Tesseract 4.0 ist wahrscheinlich die beste Wahl, um mit solchen Bildern genaue Ergebnisse zu erzielen.
Es ist Open Source und für Linux verfügbar (sowie Binärdateien für Windows).
Ich schlage vor, es mit einem auf etwa 300 DPI verkleinerten Bild und in Schwarzweiß zu fotografieren, wie in Izzys Kommentar beschrieben .
Wenn die Ergebnisse nicht so genau sind, wie Sie möchten, können Sie das neuronale Netzwerk jederzeit für dieses Bild trainieren, damit Sie eine genauere OCR für zukünftige Bilder dieses relativen Typs erhalten.
Izzy
essexboyracer