OCR für niedrig aufgelöste Bilder von Text in Kursivschrift

Ich habe sehr niedrig auflösende, fast verpixelte Bilder zur Bearbeitung. Die Zeichen können erkannt werden, wenn man hineinzoomt, und ein schneller Augenscan wird mit Hilfe eines grundlegenden englischen Grammatik- und Wortschatzsatzes durchgeführt. Ich habe viele ICRs und OCRs ausprobiert, aber keine hat sich als nützlich erwiesen. Gibt es OCR/s, die ich möglicherweise übersehen habe? Geben Sie hier die Bildbeschreibung einPSDie Schreibschrift scheint das Problem zu sein.

Und seine Farbe. Als erstes würde ich versuchen, es in s / w zu konvertieren, den Kontrast zu erhöhen und es auf das 4-fache seiner Größe "aufzublasen". Letzteres mag seltsam klingen, aber für mich erhöhte sich die Erkennungsrate in einigen Fällen bemerkenswert. Was die Softwarefrage angeht: Auf welchem ​​Betriebssystem soll sie laufen und wie hoch ist Ihr Preislimit bei kostenpflichtigen Produkten?
Wenn Sie Zugriff auf einen Fotokopierer oder ein Bildbearbeitungsprogramm haben, versuchen Sie, das Bild umzukehren, z. B. negativ zu machen (schwarz zu weiß und weiß zu schwarz). Manchmal scanne ich auf Thermopapier gedruckte Kassenbons ein, die mit der Zeit an Klarheit verlieren, was dazu beigetragen hat, dass sie zumindest für das menschliche Auge lesbar sind. Die Schriftart könnte, wie Sie sagen, auch ein Problem sein

Antworten (1)

Tesseract 4.0 ist wahrscheinlich die beste Wahl, um mit solchen Bildern genaue Ergebnisse zu erzielen.

Es ist Open Source und für Linux verfügbar (sowie Binärdateien für Windows).

Ich schlage vor, es mit einem auf etwa 300 DPI verkleinerten Bild und in Schwarzweiß zu fotografieren, wie in Izzys Kommentar beschrieben .

Wenn die Ergebnisse nicht so genau sind, wie Sie möchten, können Sie das neuronale Netzwerk jederzeit für dieses Bild trainieren, damit Sie eine genauere OCR für zukünftige Bilder dieses relativen Typs erhalten.

Wie skaliere ich ein Bild auf 300 dpi?
Gibt es einen OCR-Trainer, den ich verwenden kann?
@Dhruva Um die Größe eines Bildes auf 300 DPI zu ändern, verwenden Sie einfach Ihren bevorzugten Bildeditor, und es sollte eine Option zum Skalieren oder Ändern der Größe des Bildes / der Leinwand auf eine bestimmte DPI geben (ich verwende GIMP). Um das neuronale Netzwerk zu trainieren, müssten Sie sich die verlinkte Dokumentation ansehen und von dort aus fortfahren (da kann ich Ihnen nicht viel helfen). Ich würde nur für diese bestimmte Schriftart trainieren, wenn Sie überhaupt kein genaues Ergebnis von der OCR erhalten UND mehr Bilder mit derselben Schriftart haben, die Sie später mit OCR bearbeiten möchten.