OCR für niedrig aufgelöste Bilder von Text in Kursivschrift

Question

OCR für niedrig aufgelöste Bilder von Text in Kursivschrift

okr
Schriftart
Software
Datenextraktion

Dhruva

Ich habe sehr niedrig auflösende, fast verpixelte Bilder zur Bearbeitung. Die Zeichen können erkannt werden, wenn man hineinzoomt, und ein schneller Augenscan wird mit Hilfe eines grundlegenden englischen Grammatik- und Wortschatzsatzes durchgeführt. Ich habe viele ICRs und OCRs ausprobiert, aber keine hat sich als nützlich erwiesen. Gibt es OCR/s, die ich möglicherweise übersehen habe? PSDie Schreibschrift scheint das Problem zu sein.

Izzy

Und seine Farbe. Als erstes würde ich versuchen, es in s / w zu konvertieren, den Kontrast zu erhöhen und es auf das 4-fache seiner Größe "aufzublasen". Letzteres mag seltsam klingen, aber für mich erhöhte sich die Erkennungsrate in einigen Fällen bemerkenswert. Was die Softwarefrage angeht: Auf welchem Betriebssystem soll sie laufen und wie hoch ist Ihr Preislimit bei kostenpflichtigen Produkten?

essexboyracer

Wenn Sie Zugriff auf einen Fotokopierer oder ein Bildbearbeitungsprogramm haben, versuchen Sie, das Bild umzukehren, z. B. negativ zu machen (schwarz zu weiß und weiß zu schwarz). Manchmal scanne ich auf Thermopapier gedruckte Kassenbons ein, die mit der Zeit an Klarheit verlieren, was dazu beigetragen hat, dass sie zumindest für das menschliche Auge lesbar sind. Die Schriftart könnte, wie Sie sagen, auch ein Problem sein

Antworten (1)

OCR für niedrig aufgelöste Bilder von Text in Kursivschrift

Und seine Farbe. Als erstes würde ich versuchen, es in s / w zu konvertieren, den Kontrast zu erhöhen und es auf das 4-fache seiner Größe "aufzublasen". Letzteres mag seltsam klingen, aber für mich erhöhte sich die Erkennungsrate in einigen Fällen bemerkenswert. Was die Softwarefrage angeht: Auf welchem Betriebssystem soll sie laufen und wie hoch ist Ihr Preislimit bei kostenpflichtigen Produkten?
Wenn Sie Zugriff auf einen Fotokopierer oder ein Bildbearbeitungsprogramm haben, versuchen Sie, das Bild umzukehren, z. B. negativ zu machen (schwarz zu weiß und weiß zu schwarz). Manchmal scanne ich auf Thermopapier gedruckte Kassenbons ein, die mit der Zeit an Klarheit verlieren, was dazu beigetragen hat, dass sie zumindest für das menschliche Auge lesbar sind. Die Schriftart könnte, wie Sie sagen, auch ein Problem sein

HerrÖffentlichkeit · Answer 1

Tesseract 4.0 ist wahrscheinlich die beste Wahl, um mit solchen Bildern genaue Ergebnisse zu erzielen.

Es ist Open Source und für Linux verfügbar (sowie Binärdateien für Windows).

Ich schlage vor, es mit einem auf etwa 300 DPI verkleinerten Bild und in Schwarzweiß zu fotografieren, wie in Izzys Kommentar beschrieben .

Wenn die Ergebnisse nicht so genau sind, wie Sie möchten, können Sie das neuronale Netzwerk jederzeit für dieses Bild trainieren, damit Sie eine genauere OCR für zukünftige Bilder dieses relativen Typs erhalten.

@Dhruva Um die Größe eines Bildes auf 300 DPI zu ändern, verwenden Sie einfach Ihren bevorzugten Bildeditor, und es sollte eine Option zum Skalieren oder Ändern der Größe des Bildes / der Leinwand auf eine bestimmte DPI geben (ich verwende GIMP). Um das neuronale Netzwerk zu trainieren, müssten Sie sich die verlinkte Dokumentation ansehen und von dort aus fortfahren (da kann ich Ihnen nicht viel helfen). Ich würde nur für diese bestimmte Schriftart trainieren, wenn Sie überhaupt kein genaues Ergebnis von der OCR erhalten UND mehr Bilder mit derselben Schriftart haben, die Sie später mit OCR bearbeiten möchten.

OCR für niedrig aufgelöste Bilder von Text in Kursivschrift

Dhruva

Izzy

essexboyracer

Antworten (1)

HerrÖffentlichkeit

Dhruva

Dhruva

HerrÖffentlichkeit

Programm, das ein schiefes Foto liest und die Wörter im Bild extrahiert? [Duplikat]

OCR-Software zum Scannen medizinischer Berichte / elektronischer Patientenakten

Ersetzen beschädigter Systemschriftarten in macOS Sierra

Gibt es eine App, die schnell ein Bild von ausgewähltem Text erstellt?

AppleScript: Wählen Sie ein bestimmtes Dropdown-Menüelement aus?

Problem beim Rendern von Helvetica-Schriftarten auf dem MacBook Leopard

Windows-PowerPoint-Präsentationen auf einem iPad mit großer typografischer Verzerrung

Ein PDF-zu-Mobi-Konverter

Wie finde ich heraus, welche Serifenschrift in der Day One Mac-App verwendet wird?

/Library/Fonts vs. Font Book