OCR für Handschrift

Für Web oder Mac OS/X

Ich muss Tabellendaten aus einem handgeschriebenen Papierformular entnehmen und in digitale Daten in einem nützlichen Format wie CSV konvertieren. Meine derzeitige Überlegung ist, eine Bilddatei des Formulars zu erstellen und sie durch ein OCR-Programm laufen zu lassen. Bonuspunkte, wenn es kostenlos und online ist oder idealerweise mit einer API-Schnittstelle automatisierbar ist.

Gibt es so etwas? Vielleicht ein Open-Source-Projekt?

Es gibt keine gute Handschrift-OCR aus Bildern . Daran scheitern bekannte Dienste wie Google OCR oder OCR.space . Was existiert, sind handschriftliche Eingabelösungen wie webdemo.myscript.com - aber sie erfordern die vollständige Strichfolge als Eingabe, nicht nur ein Bild.

Antworten (2)

Die Handschrifterkennung ist generell ein schwieriges Problem. Wie auch immer Sie Formulare erwähnen, in diesem Fall kann eine unterstützte Erkennung möglich sein, wenn das Formular aus Zeichenfeldern in Gruppen mit begrenzt möglichen gültigen Eingaben besteht. Mit unterstützt meine ich, dass jedes Mal, wenn es unsicher ist, ein Bild dieses Abschnitts für die manuelle Eingabe angezeigt wird

Sie können ein solches System mit OpenCV entwickeln, wie im pyImageSearch- Blog gezeigt, möglicherweise durch Training eines Expertensystems. Es ist unwahrscheinlich, dass Sie einen finden, der bereits geschrieben ist.

Ich würde vorschlagen, sich die Computer Vision API von Microsoft anzusehen, insbesondere den handschriftlichen OCR-Teil. In ihren Dokumenten heißt es derzeit: „Hinweis: Diese Technologie befindet sich derzeit in der Vorschau und ist nur für englischen Text verfügbar.“

Ich habe beeindruckende Ergebnisse erzielt, als ich es ausprobiert habe. Sie können es testen, ohne etwas zu installieren, laden Sie einfach ein Beispielbild unter https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/ hoch (scrollen Sie auf der Seite nach unten, um „Preview: Handschriftlichen Text von Bildern lesen")

Beispielcode zeigt, wie dies von Python und anderen Sprachen aus verwendet wird:

https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/python#RecognizeText