PHP-OCR-Bibliothek

Auf der Suche nach einer OCR-Bibliothek zur Integration in eine PHP/JS/HTML5-Webanwendung. PHP wird bevorzugt , es kann jedoch jede Sprache zum Laufen gebracht werden. execWenn also eine Nicht-PHP-Option schneller oder von hoher Qualität ist, würde ich gerne davon hören.

Anforderungen:

  • "ziemlich" gute OCR-Qualität.
  • relativ schnelle Konvertierung (und hier ist eine weitere Anforderung, die gelinde gesagt etwas subjektiv ist).
  • Open Source oder eine ausgereifte und gut dokumentierte API.
  • Plattformübergreifend.
  • Kann kein Webdienst sein, selbst wenn er eine großartige API hat (Aufgrund der Verwendung der Webanwendung in vertraulichen Situationen und in Ethernets, für die nicht garantiert ist, dass eine aktive Internetverbindung besteht.

Antworten (2)

Dafür gibt es eine Bibliothek: TesseractOCR für PHP

https://github.com/thiagoalessio/tesseract-ocr-for-php

Verwenden von Tesseract unter der Haube, der wahrscheinlich besten Open-Source-OCR-Bibliothek.

Es ist Open Source und plattformübergreifend.
Kein Webservice, alles wird auf Ihrem Server erledigt.

Vielleicht möchten Sie diese Open-Source -PHP-OCR-Klasse ausprobieren , die nach einer Trainingsphase Text in monochromen grafischen Bildern erkennen kann.

Es ist in reinem PHP geschrieben, also plattformübergreifend, nicht auf externe Programme oder Webdienste angewiesen.

Es enthält Beispielskripte zum Lernen und Erkennen von Text. Die Lernphase besteht darin, ihm Beispielbilder mit Text mit vorgegebenem Text zu übergeben, damit die Klasse später den Text an sich erkennen kann. Ein angemessener Satz von Beispielbildern wird bereitgestellt. Gutes anfängliches Training,