Kennt jemand eine gute Softwareauswahl, mit der ich entweder Dokumente mit einer Reihe von Glyphen (Zeichentabelle hinter PDF-Dokumenten) vergleichen kann?
Oder kennt jemand eine gute OCR-Software, die Dokumente lesen und vergleichen kann? Es muss unter Windows laufen, und ich habe keine Preisspanne.
Wenn Sie mit einem kommerziellen OCR SDK arbeiten möchten, können Sie sich das LEADTOOLS OCR SDK ansehen . Sie können ein Dokument ganz einfach in nur wenigen Codezeilen per OCR erkennen, siehe unten.
// Initialize the OCR engine
ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage,
// Startup the engine
ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime");
using (IOcrDocument ocrDocument = ocrEngine.DocumentManager.CreateDocument())
{
//Load image
RasterImage image = ocrEngine.RasterCodecsInstance.Load(file, 0, CodecsLoadByteOrder.Rgb, 1, -1);
//Add pages
ocrDocument.Pages.AddPages(image, 1, -1, null);
//Recognize Page
ocrDocument.Pages.Recognize(null);
//Save Output
ocrDocument.Save(outPut, Leadtools.Forms.DocumentWriters.DocumentFormat.Text, null);
}
Sie können auch eine interaktive OCR-HTML5/JavaScript-Demo finden, wenn Sie daran interessiert sind, dies mit Ihrer Datei zu testen. Dieses SDK funktioniert unter Windows, Linux, Mac, Android, WinRT und iOS.
Haftungsausschluss: Ich bin ein Mitarbeiter dieses Produkts
Nikolaus Raul
Nikolaus Raul