Dokumentenscansoftware mit OCR, die mehrere CPUs nutzt

Im Moment verwende ich die Software, die mit meinen CanoScan-Flachbettscannern geliefert wurde. Meine Hauptbeschwerde über die mitgelieferte Software: keine Möglichkeit, Scan-Profile zu definieren, zu langsam (kann nicht mehrere CPU-Kerne/Threads verwenden).

Was ich suche, ist nicht die Stapelverarbeitung mit ADF-Dokumentenscannern mit höherem Volumen, sondern die Ad-hoc-Erfassung mit Flachbettscannern. Es ist zum Scannen von Dokumenten geeignet, die nicht für ADF-Scanner geeignet sind, dh Dokumente, die zu dünn/dick/groß sind oder aus mehreren kleineren Teilen bestehen, die zusammen auf einem Bild erscheinen müssen.

Ich stelle mir einen Workflow vor, der mit dem auf Unternehmens-MFPs vergleichbar ist, wo Sie Ihr Dokument auf das Glas legen und ein Scanprofil auf dem Display auswählen, nur dass Sie das Scanprofil auf dem PC auswählen, an dem der Flachbettscanner angeschlossen ist.

Geplante Softwarefunktionen:

  1. funktioniert mit TWAIN-Treibern,
  2. Scanprofile (= benutzerdefinierte Kombination aus dpi, Bildverbesserungseinstellungen, OCR-Sprache, Ausgabedateityp),
  3. optimiert für mehrere CPU-Kerne/Threads,
  4. Bildverbesserungsfunktionen (auswählbar als Teil von Scanprofilen) z. B. Entrastern, Durchscheinen verhindern, Schräglagenkorrektur, automatisches Zuschneiden,
  5. OCR für die wichtigsten europäischen Sprachen,
  6. Ausgabeformat: TIFF, durchsuchbares PDF, PDF/A, jpg, jpg2000

Ich möchte eine Software vermeiden, die dem Batch-Scanning-Ansatz folgt, da dies unnötige Komplexität hinzufügt.

Ich verwende Windows, aber ich überlege, als Alternative auf Mac OS umzusteigen, wenn ich keine geeignete Windows-Software finde und es eine gute Software für OSX gibt.

Also einen Blick wert: Tool zum Extrahieren von Text aus einem Scan . Nicht genau das, wonach Sie suchen, aber sehen Sie sich die Antwort von OCRFeeder an : Dieses Tool unterstützt direkt Scanner (eine Seite pro Scan) und sollte mindestens die Punkte d bis f Ihrer Liste erfüllen. Da ich kein Windows-Benutzer bin, habe ich keine direkte Empfehlung für diese Plattform.
Es sieht so aus, als ob Sie schnellere Software wollen. Würden Sie eine Single-Thread-Lösung akzeptieren, wenn sie deutlich schneller arbeiten würde?
@Kelly Thomas: Ja, würde ich.

Antworten (2)

Ich füge Vuescan von hamrick.com meiner Vorschlagsliste hinzu.

Ich empfehle Omnipage Pro von Nuance.

Es unterstützt 120 Sprachen.

http://www.nuance.com/for-business/by-product/omnipage/ultimate/index.htm

Was die Scanprofile betrifft, hat meine Epson-Scannersoftware sie. Je nach Scanner könnten also "Scanprofile" fehlen.

Scanprogramme lieben Arbeitsspeicher, man braucht mindestens 8GB wenn nicht 16GB

Unterstützung beim Laden Geben Sie hier die Bildbeschreibung einBildtyp speichern: Texttyp speichern Geben Sie hier die Bildbeschreibung ein: Geben Sie hier die Bildbeschreibung einHier ist die Symbolleiste Geben Sie hier die Bildbeschreibung einzur Bildverbesserung /Helligkeit“ „Zuschneiden“ „Drehen/Spiegeln“ „Despeckle“ „OCR-Helligkeit“ „Dropout-Farbe“ „Auflösung“ „Begradigen“ „3D-Begradigung“ „Füllen“ „AutoCrop“ „Ränder reinigen“ „Lochentfernung“ „ Verbessertes Whiteboard-Foto"

Vielen Dank für Ihren Hinweis! Die Software ist mit 500 USD recht teuer. Aus der Liste der Merkmale unter dem von Ihnen angegebenen Link geht nicht hervor, ob meine Kriterien 2., 3., 4. und 6. erfüllt sind. Omnipage ist schon lange auf dem Markt. Solche Legacy-Software ist oft mit unnötigen Funktionen überladen und schrecklich zu bedienen. Ist es benutzerfreundlich, sodass Sie nicht Stunden damit verbringen müssen, herauszufinden, wie man es benutzt?
Ich schlage vor, dass Sie anrufen/emailen/usw. und eine Testversion von Omnipage Pro Ultimate bekommen. Adobe Acrobat Pro ist ähnlich, aber gleich teuer.
In Bezug auf die Benutzerfreundlichkeit sind alle normalen Funktionen vorhanden. Es gibt erweiterte Funktionen, die Sie lernen müssen. Ich habe nicht die neueste Version jeder Software getestet, aber dieses Produkt war zum Zeitpunkt des Tests besser als jede andere Software, die mit einem Scanner geliefert wurde, außer dass Adobe Pro zu teuer war, also habe ich es nicht getestet. Ich habe die Version verwendet, die ich und Freunde/Familie/usw. haben. Funktionen wie das Scannen einer Seite mit 3 Spalten und einer oder mehreren mit einem Bild, oder das Bild schneidet über 3 Spalten, führt normalerweise dazu, dass die meisten anderen Scanprodukte kotzen. Omnipage macht eindeutig einen besseren Job.
cybernard sagte ""Scanprofile" könnten je nach Scanner fehlen". Wie Sie sagen, können Scanprofile Teil Ihres TWAIN/ISIS-Treibers sein. Es gibt aber auch Scansoftware auf dem Markt mit vom Scannertreiber unabhängigen Scanprofilen (z. B. ExactScan für Mac). Scanprofile ermöglichen es, das Scannen weitgehend zu automatisieren. Die Funktionen, die Sie im Screenshot "Image Enhancement" zeigen, sind manuelle, was meinem Automatisierungsziel zuwiderläuft.
Adobe hat 5 vordefinierte Scanprofile, eines davon ist "Custom Scan...". Was ich brauche, ist die Möglichkeit, meine eigenen Profile zu definieren - nicht nur eines, sondern sagen wir mindestens 10. Omnipage Pro Ultimate unterstützt diese Funktionen anscheinend nicht. Für meinen Zweck also nicht geeignet.
Mein Scannertreiber bietet Scanprofile an. Da ein Scannertreiber niemals OCR enthält, muss ich die Dokumentenerfassung in 2 Schritte unterteilen: 1. Scannen, 2. OCR. Was ich suche, ist, diese 2 Schritte in einem Rutsch zu haben. Dann könnte ein Benutzer die Scansoftware öffnen, ein Profil entsprechend den Merkmalen des zu scannenden Dokuments auswählen und das Ergebnis erhalten, ohne viel über die Details der Software zu wissen. ExactScan macht das für Mac. Es gibt eine Betaversion von ExactScan für Windows, die jedoch nicht für mehrere CPU-Kerne/-Threads optimiert ist.
Wenn Sie Omnipage Pro für die Verwendung von TWAIN-Treibern für den Scanner einrichten, wird die native Scanneroberfläche angezeigt. Ich habe versucht, ExactScan für Windows zu verwenden, und es konnte meinen Scanner nicht erkennen, und als ich versuchte, eine PDF-Datei mit durchsuchbarem Text zu speichern, erhielt ich keinen Text, wenn ich eine Bilddatei als Ersatz für einen Scanner verwendete.
Jetzt, wo ich weiß, wie ExactScan funktioniert, würde ich definitiv Vuescan von www.hamrick.com empfehlen. Kostenlose Demo verfügbar. Optionen können in INI-Dateien gespeichert werden, sodass Sie problemlos mehrere Profile laden können. Sie müssen auf mehreren verschiedenen Bildschirmen auf die Schaltfläche „Erweitert“ klicken, um OCR zu aktivieren und den Text bei Bedarf in einer Datei zu speichern.
Vielen Dank für das Feedback zu ExactScan Beta. Die native Scannerschnittstelle ist oft (optional) in Scansoftware zugänglich, zB auch in Adobe. Das Problem ist, dass normalerweise zusätzliche Klicks erforderlich sind, um dorthin zu gelangen - manchmal zu viele (wie bei Adobe). Eine solche Lösung ist einerseits nicht „idiotensicher“ und fügt andererseits unnötig Klicks und Zeit hinzu, um zu einem Ergebnis zu kommen. Ich denke, einige Scanner-Hersteller gehen mit Scan-Profilen in diese Richtung (zB Canon), aber sie sind noch nicht ganz da (Canon-Software fehlt zB die Möglichkeit, eigene Scan-Profile zu konfigurieren).
Ich kenne Vuescan und mag es. Leider funktioniert es nur mit WIA aber nicht mit TWAIN Treibern. Und einer meiner Scanner hat einen WIA-Treiber, der wegen eines Fehlers unbrauchbar ist. Schade, dass ich Vuescan mit diesem Scanner nicht nutzen kann.
Vor einiger Zeit habe ich IDM Scan 2.0 (www.idmscan.com) getestet. Es bietet Scanprofile. Ich hatte nicht genug Zeit, um es vor Ablauf der Testphase vollständig zu testen. Wenn ich mich richtig erinnere, bietet es kein OCR und die Benutzeroberfläche hat mich nicht vollständig überzeugt.
Haben Sie den Autor von Vuescan per E-Mail gefragt, ob er TWAIN-Unterstützung für Ihren Scanner hinzufügen würde? Kann ich davon ausgehen, dass Sie regelmäßig nach Treiberaktualisierungen suchen und / oder dem Unternehmen eine E-Mail senden, um zu sehen, ob der Scanner mit defektem WIA repariert wird? Vielleicht ist es besser, alles als TIFF mit 600/1200 dpi zu scannen und anschließend mit OCR zu scannen. Ein neuer Scanner, der über TWAIN und Vuescan kompatibel ist, würde viel weniger kosten als professionelle Software. Epson v550 kostet 149 US-Dollar und ist mit VueScan kompatibel.
Ja, ich habe Vuescan kontaktiert. Es verwendet kein TWAIN, nur WIA. Leider hat Lexmark den WIA-Treiber seit mehr als 2 Jahren nicht mehr aktualisiert. Ich habe sie jetzt kontaktiert und werde sehen, was sie sagen.
Das Problem bei Flachbettscannern ist die eher langsame Geschwindigkeit. Der Lexmark Genesis S815 verwendet ein Kameramodul, das ein Bild der gesamten Seite aufnimmt. Der Scanvorgang dauert 3 Sekunden. Die meisten Standard-Flachbettscanner benötigen 8 Sekunden oder mehr. Meine Idee war, den Prozess so weit wie möglich in einem Schritt mit einer schnellen Erfassung durch den Scanner zu automatisieren. Ich bin überrascht, dass kein anderer Hersteller einen Flachbettscanner mit Kameramodul anbietet. Der Vorteil der höheren Geschwindigkeit liegt auf der Hand.

Sie sollten sich Abbyy Finereader ansehen, ehrlich gesagt bin ich mir nicht sicher, ob es alle Ihre Kriterien erfüllt, da ich vor ein paar Jahren eine ältere Version verwendet habe. Ich erinnere mich nur, dass es mit meinem Scanner funktionierte und wirklich effizient und einfach zu bedienen war.

Wie auch immer, Sie können es kostenlos ausprobieren, also ist der beste Weg, um herauszufinden, ob es wirklich Ihren Bedürfnissen entspricht, es auszuprobieren, denke ich.

Bearbeiten: Laut den technischen Spezifikationen der neuesten Version scheint es Ihre Erwartungen ziemlich gut zu erfüllen.

Ich kenne Abbyy Finereader. Der Fokus liegt auf OCR, nicht auf Scan-Automatisierung in meinem Sinne. Da es keine Scanprofile anbietet, ist es tot im Wasser.