Was ich versuche ist im Wesentlichen:
Ich bekomme ein Bild von einem Buch/Papier. Alle Wörter in diesem Bild wurden getippt, aber ich kann die Wörter nicht mit meinem Cursor extrahieren.
Aus diesem Bild möchte ich alle Wörter extrahieren. Gibt es ein Programm, das das Bild aufnehmen und alle Wörter extrahieren kann (mit Leerzeichen, Großbuchstaben, Satzzeichen usw.)?
Ich denke, meine Frage unterscheidet sich möglicherweise von dem Link im Kommentar unten, da das Bild, aus dem ich versuche, Wörter zu extrahieren, ein Telefonbild einer Seite in einem Buch ist. Der Winkel ist leicht schief. Ich habe den OCR-Reader von Adobe ausprobiert und er gibt mir keine korrekte Ausgabe.
Ich nutze hauptsächlich macOS. Ich kann jedoch auf Windows 7 (und 10) und Linux zugreifen. Qualität steht an erster Stelle, und die Kosten sind bis zu einem gewissen Grad zweitrangig. Ich bin wirklich auf der Suche nach einer guten Software und bin bereit, etwas Geld auszugeben.
Ich muss insgesamt 100 Seiten bearbeiten.
Eines der wichtigsten OCR-Programme ist Tesseract OCR , ein Befehlszeilen-, Open-Source-, Apache-Lizenz- und plattformübergreifendes Tool. Es ist kostenlos und kann eine große Anzahl von Sprachen unterstützen (>100 einschließlich Unicode-Unterstützung) und kann für mehr trainiert werden. Es wurde seit 1985 entwickelt und wird immer noch (2017) aktiv weiterentwickelt. Es ist von der Quelle oder als vorgefertigte Binärdateien für Windows, Linux, Mac, Android verfügbar.
Wie bei der meisten OCR-Software hängt die Genauigkeit von der Bildqualität ab (die Sie möglicherweise verbessern können) und möglicherweise vom Training des Pakets für die Schriftart usw. sowie von der Sprache. Wenn beispielsweise der Winkel des Textes schief ist, lohnt es sich, einen Bildeditor wie GIMP zu verwenden , um den Winkel des Bildes zu begradigen.
Es gibt eine Reihe von GUIs, die hier unter verschiedenen Lizenzen und für verschiedene Plattformen aufgeführt sind.
Es gibt auch eine große Anzahl von Webdiensten, die dieselbe Technologie verwenden, aber ein Wort der Vorsicht: Verwenden Sie Webdienste nicht für urheberrechtlich geschützte oder vertrauliche Informationen, da die Verwendung einiger solcher Dienste als Veröffentlichung der Informationen in der Welt gilt und/oder Einige Dienste behalten sich das Recht vor, Ihre Informationen auf beliebige Weise zu verwenden .
Wenn Sie ein Bild in MS OneNote einfügen und mit der rechten Maustaste auf das Bild klicken, gibt es eine Option für „Text aus Bild kopieren“. Sie können es dann dort einfügen, wo Sie es brauchen. Diese Methode ist alles andere als perfekt. Dies hängt von der Qualität des Textes im Bild und der verwendeten Schriftart ab. Aber ich habe lange Textzeilen aus Bildern extrahiert. Es kann schneller sein als das Kopieren/Eingeben beim Lesen von Text durch einfaches Eintippen.
Hinweis: Ich verwende die Windows-Version.
ivwan
Lawson123