Programm, das ein schiefes Foto liest und die Wörter im Bild extrahiert? [Duplikat]

Was ich versuche ist im Wesentlichen:

  1. Ich bekomme ein Bild von einem Buch/Papier. Alle Wörter in diesem Bild wurden getippt, aber ich kann die Wörter nicht mit meinem Cursor extrahieren.

  2. Aus diesem Bild möchte ich alle Wörter extrahieren. Gibt es ein Programm, das das Bild aufnehmen und alle Wörter extrahieren kann (mit Leerzeichen, Großbuchstaben, Satzzeichen usw.)?

Ich denke, meine Frage unterscheidet sich möglicherweise von dem Link im Kommentar unten, da das Bild, aus dem ich versuche, Wörter zu extrahieren, ein Telefonbild einer Seite in einem Buch ist. Der Winkel ist leicht schief. Ich habe den OCR-Reader von Adobe ausprobiert und er gibt mir keine korrekte Ausgabe.

Ich nutze hauptsächlich macOS. Ich kann jedoch auf Windows 7 (und 10) und Linux zugreifen. Qualität steht an erster Stelle, und die Kosten sind bis zu einem gewissen Grad zweitrangig. Ich bin wirklich auf der Suche nach einer guten Software und bin bereit, etwas Geld auszugeben.

Ich muss insgesamt 100 Seiten bearbeiten.

Hast du viel davon? Für "nur ein paar" finden Sie vielleicht einen Online-Dienst, der es einfacher macht, alles selbst zu machen - ich habe onlineocr.net erfolgreich verwendet , um Screenshots von Programmiercode (Java) in reinen Text zu konvertieren, den ich dann tatsächlich verwenden könnte ...
Ich habe im Moment ziemlich viele, und ich bin mir sicher, dass ich in den kommenden Monaten noch mehr haben werde. Wahrscheinlich irgendwo um die 100 Seiten insgesamt in den nächsten Monaten. Ich habe das Adobe OCR-Tool ausprobiert, und es macht überhaupt keine gute Arbeit. Ich habe es vorhin auf einem Bild ausprobiert und es hat mir viele seltsam aussehende Symbole gegeben.

Antworten (2)

Eines der wichtigsten OCR-Programme ist Tesseract OCR , ein Befehlszeilen-, Open-Source-, Apache-Lizenz- und plattformübergreifendes Tool. Es ist kostenlos und kann eine große Anzahl von Sprachen unterstützen (>100 einschließlich Unicode-Unterstützung) und kann für mehr trainiert werden. Es wurde seit 1985 entwickelt und wird immer noch (2017) aktiv weiterentwickelt. Es ist von der Quelle oder als vorgefertigte Binärdateien für Windows, Linux, Mac, Android verfügbar.

Wie bei der meisten OCR-Software hängt die Genauigkeit von der Bildqualität ab (die Sie möglicherweise verbessern können) und möglicherweise vom Training des Pakets für die Schriftart usw. sowie von der Sprache. Wenn beispielsweise der Winkel des Textes schief ist, lohnt es sich, einen Bildeditor wie GIMP zu verwenden , um den Winkel des Bildes zu begradigen.

Es gibt eine Reihe von GUIs, die hier unter verschiedenen Lizenzen und für verschiedene Plattformen aufgeführt sind.

Internetdienste

Es gibt auch eine große Anzahl von Webdiensten, die dieselbe Technologie verwenden, aber ein Wort der Vorsicht: Verwenden Sie Webdienste nicht für urheberrechtlich geschützte oder vertrauliche Informationen, da die Verwendung einiger solcher Dienste als Veröffentlichung der Informationen in der Welt gilt und/oder Einige Dienste behalten sich das Recht vor, Ihre Informationen auf beliebige Weise zu verwenden .

"gilt als Veröffentlichung der Informationen" Bedeutung? Grammatik?
@ Pacerier - Ich denke, dass ich die Vorsicht sowohl in Bezug auf die Klarheit als auch auf die Grammatik verbessert habe.

Wenn Sie ein Bild in MS OneNote einfügen und mit der rechten Maustaste auf das Bild klicken, gibt es eine Option für „Text aus Bild kopieren“. Sie können es dann dort einfügen, wo Sie es brauchen. Diese Methode ist alles andere als perfekt. Dies hängt von der Qualität des Textes im Bild und der verwendeten Schriftart ab. Aber ich habe lange Textzeilen aus Bildern extrahiert. Es kann schneller sein als das Kopieren/Eingeben beim Lesen von Text durch einfaches Eintippen.

Hinweis: Ich verwende die Windows-Version.

Dies scheint auf der Mac-Version von OneNote nicht zu funktionieren. Ich werde es auf einer Windows-Version versuchen, wenn ich Zugang bekomme.
OK - ich habe das in der Antwort hinzugefügt, falls sich das jemand anderes ansieht. Viel Glück.