Schnelles Ersetzen beschädigter Zeichen für gescannte Seiten

1. Zusammenfassung

Ich habe gescannte PDFs von Drittanbietern in schlechter Qualität, bei denen die Anfangsbuchstaben der Zeilen hervorgehoben sind.

Ich habe zahlreiche schlecht gescannte PDFs, die manuelle Ausrichtung von Zeichen zum Ersetzen nimmt viel Zeit für mich in Anspruch. Ich kann nicht finden, wie ich Zeichen in schlechter Qualität schnell überschreiben/ersetzen/reparieren kann.


2. Erwartetes Ergebnis

  • Vor:

Vor

  • Nach:

Nach


3. Beispieldaten

Es wäre schön, das erwartete Ergebnis für jede dieser Dateien zu erhalten.

Startzeichen beschädigt:

Text in schlechter Qualität


4. Grenzen

  1. Ich kann keine Seiten mit schlechter Qualität erneut scannen oder Fotos machen, da ich keinen Zugriff auf Bücher habe.
  2. Bitte keine kostenlose Windows-Software. Nicht Photoshop, FineReader oder Acrobat.

5. Beispiele für erwartetes Verhalten

Ich habe beschädigte Symbole; Ich denke nicht, dass man sie über Features wie „ Dodge/Burn “ reparieren kann.

5.1. Verhalten von Texteditoren

Ich entferne vorherigen Text → Ich drucke neuen Text wie in jedem Texteditor:

Texteditor

5.2. Zeilenweise ausrichten

Ich entferne beschädigte Zeichen im Bildeditor, verwende „ Bucket Fill “ → Ich erhalte Schriftart und Schriftgröße, verwende pdffonts → Ich setze sie in den Bildeditoreinstellungen → Ich schreibe den Text:

Nicht ausgerichtet

→ Ich drücke auf die magische Schaltfläche „Align by line“ → Text wird zwischen imaginären roten Linien ausgerichtet:

Ausgerichtet

Ich kann in keinem Bildeditor eine ähnliche Funktion wie „An Zeile ausrichten“ finden (siehe Abschnitt „Bildeditoren“); Ich muss Text manuell ausrichten, das nimmt viel Zeit in Anspruch.


6. Nicht geholfen

Ich kann die erwarteten Funktionen in diesen Programmen nicht finden. Außerdem habe ich versucht, FineReader-Alternativen wie NAPS2 und GImageEditor zu verwenden → kein Erfolg.

6.1. PDF-Editoren

Ich habe hier nach Software gesucht :

  • PDF-XChange-Editor
  • LibreOffice Draw — Ich habe gefunden, wie ich die OCR-Ebene bearbeiten kann, nicht das Original-PDF:

    LibreOffice Draw

  • PDFEdit — Textbearbeitung funktioniert bei mir nicht:

    PDFBearbeiten

  • Icecream PDF-Editor

6.2. Bildbearbeiter

Ich habe hier nach Software gesucht :

  • GIMP
  • Inkscape
  • Paint.NET
  • Krita
Ich glaube nicht, dass es dafür eine "schnelle" oder "einfache" automatisierte Lösung gibt.

Antworten (1)

Es gibt keine Software, die fehlerhafte Rasterscans von Text automatisch reparieren kann. Es gibt keine einfache Möglichkeit, neu eingegebenen Text an Rastertextzeilen auszurichten, außer mit dem Auge oder mithilfe von Hilfslinien. Rasterbilder sind kein bearbeitbarer Text, daher gibt es nichts, an dem getippter Text ausgerichtet werden kann, außer an Pixeln.

OCR-Software funktioniert nicht richtig, wenn Zeichen durcheinander sind. Wenn Sie es jedoch ohnehin durch eine OCR-Software ausführen können, können Sie die Bits, die durcheinander geraten sind, einfach erneut eingeben.

Ich habe diesen Onlinedienst für eines Ihrer Bilder verwendet. https://onlineocr.net/ . Es hat eine russische Sprachoption. Sieht größtenteils OK aus, obwohl es wegen der durcheinandergebrachten Zeichen Fehler gibt, und diese müssen manuell neu eingegeben werden. Ich habe keine Zugehörigkeit zu der Website oder ihren Entwicklern.

Hier ist das Ergebnis:

АРИСТОТЕЛЬ , L (384-322 до н.э.) древнегреческий философ' и ученый

л 335 году до н.э. Аристотель, закончив воспитание с�оro Александра Македонского, основал в Афинах свою о� -хофскую школу. когда Александр неожиданно умер, в Афинах взяли верх *х:.нвники Македонии. Аристотеля, как прежде Анаксаго-л Сократа, обвинили в нечестии, то есть в неуважении s �•згач. Он оставил Афины, «чтобы афиняне, - как он ска-г= — вторично не совершили преступления против фило--:лии ,. казнив его, как некогда казнили Сократа. Философ гхелился на родине своей матери, в городе Халкида на :сове Эвбея. Здесь он и умер от болезни желудка. Много веков спустя появилась легенда о смерти фило-:_а из-за неудовлетворенного научного любопытства. Халкида расположена на берегу пролива Эврип, отделя-:• :его остров Эвбею от материковой Греции. Пролив этот -=- оычайно узок: его минимальная ширина всего 38 ме--+,в. Каждые б часов направление течения в проливе ме -ется. Аристотель долго пытался разгадать причину такой ь -оиаiии; когда же ему это не удалось, он от отчаяния бро-хтся в море, воскликнув: — Аристотель не смог охватить умом Эврип, так вгть же Эврип охватит Аристотеля! Эти слова привел византиец VIII века Косма Маюмский комментарии к «Стихотворениям Григория Богослова. 39