PDF-Bearbeitungssoftware zum Entfernen dunkler Scanränder

Angenommen, Sie haben eine PDF-Datei, die aus einem Scan mehrerer Seiten eines Buches (in einem kleineren Format als dem Standardformat des Scanners (z. B. 10 cm x 20 cm und DIN A4)) resultiert, und dass die Person, die gescannt hat, das Buch eher an willkürlichen Positionen platziert hat der Scanner. Gibt es ein Tool, das entweder

  • ermöglicht das automatische Entfernen dieser Ränder (Fehlberechnungen des Randes sind eher unwahrscheinlich, müssen aber akzeptiert werden)
  • erlaubt, von Seite zu Seite zu gehen und die dunklen Ränder zu entfernen, basierend auf Vorschlägen des Programms (ich möchte darüber hinaus keine Bearbeitungswerkzeuge verwenden müssen, vielleicht den Vorschlag korrigieren, aber den Rand nicht von Anfang an definieren Ziehen eines Rahmens, Verschieben von Trennlinien oder ähnliches)

Die Umwandlung PDF -> Bild(er) -> PDF sollte nicht das Problem sein und man kann das mit zwei oder drei Befehlen auf der Befehlszeile machen, also wenn es eine Batch-fähige Lösung für Bilder gibt, würde ich es als Lösung betrachten.

Sieht so aus, als ob das PDF nur aus Bildern besteht. Ein „mittleres Arbeitsniveau“, das ich mir vorstellen kann, ist: Exportieren Sie die Bilder und verarbeiten Sie sie dann im Stapel mit OCR-Software. Aber dann hätten Sie Text statt Bilder, und das könnte Ihnen zu weit gehen.
Photoshop? Es ist in der Lage, PDF-Dateien zu verarbeiten, und Sie können diese unerwünschten dunklen Bereiche damit leicht entfernen, nehme ich an?
@Neeku Ja, aber Photoshop verfügt nicht über die von mir beschriebene Automatisierung ("Ich möchte keine Bearbeitungswerkzeuge außer [dem automatisch generierten Vorschlag der Software] verwenden müssen"). Ich könnte jede Bildbearbeitungssoftware verwenden, sogar viel weniger ausgefeilte und/oder kostenlose Alternativen zu Photoshop.
Recht. Ich bin mir nicht sicher, ob ich verstehe, was Sie mit der Automatisierung meinen, aber Sie können Makros (Aktionen) in Photoshop erstellen, um die sich wiederholenden Aktionen für Sie auszuführen. Aber nochmal, ja! Ich verstehe, dass PS mehr für Bilder als für PDFs ist. Außerdem konnte ich mich an den Namen der App erinnern, die ich vor Jahren unter Windows verwendet habe, Nitro PDF . Ich bin mir nicht sicher, ob ich es als Antwort dort hinstellen sollte, da ich mich nicht erinnern kann, ob es diese Funktion hatte, aber ich war normalerweise sehr glücklich damit, PDFs damit zu bearbeiten.
Ich denke, dass GIMP und Blender auch viele Möglichkeiten zum Skripten haben (tolle Python-API und / oder Bindungen), aber es ist ziemlich nicht trivial und ich kann mir nicht vorstellen, dass dies in Photoshop einfacher ist. Außerdem gehe ich davon aus, dass Ihnen die Makroaufzeichnung basierend auf GUI-Aktionen (in jeder Anwendung) die Implementierung der Margin-Erkennungslogik nicht ersparen wird.

Antworten (2)

Probieren Sie die folgende Software aus:

  • Unpaper [Befehlszeilentool, plattformübergreifend]

    Nachbearbeitungstool für gescannte Papierbögen, insbesondere für Buchseiten, die von zuvor erstellten Fotokopien gescannt wurden. Der Hauptzweck besteht darin, gescannte Buchseiten nach der Konvertierung in PDF auf dem Bildschirm besser lesbar zu machen. Darüber hinaus kann Unpaper nützlich sein, um die Qualität gescannter Seiten zu verbessern, bevor die optische Zeichenerkennung (OCR) durchgeführt wird. unpaper versucht, gescannte Bilder zu bereinigen, indem es dunkle Ränder entfernt, die durch Scannen oder Kopieren an Bereichen außerhalb des eigentlichen Seiteninhalts entstanden sind (z. B. dunkle Bereiche zwischen der linken und rechten Seite eines doppelseitigen Buchseitenscans). ).

    OSX-Installation über Homebrew :brew install unpaper

  • Scan Tailor ( GitHub ) [Windows/OSX/Linux]

    Interaktives Nachbearbeitungstool für gescannte Seiten. Es führt Vorgänge wie Seitenaufteilung, Schräglagenkorrektur, Hinzufügen/Entfernen von Rändern und andere aus.

    OSX-Installation über Homebrew :brew install scantailor

  • Buchscan-Assistent [Java/plattformübergreifend]

    Ein Dienstprogramm, das beim Scannen von Büchern mit Kameras als Scanner hilft. Es automatisiert Dinge wie Zuschneiden, Drehen, Trapezkorrektur, DPI-Korrektur und Ausgabe in TIFF-Dateien, die in PDFs oder E-Books umgewandelt werden können.

  • DIY-Buchscanner-Bildpostprozessor

    Ein Bild-Postprozessor für den auf instructables.com und DIY Book Scanner beschriebenen DIY Book Scanner . Bereitet Bilder für OCR oder PDF vor. Geschrieben in Java basierend auf einer partiellen Portierung der Leptonica-Bildverarbeitungsbibliothek.

Zusammenhängende Posts:

Sie können das ImBatch- Programm ausprobieren . Es ist ein Batch-Bildverarbeitungstool für Windows. Es kann eine mehrseitige PDF-Datei als Eingabe verwenden, jede Seite kann als Bild mit der Aufgabe "Autocrop" verarbeitet werden, dann die Aufgabe "In PDF speichern ..." hinzufügen und sicherstellen, dass die Option "Separate PDF-Datei für jedes Bild" deaktiviert ist .

Es sollte für Sie funktionieren. Ich bin mir jedoch nicht sicher, ob die Aufgabe "Autocrop" Ihre Seiten korrekt verarbeiten kann. Dieses Tool verfügt auch über eine Batch-Aufgabe zum Geraderichten von Text, falls die Seiten etwas gedreht gescannt wurden.