Es gibt eine Aktion in Automator, mit der Sie programmgesteuert „ PDF-Text extrahieren “ können, dies schlägt jedoch fehl, wenn eine moderate Anzahl von Dateien (25 bis 100) zugeführt wird. Schlimmer noch, es schlägt fehl, ohne dass irgendetwas Hilfreiches protokolliert wird, außer einer Meldung, dass "Automator Unexpectedly Quit".
Kennt jemand einen entsprechenden Befehl, um dies in Applescript zu tun? Ich suche nach Tools, mit denen ich mehr Kontrolle über Dinge wie Protokollierung und Fehlerbehandlung habe, damit ich PDF-Dateien effizienter in ein Textformat verarbeiten kann.
Ich weiß nicht, wie es mit anderen Optionen verglichen wird, aber Sie könnten pdfotext verwenden. Es kann mit installiert werden brew install xpdf
.
do shell script "/usr/local/bin/pdftotext /usr/share/doc/bash/bash.pdf -" without altering line endings
Calibre enthält auch einige Befehlszeilenprogramme:
/Applications/calibre.app/Contents/MacOS/ebook-convert /usr/share/doc/bash/bash.pdf /tmp/output.txt
Verwandte Fragen:
Fahrrad
Benutzer141146
Simon