Export: Text aus PDF ohne Zeilenumbruch kopieren

Es gibt einige PDF-Dateien in freier Wildbahn, in denen jede Textzeile fest codiert zu sein scheint. Wenn ich also einen Textblock kopiere, kommt alles mit: Zeilenumbrüche und sogar "-"-Trennzeichen.

Meine Fragen sind: Wie erstelle ich PDFs in InDesign, bei denen dieses Verhalten nicht auftritt.

Weiß jemand mehr darüber?

Ich möchte nur anmerken, dass dies ein massives Problem in vielen akademischen Artikeln ist und ich keinen Grund / keine Lösung für dieses Problem gefunden habe. Hoffe auf gute Antworten!
... also könnte es eine uralte Exportfunktion in einer idiotischen Praxis aus der Präkambrium-Ära sein, die schuld ist.

Antworten (3)

Das liegt daran, dass PDFs auf viele Arten aus einer Reihe von Software- und Online-Apps generiert werden können. Jede dieser Zeilen behandelt Textzeilen unterschiedlich, sodass Sie nie feststellen können, wie Text tatsächlich eingeschlossen ist, bis Sie versuchen, ihn aus PDF zurück in InDesign zu kopieren und einzufügen.

In InDesign exportierte PDF- Dateien behalten jedoch im Allgemeinen die Leerzeichen am Ende jeder Zeile bei, sodass Sie sich keine Gedanken darüber machen müssen, dass nach jeder Zeile ein Absatzumbruch eingefügt wird. Um 100 % sicherzugehen, aktivieren Sie das Create Tagged PDFKontrollkästchen, wenn Sie ein PDF aus InDesign exportieren. Persönlich werde ich dieses Kontrollkästchen immer aktivieren und es in alle Voreinstellungen aufnehmen, die ich verwende. Weitere Details zu dieser Option hier .

Wenn Sie auf ein schlecht exportiertes PDF stoßen und die abschließenden Absatzumbrüche nach jeder Textzeile bereinigen müssen, ist Suchen/Ersetzen die schnellste Option. Geben Sie ^pin das Find whatFeld ein und setzen Sie ein Leerzeichen in das Change toFeld. Wählen Sie je nach Ihrer Situation entweder Storyoder Selectionunten aus, und dies sollte Ihren Text bereinigen.

Dialogfeld „Änderung finden“.

Eine Möglichkeit, die funktioniert, besteht darin, das PDF als HTML aus Acrobat Pro zu exportieren , diese Datei in Ihrem Webbrowser zu öffnen und dann den Text von dort zu kopieren.

Im Gegensatz zum Exportieren als Textformat bricht das HTML normalerweise keine Zeilen.

Von InDesign aus kann man das meines Wissens nach nicht verhindern, es scheint ein Verhalten zu sein, das von der PDF bzw. PDF Software kommt. Es ist möglich, dass jede Veröffentlichungssoftware, die "Textrahmen/-boxen" verwendet, diese Art von Texten in einem PDF erstellt.

Das liegt daran, dass PDFs Text auf diese Weise erkennt – jede Zeile wird tatsächlich zu einem Absatz (daher Return am Ende). Es führt kein Weg daran vorbei, Sie müssen es nach dem Kopieren global in Dokumenten ändern, indem Sie die Option Suchen/Ersetzen und versteckte Zeichen verwenden.

Aber es gibt PDFs, die dieses Verhalten nicht haben. PDFs, in denen Sie das Ganze problemlos kopieren können. Ich frage mich nur, wie dies beim Export erreicht werden könnte.