Wie können wir mit dem geringsten Aufwand von Stack Exchange Q/A zu publizierbaren PDFs gelangen?

Auf einer anderen Website sprechen wir darüber , einige unserer Inhalte (zu einem bestimmten Thema) als druckbares PDF neu zu verpacken. (Der primäre Anwendungsfall ist Papier.) Dies wäre kein direkter Dump der ursprünglichen Posts; Manchmal möchten Sie einige für ein anderes Publikum bearbeiten, Links funktionieren nicht und so weiter. Wir denken derzeit darüber nach , Meta-Posts zu verwenden, um diese Bearbeitung zu erleichtern (damit wir diesen Teil der Arbeit durch Crowdsourcing beziehen können).

Meine Frage ist: Was ist der beste Weg, um von diesen Beiträgen zum Endprodukt zu gelangen und dabei so viel Formatierung wie möglich beizubehalten, damit wir es nicht erneut tun müssen? Man könnte mit dem Markdown arbeiten (gibt es dafür Übersetzer in andere Formate?) oder mit dem generierten HTML (der eigentlichen Webseite). Oder man könnte in sein bevorzugtes Dokumenterstellungstool ausschneiden/einfügen, was nach einer unglücklichen Wahl klingt, weil es arbeitsintensiv ist und die Formatierung nicht folgen würde. Eine zusätzliche Überlegung ist, dass einige unserer Inhalte auf Hebräisch sind (also Nicht-ASCII).

Mir ist klar, dass ich gefährlich nah an "zu lokalisiert" trete, aber es scheint, als könnten die gleichen Techniken, die für Wikis und Blogs verwendet werden, auch hier angewendet werden.

::kratzt sich am Kopf:: Warum sollten Autoren eine Codierungsfrage stellen? Warum kein Stapelüberlauf?
@LaurenIpsum, ich weiß nicht, ob "XSLT (oder was auch immer) schreiben, um die Quelle zu transformieren" tatsächlich der beste Ansatz im Vergleich zu einem eher manuellen Prozess ist - Überlegungen zu Kosten/Nutzen, Flexibilität usw.? Es schien im Einklang mit einer Frage zu stehen, die wir zum Veröffentlichen von E-Books hatten, also dachte ich, ich versuche es zuerst hier.
Hmm, ich hätte die Verbindung zu einem E-Book nicht hergestellt, aber Sie haben Recht; das hat eine gewisse logik.
Wenn ich Ihnen also folge, suchen Sie nach einer Möglichkeit, Kursivschrift/Fettdruck/andere Formatierungen auf Papier beizubehalten, ohne dass ein Mensch beteiligt ist? Wird es einen Lektorats-/Lektoratspass geben?
@NeilFein, ja und ja. Die Idee ist, eine veröffentlichungsfähige Version der Fragen/Antworten zusammenzustellen (bearbeitet, Links entweder entfernt oder in Erklärungen umgewandelt, was auch immer den Inhalt auf Papier funktionieren lässt), und dann diese Informationskleckse zu nehmen und ... etwas damit zu tun. Wir hoffen, dass die einzige zusätzliche Bearbeitung, die erforderlich wäre, darin besteht, Formatierungsartefakte wie fehlerhafte Seitenumbrüche zu beheben.
Dies ist KEINE Empfehlung, aber ebookglue.com ist ein Beispiel für ein Online-Tool, das zeigt, dass das, was Sie tun möchten, automatisiert werden kann. Siehe auch Wikipedia Book Creator .

Antworten (2)

Wir haben durch Experimentieren gelernt, dass eine ausreichend neue Version von Microsoft Word (wir haben mit 2010 getestet) das formaterhaltende Ausschneiden und Einfügen von Stack Exchange-Posts unterstützt. Wir haben einige Formatierungsrichtlinien erstellt , um den Inhalt in Form zu bringen (z. B. Entlinkung, da dies für Papier ist). Dies beinhaltet immer noch das manuelle Ausschneiden und Einfügen aus dem Browser in ein anderes Programm (z. B. Word), aber es stellt sich heraus, dass wir den Quell-HTML oder Markdown nicht extrahieren müssen, um damit zu arbeiten, sodass wir für ein kleines Projekt damit leben können das.

Wenn Sie nur eine Handvoll Seiten in PDF konvertieren möchten, können Sie dies in Microsoft Word tun, und Sie werden wahrscheinlich in Ordnung sein.

Wenn Sie eine große Anzahl von Webseiten in PDFs konvertieren und ihre Essbarkeit bewahren und unnötige Informationen entfernen möchten, empfehle ich dringend Folgendes:

Exportieren Sie die Webseite mit den Quellinformationen als HTML. Öffnen Sie die gespeicherte Seite in Adobe Dreamweaver (oder ähnlich) und nehmen Sie alle Änderungen am Text und Seitenlayout in HTML vor und speichern Sie dann den neuen Inhalt erneut als HTML. Wenn alle letzten Änderungen vorgenommen wurden, erstellen Sie das PDF aus dem HTML in Adobe Acrobat (oder ähnlich).

Warum das und nicht Word? Zwei Gründe.

Erstens finde ich, dass Word dazu neigt, durcheinander zu kommen, wenn Sie aus dem Internet ausschneiden und einfügen. Die Dinge neigen dazu, falsch zu fließen, und es kann ziemlich frustrierend sein, sie zu beseitigen. Ihre Erfahrung kann variieren.

Zweitens, wenn Sie vorausschauend denken und eventuell ein ePub oder ein Kindle-Buch erstellen möchten, oder was haben Sie in meinen Erfahrungen festgestellt, dass Sie bessere Ergebnisse erzielen, wenn Sie Ihr E-Book aus HTML erstellen, im Gegensatz zu MS Word oder sogar PDFs.

Wenn Sie vorausschauend denken möchten, ist es besser, Ihr Produkt einmal durch die HTML-Bearbeitung zu bearbeiten, als es zweimal durch Word zu bearbeiten.