Auf einer anderen Website sprechen wir darüber , einige unserer Inhalte (zu einem bestimmten Thema) als druckbares PDF neu zu verpacken. (Der primäre Anwendungsfall ist Papier.) Dies wäre kein direkter Dump der ursprünglichen Posts; Manchmal möchten Sie einige für ein anderes Publikum bearbeiten, Links funktionieren nicht und so weiter. Wir denken derzeit darüber nach , Meta-Posts zu verwenden, um diese Bearbeitung zu erleichtern (damit wir diesen Teil der Arbeit durch Crowdsourcing beziehen können).
Meine Frage ist: Was ist der beste Weg, um von diesen Beiträgen zum Endprodukt zu gelangen und dabei so viel Formatierung wie möglich beizubehalten, damit wir es nicht erneut tun müssen? Man könnte mit dem Markdown arbeiten (gibt es dafür Übersetzer in andere Formate?) oder mit dem generierten HTML (der eigentlichen Webseite). Oder man könnte in sein bevorzugtes Dokumenterstellungstool ausschneiden/einfügen, was nach einer unglücklichen Wahl klingt, weil es arbeitsintensiv ist und die Formatierung nicht folgen würde. Eine zusätzliche Überlegung ist, dass einige unserer Inhalte auf Hebräisch sind (also Nicht-ASCII).
Mir ist klar, dass ich gefährlich nah an "zu lokalisiert" trete, aber es scheint, als könnten die gleichen Techniken, die für Wikis und Blogs verwendet werden, auch hier angewendet werden.
Wir haben durch Experimentieren gelernt, dass eine ausreichend neue Version von Microsoft Word (wir haben mit 2010 getestet) das formaterhaltende Ausschneiden und Einfügen von Stack Exchange-Posts unterstützt. Wir haben einige Formatierungsrichtlinien erstellt , um den Inhalt in Form zu bringen (z. B. Entlinkung, da dies für Papier ist). Dies beinhaltet immer noch das manuelle Ausschneiden und Einfügen aus dem Browser in ein anderes Programm (z. B. Word), aber es stellt sich heraus, dass wir den Quell-HTML oder Markdown nicht extrahieren müssen, um damit zu arbeiten, sodass wir für ein kleines Projekt damit leben können das.
Wenn Sie nur eine Handvoll Seiten in PDF konvertieren möchten, können Sie dies in Microsoft Word tun, und Sie werden wahrscheinlich in Ordnung sein.
Wenn Sie eine große Anzahl von Webseiten in PDFs konvertieren und ihre Essbarkeit bewahren und unnötige Informationen entfernen möchten, empfehle ich dringend Folgendes:
Exportieren Sie die Webseite mit den Quellinformationen als HTML. Öffnen Sie die gespeicherte Seite in Adobe Dreamweaver (oder ähnlich) und nehmen Sie alle Änderungen am Text und Seitenlayout in HTML vor und speichern Sie dann den neuen Inhalt erneut als HTML. Wenn alle letzten Änderungen vorgenommen wurden, erstellen Sie das PDF aus dem HTML in Adobe Acrobat (oder ähnlich).
Warum das und nicht Word? Zwei Gründe.
Erstens finde ich, dass Word dazu neigt, durcheinander zu kommen, wenn Sie aus dem Internet ausschneiden und einfügen. Die Dinge neigen dazu, falsch zu fließen, und es kann ziemlich frustrierend sein, sie zu beseitigen. Ihre Erfahrung kann variieren.
Zweitens, wenn Sie vorausschauend denken und eventuell ein ePub oder ein Kindle-Buch erstellen möchten, oder was haben Sie in meinen Erfahrungen festgestellt, dass Sie bessere Ergebnisse erzielen, wenn Sie Ihr E-Book aus HTML erstellen, im Gegensatz zu MS Word oder sogar PDFs.
Wenn Sie vorausschauend denken möchten, ist es besser, Ihr Produkt einmal durch die HTML-Bearbeitung zu bearbeiten, als es zweimal durch Word zu bearbeiten.
Lauren-Clear-Monica-Ipsum
Monika Cellio
Lauren-Clear-Monica-Ipsum
Auf Wiedersehen Stapelaustausch
Monika Cellio
Stärker
John Smithers