Anwendung zum Zusammenstellen eines einzelnen Buches aus fanfiction.net-Kapiteln

Benötigt: Software, die eine Geschichte, die in mehreren Kapiteln auf fanfiction.net gepostet wurde, zu einem einzigen Text/Buch machen kann.

Kostenlos

Gewünschte Technologie: irrelevant (Webapp, Windows, Linux, Perl/Python/Java-Code usw. sind alle akzeptabel, obwohl Windows oder Webapp eine schwache Präferenz ist)

Ausgang: egal. TXT-Datei oder HTML-Datei oder epub oder was auch immer mit Standardtext oder E-Book-Reader lesbar ist. ( Quellenmaterial ist unformatierter Text ).

Tut mir leid, das richtige Tag sollte sich auf Website-Scraping beziehen. Wenn jemand das bearbeitet, danke

Antworten (2)

Einfachste Antwort: Pandoc

pandoc -s -r html Kapitel_URL Kapitel_URL Kapitel_URL -o outputfilename.epub

wobei jede kapitel_url ein Link zu einer Webseite ist, die ein Kapitel enthält, nimmt die gesamten Webseiten, auf die Sie mit der kapitel_url verweisen , als Kapitel im E-Book.

  • Kostenlos
  • Ausgabeformate: Lose
  • Plattform: Windows/OS-X/Linux
  • ToC-Option hinzufügen: -tocfügt eine hinzu
  • Funktioniert „ direkt aus der Box
  • Für Sie zu erledigende Aufgaben: Informieren Sie sich über die Optionen und geben Sie die Webseiten an

Der einzig mögliche Nachteil ist, dass Sie möglicherweise die Kopf- und Fußzeileninformationen entfernen möchten, was in diesem Fall ein manueller Vorgang wäre. Sie könnten jedoch pandoc verwenden, um die Seiten in Markdown zu holen, diese zu bearbeiten und dann pandoc verwenden, um sie zu konvertieren Endformat.

Natürlich sollten Sie die Genehmigungen/Lizenzbedingungen des Autors/der Autoren der Webseiten überprüfen, bevor Sie diese verwenden, um sicherzustellen, dass es sich um eine zulässige Verwendung handelt

Für die Menge an DIY, die dafür erforderlich ist, machen die Nachteile, sowieso ganze Seiten zu bekommen und eine eigene URL zu konstruieren, dies zu einer Lösung, die der reinen Programmierung von Python weit unterlegen ist (wo man zumindest vermeiden kann, 40- lange Liste von Kapitel-URLs und in der Lage sein, Seitengerüste abzukratzen). Zumindest von meinen Bedürfnissen - ymmv

Etwas mehr Arbeitsantwort: Python + Scrapy

Mit python & scrapy können Sie die Webseiten abrufen, die Sie benötigen, den Inhalt von den anderen Informationen trennen, möglicherweise auch andere Informationen abrufen, die innerhalb der Geschichte verlinkt sind, und sie nach Belieben zusammenstellen. Es gibt viele Beispiele auf der Website & auf Stapelüberlauf.

Python kann das E-Book sogar direkt für Sie erstellen - entweder nur mit den Standardbibliotheken (wiederum gibt es Beispiele im Web dafür) oder mit der ebooklib .

  • Kostenlos
  • Ausgabeformate: Alle, die Sie implementieren möchten
  • Plattform: Windows/OS-X/Linux/RaspberryPi/viele andere
  • ToC-Option hinzufügen: Ja
  • Arbeit für Sie: Lernen Sie etwas Python und Scrapy, identifizieren Sie die Webseitenabschnitte, die Sie benötigen, schreiben und testen Sie die Skripte.

Dieser Ansatz ist mehr Arbeit als meine andere Antwort und erledigt die Arbeit nicht sofort, führt aber letztendlich zu einem besser aussehenden Endergebnis und Sie werden viele übertragbare Fähigkeiten erlernen.

Natürlich sollten Sie die Genehmigungen/Lizenzbedingungen des Autors/der Autoren der Webseiten überprüfen, bevor Sie diese verwenden, um sicherzustellen, dass es sich um eine zulässige Verwendung handelt