Tool zum Konvertieren von Online-HTML-Dokumentation in EPUB über die Befehlszeile

Question

Tool zum Konvertieren von Online-HTML-Dokumentation in EPUB über die Befehlszeile

osx
epub
html
Software
Dokumentenkonverter

rraallvv

Ich habe eine Reihe von miteinander verflochtenen HTML-Webseiten, die ich in das EPUB-Format konvertieren möchte.

Zum Beispiel ist die Indexseite bei

http://example.com/documentation/index/index.html

Während die von den Indexseiten verlinkten Kapitel in sind

http://example.com/documentation/chapters/*

Auch einige Bilder und Formatierungsdateien sind dabei

http://example.com/css/*
http://example.com/img/*

Gibt es ein Tool zum Herunterladen und rekursiven Konvertieren der Dokumentation unter Berücksichtigung dieser spezifischen Einschränkungen in das epub-Format?

Ich kann die Seiten mit httrack so herunterladen:

httrack http://example.com/documentation/index/index.html +http://example.com/documentation/index/* +http://example.com/documentation/chapters/* +http://example.com/css/* +http://example.com/img/*

… und wandle die HTML-Seiten mit tidy-html5 in XHTML um

tidy -asxhtml -numeric < index.html > index.xhml

aber ich habe immer noch kein Tool gefunden, um den gesamten Baum auf einmal in EPUB zu konvertieren.

Ich habe Calibre auch einmal ausprobiert, aber die Benutzeroberfläche ist unfreundlich, also habe ich wirklich nicht versucht, dieses Tool zu verstehen. Wenn ich die Calibre-Benutzeroberfläche lernen muss, schreibe ich lieber ein Bash-Skript, um die Arbeit zu erledigen.

Izzy

Calibre hat auch eine Befehlszeilenschnittstelle. Ich benutze die GUI selten. Siehe hier für Parameter zur ebook-convertCLI . Und ja, in meinem Fall ist es normalerweise ein Bash-Skript, das die Arbeit erledigt: Ich verwende ein Skelett mit "Platzhaltern" (Variablen) für Quelldetails :)

Antworten (1)

Tool zum Konvertieren von Online-HTML-Dokumentation in EPUB über die Befehlszeile

Calibre hat auch eine Befehlszeilenschnittstelle. Ich benutze die GUI selten. Siehe hier für Parameter zur ebook-convertCLI . Und ja, in meinem Fall ist es normalerweise ein Bash-Skript, das die Arbeit erledigt: Ich verwende ein Skelett mit "Platzhaltern" (Variablen) für Quelldetails :)

Steve Barnes · Answer 1

Obwohl Sie nicht immer perfekte Ergebnisse liefern, können Sie Pandoc verwenden , um HTML aus dem Internet herunterzuladen und ein Epub auf einmal zu generieren - Sie müssen Pandoc möglicherweise die Reihenfolge der Seiten/Kapitel mitteilen und/oder welche Seiten, aber alle referenzierten CSS/Bilder sollten auch automatisch heruntergeladen und eingebettet werden.

Befehlszeile - Ja
Erfolgt der Download direkt aus dem Internet - Ja
E-Pub erstellen - Ja und viele andere
Kostenlos, kostenlos & Open Source
Plattformübergreifend einschließlich OS-X

Tool zum Konvertieren von Online-HTML-Dokumentation in EPUB über die Befehlszeile

rraallvv

Izzy

Antworten (1)

Steve Barnes

Erstellen Sie eine verlinkte Website aus einer EPUB-Datei

Open-Source-Tool zum Erstellen von EPUB-Dateien

Software zum Konvertieren des HOCR-Formats in txt?

Tool zum Konvertieren zwischen verschiedenen Nur-Text-Formaten

Tool zum Konvertieren von HTML4 in HTML5+CSS

Perl-geschriebenes MkDocs-Äquivalent zum Konvertieren von Markdown- oder POD-Bäumen in HTML mit Index in jeder Datei

Tool zum Speichern von Webseiten im XML-Format

Software zum Konvertieren von MHT-Dateien (MHTML) in ein browser- und plattformneutrales Einzeldatei-Dateiformat

Webseite zu PDF-Konverter

osx kostenlose epub3-Erstellungssoftware