Kompletter Website-Downloader

Wie lädt man eine statische Kopie einer Website herunter? Ich meine, keine Skripte laden und später verwenden, wenn Sie die "Offline" -Seite laden, sondern das DOM so speichern, wie es ist, NACHDEM alle Skripte Änderungen an der Seite vorgenommen haben, damit beim nächsten Laden der Website keine anderen Websites angepingt werden für alles, und die Version, die Sie in diesem HTML-Code sehen, ist das, was beim Scannen gespeichert wurde, nicht das, was die Skripte ein zweites Mal auf dem Computer des Betrachters generiert haben.

Das könnte die Definition von offline sein, aber ich denke, ich suche auch nach offline, statisch und dumm.

In Chrome, IE und Firefox können Sie mit der rechten Maustaste klicken, um die Seite so zu speichern, wie sie aussieht.
Ja, aber alle Dateien werden geladen, einschließlich JS, und wenn sie onload auslösen, wird das DOM erneut geändert, unabhängig davon, was Sie geladen haben.
Sie können versuchen, den Internet Download Manager zu verwenden

Antworten (4)

Ich weiß nicht, ob es das ist, wonach Sie suchen, aber hier ist eine großartige Software, die Sie sich ansehen sollten: HTTrack Website Copier . Ich benutze es nicht oft, aber von dem, was ich bisher gesehen habe, funktioniert es großartig, laden Sie die Website herunter. Außerdem habe ich es mit Norton überprüft und es ist virensicher.

Ja, dieses Programm ist absolut sicher und ich kann es nur wärmstens empfehlen.

Ein PhantomJS- Skript kann das DOM speichern, wie es ist, NACHDEM alle Skripts Änderungen an der Seite vorgenommen haben, aber dieses Beispiel behandelt nicht die anderen Teile des Problems, wie z. B. das lokale Speichern von Bildern.

var page = require('webpage').create();
var fs = require('fs');

var url = 'https://www.google.com/';

page.open(url, function(status) { // Load the web-page

    setInterval(function()        // Give any scripts a few seconds to mess around with the page's structure
    {
        console.log(status);

        page.render('page.png');  // Save web-page as an image - in case you *really* want offline, static and dumb ;-)

        // Get the content of the page
        var html = page.evaluate(function() {
            return document.documentElement.outerHTML;
        });

        // Save the content of the page
        fs.write('./index.html', html, 'w');

        phantom.exit();

    }, 3000);
});

Sie können nach folgenden Formaten suchen:

  • MAFF - ein Archivierungsformat für Webseiten, das von Firefox über eine Erweiterung bereitgestellt wird
  • MHTML - Archivformat für Webseiten, das verwendet wird, um den HTML-Code in einem einzigen Dokument zu kombinieren

Um diese Formate zu verwenden, versuchen Sie, das Add-on Mozilla Archive Format zu installieren , das alle Ressourcen in einer einzigen ZIP-Datei (MAFF) speichert, sodass Sie zu der ursprünglichen Website zurückkehren können, von der Sie eine Seite gespeichert haben. Es unterstützt auch MHT (MHTML)-Dateien.

Probieren Sie HTTrack Website Copier aus. Ich habe es benutzt und es ist wirklich gut. Zu diesem Zweck musste nie eine andere Software ausprobiert werden. Wenn Sie Optionen zur Hand haben möchten, schauen Sie hier nach . Viel Glück! :)