Diff für HTML-Seiten

Ich habe einige hundert HTML-Dateien, deren Inhalt ziemlich ähnlich ist. Ich suche ein GUI-Programm für Windows, mit dem ich einen Bereich im HTML (zB eine Tabelle) definieren kann, der sich über alle HTML-Dateien hinweg unterscheiden soll.

Bsp gegeben:

Datei1.html:

<table>hey<table>

Datei2.html:

<table>hey<table>

file3.html:

<table>hello<table>

Der Unterschied sollte zeigen, dass file3.html etwas anderes in der Tabelle enthält.

Ich weiß, wie man es codiert (z. B. Python + Beautiful Soup), aber ich frage mich, ob es für diesen Zweck ein vorhandenes Programm gibt.

Sie möchten bestimmte Bereiche in den zu vergleichenden Dateien kennzeichnen (z. B. ist dies kein Gesamtdateivergleich)? Wie würden Sie diese Bereiche bezeichnen?
@IraBaxter ZB Text in einer HTML-Seite oder Element wie in Chrome Developer Tools auswählen.
Was wollen Sie auf hohem Niveau erreichen? Möchten Sie nur zwei Dateien gleichzeitig vergleichen oder eine Liste von Dateien mit einer Datei vergleichen, oder was? Möchten Sie den Inhalt der gerenderten Webseiten oder die HTML-Quelle vergleichen?
@MartinCarney Ich habe über ein paar Tage alle 30 Sekunden eine Webseite heruntergeladen. Die Seite enthält eine Tabelle, die sich manchmal ändert. Ich möchte solche Veränderungen erkennen.
Sie interessieren sich also mehr für die Daten in der Tabelle als für das HTML-Markup. Wenn die gegebenen Antworten es nicht für Sie lösen, ist es wahrscheinlich am besten, etwas zu codieren. Es gibt viele Bibliotheken zum Lesen von HTML/XML in fast jeder Programmiersprache, also müssen Sie nur die Tabelle aufschlüsseln und die Daten herausziehen und dann vergleichen.

Antworten (2)

Ich bin ein Fan des Diff-Tools Meld für solche Dinge. Sie können je nach Bedarf bis zu 3 Dateien gleichzeitig vergleichen, bei Bedarf werden aber auch ganze Verzeichnisse verglichen.

Nur ein paar Features von ihrer Homepage:

  • Zwei- und Drei-Wege-Vergleich von Dateien und Verzeichnissen
  • Dateivergleiche werden während der Eingabe aktualisiert
  • Der automatische Zusammenführungsmodus und Aktionen bei Änderungsblöcken erleichtern das Zusammenführen
  • Visualisierungen erleichtern den Vergleich Ihrer Dateien
  • Unterstützt Git, Bazaar, Mercurial, Subversion usw.

Hier ist ein kleines Bild von der Meld-Site für die Diff-Fähigkeit, das Blöcke von Unterschieden oder eine kleine Änderung in einer Zeile zeigt:

Geben Sie hier die Bildbeschreibung ein

Es läuft unter Windows, enthält Pakete für die meisten Linux-Distributionen und hat sogar eine Mac-Version, sodass Sie die Umgebung ändern können, wenn Sie möchten.

Probieren Sie Beyond Compare aus . Es ist sehr flexibel, unterstützt viele viele Formate und vergleicht jetzt 3 Dateien.

Sie können einen Abschnitt von einer Datei zu einem Abschnitt in einer anderen Datei aliasieren , selbst wenn der automatische Scanner die Ähnlichkeit ablehnt. Das heißt, Sie können es zwingen, die Abschnitte zu unterscheiden, die Sie vergleichen möchten.

Textdateien können mit Syntaxhervorhebung und Vergleichsregeln angezeigt und bearbeitet werden, die speziell für Dokumente, Quellcode und HTML angepasst wurden.

Können Sie bitte Ihre Antwort bearbeiten und angeben, wie Beyond Compare die Anforderung erfüllt, "würde es mir ermöglichen, einen Bereich im HTML (z. B. eine Tabelle) zu definieren, der in allen HTML-Dateien unterschieden werden sollte"?