Tools zum Auffinden defekter eingebetteter Inhalte

Wir haben unsere Website gerade auf die Verwendung von SSL überall umgestellt, aber dies führt zu einigen fehlerhaften eingebetteten Inhalten in Browsern.

Gibt es ein Tool, mit dem ich die gesamte Website durchsuchen kann, um nach dieser Art von fehlerhaftem Inhalt (hauptsächlich Videos) zu suchen, damit ich sie reparieren/ersetzen kann? Es gibt genug Inhalte, dass dies manuell zu tun wäre eine Plackerei. Ich benutze Linkchecker bereits gelegentlich, um 404ing-Links und dergleichen zu finden, aber dies findet keine fehlerhaften Einbettungen (afaik).

Können Sie näher darauf eingehen, was Sie mit fehlerhaften eingebetteten Inhalten in Browsern meinen?
Videos zum größten Teil, die der Browser nicht lädt, weil sie von einer Nicht-SSL-URL stammen. Am Ende bleibt ein leerer Bereich auf der Seite.
Hast du Xenus Link Sleuth ausprobiert? Es gibt es schon seit Jahrzehnten und es funktioniert gut - home.snafu.de/tilman/xenulink.html
Verwenden Sie ein CMS, um die Website zu betreiben? Zum Beispiel WordPress, wenn Sie vielleicht nach einem Tool suchen, das für dieses CMS geschrieben wurde, um die Datenbank zu scannen und das Protokoll für Sie zu ändern? ZB https://interconnectit.com/products/search-and-replace-for-wordpress-databases/ .
Hast du jemals eine Lösung gefunden?

Antworten (3)

Ich schlage vor, zu versuchen, die Seite mit Screamingfrog zu crawlen .

Ich würde Ihre Webserver-Protokolldateien überprüfen, je nachdem, welches Format (d. h. allgemeines Apache-Protokollformat) Sie in der Lage sein sollten, den Statuscode (suchen Sie nach 404), die Ask-for-but-unfound-Ressource und die verweisende URL ( auf welcher Seite der Link/Einbettung war)

Wenn alle Ihre Inhalte https oder ssl sein sollen, sollten Sie in der Lage sein, die Website mit Scrapy zu crawlen und nach Links zu der Website zu suchen, aber nicht nach dem richtigen Typ mit Beautiful Soup 4 .

Verwenden Sie einfach Scrapy, um alle Seiten zu finden, parsen Sie mit BS4 und überprüfen Sie die eingebetteten Elemente.