Wir haben unsere Website gerade auf die Verwendung von SSL überall umgestellt, aber dies führt zu einigen fehlerhaften eingebetteten Inhalten in Browsern.
Gibt es ein Tool, mit dem ich die gesamte Website durchsuchen kann, um nach dieser Art von fehlerhaftem Inhalt (hauptsächlich Videos) zu suchen, damit ich sie reparieren/ersetzen kann? Es gibt genug Inhalte, dass dies manuell zu tun wäre eine Plackerei. Ich benutze Linkchecker bereits gelegentlich, um 404ing-Links und dergleichen zu finden, aber dies findet keine fehlerhaften Einbettungen (afaik).
Ich schlage vor, zu versuchen, die Seite mit Screamingfrog zu crawlen .
Ich würde Ihre Webserver-Protokolldateien überprüfen, je nachdem, welches Format (d. h. allgemeines Apache-Protokollformat) Sie in der Lage sein sollten, den Statuscode (suchen Sie nach 404), die Ask-for-but-unfound-Ressource und die verweisende URL ( auf welcher Seite der Link/Einbettung war)
Wenn alle Ihre Inhalte https oder ssl sein sollen, sollten Sie in der Lage sein, die Website mit Scrapy zu crawlen und nach Links zu der Website zu suchen, aber nicht nach dem richtigen Typ mit Beautiful Soup 4 .
Verwenden Sie einfach Scrapy, um alle Seiten zu finden, parsen Sie mit BS4 und überprüfen Sie die eingebetteten Elemente.
Tom
feroxy
Mawg sagt, Monica wieder einzusetzen
essexboyracer
Mawg sagt, Monica wieder einzusetzen