kostenlos, automatisch, cloudbasiert, Webscraper?

Vor Jahren habe ich das Modul "Seite abrufen" von Yahoo Pipes verwendet, um einige regelmäßig aktualisierte Websites in RSS-Feeds umzuwandeln. Ich könnte dann den Rest ihrer Werkzeuge verwenden, um damit zu machen, was ich will.

Ich bin kürzlich auf eine regelmäßig aktualisierte Website-Audio-Website gestoßen und möchte daraus einen Podcast-Feed erstellen. Mein erster Schritt wird darin bestehen, einen automatischen Online-Scraper zu erstellen, der meinen Feed generiert und ihn dann hoffentlich einfach importiert.

Können Sie ein aktuelles Tool vorschlagen, mit dem ich eine Site 1) automatisch 2) kratzen und einen Feed erstellen kann, den ich 3) bearbeiten und ändern kann, um mir einen Podcast-Feed zu erstellen?

Ich habe in der Vergangenheit solche Dinge mit RSS gemacht, aber niemals Podcast-Feeds. Wenn es also eine Straßensperre gibt, die ich nicht in Betracht ziehe, würde ich gerne wissen.

Antworten (1)

"Kostenlos" oder "Cloud-basiert" - wählen Sie eine aus :-)

Das Ausführen von gehosteten Diensten kostet Geld, daher bieten die meisten, wenn nicht alle Cloud-Dienste nur eine begrenzte Testversion oder einen sehr begrenzten kostenlosen Plan an. Das heißt, hier ist eine gute Liste .

Und hier ist meine persönliche Liste von selbst gehosteten Webautomatisierungs- und Web-Scraping-Tools, die ich in der Vergangenheit mit gutem Erfolg verwendet habe:

Tools mit Rekorder (einfach zu verwenden, aber langsame Ausführung, gut für Scraping mit geringem Volumen bei Websites, die sich häufig ändern):

  • iMacros Browser
  • Kantu Browser

Web Scripting Frameworks (komplexer, aber schnell, gut für die Extraktion von Daten mit hohem Datenvolumen)

  • Scrapy
  • Schöne Suppe
Vielen Dank für die Vorschläge, aber ich glaube, ich habe all diese Probleme gelöst, und ich glaube nicht, dass dies meinen Bedürfnissen entspricht. Ich bin zufrieden mit seltenem oder langsamem Schaben, und es muss auch nicht sehr ausdrucksstark sein. Dies ist eine relativ einfache Aufgabe, und es sollte nur ein vorhandenes, vorgefertigtes und frei verfügbares Werkzeug geben, das dafür geeignet ist. Ich denke, Yahoo! Pipes hätten zum Beispiel gut funktioniert. Es gibt viele kostenlose und Cloud-basierte Dienste aller Art (Google Mail, Yahoo! Maps, DuckDuckGo usw.), daher hoffe ich, dass jemand einen vorschlagen kann, der meine Anforderungen hier erfüllt.