Scrape / Extrahiere Wikipedia-Kategorie-Taxonomien in die Benutzeroberfläche

Ich würde gerne wissen, wie man einen visuellen Taxonomiebaum aus den Kategorien auf Wikipedia als Seed erstellt; Gibt es vorhandene Tools, die möglicherweise verwendet werden können, um diese Art von Informationen zu extrahieren, sie für diese Verwendung zu formatieren und was ich tun müsste, um sie zu verwenden?

Extrahieren Sie die Titel und Links zu allen verwandten Kategorien und Unterkategorien für https://en.wikipedia.org/wiki/Category:Energy und fügen Sie sie in eine Datenbank ein, um sie mit etwas wie d3js {in Erwägung; obwohl keine endgültige Entscheidung - da Arbeitserleichterung, Schnittstellenbetrieb, Kreuzkompatibilität und Erweiterbarkeit stärkere Überlegungen sind.}

Phylogenetische / Taxonomie-Baum-Visualisierung, dh: ein Zweig:

  • en.wikipedia /wiki/Category:Energie
  • en.wikipedia /wiki/Category:Energy_infrastructure
  • en.wikipedia /wiki/Category:Energy_infrastructure_by_continent
  • en.wikipedia /wiki/Category:Energy_infrastructure_in_Europe
  • en.wikipedia /wiki/Category:Energy_infrastructure_in_Spain

Ich erkunde en.wikipedia.org/wiki/Special:ApiSandbox, um mit den gegebenen Informationen herumzuspielen; Allerdings erhalte ich nur aktuelle Informationen zB: 29 Unterkategorien mit 41 Seiten.

So etwas wäre ein Erfolg:Reaktionsfähiger Taxonomiebaum

Allgemeine Referenz :

Antworten (1)

Die Mediawiki-Software enthält eine solche "visuelle Taxonomiebaum"-Funktion, auf die hier zugegriffen werden kann:

https://en.wikipedia.org/wiki/Special:CategoryTree

Sie müssen die Wurzel angeben, und sie zeigt den standardmäßig gefalteten Baum, sehr ähnlich dem Bild in der Frage:

Geben Sie hier die Bildbeschreibung ein