Python-Bibliotheken zum Clustern von Dezimalzahlen

Ich habe eine Sammlung von Dezimalzahlen mit jeweils einem Wert zwischen 0,0 und 1,0.

Ich möchte sie nach Wert in zwei Dimensionen "gruppieren", so dass Dezimalstellen mit nahen Werten gruppiert werden, aber genügend Abstand haben, damit das Diagramm optisch ansprechend ist.

Welche Bibliotheken in Python kann ich dafür in Betracht ziehen?

Anforderungen:

  • Geschwindigkeit über Genauigkeit
  • am liebsten kostenlos
Ich lege dies auf Eis, weil es um eine Empfehlung bittet, wo man mit einem Problem anfangen soll, nicht um ein Stück Software. Wenn Sie Ihre Frage bearbeiten können, um nach einer Software zu fragen, die bestimmte Anforderungen erfüllt, können wir sie erneut öffnen.
Ich habe die Frage zum Thema gemacht, indem ich sie stark modifiziert habe.
Was sind deine zwei Dimensionen?

Antworten (1)

Sie können das Modul sklearn.cluster aus der Python-Bibliothek scikit-learn (kostenlos und Open Source) verwenden.

Geben Sie hier die Bildbeschreibung ein

Wenn Sie zB den k-Means-Algorithmus verwenden möchten:

import numpy as np
from sklearn.cluster import KMeans
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
metrics.silhouette_score(X, labels, metric='euclidean')
Danke schön. Ich verwende Spectral Clustering und es scheint den Zweck sehr gut zu erfüllen.