Software zum Speichern und einfachen Visualisieren mehrdimensionaler Datenschnitte

Ich habe mehrere hundert Werte, die jeweils einem Tupel von Merkmalen aus verschiedenen Dimensionen entsprechen. Der Wert ist beispielsweise price , Dimensionen sind:

  • Obst: Äpfel, Orangen, Bananen (Aufzählungsdimension)
  • Herkunft: USA, Argentinien, Marokko, ...
  • Monat: Feb. 2014, Jan. 2014, Dez. 2013, ...
  • Mindestabnahmemenge: 1 kg, 10 kg, 1000 kg (Scheinmaß)

Ich suche nach einer plattformübergreifenden Software zum Speichern solcher Daten und zur einfachen Visualisierung von Datenscheiben: Zeichnen verschiedener Diagramme (3D, gestapelt, Fläche, Prozentsatz, Balken), Auswählen mehrerer Merkmale für Achsen.

Beispiele:

  • Liniendiagramm mit Preisen von Äpfeln für 1 kg aus Argentinien (Monat auf X-Achse).
  • Balkendiagramm mit Orangenpreisen, Herkunft nach X-Achse und gruppiert nach Mindesteinkaufsvolumen.
  • 3D-Diagramm mit Bananenpreisen, Monat auf der X-Achse, Mindestvolumen auf der Y-Achse, gemittelte Preise nach Herkunft.
Zeit wäre auch schön, mit einer Komprimierung für diesen Monat/letzten Monat oder April für jedes Jahr an Daten

Antworten (2)

Ich würde Pentaho dafür empfehlen.
Es ist nicht gerade einfach, aber auch nicht zu schwer, sobald Sie das Konzept verstanden haben.

Sie haben viele Möglichkeiten, Ihre Daten (z. B. CSV) einzufügen.
Dann können Sie einen Drill in die gewünschten Dimensionen erstellen und schöne Diagramme erstellen.

Sie können auch automatisch aktualisierte Dashboards und Berichte definieren.

Die Community Edition (CE) ist Open Source (Apache 2-Lizenz) und kann hier gefunden werden .
Ich habe es unter Linux und Windows verwendet, aber es funktioniert auch unter Mac OS X.

Geben Sie hier die Bildbeschreibung ein

Die kostenlose Community-Edition ist auf der Website nicht leicht zu finden – Sie müssen in community.pentaho.com nachsehen , um sie zu finden. Ich glaube auch nicht, dass die "Teilnahmevereinbarung" die Anforderungen IRGENDEINER Open-Source-Lizenz erfüllen würde.
Wikipedia gibt an, dass die Community Edition unter der Apache 2-Lizenz steht, was Open Source bedeutet. Ich habe beim Herunterladen von sourceforge.net/projects/pentaho/files keine "Teilnahmevereinbarung" gesehen

Ich würde dringend empfehlen, einen Blick auf python + zu werfen, entweder wenn Ihre Daten wirklich große pyTables & MatPlotLib oder Pandas mit moderater Größe sind - auf jeden Fall erhalten Sie eine kostenlose, plattformübergreifende, vollständig anpassbare Ansicht Ihrer Daten.

Es gibt nur hunderte, maximal mehrere tausend Werte. Panda sieht interessant aus. Ich muss die Daten nicht analysieren (Mittelwerte, Verteilungen usw.), sondern nur visualisieren. Ich habe ein wenig Erfahrung mit Matplotlib und das möchte ich vermeiden. Matplotlib ist mächtig, aber nicht einfach.
Sehen Sie sich die Beispiele unter pandas.pydata.org/pandas-docs/stable/rplot.html an
Das klingt alles nett und ich persönlich benutze sie für alles, aber es erfordert im Grunde, dass er seine eigene Software schreibt. Während das OP dies möglicherweise kann, hilft es niemandem, der beispielsweise Excel fallen lassen möchte