Soll entweder die Fläche oder die Länge eines Quadrats proportional zu den visualisierten Daten sein?

Ich mache eine Datenvisualisierung. Jedes Datum wird durch ein Quadrat dargestellt. Um die zugrunde liegenden Daten intuitiv lesbar zu machen, sollte die Seitenlänge jedes Quadrats oder die Fläche jedes Quadrats proportional zu dem Datum sein, das es darstellt?

Noch nicht. Ist es breit? Ich hatte gehofft, dass die Antwort eindeutig war (ich nehme an, es ist "Bereich"), aber diese Leute hier würden mehr Wissen über Grafikdesign und Wahrnehmungspsychologie haben, um dies zu untermauern.
IIRC Dies wurde in einem deutschen Buch behandelt, das ich einmal gelesen habe, "So lügt man mit Statistik" von en.wikipedia.org/wiki/Walter_Krämer - nicht sicher, ob es ein englisches Äquivalent gibt. TL;DR - hängt davon ab, was Ihre Leser aus den Visualisierungen lesen sollen.
Die Antwort ist sicher nicht eindeutig. Es hängt alles von den Besonderheiten ab – nämlich, welche Daten Sie präsentieren, wie Sie sie präsentieren und was Sie mit diesen Daten kommunizieren möchten.
Können Sie Beispiele nennen, bei denen die Besonderheiten oder das, was die Leser aus der Visualisierung lesen sollen, uns dazu veranlassen würden, die Länge der Seite eines Quadrats proportional zum Datum zu machen, anstatt die Fläche des Quadrats?
+1 Warum zieht jede interessante Frage mindestens eine enge Abstimmung an?!? <grummel>

Antworten (5)

Wenn Sie, der Ersteller, sich nicht sicher sind, wie soll der Leser wissen, worum es sich handelt?

Kurze Antwort: Der Wert sollte 1:1 an die Farbmenge auf der Seite gekoppelt sein . In Ihrem Beispiel sollte es also Bereich sein. Aber es gibt noch mehr: Sie müssen auch irreführende Hinweise vermeiden, die dazu führen könnten, dass ein Leser es falsch liest, und Sie müssen wissen, warum Sie Fläche anstelle von Länge verwenden (z. B. Balkendiagramme), da dies echte Vor- und Nachteile hat.


Erstens sollten sich niemals sowohl Länge als auch Breite (dh Fläche) einer Form ändern, wenn die Variable tatsächlich nur mit der Länge einer Seite verknüpft ist. Wenn X das Doppelte von Y ist, aber Y viermal so viel Farbe auf der Seite hat, führen Sie Ihre Leser in die Irre. Diese Art von Verzerrung wird manchmal als „ Lügenfaktor “ bezeichnet und wird oft als bewusster Versuch angesehen, Unterschiede irrezuführen und zu übertreiben.

Geben Sie hier die Bildbeschreibung ein


Wenn Sie die Fläche als Maß verwenden, würde ich dringend empfehlen:

  • Zu wissen, warum Sie area verwenden . Indem Sie die Fläche anstelle einer linearen Dimension wie der Länge verwenden, können Sie:

    • Opfern Sie die Fähigkeit, Unterschiede mathematisch klar zu sehen (Sie können nicht einfach sagen: "Schau, das ist das Doppelte des anderen")
    • Laden Sie Ihre Leser ein, es auf eine intuitive , alltägliche, nicht-numerische Weise zu betrachten, so wie Menschen beispielsweise die Größe von Torten in einem Geschäft vergleichen. Weniger anspruchsvoll, aber unmittelbarer. Mehr Bauch, weniger Kopf.
    • Kleine Unterschiede zwischen sehr ähnlichen Zahlen werden fast unsichtbar.
    • Wenn eine Variable um ein Vielfaches kleiner ist als eine andere, verschwindet die sehr kleine nicht so stark wie in einem Balkendiagramm, was mehr Flexibilität in Layouts ermöglichen kann.

Geben Sie hier die Bildbeschreibung ein

  • Erwägen Sie die Verwendung von Kreisen für die Fläche, nicht von Quadraten, zentriert ausgerichtet :

    • Kreise, weil es nicht zu Verwechslungen mit Balkendiagrammen und ähnlichem führt. Höhe und Breite stehen weniger im Vordergrund: Es sieht weniger so aus, als würden Sie zu einem Höhen- oder Breitenvergleich einladen.
    • Zentriert, weil es nicht zum Höhenvergleich einlädt

Geben Sie hier die Bildbeschreibung ein

Zum Beispiel oben ist es schwer zu erkennen, dass das Quadrat mit der Bezeichnung „5“ drei Viertel der Höhe des Quadrats mit der Bezeichnung „10“ hat, daher ist es möglicherweise irreführend.

Die Kreise laden nicht zu dieser Art von Vergleich ein: Es ist eher ein sofortiges "Dieser Klecks ist viel größer als der nächste Klecks".


Es gibt eine Vielzahl von Beweisen, von Benutzertests bis hin zu kleinen Studien (ich werde später versuchen, einige Beispiele zu finden), dass diese Art von intuitivem bereichsbasiertem Vergleich ansprechender sein kann, die Eintrittsbarriere für weniger engagierte Zielgruppen senken kann und kann helfen, den Fokus des Lesers auf das Thema zu lenken und nicht auf die kalten Details der Zahlen. Dies geht jedoch auf Kosten einer stärker numerisch ausgerichteten Analyse.

Wählen Sie aus ästhetischen Gründen nicht zwischen eindimensional (Länge oder Abstand) und zweidimensional (Fläche): Wählen Sie zwischen ihnen basierend auf Ihrem Publikum und Ihrer Botschaft.

Was ist für die Kommunikation angemessener: sofortige Bauchvergleiche auf der Ebene „das ist viel größer“ oder eher überlegte Zahlenvergleiche auf der Ebene „das sind etwa 80 % des anderen“?

Oder gibt es praktische Gründe, warum Sie die Fläche verwenden müssen?

Wenden Sie dann, wenn Sie sich aus praktischen Gründen entschieden haben, Ästhetik an.

„Proportional zur Farbmenge auf der Seite“ ist eine sehr nützliche Faustregel (zumindest in 2D); danke dafür werde ich verwenden. Das Design, zu dem ich mich bewege, basiert auf Kreisen, ich denke, Sie haben Recht

Ich würde sagen, die Gegend. Optisch erscheint ein Quadrat mit einer doppelt so langen Seite als eine viermal so große Fläche. Gelegenheitsbeobachter werden sich mit der Gegend identifizieren, auch ohne Ihre Legende zu lesen.

Ein schönes Beispiel ist diese legendäre Grafik von Randall Munroe von xkcd :

Geben Sie hier die Bildbeschreibung ein( große, gut lesbare Version )

Wir können Unterschiede in der Fläche nicht so gut einschätzen wie in der Länge. Wir verwenden die Länge als Näherungswert und neigen daher dazu, Unterschiede in den Bereichen zu unterschätzen.

Aus diesem Grund erscheint ein Kreis, der eigentlich die 2-fache Fläche eines anderen hat, zu klein , weil unser Gehirn ihre Radien, die sich um den Faktor 1,4 unterscheiden, in Beziehung setzt.

Es gibt interessante Versuche, dieses Phänomen in Einklang zu bringen, wie z. B. Proportional Symbol Mapping in R , das eine wahrnehmungsbezogene Skalierung von Symbolen vorschlägt, um sie enger an die Art und Weise anzupassen, wie wir Längen und Flächen beurteilen.

Hier ist Abb. 2 aus diesem Papier

Geben Sie hier die Bildbeschreibung ein

Ich persönlich habe damit keine Erfahrung und vermeide es, Bereiche zu verwenden, wenn quantitative Beurteilungen erforderlich sind.

Eine interessante Tangente ist die Beziehung zwischen der Wahrnehmung von Volumen und Länge. Noch auffälliger ist der Unterschied, wie wir diese wahrnehmen. Dies kann in diesem Video zum Größenvergleich von Sternen veranschaulicht werden .

Wenn Sie den größten Stern erreichen, der etwa das 1.700-fache des Sonnendurchmessers hat, haben Sie den Eindruck, dass er viel größer als 1.700-fach ist.

Für einen systematischeren Blick auf unseren Fehler bei der Wahrnehmung von Unterschieden in Flächen und Längen siehe Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design von Jeffrey Heer und Michael Bostock.

Meiner Meinung nach der Bereich (D), nicht jede Seite (E).

Wenn Sie eine Seite der Länge 2 verwenden, wäre die Fläche das 4-fache des Wertes und Sie hätten ein stark überlappendes Diagramm. (E)

Wenn Sie ein normales Balkendiagramm (A) haben, sind die Daten linear und die Breite des Balkens dient nur der Ästhetik. (B)

In diesen Fällen ist die Fläche wieder repräsentativ für die Daten, da die Breite der Balken gleich ist. Sie können einen 3D-Balken haben und dennoch ist das Volumen des Balkens derjenige, der die Daten darstellt (C)

Diagramme zur Veranschaulichung von Größenwahrnehmungsunterschieden und Überschneidungen

4 Mal? Ist es nicht der Unterschied zwischen linear und quadratisch?
Lassen Sie mich den Beitrag illustrieren und bearbeiten.
Angenommen, das Datum ist 81. Wenn wir Fläche verwenden, haben die Seiten eine Länge von 9, was eine Fläche von 81 ergibt. Wenn wir Seiten verwenden, haben sie eine Länge von 81 und die Fläche ist 6.561. 81 ist nicht 4 mal 9 und 6.561 ist nicht 4 mal 81. Woher bekommt man 4?
"Wenn Sie eine Seite der Länge 2 verwenden, wäre die Fläche das 4-fache des Wertes." Ich kann nicht sagen, was Sie damit sagen wollen. Ich denke, Sie meinen, dass, wenn Sie die Länge der Seite verwenden, um die Größe der Daten darzustellen, das Verdoppeln des Datenwerts die Fläche mit vier multipliziert.
David - das ist meine Bearbeitung! Rafaels ursprünglicher Beitrag sagte: "Wenn Sie eine Seite verwenden, wäre die Fläche das Vierfache des Wertes". Wenn Sie einen besseren Weg kennen, dies zu verdeutlichen, tun Sie dies bitte.

Tufte hat sich ausführlich damit auseinandergesetzt. Sehen:

  • Die visuelle Darstellung quantitativer Informationen,
  • Vorstellung von Informationen und anderen.

Einige Prinzipien der grafischen Integrität:

  1. Die Darstellung von Zahlen, wie sie physikalisch auf der Oberfläche des Graphen selbst gemessen wird, sollte direkt proportional zu den dargestellten numerischen Größen sein
  2. Eine klare, detaillierte und gründliche Kennzeichnung sollte verwendet werden, um grafische Verzerrungen und Mehrdeutigkeiten zu vermeiden. Schreiben Sie Erklärungen zu den Daten in die Grafik selbst. Kennzeichnen Sie wichtige Ereignisse in den Daten.
  3. Datenvariation anzeigen, keine Designvariation.
  4. In Zeitreihendarstellungen von Geld sind deflationierte und standardisierte Geldmaßeinheiten fast immer besser als nominale Einheiten.
  5. Die Anzahl der dargestellten informationstragenden (variablen) Dimensionen sollte die Anzahl der Dimensionen in den Daten nicht überschreiten. Grafiken dürfen Daten nicht aus dem Kontext reißen.

In Ihrem Fall müssen Sie sich fragen, ob die Daten besser durch ein 2D- oder 3D-Bild oder eine Linie dargestellt werden. Ein Würfel, ein Quadrat und eine Linie sind nicht dasselbe. Das ist einer der Gründe, warum 3D-Balkendiagramme so oft irreführend sind.