Ich mache eine Datenvisualisierung. Jedes Datum wird durch ein Quadrat dargestellt. Um die zugrunde liegenden Daten intuitiv lesbar zu machen, sollte die Seitenlänge jedes Quadrats oder die Fläche jedes Quadrats proportional zu dem Datum sein, das es darstellt?
Wenn Sie, der Ersteller, sich nicht sicher sind, wie soll der Leser wissen, worum es sich handelt?
Kurze Antwort: Der Wert sollte 1:1 an die Farbmenge auf der Seite gekoppelt sein . In Ihrem Beispiel sollte es also Bereich sein. Aber es gibt noch mehr: Sie müssen auch irreführende Hinweise vermeiden, die dazu führen könnten, dass ein Leser es falsch liest, und Sie müssen wissen, warum Sie Fläche anstelle von Länge verwenden (z. B. Balkendiagramme), da dies echte Vor- und Nachteile hat.
Erstens sollten sich niemals sowohl Länge als auch Breite (dh Fläche) einer Form ändern, wenn die Variable tatsächlich nur mit der Länge einer Seite verknüpft ist. Wenn X das Doppelte von Y ist, aber Y viermal so viel Farbe auf der Seite hat, führen Sie Ihre Leser in die Irre. Diese Art von Verzerrung wird manchmal als „ Lügenfaktor “ bezeichnet und wird oft als bewusster Versuch angesehen, Unterschiede irrezuführen und zu übertreiben.
Wenn Sie die Fläche als Maß verwenden, würde ich dringend empfehlen:
Zu wissen, warum Sie area verwenden . Indem Sie die Fläche anstelle einer linearen Dimension wie der Länge verwenden, können Sie:
Erwägen Sie die Verwendung von Kreisen für die Fläche, nicht von Quadraten, zentriert ausgerichtet :
Zum Beispiel oben ist es schwer zu erkennen, dass das Quadrat mit der Bezeichnung „5“ drei Viertel der Höhe des Quadrats mit der Bezeichnung „10“ hat, daher ist es möglicherweise irreführend.
Die Kreise laden nicht zu dieser Art von Vergleich ein: Es ist eher ein sofortiges "Dieser Klecks ist viel größer als der nächste Klecks".
Es gibt eine Vielzahl von Beweisen, von Benutzertests bis hin zu kleinen Studien (ich werde später versuchen, einige Beispiele zu finden), dass diese Art von intuitivem bereichsbasiertem Vergleich ansprechender sein kann, die Eintrittsbarriere für weniger engagierte Zielgruppen senken kann und kann helfen, den Fokus des Lesers auf das Thema zu lenken und nicht auf die kalten Details der Zahlen. Dies geht jedoch auf Kosten einer stärker numerisch ausgerichteten Analyse.
Wählen Sie aus ästhetischen Gründen nicht zwischen eindimensional (Länge oder Abstand) und zweidimensional (Fläche): Wählen Sie zwischen ihnen basierend auf Ihrem Publikum und Ihrer Botschaft.
Was ist für die Kommunikation angemessener: sofortige Bauchvergleiche auf der Ebene „das ist viel größer“ oder eher überlegte Zahlenvergleiche auf der Ebene „das sind etwa 80 % des anderen“?
Oder gibt es praktische Gründe, warum Sie die Fläche verwenden müssen?
Wenden Sie dann, wenn Sie sich aus praktischen Gründen entschieden haben, Ästhetik an.
Ich würde sagen, die Gegend. Optisch erscheint ein Quadrat mit einer doppelt so langen Seite als eine viermal so große Fläche. Gelegenheitsbeobachter werden sich mit der Gegend identifizieren, auch ohne Ihre Legende zu lesen.
Ein schönes Beispiel ist diese legendäre Grafik von Randall Munroe von xkcd :
Wir können Unterschiede in der Fläche nicht so gut einschätzen wie in der Länge. Wir verwenden die Länge als Näherungswert und neigen daher dazu, Unterschiede in den Bereichen zu unterschätzen.
Aus diesem Grund erscheint ein Kreis, der eigentlich die 2-fache Fläche eines anderen hat, zu klein , weil unser Gehirn ihre Radien, die sich um den Faktor 1,4 unterscheiden, in Beziehung setzt.
Es gibt interessante Versuche, dieses Phänomen in Einklang zu bringen, wie z. B. Proportional Symbol Mapping in R , das eine wahrnehmungsbezogene Skalierung von Symbolen vorschlägt, um sie enger an die Art und Weise anzupassen, wie wir Längen und Flächen beurteilen.
Hier ist Abb. 2 aus diesem Papier
Ich persönlich habe damit keine Erfahrung und vermeide es, Bereiche zu verwenden, wenn quantitative Beurteilungen erforderlich sind.
Eine interessante Tangente ist die Beziehung zwischen der Wahrnehmung von Volumen und Länge. Noch auffälliger ist der Unterschied, wie wir diese wahrnehmen. Dies kann in diesem Video zum Größenvergleich von Sternen veranschaulicht werden .
Wenn Sie den größten Stern erreichen, der etwa das 1.700-fache des Sonnendurchmessers hat, haben Sie den Eindruck, dass er viel größer als 1.700-fach ist.
Für einen systematischeren Blick auf unseren Fehler bei der Wahrnehmung von Unterschieden in Flächen und Längen siehe Crowdsourcing Graphical Perception: Using Mechanical Turk to Assess Visualization Design von Jeffrey Heer und Michael Bostock.
Meiner Meinung nach der Bereich (D), nicht jede Seite (E).
Wenn Sie eine Seite der Länge 2 verwenden, wäre die Fläche das 4-fache des Wertes und Sie hätten ein stark überlappendes Diagramm. (E)
Wenn Sie ein normales Balkendiagramm (A) haben, sind die Daten linear und die Breite des Balkens dient nur der Ästhetik. (B)
In diesen Fällen ist die Fläche wieder repräsentativ für die Daten, da die Breite der Balken gleich ist. Sie können einen 3D-Balken haben und dennoch ist das Volumen des Balkens derjenige, der die Daten darstellt (C)
Tufte hat sich ausführlich damit auseinandergesetzt. Sehen:
Einige Prinzipien der grafischen Integrität:
- Die Darstellung von Zahlen, wie sie physikalisch auf der Oberfläche des Graphen selbst gemessen wird, sollte direkt proportional zu den dargestellten numerischen Größen sein
- Eine klare, detaillierte und gründliche Kennzeichnung sollte verwendet werden, um grafische Verzerrungen und Mehrdeutigkeiten zu vermeiden. Schreiben Sie Erklärungen zu den Daten in die Grafik selbst. Kennzeichnen Sie wichtige Ereignisse in den Daten.
- Datenvariation anzeigen, keine Designvariation.
- In Zeitreihendarstellungen von Geld sind deflationierte und standardisierte Geldmaßeinheiten fast immer besser als nominale Einheiten.
- Die Anzahl der dargestellten informationstragenden (variablen) Dimensionen sollte die Anzahl der Dimensionen in den Daten nicht überschreiten. Grafiken dürfen Daten nicht aus dem Kontext reißen.
In Ihrem Fall müssen Sie sich fragen, ob die Daten besser durch ein 2D- oder 3D-Bild oder eine Linie dargestellt werden. Ein Würfel, ein Quadrat und eine Linie sind nicht dasselbe. Das ist einer der Gründe, warum 3D-Balkendiagramme so oft irreführend sind.
dummer Vater
Michael Schumacher
DA01
dummer Vater
user56reinstatemonica8