Was ist der Unterschied zwischen Korrelation und Kausalität?

Was ist der Unterschied zwischen Korrelation und Kausalität?

Beispiel Piraten und globale Temperatur

Woher wissen wir zum Beispiel, wann wir es hier nur mit Korrelation und nicht auch mit Kausalität zu tun haben?Globale Durchschnittstemperatur vs. Anzahl der Piraten

Was bestimmte Philosophen diesbezüglich zu vertreten scheinen

Es scheint so

  • Hume würde sagen
    correlation ≡ causation.
  • Aristoteles würde das allgemein sagen
    correlation ≢ causation
    und das
    causation ⇔ correlation
    nur, wenn wir es nicht mit zufälligen Ereignissen zu tun haben.

("≡" bedeutet "ist identisch mit" und "⇔" bedeutet "impliziert einander.")

Was genau suchen Sie hier in einer Antwort? Es gibt eine mögliche philosophische Frage und eine mögliche Off-Topic-Frage zur allgemeinen Definition. Können Sie erklären, worauf Sie hoffen und warum es sich um eine spezifisch philosophische Frage handelt?
Nur so zum Spaß, einige andere Korrelationen sind, dass Eiscremeverkäufe mit Ertrinkungstoten korrelieren, die Anzahl der wandernden Störche mit der Geburtenrate korreliert, Fettleibigkeit mit Schulden korreliert und der S&P 500-Index über viele Jahre eng mit dem korreliert ist Butterpreis in Bangladesch.
Können Sie Definitionen für Korrelation und Kausalität posten?
Obligatorisches XKCD
Das ist ein großes Missverständnis von Hume und seinem Induktionsproblem. Sein Punkt war, dass es uns kein sicheres Wissen geben kann, nicht dass wir nur Korrelationen haben. Und um diese Ursache hervorzuheben, muss begründet und nicht einfach gefunden werden.

Antworten (5)

Was ist der Unterschied zwischen Korrelation und Kausalität?

  • Korrelation ist eine beschreibende Beziehung, alles, was sie sagt, ist: Hier sind eine Reihe von Messungen von zwei (oder mehr Variablen) und es gibt eine bestimmte numerische Beziehung - dass der Korrelationskoeffizient über einem bestimmten Schwellenwert liegt. Mehr sagt die Korrelation formal nicht aus.
  • Kausalität hingegen ist eine erklärende Beziehung: Sie liefert eine logische Beziehung zwischen den Variablen, die man auf Fälle verallgemeinern können sollte, die über den Satz von Messungen hinausgehen, aus denen wir die ursprüngliche Hypothese gezogen haben. In Ihrem Piraten-/Temperaturdiagramm-Fall müsste man eine detaillierte Erklärung/den Mechanismus dafür liefern, was es genau mit Piraten auf sich hat, die die globalen Temperaturen niedrig gehalten haben? War es ihre Kleidung? Waren es ihre komischen Akzente? Waren es ihre unausstehlichen Papageien? Dann wäre es möglich, diesen Mechanismus auf andere Fälle zu verallgemeinern. Nehmen wir an, dass ich bei eingehender Analyse entscheide, dass es ihre Akzente waren, die die globalen Temperaturen niedrig hielten. Ich könnte dies dann verallgemeinern, indem ich normale Nichtpiraten mit einem Piratenakzent sprechen lasse, und messen Sie die Wirkung, die es auf die globale Erwärmung hat.

Kausalität ist schwer prägnant zu definieren, aber hier ist eine aktuelle Definition von Nancy Cartwright ( siehe auch diesen Beitrag ):

C verursacht E genau dann, wenn C die Wahrscheinlichkeit von E in jeder ansonsten bezüglich E kausal homogenen Situation erhöht. (Causal Laws and Effective Strategies, 423)

Das Schlüsselwort hier ist "in jeder Situation" . Die Korrelation betrifft nicht jede Situation, sondern nur die Daten, die wir gerade haben. Die Kausalität hingegen umfasst jede Situation, darunter viele, die nicht in unseren aktuellen Daten enthalten sind. Beachten Sie die probabilistische Definition, die Aussagen wie „Rauchen verursacht Krebs“ zulässt, obwohl wir ein oder zwei starke Raucher getroffen haben, die keinen Krebs haben.

Woher wissen wir zum Beispiel, wann wir es hier nur mit Korrelation und nicht auch mit Kausalität zu tun haben?

Dies ist noch eine offene Frage. Ihre Lösung hätte schwerwiegende Folgen für die Wissenschaftstheorie (in Bezug auf das Abgrenzungsproblem und das Induktionsproblem).

Der Falsifikationismus von Karl Popper war gewissermaßen ein Versuch, dieses Problem zu lösen. Davor war der Verifikationismus der logischen Positivisten problematisch, genau weil Korrelation keine Kausalität impliziert, und man alle möglichen pseudowissenschaftlichen Theorien verifizieren konnte, vorausgesetzt, sie gruben genügend passend korrelierte Datenpunkte aus. Fälschung löst das Problem jedoch nicht vollständig.

Angesichts der Tatsache, dass zwei Datensätze A und B korreliert sind, schauen wir uns die Möglichkeiten an, warum sie korreliert sind:

  1. Ihre Korrelation ist rein zufällig.
  2. A verursacht B.
  3. B verursacht A.
  4. A und B werden beide durch eine dritte Variable C verursacht.

Durch Fälschung können wir Fälle wie (1) ausschließen: Wenn man in Ihrem Piratenbeispiel eine Möglichkeit hätte, die Anzahl der Piraten plötzlich zu erhöhen, oder es schaffte, alle dazu zu bringen, ein paar Jahre lang wie ein Pirat zu sprechen, würden sie das bemerken Nach 10 oder 20 Jahren sind die globalen Durchschnittstemperaturen immer noch nicht gesunken, sodass wir die Hypothese, dass Piraten einen kausalen Zusammenhang mit den globalen Temperaturen haben, getrost verwerfen können.

Aber das lässt uns mit (2), (3) und (4) zurück. Für diese gibt es einige Heuristiken, um zwischen den Möglichkeiten zu unterscheiden, aber keine sichere Methode.

  • Zeit ist ein Faktor: In jedem realen physikalischen Fall geht die Ursache immer den Auswirkungen voraus. Wenn Ihre Daten also mit ausreichender Genauigkeit mit einem Zeitstempel versehen sind, können Sie dies als Indikator verwenden. Dies würde es erlauben, zwischen (2) und (3) zu entscheiden, lässt uns aber immer noch unentschlossen, welche von denen wir auswählen und (4).
  • Verallgemeinerung: Wenn Ihre erklärende Theorie nur die beiden Variablen erklärt, die Sie haben, und nichts anderes, dann sollten Sie vielleicht tiefer graben. Eine gute Theorie sollte in der Lage sein, andere verwandte Fragen zu erklären, nicht nur die, die sich aus den vorliegenden Daten ergeben. Obwohl beispielsweise eine kausale Beziehung zwischen Piraten und Klima die Daten in Ihrem Diagramm erklären könnte, wird dies niemals etwas anderes erklären. Die Erklärung des Klimawandels mit dem Konzept der Treibhausgase erklärt auch andere Phänomene, zum Beispiel warum Treibhäuser funktionieren und warum die Venus so viel wärmer ist als die Erde.
  • Passt Ihre Erklärung zu anderen bereits existierenden Theorien? Gibt es ein allgemeineres Muster, dem diese Theorien folgen? Wenn Piraten mit dem Klimawandel in Verbindung gebracht werden, können wir dann auch den Rückgang der Gladiatoren mit der Wasserverschmutzung in Verbindung bringen?
Interessant. Was Sie als Antwort auf meine erste Frage sagen, hängt mit meiner anderen Frage hier zusammen: " Was ist der Unterschied (falls vorhanden) zwischen Demonstration [dh etwas durch Ursachen beweisen] und Beschreibung? "
@Geremia jetzt, wo du es erwähnst, erinnere ich mich an meine letzte Frage, die ich gepostet habe. Siehe meine Bearbeitungen. -- Prost

Korrelation und Kausalität sind nicht dasselbe:

Korrelation ist eine Tatsache, die sich einfach aus der Beobachtung ergibt - wie in Ihrem schönen Beispiel.

Dagegen beantwortet die Kausalität zusätzlich die Frage: Warum ?

Die Warum-Frage zu beantworten bedeutet, eine Erklärung für die Beobachtung zu geben. Eine Erklärung sollte allgemeiner sein als eine spezifische Beobachtung. Es sollte mehrere Fälle abdecken, auch noch nicht beobachtete Fälle (Vorhersagekraft). Die besten Erklärungen sind wissenschaftliche Theorien. Sie erlauben es, viele Phänomene aus wenigen allgemeinen Annahmen abzuleiten.

Leider kenne ich keine einfache und treffende Definition von Kausalität.

Abgesehen davon sollte in Ihrer Zahl 35.000 durch einen anderen Wert ersetzt werden. Verwenden Sie eine logarithmische Skala?

Nehmen Sie dieses Beispiel: Menschen, die Regenmäntel tragen, Menschen, die Regenschirme tragen, und es regnet. Diese drei werden dazu neigen, zusammen zu passieren oder nicht zusammen zu passieren. Das ist Korrelation.

Es gibt drei Hauptfälle für Kausalität: Die Beziehung zwischen Regen und Regenschirmen ist kausal. Wenn es regnet, holen die Leute ihre Regenschirme heraus. In die andere Richtung gibt es keinen kausalen Zusammenhang: Das Tragen eines Regenschirms verursacht keinen Regen. Wenn Sie Ihren Regenschirm während des Regens weglegen, wird der Regen dadurch nicht aufhören. Und das Verhältnis zwischen Regenmänteln und Regenschirmen ist wieder anders: Beide haben eine gemeinsame Sache.

Beachten Sie, dass die Korrelation in beide Richtungen funktioniert: Regen ist mit Regenschirmen korreliert, und Regenschirme sind gleichermaßen mit Regen korreliert. Kausalität ist normalerweise eine Einbahnbeziehung.

Der Unterschied zwischen Korrelation und Kausalität wird am besten durch die Aussage erfasst: "Korrelation impliziert keine Kausalität." Kausalität impliziert Korrelation, aber das Gegenteil ist nicht der Fall: Korrelation impliziert keine Kausalität. Das heißt, es gibt keine Möglichkeit, eine Ursache-Wirkungs-Beziehung zwischen A und B nur auf der Grundlage einer beobachteten Assoziation oder Korrelation zwischen ihnen legitim abzuleiten (oder abzuleiten).

Die Behauptung, dass "Korrelation Kausalität impliziert ", ist ein Fall des logischen Fehlschlusses, der als "fragwürdige Ursache" bezeichnet wird.

Wenn A und B korreliert sind, gibt es die folgenden Optionen:

  1. Zwischen A und B besteht kein Zusammenhang (Nullhypothese: H0), dh zufällige Korrelation.
  2. A verursacht B
  3. B verursacht A
  4. A und B werden durch eine dritte Variable C verursacht
  5. (A verursacht B) UND (B verursacht A): "bidirektional" (A und B verursachen sich gleichzeitig) oder "zyklisch" (nicht gleichzeitig, [A verursacht B] DANN [B verursacht A] usw.)

Die Idee, dass Korrelation eine Kausalität impliziert, ist ein Fall des Trugschlusses „fragliche Ursache“, bei dem angenommen wird, dass zwei Ereignisse, die zusammen auftreten, eine Ursache-Wirkungs-Beziehung hergestellt haben.

Fragwürdiger Ursache Irrtum: „cum hoc ergo propter hoc“ = „mit diesem deshalb deshalb.“ Beachten Sie, dass sich dies vom "post hoc ergo propter hoc" (nach diesem, also deswegen) unterscheidet, bei dem ein Ereignis, das auf ein anderes folgt, als notwendige Folge des vorherigen Ereignisses angesehen wird. Ein Beispiel für den „post hoc“-Irrtum ist: „Jeden Morgen kräht mein Hahn, dann geht die Sonne auf.

Korrelation (P) kann unmöglich Kausalität (Q) implizieren, weil „Implikation“ notwendigerweise etwas Deduktives ist. Im logischen Sinne bedeutet der Begriff „impliziert“ „ist eine hinreichende Bedingung für“. Daher stellt die (materielle) Implikation in der Bedingung „wenn P, dann Q“ eine hinreichende Bedingung zwischen P und Q auf, so dass „P für Q ausreichend ist“, was gleichbedeutend ist mit der Aussage „Q ist eine notwendige Bedingung für P. ' Die technische Bedeutung der materiellen Bedingung "P impliziert Q", die als P -> Q bezeichnet wird, bedeutet "Wenn der Umstand P der Fall ist, dann folgt Q." In diesem Sinne des Wortes „implizieren“ ist es immer richtig zu sagen „Korrelation impliziert nicht Kausalität“. Korrelation ist eine notwendige Bedingung für Kausalität, keine hinreichende Bedingung!

Außerdem legt eine bloße Korrelation zwischen A und B noch nicht einmal die Richtung der Kausalität fest: Aus der bloßen Tatsache, dass A und B korreliert sind, kann man nicht schließen, dass A die Ursache oder die Wirkung ist, und ebenso für B.

Was ist der Unterschied zwischen Korrelation und Kausalität?

Der Unterschied besteht darin, ein Modell (auch bekannt als Theorie) zu haben.

Wir können sagen, dass A B verursacht, wenn wir durch Logik und Vernunft erklären können, warum das so ist.

Und obwohl Kausalität oft eine Korrelation erzeugt, ist sie keineswegs implizit. „Zu viel des Guten“ ist ein Beispiel für ein solches Paradoxon, das jeder nur zu gut kennt.

Woher wissen wir zum Beispiel, wann wir es hier nur mit Korrelation und nicht auch mit Kausalität zu tun haben?

Wir nicht. Aber da wir die Ursache nicht identifizieren können, sollten wir sicherlich keine annehmen.