Haben sich die globalen Oberflächentemperaturen seit den späten 1990er Jahren nicht signifikant erwärmt?

Diejenigen, die der Wissenschaft der globalen Erwärmung skeptisch gegenüberstehen, haben häufig behauptet, dass die Aufzeichnung der Oberflächentemperatur seit etwa 1998 „pausiert“ und keinen signifikanten Erwärmungstrend gezeigt habe (siehe diesen kürzlich erschienenen Wattsupwiththat- Beitrag als repräsentatives Beispiel).

Die Mainstream-Gemeinschaft der Klimawissenschaftler hat darauf auf verschiedene Weise reagiert (siehe meine Kursivschrift in den Zitaten unten, die die verschiedenen Behauptungen hervorhebt).

Einige bestreiten, dass die Pause existiert, oder argumentieren, dass die jüngsten Erweiterungen des Datensatzes zeigen, dass es sich um einen Datenfehler handelt, siehe diese Nachricht aus dem Independent , in der behauptet wird:

Eine neue Studie hat herausgefunden, dass die globalen Temperaturen in den letzten 15 Jahren nicht abgeflacht sind , wie die Aufzeichnungen von Wetterstationen vermuten lassen, sondern tatsächlich so schnell weiter gestiegen sind wie in den vergangenen Jahrzehnten, in denen wir eine beispiellose globale Beschleunigung erlebt haben Erwärmen.

Aber andere Mainstream-Wissenschaftler akzeptieren die Pause und suchen nach Erklärungen. Eine aktuelle Rezension in Nature beginnt mit diesem Eingeständnis:

Mehrere Jahre lang schrieben Wissenschaftler den Stillstand als Rauschen im Klimasystem ab: die natürlichen Schwankungen in der Atmosphäre, den Ozeanen und der Biosphäre, die weltweit zu warmen oder kühlen Perioden führen. Aber die Pause dauerte an und löste eine kleine Vertrauenskrise in diesem Bereich aus. Obwohl es Sprünge und Einbrüche gegeben hat, sind die durchschnittlichen atmosphärischen Temperaturen seit 1998 kaum gestiegen , scheinbar trotz der Prognosen von Klimamodellen und der ständig steigenden Emissionen von Treibhausgasen.

aber geht weiter

... Jetzt, da die globale Erwärmungspause in ihr sechzehntes Jahr eintritt, machen Wissenschaftler endlich Fortschritte im Fall der fehlenden Wärme.

Einige Leute glauben also nicht, dass es eine Pause gegeben hat, und andere versuchen, die Pause zu erklären. Meine Frage ist angesichts der Unsicherheiten, ob die globalen Oberflächentemperaturen seit etwa 1998 keinen signifikanten Anstieg gezeigt haben?

Hinweis zur Verdeutlichung : Mir ist klar, dass die meiste Wärme nicht von der Atmosphäre absorbiert wird und dass sich der Klimawandel möglicherweise fortsetzt. Das ist relevanter Kontext , aber nicht die Frage. Die Frage ist nach den Oberflächentemperaturen. Beantworten Sie das also zuerst und geben Sie später den Kontext an.

@Tor-EinarJarnbjo Die Met Office-Frage ist viel zu spezifisch und führte nicht zu guten Antworten auf die allgemeine Frage. Diese Frage ist verwandt, sollte aber Raum für eine ordnungsgemäße Analyse aller Daten und aller diesbezüglichen Behauptungen lassen.
@GlenTheUdderboat Ich kann nicht auf Ihr PDF zugreifen. Aber ich denke, die Antworten müssen eine gute Diskussion über Statistiken, Glätten und verrauschte Daten liefern und "Signifikanz" rechtfertigen, wenn sie sich für die Verwendung des Begriffs entscheiden.
Es ist möglich, dass beide Papiere richtig sind; Sie widersprechen sich nicht unbedingt. Wenn beides richtig ist, ist die Atmosphäre wärmer als wir denken und die tiefen Ozeane haben mehr Wärme absorbiert als wir erwartet haben und daher unterschätzen wir die Geschwindigkeit, mit der die globale Erwärmung stattfindet (zumindest in den letzten 16 Jahren). . Da die Papiere beide wahr sein können, sollte ihre Genauigkeit wahrscheinlich in zwei getrennten Fragen abgefragt werden. Da beide Papiere letztes Jahr veröffentlicht wurden, ist es unwahrscheinlich, dass es bisher unabhängige Studien zu demselben Thema gegeben hat.
@Ladadadada Ich interessiere mich nicht besonders für die beiden Papiere: Ich habe einfach einige repräsentative Fälle verwendet, um den Punkt zu veranschaulichen, dass die Leute sich über die Daten nicht einig zu sein scheinen. Was mich interessiert, ist, was die Daten aussagen, und das wurde in vielen Artikeln diskutiert. Wie ist der Konsens und stimmt er mit der Statistik überein?
Keine aus den RSS-Satellitendaten klimadepot.com/2014/06/04/…

Antworten (2)

Als Erstes ist darauf hinzuweisen, dass „keine statistisch signifikante Erwärmung“ nicht bedeutet, dass es keine Erwärmung gegeben hat, im Wesentlichen bedeutet es nur, dass es nicht genug Erwärmung gegeben hat, um die Möglichkeit auszuschließen, dass es keine Erwärmung gegeben hat. Wenn das kontraintuitiv klingt, liegt es daran, aber so funktioniert häufiges statistisches Hypothesentesten.

Die Funktionsweise frequentistischer Hypothesentests ist im Großen und Ganzen wie folgt: Angenommen, Sie haben eine Hypothese (H1), die Sie mit einer Reihe von Beobachtungen (X) stützen möchten. Als nächstes definieren Sie eine "Nullhypothese", die Sie im Grunde als falsch zeigen müssen, damit Ihr H1 wahr ist. Wenn Sie zum Beispiel die Hypothese aufstellen, dass es zu einer gewissen Erwärmung gekommen ist, dann ist die offensichtliche Wahl für H0, dass es überhaupt keine Erwärmung gegeben hat, dh die Erwärmungsrate ist null. Anschließend berechnen Sie den p-Wert, der die Wahrscheinlichkeit darstellt, einen Trend zu beobachten, der mindestens so groß ist wie der beobachtete IFH0 ist wahr. Wenn der p-Wert ausreichend klein ist, sagen wir p < 0,05, wird dies als ausreichender Beweis dafür angesehen, dass H0 falsch ist, also sagen wir, dass „wir die Nullhypothese ablehnen“ oder äquivalent „die Erwärmungsrate ist statistisch signifikant“ und andernfalls „wir die Nullhypothese nicht ablehnen" oder "die Erwärmungsrate ist statistisch nicht signifikant".

Der erste Punkt, den Sie hier beachten sollten, ist, dass H0 die Hypothese sein sollte, gegen die Sie argumentieren . Für die Mainstream-Wissenschaft, die vorschlägt, dass es aufgrund des Treibhauseffekts zu einer Erwärmung kommen wird, ist das natürliche H0, dass es keine Erwärmung gibt. Die „Skeptiker“ hingegen gehen davon aus, dass es keine Erwärmung gibt, aber sie verwenden dies auch als ihre Nullhypothese. Dies ist ein schwerwiegender statistischer Fehler, da es bedeutet, dass Hypothesentests nicht mehr als Plausibilitätsprüfung funktionieren, da die Skeptiker davon ausgehen, dass sie Recht haben, und Beweise verlangen, um zu beweisen, dass sie falsch liegen. Die Mainstream-Wissenschaft hingegen geht davon aus, dass sie falsch liegen (H0 ist wahr) und fragt, ob die Beobachtungen H0 widerlegen (was impliziert, aber nicht beweist, dass H1 wahr ist).

Nun zum zweiten Punkt. Wenn der Trend statistisch nicht signifikant ist, gibt es mindestens zwei Gründe: Erstens ist H0 tatsächlich wahr, und zweitens ist H0 falsch, aber es gibt nicht genügend Daten, um zu beweisen, dass es falsch ist. Ziehen Sie in Betracht, eine zweiköpfige Münze viermal zu werfen. Der traditionelle Test für die Voreingenommenheit einer Münze wird die Nullhypothese nicht zurückweisen, da sogar viermal hintereinander mit einer fairen Münze in mehr als 5 % der Fälle zufällig passiert. Das liegt daran, dass die Power des Tests (die Wahrscheinlichkeit, die Nullhypothese abzulehnen, wenn sie eigentlich falsch ist) nicht sehr hoch ist.

Dies ist der Fall für den „nicht statistisch signifikanten“ beobachteten Trend, den wir jetzt haben, angesichts der erwarteten Größe des anthropogenen Trends und des Rauschens in den Daten (Wetter), ist die Aussagekraft des Tests so gering, dass es überhaupt nicht überraschend ist dass das Ergebnis statistisch nicht signifikant ist. E asterling und Wehner haben gezeigt, dass das Klima gelegentlich dekadische (oder mehr) Perioden mit wenig oder keinem Trend aufweist, und dass dies auch in Modellsimulationen zu finden ist.

Hinzu kommt, dass der Hypothesentest davon ausgeht, dass Sie einen zufällig ausgewählten Zeitraum von n Jahren betrachten. Wenn Sie die Start- und Enddaten aussuchen, ist die Aussagekraft noch geringer, es sei denn, Sie kompensieren das implizite Testen mehrerer Hypothesen.

Aus dem Zitat des Independent geht nicht hervor, dass es sich um einen „Datenfehler“ handelt

Eine neue Studie hat herausgefunden, dass die globalen Temperaturen in den letzten 15 Jahren nicht abgeflacht sind, wie die Aufzeichnungen von Wetterstationen vermuten lassen, sondern tatsächlich so schnell weiter gestiegen sind wie in den vergangenen Jahrzehnten, in denen wir eine beispiellose globale Beschleunigung erlebt haben Erwärmen.

Zu sagen, dass die Temperaturen nicht „flach verlaufen“ sind, ist nicht unvereinbar damit, dass die Erwärmungsrate statistisch nicht signifikant ist, denn letzteres bedeutet nur, dass wir die Möglichkeit nicht ausschließen können, dass die zugrunde liegende Erwärmungsrate null ist. Das Problem ist, dass die meisten Journalisten und ein noch größerer Teil der klimaskeptischen Blogger das Testen von Hypothesen nicht wirklich verstehen.

Zu sagen, dass die Erwärmungsrate dieselbe ist wie zuvor, ist nicht unvereinbar damit, dass die Erwärmungsrate aus dem gleichen Grund auch statistisch nicht signifikant ist.

Der Kommentar zur Beschleunigung erfordert jedoch etwas mehr Beweise.

Die Unterbrechung der Erwärmung ist interessant, sie wird durch die Auswirkungen von ENSO gut erklärt (siehe den Artikel von Foster und Rahmsdorf ) und bietet ein interessantes Gebiet für die Erforschung der Klimavariabilität. Dies bedeutet jedoch nicht, dass sich die zugrunde liegende Erwärmungsrate geändert hat oder dass Kohlendioxid kein Treibhausgas ist usw. Die beiden Ansichten sind also nicht wirklich widersprüchlich.

Um eine direkte Antwort auf die Frage zu geben, ob die Erwärmung signifikant ist oder nicht, hängt davon ab, welchen Datensatz Sie betrachten, wie Sie den betreffenden Zeitraum wählen, Ihre statistischen Annahmen (z. B. Berücksichtigung von Autokorrelation und multiplen Hypothesentests aufgrund der Wahl des Zeitraums). nach Sichtung der Daten etc.). Selbst dann bedeutet es nicht unbedingt viel, es sei denn, Sie betrachten auch die statistische Aussagekraft des Tests.

Ich mag den Punkt, dass man sich den Ausgangspunkt aussuchen sollte, aber er trifft in beide Richtungen, da Behauptungen über einen starken Trend in früheren Perioden ebenfalls der Kritik ausgesetzt sind. Gibt es eine klare statistische Möglichkeit, dies im Allgemeinen anzupassen ?
@matt_black Was den Ausgangspunkt für eine starke Trendphase angeht, meinst du wohl die 1970er? Dies ist nicht unbedingt eine Rosinenpickerei, da (i) statistische Verfahren einen Änderungspunkt zu diesem Zeitpunkt vorschlagen (z. B. tamino.wordpress.com/2010/08/13/changes ) und (ii) es vorhergesagt wurde, bevor es passierte (die anfängliche Sorge über den zukünftigen Klimawandel entstand zu einer Zeit, als es Ende der 60er und Anfang der 70er Jahre nicht wirklich wärmer wurde) - Sie können sich die Zukunft nicht aussuchen! Wenn Sie jedoch einen Zeitraum auswählen, der lang genug ist (Klimatologen verwenden normalerweise 30 Jahre), hat der Test eine beträchtliche Aussagekraft und ...
Rosinenpicken beginnt, wenig Einfluss auf das Ergebnis zu haben. Klimatologen verwenden so lange Zeiträume, da dies bedeutet, dass sich die Auswirkungen der internen Variabilität (z. B. ENSO) mitteln und einen (fast) vernachlässigbaren Einfluss auf die Schätzung des Trends haben. Die einfachste Art, das Rosinenpicken zu kompensieren, besteht darin, einfach einen Zeitraum zu verwenden, der lang genug ist, dass es keine Rolle spielt. Der andere Ansatz besteht darin, eine Anpassung für das Testen mehrerer Hypothesen vorzunehmen, aber das ist schwierig. Ich würde wahrscheinlich Simulationen von AR-Daten mit ähnlichen Eigenschaften verwenden, um den Effekt abzuschätzen, ich bin mir nicht sicher, ob es eine analytische Lösung gibt.
Übrigens, Tamino hat hier einen wirklich schönen Beitrag: tamino.wordpress.com/2014/01/30/… der hervorragend zeigt, wie wenig das Fehlen einer statistisch signifikanten Erwärmung seit 1998 bedeutet, als ob Sie die Daten von 1979 verwenden würden -1998 sind die Temperaturen seit 1998 immer noch höher gewesen, als man erwarten würde, wenn sich die Erwärmung im gleichen Tempo wie 1979-1998 fortgesetzt hätte.
Ich habe Taminos Beiträge gelesen, ohne auch nur einmal daran zu denken, dass er Statistiken objektiv verwendet, anstatt die Antwort zu beweisen, die er bekommen möchte. Sein 1979 ist auch ein Datum der Rosinenpickerei und sein Argument, dass der Wendepunkt in den 1970er Jahren objektiv ist, basiert auf einigen sehr falschen Statistiken, die nicht allgemein validierte Techniken sind, die ich anderswo gesehen habe. Aber ich würde mich freuen, wenn jemand Ideen von vertrauenswürdigen Statistikern vorlegen kann , die die gleichen Ergebnisse zeigen.
"kann einige Ideen von vertrauenswürdigen Statistikern hervorbringen" Erstens ist Tamino ein Statistiker, und da ich selbst einer bin, kann ich erkennen, dass er auch ein ziemlich guter ist. Zweitens halte ich es für Zeitverschwendung, mit denen über Wissenschaft zu diskutieren, die Ad-hominems anstelle rationaler Argumente verwenden (zu sagen, dass die Statistiken "falsch" sind, ist kein rationales Argument). Wenn Sie die konkreten Fehler in Taminos Post erklären wollen, dann tun Sie dies.
Übrigens ist das Jahr 1979 keine Rosinenpickerei, es ist das Datum, an dem Satellitenbeobachtungen verfügbar wurden. Wenn Sie also dieselbe Analyse für mehrere Datensätze durchführen möchten (um gesehen zu werden, dass Sie sich nicht die Rosinenpickerei aussuchen), müssen Sie dies tun Verwenden Sie einen Zeitraum, der tatsächlich in allen Datensätzen vorhanden ist. Wenn Sie den Beitrag tatsächlich gelesen hätten, wüssten Sie natürlich, dass „wir Temperaturdaten ab 1979 verwenden (damit wir Satellitendaten für die untere Troposphäre einbeziehen können)“.
Mir ist keine Rosinenpickerei beim Enddatum bekannt - es sind normalerweise die letzten Daten, die zum Zeitpunkt der Analyse verfügbar waren. Was routinemäßig herausgegriffen wird, ist das Startdatum – beachten Sie, dass solche Argumente normalerweise 1998 als Startdatum verwenden. 1998 ist ein ziemlicher Ausreißer.
Das Hauptproblem besteht darin, vom heutigen Tag zurückzublicken, um zu sehen, wie weit man zurückgehen und einen statistisch nicht signifikanten Trend erhalten kann. Der übliche Test auf statistische Signifikanz wird dadurch verletzt, da er davon ausgeht, dass Sie einen zufällig ausgewählten Zeitraum aus der Zeitreihe betrachten. Das Wichtigste ist zu verstehen, warum wir sehen, was wir in den Datensätzen der Oberflächentemperatur sehen (aber vor allem nicht im Wärmegehalt der Ozeane). ENSO erklärt ziemlich viel davon.
@matt_black - Entschuldigung, das ist so viele Jahre später, aber wie sie im Allgemeinen damit umgehen, ist, anstatt 1998 oder ein anderes Jahr als Ausgangspunkt auszuwählen, vergleichen sie Zehnjahresdurchschnitte (Fünfjahresdurchschnitte, was auch immer) ab diesem Jahr oder in diesem Jahr, und das schließt tendenziell die Möglichkeit aus, dass eine einjährige Spitze oder ein Tal den Vergleich aller anderen Daten verfälscht.
@PoloHoleSet Es ist nicht klar, dass dies die offensichtliche Pause erklärt. Dies wird jetzt jedoch viel seltener behauptet, da die jüngsten Daten nicht viel von einer Pause signalisieren, sodass wir vielleicht noch weitere 5 Jahre an Daten benötigen, um dies zu klären, oder vielleicht verschwindet die Behauptung, da ihre Plausibilität angesichts neuer Daten abnimmt.
@matt_black - Wenn Sie das Rosinenpicken entfernen, gibt es keine offensichtliche Pause. Sie bitten uns, ein fiktives Konstrukt zu erklären. Selbst wenn Sie die Trendlinie der Gesamtdaten auf Jahresbasis darstellen, geht sie stetig nach oben.

In dieser Antwort konzentriere ich mich auf das Papier von Cowtan und Way, das anscheinend einen Teil der Dynamik dieser Debatte verursacht (z. B. der von Ihnen erwähnte The Independent - Artikel).


Ich gehe davon aus, dass Sie mit „signifikant“ „statistisch signifikant“ meinen. Das Wort hat eine andere Bedeutung, und wenn Sie das gemeint haben, ist diese Antwort nicht sehr nützlich. Ich gehe auch davon aus, dass Sie als Nullhypothese "keinen Aufwärtstrend" annehmen möchten.

Angesichts der von Cowtan und Way durchgeführten Extrapolation schlage ich vor, dass ihre Analyse nicht geeignet ist, Ihre Frage zu verneinen [dies ist umständlich formuliert, weil Sie bereits ein „nicht“ in Ihrer Frage haben], sondern eher darauf abzielt, sie bereitzustellen nur eine Trend- (dh Punkt-) Schätzung. (In der Tat scheint es weder in der Zusammenfassung noch in der Schlussfolgerung des Papiers einen Anspruch auf Bedeutung zu geben.)

In ihrem Papier (S. 11) liefern sie uns jedoch :

Dataset          Trend +/- sigma
Hybrid s = 1.0   0.119 +/- 0.076

die verwendet werden könnten, um Ihre Frage positiv zu beantworten ( zumindest wenn dieser Datensatz/Zeitraum die einzigen zugelassenen Daten sind ).

Mit einigen weiteren Annahmen ergibt das einen p-Wert von etwa 6 %. Angesichts all der laufenden Extrapolation würde ich vorschlagen, dass Sigma objektiv höher geschätzt werden sollte, und daher würde ich vorschlagen, dass der p-Wert ebenfalls höher ist. Ich weiß nicht, welches Signifikanzniveau (mit dem der p-Wert verglichen werden sollte) in diesem Bereich konventionell oder gerechtfertigt ist, aber ich wäre nicht überrascht, wenn es 5 % oder weniger wären.

Zusammenfassung: Das Papier von Cowtan und Way ist in Bezug auf Ihre Frage in keiner Weise schlüssig und gibt uns auch keinen Grund dafür. (Das heißt: Es kann nicht „signifikant“ und nicht „nicht signifikant“ geben.) Wenn ihre Daten/Zeiträume die einzigen verfügbaren wären, dann würde ihre Analyse nahelegen: kein signifikanter Aufwärtstrend.


Ich habe festgestellt, dass solche Dinge heiß diskutiert werden. Vielleicht ist es gut, meine Position darzulegen. Es ist mir egal. (Und ich verfolge diese Debatte nicht.)

Ich bin mir dessen nicht sicher: Wenn ein Experiment nicht schlüssig ist, sollten wir andere Artikel nach Antworten durchsuchen - es sei denn, dies ist der einzige relevante Artikel. In diesem Fall sollte Ihre Antwort dies vermerken.
Es gibt kein Data Mining in C&W (wie im Chat besprochen), aber ansonsten +1.
Das C&W-Papier ist nur eines von vielen. Es wäre gut, es in den Kontext anderer zu stellen, zumal es eine gewisse Unzuverlässigkeit in der Oberflächenaufzeichnung impliziert, die auch für Zeiten gelten könnte, in denen die Aufzeichnungen eindeutig eine Erwärmung zeigten. Das größte Problem mit der Zeitung könnte nur das Ausmaß sein, in dem sie von Journalisten, die darauf bedacht sind, Klimaskeptiker zu widerlegen, überbewertet wurde.
C&W schlägt nicht vor, dass die Oberflächenaufzeichnung unzuverlässig ist, das Problem ist, dass es (aus offensichtlichen Gründen) keine permanenten Wetterstationen in der Arktis gibt, aber Sie müssen dies irgendwie kompensieren, da sonst der Datensatz systematisch nach unten verzerrt wird. C&W wurde nicht überbewertet, es ist wirklich eine so gute Zeitung. Das eigentliche Problem ist, dass die Bedeutung der Erwärmungspause viel zu oft berichtet wurde, insbesondere von den skeptischen Medien, die darauf hindeuten, dass es ein Problem mit der Mainstream-Klimatologie gibt, was aus den in meiner Antwort angegebenen Gründen einfach nicht zutrifft.
Natürlich schlagen C&W und GISTEMP eine stärkere Erwärmung vor als die anderen Datensätze, aber das liegt daran, dass sie die einzigen sind, die etwas tun, um die bekannte Verzerrung zu kompensieren, die durch das Ignorieren der Existenz der Arktis verursacht wird (was die anderen Datensätze effektiv tun). Ich würde jedoch von ganzem Herzen empfehlen, sich alle Datensätze anzusehen und die Gründe zu verstehen, warum sie nicht alle genau dasselbe sagen. Wenn jemand nur einen Datensatz zeigt, ist es durchaus sinnvoll, sich zu fragen, warum.