Verwendung der kanonischen Korrespondenzanalyse für Matrizen mit fehlenden Daten

Ich habe eine Matrix von Standorten, an denen nicht alle Umgebungsvariablen, die ich bewerten möchte, abgetastet wurden. Mit anderen Worten, es gibt Sites, auf denen alle Variablen abgetastet wurden, und es gibt andere Sites, auf denen nur einige Variablen abgetastet wurden. Funktioniert die kanonische Korrespondenzanalyse mit fehlenden Daten für die Umgebungsvariablen? Wenn dies der Fall ist, welche Auswirkung hätte es, wenn die fehlenden Werte nicht eingeschlossen würden?

Diese Frage sollte am besten in Cross Validated ( stats.stackexchange.com ) gestellt werden.
Da habe ich mal schnell nachgeschaut. Ich denke, dass Ökologen mit CCA besser vertraut sind als „konventionelle“ Statistiker.
Ich sollte es erwähnen, da die Möglichkeit besteht, dass es eine enge Abstimmung gibt, da dies immer noch eine auf Statistiken / Stichproben basierende Frage ist!
Ich hatte gemischtes Glück beim Posten ökologisch motivierter statistischer Fragen im Lebenslauf. Ich war überrascht, dass das Wort „Ordination“ außerhalb der ökologischen Statistik nicht sehr bekannt ist :p

Antworten (1)

Erstens können Sie paarweise Korrelationen zwischen Ihren Umgebungsvariablen nicht vollständig mit NA-Werten analysieren und können daher die Einbeziehung kovariierender Variablen nicht vollständig ausschließen. Wenn dies der Fall ist, können Sie nicht wissen, welche der kovariierenden Variablen für Trends in Ihren Daten verantwortlich ist.

Zweitens glaube ich nicht, dass CCA mit NA-Werten funktionieren wird – Sie müssen entweder die Beobachtungen eliminieren, die diese fehlenden Werte enthalten, oder sie mit Spaltendurchschnitten füllen. Beide Methoden wirken sich jedoch auf Ihre Ergebnisse aus, gehen Sie also vorsichtig vor.

Drittens frage ich mich, ob CCA überhaupt der Weg ist, den Sie gehen möchten. nMDS (nicht metrische multidimensionale Skalierung) ist viel weniger eingeschränkt als CCA. Außerdem unterliegt es nicht so vielen Annahmen/Einschränkungen wie CCA.

Aus McCune & Grace (2002):

Die folgenden zwei Fragen können verwendet werden, um zu entscheiden, ob CCA angemessen ist: (1) Interessieren Sie sich nur für die Gemeinschaftsstruktur, die mit Ihren gemessenen Umweltvariablen in Beziehung steht? (2) Ist ein unimodales Modell der Artenreaktionen auf die Umwelt sinnvoll? Wenn Sie für ein bestimmtes Problem beides mit Ja beantworten, könnte CCA angemessen sein

Fehlende Umweltdaten sind jedoch immer noch ein Problem in nMDS.