Auswahl eines geeigneten statistischen Tests für ordinale Daten

Ordinale Antwortvariablen tauchen in der Biologie häufig auf, aber ich bin mir nicht sicher, wie sie am besten analysiert werden. Einige Beispiele sind qualitative Bewertungen (wenig, viele, viel) oder Risikobewertungen (geringes Risiko, mittleres Risiko, hohes Risiko).

In meiner Studie geht es um die Korrelation zwischen Schmerzen und Depressionsniveaus. Wir messen Schmerz auf einer ordinalen Likert - Skala. Dies ist eine Zahlenskala von 10 (starke Schmerzen) bis 0 (keine Schmerzen).

Wir messen auch Depressionen auf einer ähnlichen Skala (Skala: 4 - 0).

Welchen statistischen Test sollte ich verwenden?

Dies ist vielleicht besser für Math SE geeignet.
@canadianer Dies ist nicht für Math.SE geeignet, aber Cross Validated ( stats.stackexchange.com )
Dies ist meiner Meinung nach geeignet, da Likert-Skalen in der biomedizinischen Forschung häufig (missbraucht) werden.
@ChrisStronks Bei der Frage geht es nicht um Biologie, sondern um die Anwendung einer statistischen Methode. Ihre Antwort ist ausgezeichnet und würde eine großartige Ergänzung zu Cross Validated darstellen, aber ich glaube, dass sie hier nicht zum Thema gehört.
@Luigi Kein Wunder, dass ich keine Statistik-SE finden konnte…
Mann-Whitney-U-Test. (?)
Ich denke, diese Frage könnte auf der Website nützlich sein, da dieses Problem in vielen biologischen Bereichen auftreten kann. Es ist auch auf stats.stackexchange.com eindeutig on-topic, aber das bedeutet nicht unbedingt, dass es hier nicht zum Thema gehört. Die Wahl der Methoden / Annahmen kann auch mit dem biologischen Prozess interagieren, den Sie modellieren möchten, weshalb ich denke, dass dies auch hier zum Thema gehört. Wenn Fragen wie diese geschlossen werden, müssen wir meiner Meinung nach viele der anderen Fragen mit dem Statistik-Tag aus Gründen der Fairness schließen.
Könnte Informationen über das experimentelle Design gebrauchen, ob es sich um ein ausgewogenes Design handelt, Stichprobengrößen und Normalität der Verteilungen und Hypothesen.

Antworten (2)

Sie können die ordinale multinomiale Regression (auch als geordnetes Logit bezeichnet) verwenden, wenn die Antwort geordnet ist. Diese Methoden sind im Grunde Erweiterungen logistischer Regressionen, verwenden aber zB einen kumulativen Logit anstelle des Logit. Es gibt jedoch eine Reihe unterschiedlicher Annahmen, die Sie berücksichtigen müssen. Werden Sie zum Beispiel eine Quotenannahme verwenden (die allgemein verwendet wird), was bedeutet, dass es eine gleiche Wahrscheinlichkeit gibt, von zB Klasse 1 -> 2 und Klasse 5 -> 6 zu gehen? Sie können die proportionale Quotenannahme auch mithilfe von Plots oder einem Score-Test auswerten. Wenn die Antwort nicht geordnet werden kann, gibt es multinomial nominale Verfahrendie Sie verwenden können, und Sie können auch die Ergebnisse einer geordneten Analyse auswerten, indem Sie die Vorhersagen mit denen einer multinomialen nominalen Analyse vergleichen. Ich habe diese Art von Methoden für die Analyse von Klassifikationen der Roten Liste verwendet, die klar geordnet sind, aber nicht einfach in eine numerische Antwort umgewandelt werden können (ähnlich wie Ihre Situation).

Das Buch Analysis of Ordinal Categorical Data (Agresti. 2010) ist ein wirklich guter Ausgangspunkt.

In R können Sie sich die Pakete ansehen polrund vgamnach Möglichkeiten suchen, verschiedene Arten von Analysen mit ordinalen Daten durchzuführen. Der Autor des oben genannten Buches hat auch einige Beispiele für die kategoriale Datenanalyse in R unter Verwendung der von mir erwähnten Pakete veröffentlicht: Examples of Using R for Modeling Ordinal Data . In SAS können ähnliche Analysen mit Proc Genmodund durchgeführt werden Proc Logistic.

Das Testen einer Ordinalskala erfordert nichtparametrische statistische Tests. Mittelwert und Standardabweichung sind ungültige Parameter für die deskriptive Statistik, wenn sich die Daten auf Ordinalskalen befinden, ebenso wie alle parametrischen Analysen, die auf der Normalverteilung basieren.

Der Bericht von Allen & Seaman, 2007, beschreibt eine Reihe möglicher Tests:

Zur Analyse dieser Daten eignen sich nichtparametrische Verfahren – basierend auf Rang, Median oder Spannweite – ebenso wie Chi-Quadrat-Statistiken.

Insbesondere können Kruskall-Wallis-Modelle verwendet werden, um eine standardmäßige parametrische Varianzanalyse zu ersetzen, da sie auf den Rängen und nicht auf den Mittelwerten der Antworten basiert. Da diese Skalen repräsentativ für ein zugrunde liegendes kontinuierliches Maß sind, besteht eine Empfehlung darin, sie als Intervalldaten als Pilot zu analysieren, bevor das kontinuierliche Maß erfasst wird.

Nichtparametrische Tests haben jedoch eine notorisch geringe statistische Aussagekraft. Es gibt eine Möglichkeit, eine ordinale Likert-Skala wie die, die Sie verwenden, kontinuierlich zu machen, indem Sie ein Lineal oder einen Schieberegler verwenden, siehe folgende Abbildung (aus Allen & Seaman, 2007 ):

Schieberegler

Dieser Trick macht es kontinuierlich und es können normale parametrische Tests verwendet werden, wodurch die statistische Aussagekraft erheblich gesteigert wird. Es ist jedoch viel mehr Arbeit, die Daten zu analysieren. Vor allem, wenn die Probanden ihre wahrgenommenen Schmerzen/Depressionen angeben, indem sie physisch eine Markierung auf einem Papierlineal anbringen, da Sie die Reaktionen manuell messen müssen. Ein digitaler Slider kann Ihnen das Leben erleichtern. Wenn Sie Hunderte von Fächern planen, sollten Sie sorgfältig über die möglichen Optionen nachdenken.

Viel Glück!

Es gibt parametrische Tests für ordinale Antwortvariablen, die im Grunde Erweiterungen logistischer Regressionen sind.