Wie sollte die Artendichte für eine verklumpte Verteilung berechnet werden?

Stellen wir uns vor, 5 Parzellen unterschiedlicher Größe werden für eine Zielart beprobt:

plot#  count  area(m^2)  plot_density
  1      1       5         0.2
  2      3       2         1.5
  3      0      10         0.0
  4      5       1         5.0
  5      2       6         0.33

Welche Dichte hat diese Art? Ich sehe zwei Möglichkeiten, die Dichte zu berechnen, die völlig unterschiedliche Werte ergeben.

Der erste Weg mittelt die Dichte bei jedem Diagramm:

Σ ( c Ö u n t ich a r e a ich ) 5 = 1.41 / m 2

Dies scheint in Ordnung zu sein , aber es hilft nicht viel, um die Änderung der Plotgröße zu steuern . Wenn zum Beispiel Diagramm 3 oben 10-mal größer wäre, wäre die Dichte immer noch dieselbe. In einer Situation, in der die Grundstücksgrößen durch die Umgebung bestimmt werden (z. B. unter natürlichen Deckungsobjekten), erscheint dies alles andere als ideal.

Der zweite Weg summiert die Zählungen und den Suchbereich und dividiert sie:

Σ ( c Ö u n t ich ) Σ ( a r e a ich ) = 0,46 / m 2

Ich bevorzuge die zweite Methode, weil sie die Dichte der Tiere genauer zu beschreiben scheint. Und ich würde gerne die zweite Methode verwenden, aber mein Problem ist, dass ich mir nicht sicher bin, wie ich eine zusammenfassende Statistik für Methode zwei berechnen soll, da ein Mittelwert nie berechnet wurde. Methode eins ergibt eine Standardabweichung von 2,1. Was ist die Standardabweichung für Methode zwei?

Eine mögliche Lösung, die ich mir ausgedacht habe, besteht darin, die größeren Parzellen in Parzellen von 1 m ^ 2 aufzuteilen und die Anzahl der Tiere auf diese kleineren Parzellen aufzuteilen. Jetzt habe ich also 24 1m ^ 2-Plots mit den folgenden "Zählungen":

plot#  count  area(m^2)  plot_density
1-5      0.2       1         0.2
6-7      1.5       1         1.5
8-17     0.0       1         0.0
18       5.0       1         5.0
19-24    0.33      1         0.33 

Jetzt, mit der ersten Gleichung oben, bekomme ich:

Σ ( c Ö u n t ich a r e a ich ) 24 = 0,73 / m 2
Mit einer Standardabweichung von 1,26.

Ist das ein vernünftiger Ansatz? Gibt es eine etablierte Lösung für dieses Problem?

Antworten (1)

Für mich gibt es zwei Probleme, die hier vermischt werden (wenn ich dich richtig verstehe). Wollen Sie zuerst den Mittelwert und die Varianz für eine statistische Grundgesamtheit schätzen (dh eine größere Grundgesamtheit durch unabhängige Stichproben charakterisieren), oder möchten Sie die tatsächliche Dichte für ein bestimmtes Gebiet berechnen, in dem Sie alle Vorkommen in diesem Gesamtgebiet gezählt haben Bereich (aber vielleicht den Bereich aus Bequemlichkeit beim Zählen in Unterbereiche unterteilt)? Das geht aus deiner Frage nicht hervor.

Im zweiten Fall eignet sich Ihre zweite Möglichkeit der Zusammenlegung von Zählungen und Flächen. Dann haben Sie jedoch nur die tatsächliche Dichte in diesem bestimmten Bereich berechnet (wobei Fragen der Nachweisbarkeit des Organismus bei der Zählung ignoriert werden) und können keine Rückschlüsse auf eine größere statistische Population ziehen.

Wenn Sie Schlussfolgerungen für eine größere statistische Grundgesamtheit ziehen möchten, sollten Sie zunächst den Mittelwert und die Standardabweichung (SD) Ihrer Stichprobe berechnen. In diesem Fall gehe ich davon aus, dass Ihre Stichproben zufällig und unabhängig aus einer größeren statistischen Grundgesamtheit ausgewählt werden. Ihre erste Option ist dann der richtige Ansatz. Da Ihre Stichproben jedoch unterschiedliche Größen haben, sollten Sie größeren Stichproben möglicherweise mehr Gewicht beimessen, da davon ausgegangen werden kann, dass sie den Bevölkerungsdurchschnitt besser beschreiben als kleinere Stichproben. Dies wird als gewichteter Mittelwert bezeichnet .

Im Allgemeinen ist das gewichtete arithmetische Mittel definiert als:

x ¯ w = ich = 1 n w ich x ich ich = 1 n w ich

wo w ich sind die Gewichte für jede Probe ( x ich ) und n sind die Anzahl der Proben. Mit dieser Formel kommst du auf genau denselben Wert für den gewichteten Mittelwert, den du im zweiten Versuch berechnet hast (0,458), wenn du die Flächen als Gewichte verwendest.

Die gewichtete Standardabweichung ist etwas problematischer, da es keine einzige Standardmethode gibt, um diese zu berechnen. Eine häufig verwendete Formel lautet jedoch:

σ w 1 = ich = 1 n w ich ( x ich x ¯ w ) 2 ( M 1 ) M ich = 1 n w ich ,

wo M sind die Anzahl der Gewichtungen ungleich Null. Weitere Definitionen der gewichteten Standardabweichung finden Sie bei Wikipedia: Weighted Sample Variance .

Eine andere Version ist definiert als (auf der Wiki-Seite "Zuverlässigkeitsgewichte" genannt):

σ w 2 = ich = 1 n w ich ( x ich x ¯ w ) 2 ich = 1 n w ich ich = 1 n w ich 2 ich = 1 n w ich ,

Wenn ich mich nicht geirrt habe, ergeben diese mit Ihren Daten die Standardabweichungen 1,15 und 1,22.

Was die biologische Deutung betrifft, weisen alle Berechnungen der durchschnittlichen Dichten auf eine gehäufte Verteilung hin, da der Variationskoeffizient (CV) größer als 1 ist (CV = sd/Mittelwert), jedoch umso mehr, wenn Sie einen gewichteten Mittelwert verwenden. Der CV unter Verwendung des arithmetischen Mittels beträgt 1,5, während er für den gewichteten Mittelwert 2,5–2,65 beträgt, was vernünftig ist, da Sie der großflächigen Stichprobe mit einer Nullzählung mehr Gewicht geben. Ich sollte jedoch auch beachten, dass Sie bei der Verwendung eines gewichteten Mittelwerts vorsichtig sein sollten, wenn Sie eine stark verklumpte Verteilung haben, da Sie Gefahr laufen, dass z. B. ein großes Stichprobengebiet auf einem Gebiet ohne Vorkommnisse landet, was Ihre Dichteschätzung verfälschen könnte. Wenn Sie eine verklumpte Verteilung haben, müssen Sie im Allgemeinen intensiver abtasten, um eine gute Schätzung der durchschnittlichen Dichte zu erhalten, und viele kleine Stichproben sind oft besser als wenige große.

Tolle Antwort, danke! Wenn jemand vorbeikommt und Ihre Antwort hilfreich findet, könnte er auch daran interessiert sein, zu erfahren, dass das r-Paket SDMTools die Funktionen wt.mean(), wt.sd() und wt.var() enthält. wt.sd() verwendet die gebräuchlichere Gleichung, die Sie oben beschrieben haben.
Nachdem ich mehr Zeit gefunden habe, um über Ihre Antwort nachzudenken, habe ich eine geringfügige Korrektur Ihrer Antwort und eine Folgefrage. Der gewichtete Mittelwert für das obige Beispiel beträgt 1,16 und nicht 0,458, wie Sie sagen. Betrachten Sie nun diese drei Diagramme: Anzahl: 1, 1, 20; Fläche (m2): 1,1,20. Ich würde sagen, die Dichte beträgt 1 Tier/m2 und die drei Methoden in meinem ursprünglichen Beitrag stimmen überein. Aber das gewichtete Mittel ist 18,2. Das scheint nicht richtig zu sein. Was sind Ihre Gedanken dazu?
Wenn Sie einen gewichteten Mittelwert von 1,16 erhalten, berechnen Sie einen Mittelwert auf der Grundlage von Zählungen, nicht von Dichten, und dasselbe gilt für Ihr neues Beispiel. Es macht auch wenig Sinn, die durchschnittliche Anzahl von Vorkommen (Counts) für Plots unterschiedlicher Größe zu berechnen, was Sie in Ihrem Beispiel im Kommentar getan haben. Wenn Sie einen Mittelwert (gewichtet oder anderweitig) basierend auf den Dichten berechnen, erhalten Sie 1 Tier/m2.
Yep du hast genau recht. Natürlich würden Sie die Dichten verwenden, wenn Sie die gewichtete Dichte berechnen. Wie ich das vorher nicht gesehen habe, ist mir schleierhaft. Danke noch einmal.
@AdamC Gern geschehen. Beachten Sie, dass ich etwas zur biologischen Interpretation und einigen Problemen bei der Verwendung des gewichteten Mittelwerts für klumpige Verteilungen hinzugefügt habe.