Unterschiedliche Auswirkungen der Entdeckungswahrscheinlichkeit zwischen Anwesenheits- und Zähldaten am selben Ort

Ich modelliere die Eignung des Lebensraums für ein großes, mobiles Tier anhand von Ereignisdaten (nur Anwesenheit - ich habe in diesem Fall keine echten Abwesenheitsdaten), die von Kamerafallen (Stationen mit automatischen Bewegungs- / Wärmesensorkameras) gesammelt wurden. An jedem Kamerafallenstandort habe ich 0 bis mehrere Vorkommnisse aufgezeichnet.

Wenn solche Daten modelliert werden, werden sie typischerweise als Zähldaten modelliert, und die Erkennungswahrscheinlichkeit wird eingeschlossen, um Kovariaten abzuschwächen, die die Erkennung beeinflussen, die andernfalls als Kovariaten identifiziert werden könnten, die die Eignung beeinflussen. Zum Beispiel kann ein Bereich, in dem eine Erkennung aufgrund von beispielsweise dichter Vegetation weniger wahrscheinlich ist, aufgrund dieser Vegetationsstruktur fälschlicherweise als weniger geeignet angesehen werden, obwohl dies möglicherweise nicht der Fall ist (oder sogar das Gegenteil der Fall sein kann).

Meine Frage ist, wenn die Zählvariable stattdessen als Erkennungs- / Nichterkennungsvariable (also eine Binärdatei) verwendet werden würde, hätte die Erkennungswahrscheinlichkeit einen geringeren Einfluss auf das Modell (* bei der Modellierung der relativen Eignung, nicht der Wahrscheinlichkeit von Auftreten)? dh wenn Sie die Entdeckungswahrscheinlichkeit nicht berücksichtigen, würde Ihnen die Verwendung einer binären Antwortvariablen eine weniger verzerrte Schätzung der Habitateignung geben, als wenn Sie Zähldaten verwenden würden? Und wenn ja, warum? Es sieht nicht so aus, als würde sich die Erkennungswahrscheinlichkeit mit dieser Änderung ändern oder im gesamten Untersuchungsgebiet homogener sein, aber es scheint, als wären die Auswirkungen geringer, wenn die Unterschiede in der Erkennungswahrscheinlichkeit bei mehreren Vorkommen nicht verstärkt werden.

Ich verstehe auch, dass es nicht wünschenswert ist, alle anderen Vorkommen wegzuwerfen, vorausgesetzt, Sie können die Erkennungswahrscheinlichkeit berechnen. Ich frage dies, um die möglichen Unterschiede im Ergebnis zwischen diesen beiden Modellierungsansätzen bei der Verwendung solcher Daten besser zu verstehen, da ich beide Methoden in der Literatur gesehen habe, diese Frage jedoch nicht speziell angesprochen wurde. Wenn Sie auf Veröffentlichungen verweisen könnten, die Licht ins Dunkel bringen könnten, wäre ich sehr dankbar.

Haben Sie in irgendeiner Weise die Möglichkeit, die Entdeckungswahrscheinlichkeit über eine Saison abzuschätzen, zB indem Sie die Personen auf den Bildern identifizieren können? Haben Sie Daten für mehrere Jahre oder nur für ein Jahr?
ja, das wurde tatsächlich schon gemacht. Die Daten, von denen ich spreche, wurden verwendet, um die Belegung mit einem Capture/Recapture-Modell zu modellieren. Fangwahrscheinlichkeit war 0,05.

Antworten (2)

Disclaimed: Nicht wirklich eine Antwort, aber zu lang für einen Kommentar


Wenn ich Sie richtig verstehe, muss dies ausschließlich von der kumulierten Erkennungswahrscheinlichkeit über den gesamten Erkennungszeitraum (die Zeit, in der die Kameras aus waren) abhängen. Wenn die kumulierte Entdeckungswahrscheinlichkeit über alle Lebensraumtypen hinweg hoch ist (annähernd 1, vorausgesetzt, das Tier ist vorhanden), dann sollte die Entdeckungswahrscheinlichkeit kein Problem für die binäre Vorkommensvariable darstellen. Ein Hinweis darauf wäre, wenn Sie Standorte (Kameras) mit entweder null oder einer sehr hohen Anzahl von Vorkommen haben, was darauf hindeuten sollte, dass das binäre Vorkommen ziemlich robust ist. Wenn andererseits Standorte insgesamt 0–4 Vorkommen aufweisen, ist es äußerst schwierig, das Nichtvorkommen von zufälligen Faktoren oder der Nachweisbarkeit zu trennen. Ich gehe davon aus, dass die Nachweiswahrscheinlichkeit über Habitate hinweg unbekannt ist (ebenso wie die kumulierte Nachweiswahrscheinlichkeit), aber vielleicht kannst du eine fundierte Vermutung anstellen. Durch die Verwendung einer binären Antwort schließen Sie außerdem die Möglichkeit vollständig aus, z. B. einen Effekt der Habitatqualität (z. B. einen Unterschied in der Häufigkeit zwischen Habitaten) abzuschätzen, da Zählungen von 1 oder 13 beide durch 1 in der binären Erkennungsvariablen dargestellt werden . Im Q sprichst du von "Modellierung der relativen Eignung ", was darauf hinweist, dass Sie tatsächlich an etwas Ähnlichem interessiert sind (relative Lebensraumqualität). In diesem Fall denke ich, dass eine binäre Antwort zu grob ist, um nützliche Informationen zu liefern.

Ein mögliches Spielzeugszenario könnte sein, dass Sie zwei Lebensraumtypen A und B (jeweils 10 Kamerastandorte/Standorte) mit einer binären Erkennungsvariablen wie folgt haben:

A: 1 1 1 0 1 0 1 1 0 1 (Arten an 7 Standorten gefunden)
B: 0 1 0 0 1 0 1 1 0 0 (Arten an 4 Standorten gefunden)

In diesem Fall kann die Art offensichtlich in beiden Habitattypen existieren (wie Sie sie kategorisiert haben), also kann die höhere Menge an Nullen in B (unter anderem) 1) eine geringere Belegung dieses Habitats darstellen (in einer Metapop-Perspektive), 2) dass die Qualität von B heterogen ist, was von Ihrer Lebensraumkategorisierung nicht erfasst wird (also Teile von B genauso geeignet sind wie A), 3) geringere Populationshäufigkeit in B im Vergleich zu A (aber die gleiche Nachweisbarkeit), oder 4) geringere Nachweisbarkeit in B im Vergleich zu A (aber gleiche Häufigkeit). Ich verstehe nicht wirklich, wie Sie zwischen diesen Fällen nur mit der binären Variablen trennen können, und ich glaube nicht, dass die Verwendung einer binären Erkennungsvariablen bestimmte Probleme im Vergleich zur Verwendung der Zähldaten lösen wird.

Dies ist alles sehr handgewellt, kann Ihnen aber hoffentlich einige nützliche Ideen / Perspektiven geben.

danke für die ausführliche antwort. Ich dachte in die gleiche Richtung wie Ihr erster Punkt - dass die kumulative Erkennungswahrscheinlichkeit über den Erkennungszeitraum hoch genug sein könnte, um keine größeren Probleme bei der Verwendung von Binärdaten zu verursachen. Der Erkennungszeitraum betrug 20 Tage, es wurden mehr als 300 Fallen verwendet und mehr als 100 Ereignisorte generiert (~180 Erkennungen). Zählungen reichen von 0-5. Das einzige spezifische Problem, das die Verwendung von Binärdaten lösen würde, ist das Problem der Zeit und der Benutzererfahrung. Es wurde die Frage aufgeworfen, ob eine benutzerfreundlichere Methode (z. B. maxent) mit diesen Daten verwendet werden könnte, um sinnvolle Rückschlüsse zu ziehen.

Um die Abundanz von der Entdeckungswahrscheinlichkeit trennen zu können, müssen Sie ein markiertes Tier haben. Wenn dies der Fall ist, können Sie für jedes Tier eine Fanghistorie erstellen und die Erkennungswahrscheinlichkeit modellieren.

Schauen Sie sich diesen Artikel an: http://www.sciencedirect.com/science/article/pii/S0006320712005071 . Für einige Empfehlungen zur Verwendung eines räumlich expliziten Modells bei der Verwendung von Kamerafallen zur Schätzung von Populationsparametern (Häufigkeit ...).

Um Ihre Frage zu beantworten, wird die Verwendung von Binärdaten theoretisch die Erkennungswahrscheinlichkeit unterschätzen, wenn die Erkennung an einem Standort unabhängig ist. Wenn Ihre Erkennung jedoch abhängig ist, sagen wir, ein Tier bewegt sich in einer Gruppe, sodass Sie jedes Mal, wenn Sie ein Tier erkennen, eine starke haben Möglichkeit, mehr als einen zu erkennen, dann wäre die Verwendung von Binärdaten sinnvoll.

Ich hoffe es hilft !

Prost

Nico – Ich verstehe die Beziehung zwischen Entdeckungswahrscheinlichkeit und Häufigkeit, Markierungswiederfang und warum dies berücksichtigt werden muss. Meine Frage ist jedoch, wenn Sie die Erkennungswahrscheinlichkeit nicht berücksichtigen, würde die Verwendung einer binären Antwortvariablen Ihnen eine weniger voreingenommene Schätzung der Habitateignung geben, als wenn Sie Zähldaten verwenden würden? Und wenn ja, warum?
Es hängt alles davon ab, ob Ihre Erkennung abhängig oder unabhängig ist? Was ist das Tier, das Sie studieren?
Angenommen, sie sind unabhängig und es ist eine große Katze.
und in Ihrem Modell ist Ihre ''y''-Variable das Vorkommen der Katze, die Sie studieren? Und Ihre Frage ist: Gibt es eine größere Wahrscheinlichkeit, eine Felid in einem bestimmten Lebensraum zu entdecken?
nicht wirklich, ich denke, man könnte es als eine Frage der "Entdeckungswahrscheinlichkeit" formulieren. aber lassen Sie es uns als eine sehr grundlegende Frage zur Lebensraummodellierung formulieren: Was ist angesichts dieser Reihe von Vorkommensstandorten ein geeigneter Lebensraum für diese Art? Ich weiß, dass die Erkennungswahrscheinlichkeit diese Schätzung beeinflussen kann. Meine Frage ist, ob die Verzerrung bei Verwendung von Binärdaten abnehmen würde.
Ok, dann würde ich in diesem Fall sagen, dass die Verwendung von Binärdaten im Vergleich zu Zähldaten die Erkennungswahrscheinlichkeit unterschätzen würde, da Sie von einer Unabhängigkeit zwischen Ihrer Erkennung ausgehen. Aber die einzige Möglichkeit, dies zu bestätigen, wäre, wenn Sie ein Tier markiert hätten. Wenn Sie "Station" mit mehr als einer Erkennung erhalten, sind sie rechtzeitig in der Nähe? Erkennen Sie zwei Katzen in derselben Stunde oder in 12 Stunden?
Nico - Ich spreche nicht von der Schätzung der Erkennungswahrscheinlichkeit, ich spreche von der Schätzung der Habitateignung und wie sich diese beiden Datentypen auf diese Schätzung bei einer unvollständigen Erkennung auswirken.