Aus Foll und Gagiotti (2008) (Software BayeScan ). Sie betrachten ein Modell, bei dem mehrere Subpopulationen von einer einzigartigen Ahnenpopulation abgeleitet werden.
Wir betrachten eine Menge von loci und lassen sei die Anzahl der Allele bei der Ort. Das Ausmaß der Differenzierung am Ort zwischen Subpopulationen und die angestammte Bevölkerung wird gemessen durch und ist das Ergebnis seiner demografischen Geschichte. Lassen bezeichnen die Allelfrequenzen der angestammten Population am Locus , Wo ist die Häufigkeit des Allels am Ort . Wir gebrauchen um den gesamten Satz von Allelfrequenzen der angestammten Population zu bezeichnen und um die aktuellen Allelfrequenzen am Locus zu bezeichnen für Teilpopulation . Unter diesen Annahmen sind die Allelfrequenzen am Locus in Teilpopulation Folgen Sie einer Dirichlet-Verteilung mit Parametern ,
, Wo
(Ich habe nicht viel Erfahrung mit Dirichlet-Verteilungen, aber ich verstehe ihre Definition und ihre Nützlichkeit in Bayes-Statistiken).
Können Sie mir bitte helfen zu verstehen, warum folgt dieser Dirichlet-Verteilung?
Aufruf der Parameter der Dirichlet-Verteilung, , ich verstehe normalerweise nicht, warum sie "gewählt" haben und nicht, sagen wir einfach oder irgendetwas anderes.
Weitgehend eine fundierte Vermutung, die eher auf Eigenschaften von Verteilungen als auf spezifischem Wissen der statistischen Genetik basiert: Eine Beta-Verteilung ist nützlich, um die Häufigkeit von zwei Allelen an einem Ort zu modellieren. Eine Dirichelet-Verteilung , die eine multivariate Verallgemeinerung einer Beta-Verteilung ist, wäre daher für die Modellierung eines Satzes von Loci nützlich.
Die Kehrseite ist, sich Beta nur als einen Sonderfall von Dirichelet vorzustellen: Wenn Sie nur einen Locus haben, funktioniert Beta. Wenn Sie mehrere Loci haben, dann Dirichelet.
Hans