Statistische Genetik: Allelhäufigkeiten, die einer Dirichlet-Verteilung folgen

Question

Statistische Genetik: Allelhäufigkeiten, die einer Dirichlet-Verteilung folgen

Biologie
Genetik
Evolution
Statistiken
Populationsgenetik
Theoretische Biologie

Remi.b

Aus Foll und Gagiotti (2008) (Software BayeScan ). Sie betrachten ein Modell, bei dem mehrere Subpopulationen von einer einzigartigen Ahnenpopulation abgeleitet werden.

Wir betrachten eine Menge von $I$ loci und lassen $K_i$ sei die Anzahl der Allele bei der $i^{th}$ Ort. Das Ausmaß der Differenzierung am Ort $i$ zwischen Subpopulationen $j$ und die angestammte Bevölkerung wird gemessen durch $F^{ij}_{ST}$ und ist das Ergebnis seiner demografischen Geschichte. Lassen $p_i=\{p_{ik}\}$ bezeichnen die Allelfrequenzen der angestammten Population am Locus $i$ , Wo $p_{ik}$ ist die Häufigkeit des Allels $k$ am Ort $i$ $\left(\sum_k p_{ik} = 1\right)$ . Wir gebrauchen $\mathbf {p} = \{\mathbf {p_i}\}$ um den gesamten Satz von Allelfrequenzen der angestammten Population zu bezeichnen und $\mathbf {\tilde p_{ij}} = \{ \tilde p_{ijk}\}$ um die aktuellen Allelfrequenzen am Locus zu bezeichnen $i$ für Teilpopulation $j$ . Unter diesen Annahmen sind die Allelfrequenzen am Locus $i$ in Teilpopulation $j$ Folgen Sie einer Dirichlet-Verteilung mit Parametern $\theta_{ij}\mathbf {p_i}$ ,

${\tilde{P}}_{ich J} \tilde{} Dir (θ_{ich J} P_{ich 1}, . . ., θ_{ich J} P_{ich K_{ich}})$ $\mathbf {\tilde p_{ij}} \space \tilde \space\space \text{Dir}(\theta_{ij} p_{i1}, ..., \theta_{ij}p_{iK_i})$

, Wo

$θ_{ich J} = \frac{1}{F_{S T}^{ich J}} - 1$ $\theta_{ij} = \frac{1}{F^{ij}_{ST}}-1$

^{(Ich habe nicht viel Erfahrung mit Dirichlet-Verteilungen, aber ich verstehe ihre Definition und ihre Nützlichkeit in Bayes-Statistiken).}

Können Sie mir bitte helfen zu verstehen, warum $\mathbf {\tilde p_{ij}}$ folgt dieser Dirichlet-Verteilung?

Aufruf der $j^{th}$ Parameter der Dirichlet-Verteilung, $\alpha_j$ , ich verstehe normalerweise nicht, warum sie "gewählt" haben $\alpha_j = \left(\frac{1}{F^{ij}_{ST}}-1\right) p_{ij}$ und nicht, sagen wir einfach $\alpha_j = F^{ij}_{ST} p_{ij}$ oder irgendetwas anderes.

Hans

Es sieht so aus, als wäre es eine Lösung für eine Integralgleichung, wie sie in Sewall Wrights Evolution in Mendelian Populations, Section Nonrecurrent Mutation genetics.org/content/genetics/16/2/97.full.pdf beschrieben ist .

Antworten (1)

Statistische Genetik: Allelhäufigkeiten, die einer Dirichlet-Verteilung folgen

Es sieht so aus, als wäre es eine Lösung für eine Integralgleichung, wie sie in Sewall Wrights Evolution in Mendelian Populations, Section Nonrecurrent Mutation genetics.org/content/genetics/16/2/97.full.pdf beschrieben ist .

km · Answer 1

km

Weitgehend eine fundierte Vermutung, die eher auf Eigenschaften von Verteilungen als auf spezifischem Wissen der statistischen Genetik basiert: Eine Beta-Verteilung ist nützlich, um die Häufigkeit von zwei Allelen an einem Ort zu modellieren. Eine Dirichelet-Verteilung , die eine multivariate Verallgemeinerung einer Beta-Verteilung ist, wäre daher für die Modellierung eines Satzes von Loci nützlich.

Die Kehrseite ist, sich Beta nur als einen Sonderfall von Dirichelet vorzustellen: Wenn Sie nur einen Locus haben, funktioniert Beta. Wenn Sie mehrere Loci haben, dann Dirichelet.

Remi.b

Danke für deine Antwort. Ja, das sind Dinge, die ich über Statistiken weiß (+1 trotzdem als Dank). Ich verstehe nicht, warum in der Regel

α_{j} = (\frac{1}{F_{S T}^{i j}} - 1) p_{i j}

$\alpha_j = \left(\frac{1}{F^{ij}_{ST}}-1\right) p_{ij}$ und nicht, sagen wir einfach

α_{j} = F_{S T}^{i j} p_{i j}

$\alpha_j = F^{ij}_{ST} p_{ij}$ oder irgendetwas anderes. (Ich werde diese Präzisierung in meiner Frage hinzufügen).

Statistische Genetik: Allelhäufigkeiten, die einer Dirichlet-Verteilung folgen

Remi.b

Hans

Antworten (1)

km

Remi.b

Innerhalb und zwischen allelischer Klassendiversität

Über den Auswahlkoeffizienten

Wie erhält man die durchschnittliche Anzahl paarweiser Unterschiede zwischen Populationen?

F-Statistiken in der Populationsgenetik verstehen

Einfache Ableitung von Kimuras Näherung für die Wahrscheinlichkeit der Fixierung einer Mutation

Diffusionsnäherung an genetische Drift

Warum ist die Steigung der Eltern-Nachkommen-Regression gleich der Erblichkeit im engeren Sinne?

Welcher Bruchteil der Stellen wird voraussichtlich polymorph sein?

Entstehen mutierte Allele aus Mutationen des Wildtyps?

Warum folgt die Anzahl der Mutationen pro Individuum einer Poisson-Verteilung?