Ich bin mehr als verblüfft über Berechnungen von Hardy-Weinberg-Gleichgewichten. Die Theorie der Formel geht von einer binomalen Verteilung von Allelhäufigkeiten in einer Population aus und erlaubt daher den Vergleich von beobachteten Phänotyphäufigkeiten mit einer idealen Modellverteilung.
mit
= Häufigkeit des homozygoten Phänotyps PP
= Häufigkeit des heterozygoten Phänotyps PQ
= Häufigkeit des homozygoten Phänotyps QQ
Es gibt zwei verschiedene Methoden, mit der HW-Gleichung zu arbeiten, auf die ich gestoßen bin, und sie scheinen nicht kompatibel zu sein; An denselben Datensätzen verwendet, ergeben sie völlig unterschiedliche Ergebnisse. Um ehrlich zu sein, habe ich das Gefühl, den Wald vor lauter Bäumen nicht zu sehen.
Ist eine dieser Methoden (technisch) falsch? Wie entscheide ich, welche für jeden Datensatz verwendet werden soll (dh ist es gültig, Methode Nr. 1 bei 3-Allel-Datensätzen zu verwenden)? Oder verwende ich einfach die Methode, die am einfachsten ist? Führt dies nicht zu Abweichungen in den Ergebnissen? Dies scheint eine große Sache zu sein, insbesondere wenn man reale Beobachtungsdaten mit angenommenen HW-Verteilungen vergleicht.
Beispieldatensatz (EST/Kalifornien) und Ergebnisse von HW-Berechnungen. Ich verwende den beobachteten Phänotyp anstelle des beobachteten Genotyps der Originaldaten.
Phenotype n | HW1 HW2p HW2q
PP 37 | 33.9 37.1 28.8
PQ 20 | 25.0 23.0 28.2
QQ 7 | 4.5 3.8 7.0
Wie von der oben verlinkten Datensatzquelle und Beebee/Rowe's Introduction to Molecular Ecology vorgeschlagen , werden Allele einfach addiert, um Werte für p bzw. q zu erhalten:
Phenotype n | P Q
PP 37 | 74 0 (37 * PP = 74 P)
PQ 20 | 20 20 (20 * PQ = 20 P + 20 Q)
QQ 7 | 0 14 ( 7 * QQ = 14 Q)
Sums 64 | 94 34
Daraus können wir direkt auf p/q schließen: Und ; unter der Vorraussetzung wahr bleiben.
Die Verwendung dieser Werte für p und q in der HW-Gleichung ergibt:
Phenotype n
PP 33.92 p^2 * 64
PQ 24.96 2pq * 64
QQ 4.48 q^2 * 64
Die zweite Methode zur Verwendung der HW-Gleichung ist viel direkter, und fast jedes Lehrbuch, das ich finden konnte, verwendet diese Methode, um 3+ Allelprobleme zu lösen (wie zum Beispiel Blutgruppen); Wikipedia lobt seine Nützlichkeit bei der Berechnung der heterozygoten Häufigkeit genetischer Erkrankungen in großen Populationen.
Bei dieser Berechnung wird direkt auf Frequenzen gemäß der Definition der HW-Gleichung geschlossen. Das heisst
ist gleich der Häufigkeit des Phänotyps PP (siehe oben).
Mit einer neuen idealen Phänotypverteilung:
Phenotype n
PP 37.1 p^2 * 64
PQ 23.0 2pq * 64
QQ 3.8 q^2 * 64
Invertieren der Berechnung durch Beginnen mit führt zu noch divergierenden Ergebnissen:
Phenotype n
PP 28.8 p^2 * 64
PQ 28.2 2pq * 64
QQ 7.0 q^2 * 64
Beides verwenden Und verstößt unweigerlich gegen die Bedingung .
Okay, das Hardy-Weinberg-Gleichgewicht ist also genau das: ein Gleichgewicht .
Genau wie in der Grundlagenphysik müssen wir unser System definieren. Wenn unser System der Genpool ist, dann liegen sogar die Verhaltensweisen der Organismen, in deren Zellen diese Allele gefunden werden, außerhalb des Systems . Das System besteht nur aus den Allelen, auch bekannt als Genpool.
Der wichtigste Teil zum Verständnis des HW-Gleichgewichts ist, dass es nur gilt, wenn die Bedingungen des Genpools, der frei von äußeren Einflüssen ist, gelten. Tatsächlich enthält die Einführung in dem von Ihnen angegebenen Link es im zweiten Satz (kein schlechtes Gewissen, ich habe es auch die ersten Male verpasst - zu konzentriert auf die Anwendung der Algebra, um zu verstehen, was es wirklich bedeutet):
Das Modell hat fünf Grundannahmen:
1) die Population ist groß (dh es gibt keine genetische Drift)
2) es gibt keinen Genfluss zwischen Populationen durch Migration oder Transfer von Gameten
3) Mutationen sind vernachlässigbar
4) Individuen paaren sich zufällig
5) Die natürliche Selektion wirkt nicht auf die Bevölkerung.
Lassen Sie uns sie aufschlüsseln / gruppieren:
Wenn jedoch die vorhergesagten Werte bei einer Methode nicht mit den tatsächlichen übereinstimmen, können Sie davon ausgehen, dass auch andere Methoden zu ungenauen Vorhersagen führen und dass die Vorhersagen der beiden unterschiedlichen Berechnungsmethoden stark voneinander abweichen, was hauptsächlich auf Ihre Annahmen zurückzuführen ist machen (Methode 2: 1 = p+q) oder machen nicht (Methode 2).
Sie werfen Zahlen in eine Gleichung, ohne sie zu verstehen.
Wenn Sie die Zahlen für pp, pq und qq kennen, verwenden Sie HWE nicht, um sie neu zu berechnen . Ihre letzte Aussage in Berechnung 1 ist also Unsinn. Sie haben dort die Anteile für eine Bevölkerung in HWE berechnet, bei der p = 0,73 ist, aber Ihnen wurde bereits die tatsächliche Verteilung in der Bevölkerung mitgeteilt, sodass es Unsinn ist, so zu tun, als ob Ihre theoretische Berechnung die angegebenen Daten übertrumpft.
Berechnung 2 funktioniert nur einwandfrei, wenn Ihre Bevölkerung genau in HWE liegt. Ihre ist ein wenig daneben, deshalb wird sie Ihnen nicht ganz die gleichen p und q geben, wie wenn Sie sie richtig berechnen, indem Sie tatsächlich die p-Allele in den Homozygoten und Heterozygoten zählen.
David
vipatron
G'Ra
David
Bharel