Was sind die Unterschiede zwischen den beiden möglichen Methoden zur Berechnung der Hardy-Weinberg-Gleichung?

Question

Was sind die Unterschiede zwischen den beiden möglichen Methoden zur Berechnung der Hardy-Weinberg-Gleichung?

Biologie
Genetik
Hardy Weinberg
Theoretische Biologie

G'Ra

Ich bin mehr als verblüfft über Berechnungen von Hardy-Weinberg-Gleichgewichten. Die Theorie der Formel geht von einer binomalen Verteilung von Allelhäufigkeiten in einer Population aus und erlaubt daher den Vergleich von beobachteten Phänotyphäufigkeiten mit einer idealen Modellverteilung.

P^{2} + 2 P Q + Q^{2} = 1

$p^2 + 2pq + q^2 = 1$

mit

$p^2$ = Häufigkeit des homozygoten Phänotyps PP

$2pq$ = Häufigkeit des heterozygoten Phänotyps PQ

$q^2$ = Häufigkeit des homozygoten Phänotyps QQ

Es gibt zwei verschiedene Methoden, mit der HW-Gleichung zu arbeiten, auf die ich gestoßen bin, und sie scheinen nicht kompatibel zu sein; An denselben Datensätzen verwendet, ergeben sie völlig unterschiedliche Ergebnisse. Um ehrlich zu sein, habe ich das Gefühl, den Wald vor lauter Bäumen nicht zu sehen.

Ist eine dieser Methoden (technisch) falsch? Wie entscheide ich, welche für jeden Datensatz verwendet werden soll (dh ist es gültig, Methode Nr. 1 bei 3-Allel-Datensätzen zu verwenden)? Oder verwende ich einfach die Methode, die am einfachsten ist? Führt dies nicht zu Abweichungen in den Ergebnissen? Dies scheint eine große Sache zu sein, insbesondere wenn man reale Beobachtungsdaten mit angenommenen HW-Verteilungen vergleicht.

Beispieldatensatz (EST/Kalifornien) und Ergebnisse von HW-Berechnungen. Ich verwende den beobachteten Phänotyp anstelle des beobachteten Genotyps der Originaldaten.

Phenotype     n  |   HW1   HW2p   HW2q
PP           37  |  33.9   37.1   28.8
PQ           20  |  25.0   23.0   28.2
QQ            7  |   4.5    3.8    7.0

Berechnungsmethode #1

Wie von der oben verlinkten Datensatzquelle und Beebee/Rowe's Introduction to Molecular Ecology vorgeschlagen , werden Allele einfach addiert, um Werte für p bzw. q zu erhalten:

Phenotype    n  |   P    Q
PP          37  |  74    0   (37 * PP = 74 P)
PQ          20  |  20   20   (20 * PQ = 20 P + 20 Q)
QQ          7   |   0   14   ( 7 * QQ = 14 Q)
Sums        64  |  94   34

Daraus können wir direkt auf p/q schließen: $p = 94/(94+34) =0.73$ Und $q = 34/(94+34) = 0.27$ ; unter der Vorraussetzung $p + q = 1$ wahr bleiben.

Die Verwendung dieser Werte für p und q in der HW-Gleichung ergibt:

P^{2} + 2 P Q + Q^{2} = 1 (0,73)^{2} + 2 (0,73) (0,27) + (0,27)^{2} = 1

$p^2 + 2pq + q^2 = 1 \\ (0.73)^2 + 2(0.73)(0.27) + (0.27)^2 = 1$ Und eine bevölkerungsweite Phänotypverteilung von

Phenotype      n
PP         33.92    p^2 * 64
PQ         24.96    2pq * 64
QQ          4.48    q^2 * 64

Berechnungsmethode #2

Die zweite Methode zur Verwendung der HW-Gleichung ist viel direkter, und fast jedes Lehrbuch, das ich finden konnte, verwendet diese Methode, um 3+ Allelprobleme zu lösen (wie zum Beispiel Blutgruppen); Wikipedia lobt seine Nützlichkeit bei der Berechnung der heterozygoten Häufigkeit genetischer Erkrankungen in großen Populationen.
Bei dieser Berechnung wird direkt auf Frequenzen gemäß der Definition der HW-Gleichung geschlossen. Das heisst $p^2$ ist gleich der Häufigkeit des Phänotyps PP (siehe oben).

P^{2} = \frac{37}{64} P = \sqrt{0} .578 P \approx 0,76

$p^2 = \frac{37}{64} \\ p = {\sqrt 0.578} \\ p \approx 0.76$

Q = 1 - P = 0,24

$q = 1 - p = 0.24$ Dies führt zu einer HW-Verteilung von

(0,76)^{2} + 2 (0,76) (0,24) + (0,24)^{2} = 1

$(0.76)^2 + 2(0.76)(0.24) + (0.24)^2 = 1$

Mit einer neuen idealen Phänotypverteilung:

Phenotype      n
PP          37.1    p^2 * 64
PQ          23.0    2pq * 64
QQ           3.8    q^2 * 64

Invertieren der Berechnung durch Beginnen mit $q^2 = 7/64$ führt zu noch divergierenden Ergebnissen:

Phenotype      n
PP          28.8    p^2 * 64
PQ          28.2    2pq * 64
QQ           7.0    q^2 * 64

Beides verwenden $p^2$ Und $q^2$ verstößt unweigerlich gegen die Bedingung $(p+q)^2 = 1$ .

David

Willkommen bei SE Biology, einer Frage-und-Antwort-Website über Biologie. Sie haben sich offensichtlich viel Mühe gegeben, aber derzeit sehe ich keine Frage. Das ist zugegebenermaßen nicht mein Gebiet, aber wenn in Titel, Anfang oder Ende Ihres Beitrags keine Frage gestellt wird, ist es schwierig zu wissen, was Sie wissen wollen. Sie fragen sich, welche der beiden Berechnungsarten richtig ist? Wenn ja, bearbeiten Sie bitte Ihren Beitrag, um dies von Anfang an klarzustellen, da sonst die Gefahr besteht, dass er auf der Grundlage von „unklar, was Sie fragen“ als „off-topic“ eingestuft wird.

vipatron

Hallo David, ich dachte, sein Beitrag wäre klar. Vielleicht muss der Titel „rogatiert“ werden, aber die Fragen stehen am Ende des Hauptbeitrags vor den rechnerischen Ergänzungen: „Ist eine dieser Methoden falsch? Muss ich entscheiden, welche ich für jeden Datensatz verwenden soll? Kann ich sogar Methode Nr. 1 für 3-Allel-Datensätze verwenden?"

G'Ra

Hej David, hej Vipatron! Sie haben Recht, dass meine Fragen nicht so klar definiert sind, wie ich dachte. Ich würde gerne wissen, woher die Unterschiede zwischen diesen beiden (drei) Gleichungen stammen und ob eine gültiger / genauer ist als das andere Modell

David

G'Ra. Bitte verwenden Sie das @, damit ich weiß, dass Sie auf meinen Kommentar geantwortet haben. Nur der Poster wird automatisch benachrichtigt. Sie müssen Ihre Frage bearbeiten. Eine Kommentarantwort ist nicht ausreichend. @vipatron — Eine Frage braucht einen Satz mit einem Fragezeichen.

Bharel

Und dann ist da noch Gene Driving, das alle Ihre Berechnungen zerstört :-/

Antworten (2)

Was sind die Unterschiede zwischen den beiden möglichen Methoden zur Berechnung der Hardy-Weinberg-Gleichung?

Willkommen bei SE Biology, einer Frage-und-Antwort-Website über Biologie. Sie haben sich offensichtlich viel Mühe gegeben, aber derzeit sehe ich keine Frage. Das ist zugegebenermaßen nicht mein Gebiet, aber wenn in Titel, Anfang oder Ende Ihres Beitrags keine Frage gestellt wird, ist es schwierig zu wissen, was Sie wissen wollen. Sie fragen sich, welche der beiden Berechnungsarten richtig ist? Wenn ja, bearbeiten Sie bitte Ihren Beitrag, um dies von Anfang an klarzustellen, da sonst die Gefahr besteht, dass er auf der Grundlage von „unklar, was Sie fragen“ als „off-topic“ eingestuft wird.
Hallo David, ich dachte, sein Beitrag wäre klar. Vielleicht muss der Titel „rogatiert“ werden, aber die Fragen stehen am Ende des Hauptbeitrags vor den rechnerischen Ergänzungen: „Ist eine dieser Methoden falsch? Muss ich entscheiden, welche ich für jeden Datensatz verwenden soll? Kann ich sogar Methode Nr. 1 für 3-Allel-Datensätze verwenden?"
Hej David, hej Vipatron! Sie haben Recht, dass meine Fragen nicht so klar definiert sind, wie ich dachte. Ich würde gerne wissen, woher die Unterschiede zwischen diesen beiden (drei) Gleichungen stammen und ob eine gültiger / genauer ist als das andere Modell
G'Ra. Bitte verwenden Sie das @, damit ich weiß, dass Sie auf meinen Kommentar geantwortet haben. Nur der Poster wird automatisch benachrichtigt. Sie müssen Ihre Frage bearbeiten. Eine Kommentarantwort ist nicht ausreichend. @vipatron — Eine Frage braucht einen Satz mit einem Fragezeichen.
Und dann ist da noch Gene Driving, das alle Ihre Berechnungen zerstört :-/

vipatron · Answer 1

Okay, das Hardy-Weinberg-Gleichgewicht ist also genau das: ein Gleichgewicht .

In der Physik befindet sich ein System (ein Objekt) im Gleichgewicht, wenn keine Nettoenergie seine Grenze zur Umgebung überschreitet.
- keine Energieänderung bedeutet keine Änderung der Bewegung (des Zustands des Objekts) aufgrund äußerer Einflüsse auf das System.
In der Chemie befindet sich ein System (Becher/Reaktionsbehälter/Cytosol) im Gleichgewicht, wenn sich die Konzentration der darin enthaltenen chemischen Spezies im Laufe der Zeit nicht ändert
- keine Änderung der chemischen Zusammensetzung bedeutet, dass der (molekulare) Zustand der Atome im System frei von energetischen Einflüssen der Außenwelt ist.
Im HW-Gleichgewicht befindet sich ein System (der Genpool) in Ruhe, wenn sich die Häufigkeit (Konzentration) seiner Allele im Laufe der Zeit nicht ändert.
- keine Änderung der Allelhäufigkeit bedeutet, dass es keinen äußeren Einfluss auf den Zustand des Genpools gibt.

Genau wie in der Grundlagenphysik müssen wir unser System definieren. Wenn unser System der Genpool ist, dann liegen sogar die Verhaltensweisen der Organismen, in deren Zellen diese Allele gefunden werden, außerhalb des Systems . Das System besteht nur aus den Allelen, auch bekannt als Genpool.

Der wichtigste Teil zum Verständnis des HW-Gleichgewichts ist, dass es nur gilt, wenn die Bedingungen des Genpools, der frei von äußeren Einflüssen ist, gelten. Tatsächlich enthält die Einführung in dem von Ihnen angegebenen Link es im zweiten Satz (kein schlechtes Gewissen, ich habe es auch die ersten Male verpasst - zu konzentriert auf die Anwendung der Algebra, um zu verstehen, was es wirklich bedeutet):

Das Modell hat fünf Grundannahmen:

1) die Population ist groß (dh es gibt keine genetische Drift)

2) es gibt keinen Genfluss zwischen Populationen durch Migration oder Transfer von Gameten

3) Mutationen sind vernachlässigbar

4) Individuen paaren sich zufällig

5) Die natürliche Selektion wirkt nicht auf die Bevölkerung.

Lassen Sie uns sie aufschlüsseln / gruppieren:

2: Offensichtlich im Sinne des Gleichgewichts == System ist von der Umgebung isoliert
4 & 5: Selektionsdruck (4: sexuelle Selektion oder 5: natürliche Selektion) übt keinen Druck auf das System aus.
1 & 3: Zufällige Effekte drücken nicht auf das System (1 = statistischer Stichprobenfehler, der kleine Populationen drücken kann, und 3 = Mutation, die das System drückt, wie das Hinzufügen einer neuen chemischen Spezies zu einem ruhenden System.)

Lassen Sie uns mit dieser soliden Grundlage in der Theorie zu Ihren Fragen zur Algebra übergehen. Denken Sie daran, dass das Gleichgewicht nur dann gilt, wenn der Genpool nicht durch externe Faktoren herumgeschubst wird. Das bedeutet, dass sich die physischen Kopien von Allelen (Gameten) bei jeder Paarung zufällig mit den möglichen Gameten paaren sollten. Wenn diese Annahmen nicht zutreffen würden, würde die Mathematik des Gleichgewichts nicht gelten. Wenn Sie die Zahlen auf einem System im Gleichgewicht ausführen, abgesehen von kleinen Stichprobenfehlern (reduzierbar mit einem größeren n), sind die Vorhersagen des HW-Modells genau. Alle Methoden führen zu ähnlichen Ergebnissen.

Wenn jedoch die vorhergesagten Werte bei einer Methode nicht mit den tatsächlichen übereinstimmen, können Sie davon ausgehen, dass auch andere Methoden zu ungenauen Vorhersagen führen und dass die Vorhersagen der beiden unterschiedlichen Berechnungsmethoden stark voneinander abweichen, was hauptsächlich auf Ihre Annahmen zurückzuführen ist machen (Methode 2: 1 = p+q) oder machen nicht (Methode 2).

Hallo viptron! Vielen Dank für Ihre Erläuterungen. Ich bin mir der Einschränkungen des HW-Modells bewusst, muss aber ehrlich zu mir selbst zugeben, dass ich ihnen noch nie so viele Gedanken gemacht habe. Aber wenn ich das richtig verstehe, sollten beide Modi - in einer idealen HW-Population - die gleichen Ergebnisse liefern, werden aber unweigerlich zu verzerrten Verteilungen führen, solange "echte" (dh "nicht ideale") Populationen beobachtet werden ? In Anbetracht der Tatsache, dass das Messen realer Abweichungen vom idealen HW-Modell das meiste ist, wofür ich HW gesehen habe, führen zwei Optionen nicht zu zwei signifikant unterschiedlichen Ergebnissen?
Ich bin kein reiner Biologe. Ich glaube also nicht, dass ich Ihre Frage beantworten kann, außer mit einer durch Erfahrung gestützten Vermutung. Angenommen, Sie testen eine Hypothese: Sie müssen eine Schätzung der Werte für p & q vornehmen und dann in der Lage sein, den Grad der Abweichung zu quantifizieren. Mit der „exakten Methode“ der Allelhäufigkeitszählung können Sie eine einzelne Schätzung der Allelhäufigkeit erhalten und dann eine Nullhypothese darüber erstellen, wie der Genpool aussehen würde, wenn er im Gleichgewicht wäre. Aber ich würde lieber die wahre Arbeit von jemandem sehen und erklären, warum er das getan hat, anstatt in den Wind zu reden.
@vipatron Unter den aufgeführten Annahmen wird das HW-Gleichgewicht in einer einzigen Generation erreicht. Der Begriff "Gleichgewicht" ist daher ein wenig komisch, und es gibt im Laufe der Zeit nicht viel Dynamik, die zu einem Gleichgewicht führen würde. Der Ausdruck HW-Regel ist ebenfalls gebräuchlich und vermeidet den Begriff "Gleichgewicht".

swbarnes2 · Answer 2

Sie werfen Zahlen in eine Gleichung, ohne sie zu verstehen.

Wenn Sie die Zahlen für pp, pq und qq kennen, verwenden Sie HWE nicht, um sie neu zu berechnen . Ihre letzte Aussage in Berechnung 1 ist also Unsinn. Sie haben dort die Anteile für eine Bevölkerung in HWE berechnet, bei der p = 0,73 ist, aber Ihnen wurde bereits die tatsächliche Verteilung in der Bevölkerung mitgeteilt, sodass es Unsinn ist, so zu tun, als ob Ihre theoretische Berechnung die angegebenen Daten übertrumpft.

Berechnung 2 funktioniert nur einwandfrei, wenn Ihre Bevölkerung genau in HWE liegt. Ihre ist ein wenig daneben, deshalb wird sie Ihnen nicht ganz die gleichen p und q geben, wie wenn Sie sie richtig berechnen, indem Sie tatsächlich die p-Allele in den Homozygoten und Heterozygoten zählen.

Was sind die Unterschiede zwischen den beiden möglichen Methoden zur Berechnung der Hardy-Weinberg-Gleichung?

G'Ra

Berechnungsmethode #1

Berechnungsmethode #2

David

vipatron

G'Ra

David

Bharel

Antworten (2)

vipatron

G'Ra

vipatron

vipatron

Remi.b

swbarnes2

Mutations-Drift-Gleichgewicht und Varianz zwischen Loci in der Heterozygotie

Verteilung der Fitness in Wildpopulationen

Innerhalb und zwischen allelischer Klassendiversität

Berechnung der Häufigkeit eines rezessiven Allels bei drei segregierenden Allelen

Über den Auswahlkoeffizienten

Gendrift: Modelle, Annahmen und empirische Beobachtungen

Konzept und Analyse von Pedigree

Fishers fundamentaler Satz der natürlichen Auslese

Warum ist es q2q2q^2 für die individuelle Zählung in Hardy Weinberg?

Verbindung zwischen chromosomalen Loci und dem Hardy-Weinberg-Prinzip