Kopplungsungleichgewicht mit mehreren Allelen und Loci

Verbindungsungleichgewicht ( D ) für zwei biallelische Loci ist definiert als:

D = X 11 X 22 X 12 X 21

wo X 11 ,   X 12 ,   X 21 ,   X 22 sind die Frequenzen der Haplotypen EIN 1 B 1 , EIN 1 B 2 , EIN 2 B 1 , EIN 2 B 2 (die tiefgestellten Zahlen entsprechen den zwei verschiedenen Allelen und EIN und B entsprechen den beiden unterschiedlichen Loci)

Meine Fragen sind

  • Wie ist D für mehr Loci und eine größere Anzahl von Allelen definiert?

  • Wie ist D definiert, wenn sich die Anzahl der Allele von Locus zu Locus unterscheidet?

Lassen Sie mich wissen, ob meine Antwort für Sie sinnvoll ist

Antworten (2)

LD beschreibt die Assoziationen zwischen Allelen an verschiedenen Loci. Für mehr als zwei biallelische Loci benötigen Sie mehr als nur eine Zahl, um die Assoziationen vollständig zu beschreiben. Wenn wir beispielsweise drei biallelische Loci 1-3 haben, benötigen wir die drei paarweisen LD-Koeffizienten plus einen zusätzlichen Drei-Wege-Koeffizienten. Im Allgemeinen, wenn wir haben K Loci und die k th Ort hat n k Allele, es gibt k n k mögliche Haplotypen, um den Zustand der Bevölkerung vollständig zu beschreiben, den wir brauchen k n k 1 Haplotyp-Frequenzen. Wenn wir stattdessen Allelfrequenzen und -assoziationen verwenden möchten, benötigen wir daher

k n k 1 k ( n k 1 ) = k n k k n k + k 1
LD-Koeffizienten. (Beachten Sie, dass jeder Locus beschrieben wird durch n k 1 Allelfrequenzen.) Bei vielen Loci wird es also schnell kompliziert! Wenn Sie in die Details eintauchen möchten, lesen Sie Barton und Turelli (1991) und Kirkpatrick, Johnson und Barton (2002) .

Als typischer Molekularbiologe fühle ich mich mit klassischen Begriffen der Genetik etwas unwohl. Ich könnte einige Symbole neu definieren (vielleicht um dasselbe zu bedeuten) [ Es ist, als würde man mit sich selbst sprechen, während man nachdenkt ].


Es gibt vier DNA-Blöcke: A 1 , B 1 , A 2 und B 2 . A k und B k sind benachbarte Blöcke. [ Vielleicht ist dies dasselbe wie das, als was Sie die Symbole definiert haben ]. A und B sind zusammenhängende DNA-Regionen, während 1 und 2 unterschiedliche Chromosomen (homologe Regionen) sind. Siehe die Abbildung unten.

                                    Geben Sie hier die Bildbeschreibung ein

Die Formel:

D=X 11 X 22 - X 12 X 21

bedeutet im Grunde, dass die Differenz zwischen der Wahrscheinlichkeit, dass die Loci in configuration I( 11 & 22) oder configuration II (swapped)( 12 & 21) sind. Nehmen wir an, es gibt eine dritte Region (3), die homolog zu den zwei Allelen ist , die die DNA-Blöcke A 3 und B 3 hat .

Wie LD definiert ist, ist es ein Unterschied in Wahrscheinlichkeiten. Je nachdem, wie Sie definieren, nimmt es einen negativen oder positiven Wert an. Wenn Sie 3 rekombinationsfähige Allele haben , kann es sechs Fälle geben:

  1. C 1 : [A 1 B 1 ] [A 2 B 2 ] [A 3 B 3 ]
  2. C 2 : [A 1 B 1 ] [A 2 B 3 ] [A 3 B 2 ]
  3. C 3 : [A 1 B 3 ] [A 2 B 2 ] [A 3 B 1 ]
  4. C 4 : [A 1 B 2 ] [A 2 B 1 ] [A 3 B 3 ]
  5. C 5 : [A 1 B 2 ] [A 2 B 3 ] [A 3 B 1 ]
  6. C 6 : [A 1 B 3 ] [A 2 B 1 ] [A 3 B 2 ]

In diesem Fall gibt es kein einzelnes Maß für die Differenz . Sie können auch so etwas tun:

LD1 ' = P(C 1 ) + P(C 2 ) – (P(C 3 ) + P(C 4 ) + P(C 5 ) + P(C 6 ))

Wobei LD 1' die LD der Region 1 ist und P(C m ) die Frequenz der m- ten Konfiguration ist.

Wenn nun 3 oder mehr benachbarte DNA-Blöcke vorhanden sind, können Sie LD nur paarweise definieren. Es ist jedoch sinnvoll, da die Verknüpfung mit der Entfernung abnimmt und Sie LD AC = LD AB x LD BC
berechnen können ( A, B und C sind in alphabetischer Reihenfolge zusammenhängend. Wenn A und B nicht verknüpft sind, können A und C nicht verknüpft werden. )