Genetische Verknüpfung von mehr als 50 Zentimorganen

Klassischerweise kann die Verbindung zwischen zwei Loci in Centimorgans (cM) gemessen werden, was die prozentuale Wahrscheinlichkeit darstellt, dass diese beiden Loci eine ungerade Anzahl von Malen rekombinieren (wodurch ein rekombinanter Genotyp erzeugt wird).

Aufgrund der unabhängigen Sortierung wird erwartet, dass Marker auf verschiedenen Chromosomen in 50 % der Fälle rekombinieren. Soweit ich weiß, werden, wenn man ein klassisches Experiment durchführt und verschiedene Nachkommen zählt, dann die scheinbare Kopplung ableitet, Werte von 50 cM oder mehr als „ unmöglich zu bestimmen, ob auf getrennten Chromosomen oder nur sehr oft rekombiniert “ interpretiert. Siehe ( Quelle ), mit korrigierter Grammatik:

Der letzte Punkt, den wir ansprechen müssen, betrifft die maximale Entfernung, die wir messen können. Aufgrund der Art und Weise, wie die Berechnungen durchgeführt werden, können wir nie mehr (als) 50 % rekombinante Gameten haben. Daher beträgt der (maximale) Abstand, den zwei Gene voneinander entfernt sein können und der diesen Abstand dennoch misst, nur weniger (als) 50 cM. Wenn zwei Gene mehr als 50 cM voneinander entfernt sind, können wir nicht feststellen, ob sie sich auf demselben Chromosom oder auf verschiedenen Chromosomen befinden.

Wikipedia gibt eine analytische Lösung und bemerkt auch, dass (d der physische Abstand ist):

Die Rekombinationswahrscheinlichkeit beträgt ungefähr d/100 für kleine Werte von d und nähert sich 50 %, wenn d gegen unendlich geht.

Was passiert jedoch, wenn die Bindung größer als 50 cM ist? Abgesehen von klassischen Experimenten scheint eine solche Situation in der Realität möglich zu sein.

Beispielsweise ist das Hefechromosom IV 1530 kb lang und hat einen Durchschnitt von 0,31 cM/kbp . Nehmen wir zwei Gene auf Chr.IV:

  • DNF2 liegt bei etwa +631 kb.
  • TOM1 liegt bei etwa +1370 kb.

Der physische Abstand zwischen diesen beträgt etwa 734 kb. Entsprechend dem cM/kbp-Wert ist der Centimorgan-Abstand 734  kb 0,31  cm / kb = 228  cm . Wie ist diese 228 zu interpretieren?

Wenn ich eine haploide Hefe, die DNF2 TOM1 ist, mit einer anderen, die dnf2 tom1 ist (Kleinbuchstaben, die eher ein kleineres Allel als eine Deletion anzeigen), paare und sie dann sporuliere, wie hoch ist die Chance, Sporen mit DNF2 tom1- oder dnf2 TOM1- Genotypen zu bekommen?

Mir ist klar, dass der cM/kbp-Wert nur eine Vereinfachung ist und dass die Verknüpfung in der Praxis ein komplexeres Phänomen ist. Trotzdem scheint es plausibel, dass mehrere Crossover-Ereignisse auf Chr.IV passieren können, da es so groß ist. Dies schließt die Möglichkeit von 1, 3, 5 und mehr Kreuzungen ein, die einen Hybrid erzeugen würden (vorausgesetzt, sie alle finden zwischen diesen beiden Loci statt), sowie die Möglichkeit von 2, 4 usw. Kreuzungen, die eine nicht-hybride Spore erzeugen würden ( zumindest was unsere gewählten Marker betrifft).

Antworten (2)

Das Verständnis der Statistiken, die wir verwenden, wenn wir über die Rekombinationsrate sprechen, ist eine wichtige Frage, die leider zu oft in einem Einführungskurs in die Evolutionsbiologie oder Populationsgenetik abgetan wird und von vielen missverstanden wird. Ich habe ein teilweises Verständnis dafür, aber hoffentlich schaffe ich es, eine anständige Antwort zu schreiben.

#Kurze Antwort

Eine Rekombinationsrate und eine genetische Distanz (in centiMorgan) sind zwei verschiedene Dinge. Während die Rekombinationsrate zwischen 0 und 0,5 begrenzt ist, ist die genetische Distanz zwischen 0 und unendlich begrenzt. Es gibt eine Eins-zu-eins-Funktion von der genetischen Distanz zur Rekombinationsrate. Für eine kleine Rekombinationsrate nehmen die Rekombinationsrate und der genetische Abstand sehr ähnliche Werte an, aber für größere Werte ist die Rekombinationsrate viel niedriger als der genetische Abstand.

#Lange Antwort

Es gibt ein kleines bisschen Mathematik unten. Diese Gleichungen dienen hauptsächlich der Neugier, da man die Antwort verstehen kann, ohne die Mathematik dahinter zu verstehen.

Definitionen von r und M

Sie werden zwischen zwei verschiedenen Statistiken verwirrt

  • Die Rekombinationsrate r zwischen zwei Orten
  • r ist die Wahrscheinlichkeit, dass zwei Loci nach erfolgter Rekombination im selben Gameten verbleiben. Diese Wahrscheinlichkeit kann nicht größer als 0,5 ( 0 r 0,5 ).
  • Die Entfernung in Morgans M (oder häufiger in centiMorgans) zwischen zwei Loci. M ist die erwartete Anzahl von Überkreuzungen, die zwischen den beiden Loci auftreten.

Morgans und centimorgans

Sie werden feststellen, dass ich eher in Morgans als in CentiMorgans spreche, was in der Literatur nicht typisch ist, aber es hilft, die Intuition dessen zu vermitteln, was es bedeutet. Wenn 150 centimorgans = 1.5 Morgans. Für zwei Loci, die um 1,5 Morgans entfernt sind, beträgt die erwartete Anzahl von Überkreuzungen zwischen den beiden Loci 1,5 (per Definition). Unten sind einige weitere Erklärungen zu diesen beiden Definitionen mit einigen Zeichnungen :)

Fallstudie mit Loci AundB

Während M und r eng verwandt sind, sie sind nicht genau dasselbe. Betrachten Sie die folgende Sequenz mit den Loci AundB

---[A]------------------[B]---

Nehmen wir an, die beiden Loci sind sehr weit voneinander entfernt und M = 2 . Die Wahrscheinlichkeit genau zu haben k Überkreuzungen ist daher durch eine Poisson-Verteilung mit Rate gegeben M = 2

P ( k ) = e M M k k !

Sagen wir für einen bestimmten Fall, dass k = 1 (ein einzelnes Crossover trat auf). Diese Überkreuzung wird unten durch ein „/“ dargestellt

---[A]-------------/----[B]---

Hier werden deutlich die beiden Sequenzen an den Loci Aund Bgetrennt. Sagen wir das jetzt k = 2 (zwei Kreuzungen traten auf).

---[A]---/-----/--------[B]---

Hier bleiben, selbst wenn Überkreuzungen aufgetreten sind, die beiden Sequenzen an den Loci Aund Bzusammen. Nur die Sequenz zwischen den beiden Kreuzungen stammt vom homologen Chromosom.

Beziehung zwischen r und M - in Worten

Sie sehen es vielleicht aus dem vorherigen Abschnitt. Die Wahrscheinlichkeit r dieser beiden Loci Aund Bdurch Rekombination getrennt zu werden, ist die Wahrscheinlichkeit, dass eine ungerade Anzahl von Rekombinationsereignissen zwischen ihnen auftritt (in Kenntnis dessen M ist die erwartete Anzahl von Überkreuzungen).

Beziehung zwischen r und M - in Gleichung

Lassen Sie uns zuerst die Wahrscheinlichkeit berechnen p e v e n dass eine gerade Anzahl von Übergängen auftritt. Diese Wahrscheinlichkeit ist gerecht

p e v e n = k = 0 e M M 2 k ( 2 k ) !

, wo ich gerade die Konstante hinzugefügt habe 2 Vor k sowohl im Zähler als auch im Nenner. Mit etwas Algebra und Trig kann man das zeigen

p e v e n = k = 0 e M M 2 k ( 2 k ) ! = e M k = 0 M 2 k ( 2 k ) ! =

e M c Ö s h ( M ) = e M ( e M + e M 2 ) = 1 + e 2 M 2


Als, r = p Ö d d = 1 p e v e n ,

r = 1 1 + e 2 M 2 = 1 e 2 M 2

Auf geht's! Wir haben unsere Beziehung zwischen r und M ! Lassen Sie es uns grafisch darstellen

#Beziehung zwischen r und M - auf einem Diagramm

Ich habe gerade die obige Gleichung in Mathematica ( Plot[y = (1 - Exp[-2 M ])/2, {M, 0, 5}]) grafisch dargestellt.

Geben Sie hier die Bildbeschreibung ein

Hier ist das gleiche Diagramm, aber auf niedrigere Werte von gezoomt r und M ( Plot[y = (1 - Exp[-2 M ])/2, {M, 0, 0.1}])

Geben Sie hier die Bildbeschreibung ein

Wir sehen deutlich aus der Grafik, dass für niedrige Werte von M , als M erhöht sich r steigen quasi linear ( M r ). Für größere Werte von M , r steigt immer noch an, aber langsamer und langsamer bis zum Erreichen einer Asymptote/eines Plateaus an 1 2 . r tatsächlich zwischen 0 (wann M = 0 ) und 1 2 (wann M = ).

Beachten Sie, dass die Summe der Wahrscheinlichkeiten jeder gerade ist k in einer Poisson-Verteilung immer kleiner oder gleich 0,5 ist, ist eine interessante mathematische Tatsache für sich!

Aus einem gelöschten Kommentar von @emre : Du solltest damit beginnen p e v e n = k = 0 2 2 d k e d ( k ) ! . Denn einfach, k = 0 d 2 k e d ( 2 k ) ! k = 0 d 2 k e d 2 ( k ) !
@ Remi.b Wie AliceD betonte, war ein Teil Ihrer Mathematik falsch. Ich habe es so modifiziert, dass es gültig ist, und um die fragliche Gleichheit immer noch zu demonstrieren, indem ich gemeinsame Trig-Identitäten von verwende c Ö s h ( x ) .
Vielen Dank @Charles

Nur um das klarzustellen: Marker auf verschiedenen Bindungsgruppen (Chromosomen) rekombinieren nicht in 50 % der Fälle. Es ist nur so, dass unverbundene Mutationen in 50% der Fälle co-segregieren.

Dies ist ein direktes Zitat aus Strickbergers Lehrbuch "Genetics" 3rd ed. 1985 S. 397:

> Nach vielen Tests mit zahlreichen geschlechtsgebundenen Genen wurde das gesamte X-Chromosom von D. melanogaster kartiert und es wurde festgestellt, dass es eine Länge von 68 Karteneinheiten hat. Dies bedeutet jedoch nicht, dass es eine Rekombinationshäufigkeit von 68 Prozent in einem Kopplungsexperiment zwischen Gelb und Bobb gibt, die sich an den äußersten Enden des X-Chromosoms befinden. Wie zuvor erläutert, wird zwischen zwei beliebigen Loci nicht mehr als 50 Prozent Rekombination erwartet, da nur zwei von vier Chromatiden in einer meiotischen Tetrade an einem bestimmten Kreuzungspunkt beteiligt sind. Tatsächlich ist der tatsächlich beobachtete Rekombinationswert zwischen gelb und schwankendkann in einem Kopplungsexperiment sogar weniger als 50 Prozent betragen, aus dem einfachen Grund, dass nicht jedes zweiwertige X-Chromosom in diesem bestimmten Intervall einen Crossover haben kann. <<

1 Prozent Rekombination = 1 Karteneinheit

Jetzt wissen wir, was diese 68 NICHT bedeutet. Können Sie erklären, was es bedeutet und wie es zu interpretieren ist?
Wenn Sie versuchen, die meiotische Rekombination zwischen sichtbaren Markern zu verwenden, um eine genetische Karte eines Chromosoms zu erstellen, benötigen Sie mehrere verknüpfte genetische Marker. Sobald Sie die Marker in Bezug zueinander angeordnet haben, führen Sie zusätzliche Kartierungskreuze durch, um genaue Rekombinationsraten (cM) zwischen den Paaren benachbarter verknüpfter Marker zu erhalten. Dann summieren Sie diese Entfernungen, um die Gesamtlänge der Verbindungsgruppe in Karteneinheiten zu erhalten.
Wenn Sie also wissen, dass zwei Gene eng mit den beiden Telomeren verbunden sind: TEL-A----Z-TEL, und Sie haben ein paar besser platzierte Gene dazwischen: TEL-A-----D- ---------H---------Z-TEL. Wenn A 18 cM von D entfernt ist und D 20 cM von H entfernt ist und H 30 cM von Z entfernt ist, dann beträgt die Gesamtentfernung von A nach Z 18 + 20 + 30 = 68 Karteneinheiten. Wenn Sie jedoch den Abstand zwischen A und Z nur mit diesen beiden Markierungen abbilden, würden Sie berechnen, dass sie zu 50 Prozent der Zeit gemeinsam getrennt und möglicherweise nicht verknüpft sind. Wenn Sie also wissen, dass sie verknüpft sind, aber 50 cM erhalten, wissen Sie, dass Sie mehr Markierungen für Ihre Karte benötigen.
Ja, genau das würde ich vorschlagen, in die Antwort aufzunehmen :)
Du bringst mich um! (womit ich LOL meine). Tut mir leid, ich habe nicht versucht, absichtlich engstirnig oder stumpf zu sein. Ich war verwirrt, weil ich weiß, dass Sie einen 10-fachen Vertreter von mir haben und dass Sie ein Experte für Evolution sind (neben vielen anderen Dingen), aber aus irgendeinem Grund war meine Geisteshaltung, als ich diese Kommentare schrieb, „das tut er wirklich nicht wissen, also werde ich versuchen, es explizit zu erklären" und ich habe überhaupt nicht auf den Untertext des StackExchange-Mantras zur Verbesserung meiner vorhandenen Antwort hingewiesen. Ich bin fast völlig weg von Bio, ich fand es einfach zu frustrierend. Als meine anfängliche Begeisterung nachließ, driftete ich ab.