Identität nach Abstammung vs. Identität nach Staat

Hintergrund

Die Konzepte von Identität nach Abstammung (IBD) vs. Identität nach Staat (IBS) sind von zentraler Bedeutung in der Populationsgenetik, aber ich schaffe es nicht, mich vollständig mit den Definitionen zu befassen.

Beispiele, bei denen mein Verständnis von IBD vs. IBS ziemlich schlecht ist, finden Sie in @DermotHarnetts Antwort hier oder in den Kommentaren mit @PaulStaab hier . @PaulStaab schlägt vor, dass verschiedene Autoren unterschiedliche Definitionen von IBD und IBS verwendet haben.

Was ist mir unklar

Soweit ich mich von Hartl und Clark erinnere (ich habe das Buch nicht bei mir, um es zu zitieren), hängt IBD von einer willkürlichen Zeitschwelle in der Vergangenheit ab, ab der wir, wenn Koaleszenzereignisse aufgetreten sind, die beiden Allele immer noch IBS (Identical by Staat) und nicht IBD. Die Vorstellung, dass der Begriff IBD von einer willkürlichen Schwelle abhängt, stört mich jedoch!

Ich nehme an, dass zwei Allele IBD sein können, ohne IBS zu sein, wenn ein Mutations- oder Rekombinationsereignis in der Mitte der interessierenden Sequenz vor (in der Zeit zurückblickend; jünger) ihrer Verschmelzung auftritt. Ich nehme an, dass zwei Allele nur IBS sein können, nicht IBD, wenn wir einen willkürlichen Schwellenwert verwenden, der älter als ihre Koaleszenzzeit ist, oder wenn eine konvergente / parallele Evolution stattgefunden hat.

Fragen

  • Hängt IBD von einer willkürlichen Schwelle ab?
  • Werden mehrere Definitionen von IBD und IBS verwendet?
  • Bedeutet IBD IBS?
  • Bedeutet IBS IBD?
  • Können Sie diese Definitionen bitte kurz wiederholen, um die Dinge zu klären?

Antworten (2)

Das Thema IBD und IBS kann in der Tat verwirrend sein.

Die Definition der Identität durch Zustand bezieht sich auf die Tatsache, dass zwei Individuen, auch wenn sie nicht miteinander verwandt sind, an einem bestimmten Ort dasselbe Allel aufweisen. Aufgrund ihrer Nicht-Verwandtschaft entstand diese Ähnlichkeit wahrscheinlich aus einem ähnlichen Mutationsereignis.

Auf der anderen Seite haben bei IBD zwei Personen aufgrund ihrer gemeinsamen Abstammung zufällig das gleiche Allel.

Allele, die von der Abstammung her identisch sind, sind auch vom Zustand her identisch. Aber das Gegenteil ist nicht wahr. (siehe auch https://www.biostars.org/p/174048/#174049 und Powell et al. 2010, Nature Reviews Genetics 11, 800–805 (1. November 2010) | doi:10.1038/nrg2865).

Nun zu der Schwelle, die Sie in Ihrer Frage erwähnten, ich bin mir nicht ganz sicher, was Sie meinen. Letztendlich sind alle Individuen auf einen MRCA (letzter gemeinsamer Vorfahre) rückführbar. Ich denke also, der Schwellenwert, von dem Sie sprechen, bezieht sich auf die Größe der Population in der Analyse. Abhängig von der Größe Ihrer Bevölkerung haben Sie unterschiedliche Anteile von Allelen, die IBD und IBS sind.

Ich hoffe das hilft.

Die „willkürliche Schwelle“ ist Teil der üblicherweise in Lehrbüchern gegebenen Definition von CED. Das Problem ist, dass, wenn man weit genug zurückgeht, alle Allele von einem gemeinsamen Vorfahren-Allel abstammen. Um es also zu definieren, gemäß der Lehrbucherklärung, bei der sowohl ich als auch der Fragende sich unwohl fühlen, was Sie tun, ist: Wählen Sie eine Anzahl von Generationen zurück, sagen wir, fünf: Entscheiden Sie sich dafür, alle Allele dieser Generation als nicht miteinander verwandt zu betrachten (nicht IBD); und dann IBD als „ein gemeinsames Vorfahren-Allel jünger als diese Anzahl von Generationen zurück“ definieren.

Dies wird keine vollständige Erklärung sein: Mich stören diese Fragen selbst. Aber ich werde sagen, was ich weiß.

Erste:

Ja, Identität durch Abstammung (IBD) wird relativ zu einer ausgewählten Schwellenanzahl von Generationen definiert, zumindest in dem Sinne, wie ich es verstehe (falls es mehr als einen Sinn gibt - ich denke, es gibt solche, die Mutationen zulassen?). Bei der gewählten Anzahl von Generationen zurück gehen wir davon aus, dass alle diese Vorfahren nicht miteinander verwandt waren. Das scheint problematisch! Aber zwei Dinge könnten dazu beitragen, dass es weniger so erscheint. Erstens: Wenn wir fragen, ob zwei Personen miteinander verwandt sind oder nicht, fragen wir wirklich, ob sie enger miteinander verwandt sind als die durchschnittliche Verwandtschaft der Hintergrundpopulation . Zweitens: Die Stammbaummethode zur Schätzung von Verwandtschafts- und Inzuchtkoeffizienten ist genau das, eine Art der Schätzung, die fehlschlagen kann, wenn ihre Annahmen fehlschlagen (z. B. wenn die Vorfahren an der Schwelle nicht zufällig aus einer zufälligen Paarungspopulation ausgewählt wurden).

Betrachten Sie zur Veranschaulichung eine Frage zu einer fiktiven Person mit einem fiktiven Stammbaum (Spoiler für Game of Thrones , Staffel 1): Wie stark ist Joffrey Baratheon angeboren?

Wir wissen, dass Joffrey Baratheon tatsächlich nicht der Sohn von König Robert Baratheon ist, sondern eher das Produkt geheimen Inzests zwischen seiner Mutter Königin Cersei Lannister und ihrem Zwillingsbruder Jaime Lannister. Wenn das alles wäre, was wir über die Situation wüssten, würden wir den folgenden Stammbaum zeichnen: Geben Sie hier die Bildbeschreibung einDurch die Verwendung dieses Stammbaums gehen wir implizit davon aus, dass die Eltern von Cersei und Jaime nicht miteinander verwandt sind, dh zufällig aus einer großen zufälligen Paarungshintergrundpopulation ausgewählt wurden (und davon ausgehen, dass, wenn Cersei und Jaime mit größerer Wahrscheinlichkeit als zufällig ausgewählte Personen ein Allel teilen, dass dies ausschließlich auf IBD von einem oder dem anderen dieser zufällig ausgewählten Eltern zurückzuführen ist , dh darauf, dass sie nahe Verwandte sind). Basierend auf dieser Annahme, indem wir die übliche Methode auf diesen Stammbaum anwenden, schätzen wir Joffreys Inzuchtkoeffizienten als 0,25 .

Wenn wir jedoch tiefer in den Lannister-Stammbaum schauen, stellen wir fest, dass Cersei und Jaime tatsächlich enger miteinander verwandt sind als ein typisches Bruder-Schwester-Paar: Ihre Eltern wurden nicht zufällig ausgewählt, sondern waren selbst verwandt (wenn auch nicht eng genug, um skandalös zu sein für die Westerosi-Gesellschaft); Ihr Vater Tywin Lannister und ihre Mutter Joanna Lannister waren Cousins. Anhand dieser Informationen zeichnen wir einen vollständigeren Stammbaum:Geben Sie hier die Bildbeschreibung einUnter erneuter Verwendung der üblichen Stammbaummethode gehen wir nun von einer anderen Annahme aus. Wir gehen nicht mehr davon aus, dass Joffreys Großeltern Tywin und Joanna zufällig aus der Hintergrundbevölkerung ausgewählt wurden. Wir gehen stattdessen davon aus, dass Joffreys Ururgroßeltern, Gerold Lannister und Lady Rohanne Webber, zufällig aus der Bevölkerung ausgewählt wurden. Diese Annahme erscheint vernünftiger. Da dieser neue Stammbaum mehr Inzucht in Joffreys Vorfahren impliziert, vermuten wir, dass die Methode eine höhere Schätzung für seinen Inzuchtkoeffizienten liefern sollte: das tut sie tatsächlich und gibt uns eine Schätzung von 0,28125 .

Hier ist, wie dies die Subjektivität der Definition von IBD veranschaulicht. Als wir den ersten Stammbaum verwendeten, fragten wir uns: Wie groß ist die Wahrscheinlichkeit, dass beide Allele an einem Ort in Joffreys Genom von demselben Allel in der Generation der Großeltern abstammen ? Als wir den zweiten Stammbaum verwendeten, fragten wir: Wie groß ist die Wahrscheinlichkeit, dass beide Allele an einem Ort in Joffreys Genom von demselben Allel in der Ur-Ur-Großeltern-Generation abstammen ? Dies sind zwei verschiedene Fragen, und natürlich gab es zwei verschiedene Antworten. Das Problem ist natürlich, dass es auf die Frage, wie Inzucht Joffrey im Verhältnis zur Hintergrundpopulation ist, nur eine Antwort gibt (die die Stammbaum-Antworten mehr oder weniger gut einschätzen können)!

Zweitens :

Obwohl wichtige Koeffizienten wie der „Inzuchtkoeffizient“ oder der „Verwandtschaftskoeffizient“ in Lehrbüchern oft als durch die Wahrscheinlichkeit definiert dargestellt werden, dass ein Paar von Allelen IBD ist, kann dies nicht die tatsächliche Definition sein. Dies liegt daran, dass Wahrscheinlichkeiten nicht negativ sein können , aber Verwandtschaft kann es sein (wenn zwei Personen weniger sindverwandt als der Durchschnitt), ebenso wie der Inzuchtkoeffizient (wenn das Tier ausgewachsen ist, dh seine Eltern hatten eine negative Verwandtschaft). Die Möglichkeit einer negativen Verwandtschaft hat sogar interessante evolutionäre Implikationen. Als eine Art Kehrseite von Hamiltons Regel für altruistische Verwandtschaftsauswahl – wo es für ein Gen evolutionär vorteilhaft sein kann, einen Träger dazu zu bringen, sich selbst zu schaden, um einem Verwandten zu helfen, dh einem Individuum, das mit größerer Wahrscheinlichkeit auch eine Kopie von trägt dieses Gen – negative Verwandtschaft ermöglicht eine boshafte Anti-Kin-Selektion – wo es ein Gen dafür bezahlt, dass sein Träger sich selbst Schaden zufügt, ohne jeglichen Nutzen, sondern nur, um einem Individuum zu schaden, das weniger wahrscheinlich als der Durchschnitt eine Kopie davon trägt selbst (und eher seine Konkurrenten tragen)!

Tatsächlich berief sich Sewall Wright in seiner ursprünglichen Formulierung dieser und verwandter Koeffizienten überhaupt nicht auf Wahrscheinlichkeiten oder Identität durch Abstammung. Zur Verwandtschaft sprach er über die Korrelation zwischen den Allelzuständen von Individuen (dies erfordert die Zuordnung von Zahlen zu Allelen, z A = 1 Und A = 0 ). Beachten Sie, dass Korrelationskoeffizienten negativ sein können . Die Interpretation der „Wahrscheinlichkeit von IBD“ wurde von Malécot eingeführt; es hat es hauptsächlich deshalb in die Lehrbücher der Populationsgenetik geschafft, weil es einfacher zu lehren ist (trotz der scheinbar paradoxen Subjektivität der Bezugszahl von Generationen und der Inkonsistenz mit der Möglichkeit einer negativen Verwandtschaft).

Wrights Erklärung des Inzuchtkoeffizienten ist intuitiver: Er weist darauf hin, dass die wichtigste Wirkung der Inzucht die Verringerung der Heterozygotie ist . Stellen Sie sich eine zufällige Paarungspopulation vor: Bei einem zufällig ausgewählten Individuum wird ein bestimmter Anteil seiner Loci heterozygot sein. Aber ein Inzucht-Individuum hat weniger heterozygote Loci (mehr homozygote Loci). Malécot interpretierte diese übermäßige Homozygotie als „aufgrund der Abstammung [seit einer subjektiv gewählten Referenzgeneration]“, aber wir können dieses konzeptionelle Gepäck ignorieren und nur über die übermäßige Homozygotie (Mangel an Heterozygotie) selbst sprechen. Damit ist eine bessere Definition des Inzuchtkoeffizienten gegeben

F = H e H H e

Wo H e ist die Heterozygotie, die man angesichts der Allelfrequenzen der Population von den Nachkommen einer zufälligen Paarung erwarten würde, und H ist die tatsächliche Heterozygotie des Inzuchtindividuums . Eine gute Darstellung dieser Interpretation findet sich in Hartl's Primer of Population Genetics .

Beachten Sie, dass diese Definition im Gegensatz zur Wahrscheinlichkeitsdefinition (aber wie die Korrelationsdefinition der Verwandtschaft) negativ sein kann: Outbred-Individuen haben weniger Homozygotie (mehr Heterozygotie) als bei zufälliger Paarung erwartet.