Sind alle Phänotypen normalverteilt

Reposting aus dem Statistik-Stackexchange.

John Cook schreibt in seinem Blog https://www.johndcook.com/blog/2015/03/09/why-isnt-everything-normally-distributed/ , dass viele es nicht sind:

Die Körpergröße von Erwachsenen folgt einer Gaußschen, auch bekannt als Normalverteilung [1]. Die übliche Erklärung ist, dass viele Faktoren in die Bestimmung der Körpergröße einfließen und der Nettoeffekt vieler separater Ursachen aufgrund des zentralen Grenzwertsatzes ungefähr normal ist.

Wenn das der Fall ist, warum sind dann nicht mehr Phänomene normalverteilt? Jemand hat mich heute Morgen speziell nach Phänotypen mit vielen genetischen Inputs gefragt.

Der zentrale Grenzwertsatz besagt, dass die Summe vieler unabhängiger, additiver Effekte näherungsweise normalverteilt ist [2]. Gene sind eher digital als analog und erzeugen keine unabhängigen, additiven Effekte. Zum Beispiel wirken die Effekte von dominanten und rezessiven Genen eher wie Max und Min als wie Addition. Gene treten nicht unabhängig voneinander auf – wenn Sie einige Gene haben, haben Sie mit größerer Wahrscheinlichkeit bestimmte andere Gene – und sie agieren auch nicht unabhängig – einige Gene bestimmen, wie andere Gene exprimiert werden.

Die Körpergröße wird durch Umwelteinflüsse sowie genetische Effekte wie Ernährung beeinflusst, und diese Umwelteffekte können additiver oder unabhängiger sein als genetische Effekte.

Dazu habe ich zwei Fragen. Erstens kann ich kein offensichtliches Beispiel für Phänotypen finden, die keiner Normalverteilung folgen. Könnte mir jemand helfen? Und zweitens scheinen seine Behauptungen diesem anderen Papier zu widersprechen: https://www.uvm.edu/~dstratto/bcor102/readings/4_Evol_of_Phenotypes.pdf

Um die genetische Grundlage quantitativer Merkmale zu verstehen, ist es wichtig, über die Wirkung eines bestimmten Allels nachzudenken, nicht nur über seine Anwesenheit oder Abwesenheit. Ein einzelner Locus kann drei diskrete Phänotypen produzieren, aber je mehr Loci zu einem Merkmal beitragen, desto näher kommt die phänotypische Verteilung einer normalen (glockenförmigen) Verteilung

Wer ist hier richtig? Macht die Tatsache, dass Gene digital statt analog sind, wirklich einen Unterschied? Und was ist mit dem zweiten Argument, dass sie nicht unabhängig sind. Ist das wirklich notwendig (das zweite Papier scheint etwas anderes anzuzeigen, wenn ich es richtig verstehe).

Was ist mit den offensichtlichsten Mendelschen Merkmalen? Das wären Phänotypen, die einer bimodalen Verteilung folgen, weil sie von einem einzigen Gen mit nur zwei Allelen verursacht werden. Viele andere Phänotypen folgen aus dem gleichen Grund ebenfalls einer bimodalen Verteilung. Wenn Sie weitere modulatorische oder regulatorische genetische Variationen hinzufügen, verschmieren Sie die Verteilung und sie wird normaler verteilt. Genau das sagen Ihnen Ihre Referenzen.

Antworten (1)

Viele Phänotypen könnten unter der Annahme einer ausreichend großen Population und vieler QTL ( Quantitative Trait Loci ) normalverteilt sein, da die Normalverteilung ein einfaches Ergebnis des CTL ( Central Limit Theorem ) ist. Wenn es dir unklar ist, solltest du dir unbedingt den zentralen Grenzwertsatz anschauen.

Wenn die Anzahl der Loci zu gering ist, kann der Phänotyp typischerweise einer Art kontinuierlicher Annäherung an eine Poisson-Verteilung folgen. Natürlich, wenn die allelischen Effekte zwischen Loci korrelieren oder wenn es ein Kopplungsungleichgewicht gibt oder wenn der Phänotyp begrenzt oder diskret oder nominell ist, werden Sie möglicherweise nicht mit einer normalen Verteilung von Phänotypen enden, aber all das ist eine Diskussion für einen anderen Zeit.

Mir fällt kein offensichtliches Beispiel für Phänotypen ein, die keiner Normalverteilung folgen

Wie das zweite Zitat sagt, denken Sie an jeden Phänotyp, der diskret ist. Hier sind ein paar Beispiele

  • Sex
  • Rechts-/Linkshänder
  • Augenfarbe

Wenn Sie nun einen quantitativen Phänotyp wünschen, der nicht normal verteilt ist, dann ist die Körpergröße (was das schlechte Beispiel Ihres ersten Zitats ist) aufgrund eines durchschnittlichen Größenunterschieds zwischen Männern und Frauen sehr leicht bimodal (siehe Sind Männer größer als Frauen bei Menschen? ). ? ). Sie können sich auch beliebige Phänotypen vorstellen, die begrenzt sind. Laufgeschwindigkeit zum Beispiel. Athleten verursachen einen sehr langen rechten Schwanz, während Rollstuhlfahrer bei 0 km/h einen großen Stapel Wahrscheinlichkeitsmasse erzeugen.

Beim Versuch zu erraten, ob a in einer Population normalverteilt ist oder nicht, sind viele Dinge zu beachten. Es erfordert einige gute Kenntnisse in Statistik und gute Kenntnisse der Genetik der Bevölkerung.

Danke für diese klare Antwort! Ich war nie von dem Argument "Höhe kann nicht normalverteilt werden, weil sie nicht negativ sein kann" überzeugt, da sie immer noch einigermaßen gut durch eine Normale angenähert werden kann. Die Laufgeschwindigkeit scheint etwas zu sein, das man mit einem normalen nicht annähern kann, aber ich wusste nicht, dass es als Phänotyp angesehen wird! Gibt es ein explizites Beispiel für etwas, das einer Poisson-Verteilung folgt?
So ziemlich alles kann als Phänotyp betrachtet werden. Ein Phänotyp ist die Wirkung, die der Genotyp auf die ihn umgebende Welt hat, die hauptsächlich alle Merkmale (Verhalten, Anatomie, Physiologie, ...) des Körpers umfasst. Ich hätte "eine Art 'kontinuierliche Annäherung' an eine Poisson-Verteilung'" sagen sollen (jetzt bearbeitet). Es ist nur eine theoretische Realität eines Modells, bei dem es nur wenige Loci gibt, die alle biallelisch sind und einen allelischen Effekt von 0 oder 1 haben. Dann würden Sie ein Poisson-verteiltes Merkmal sehen. Ich kann kein konkretes Beispiel nennen.