Ich habe einen statistischen (nicht biologischen) Hintergrund und bin sehr verwirrt darüber, was genau die "Daten" sind, die mit einem SNP verbunden sind. Im Folgenden erkläre ich die Dinge so gut ich kann – bitte korrigieren Sie mich, wenn ein Punkt falsch oder anderweitig unklar ist. Angenommen, wir arbeiten mit Menschen, da sich das Folgende je nach Spezies ändert. (Nehmen Sie an, dass alle interessierenden Fälle biallelisch sind.)
Wenn ein Locus ein Allel auf mindestens einem Chromosom hat, wird die Messung AA, Aa oder aa als SNP bezeichnet (ausgesprochen „snip“). Daher sind SNPs in statistischer Sprache dreistufige Faktoren – dies sind die Daten, die einem SNP zugeordnet sind . Wie bereits gesagt, wenn der Faktor 1 Level hat (dh es ist nur aa oder nur AA), dann ist es kein SNP.
Manchmal scheint es für Menschen, als ob die Leute sagen, ein SNP sei eigentlich nur ein Allel (also ein zweistufiger Faktor, a oder A). Wie ist das möglich? Messen Menschen manchmal nur ein Allel statt beide, um den Genotyp zu erhalten?
SNP ist kein spezifischer Datentyp, sondern ein biologisches Phänomen. Die Abkürzung "Single Nucleotide Polymorphism" bedeutet nur, dass es eine Variabilität (zwischen Individuen) in einem einzelnen Buchstaben an einer bestimmten Position in der DNA-Sequenz gibt. Es hängt vom Sprecher ab, wie er die Variabilität beschreibt; ob sie sich auf die möglichen Sequenzen konzentrieren und zum Beispiel sagen "An dieser Position gibt es nur A oder T" oder sie sich auf mögliche menschliche Genotypen konzentrieren und alle Kombinationen (AA, AT, TT) buchstabieren.
Was als SNP-Daten gilt, hängt ganz von der Forschungsfrage, dem verwendeten Organismus (diploid/haploid/polyploid) und dem experimentellen Design ab.
Der Artikel, den Sie in Ihrem Kommentar verlinken, verwendet Haferlinien und keine Individuen aus der Auszuchtpopulation. Hafer wie Arabidopsis ist von Natur aus in hohem Maße selbstbestäubend, sodass die Erzeugung hochgradig homozygoter Inzuchtlinien relativ einfach ist. In diesem Fall ist es für die Forscher vernünftig, nur AA- oder aa-Genotypen in jeder Linie zu erwarten.
Bearbeiten: Da Sie nach weiteren Beispielen gefragt haben, bei denen sich der Forscher auf Allele anstelle von Genotypen konzentriert. Die Verteilung vieler SNP-Genotypen passt zu den Hardy-Weinberg-Gleichungen . Wenn dies der Fall ist, kann die Häufigkeit von Genotypen aus einer Allelhäufigkeit in der Bevölkerung berechnet werden. Der Forscher könnte fragen: "Unterscheidet sich die Häufigkeit des Allels in Population/Gruppe 1 von Population/Gruppe 2?" Sie erheben Daten von Personen in Gruppe 1 (AA, AA, Aa, Aa, aa) und Gruppe 2 (Aa, Aa, aa, aa, aa). Sie beschließen, jedes Allel als unabhängige Messung zu behandeln (unabhängig von der Person, von der es stammt) und fragen die Daten ab: Gruppe 1 (AAAAAAaaaa), Gruppe 2 (AAaaaaaaaa) und führen dann einen einfachen Binomialtest durch, um ihre Frage zu beantworten.
Hinweis: Selbst wenn das Hardy-Weinberg-Gleichgewicht nicht erreicht wird, sind die Fragen zur Allelhäufigkeit immer noch gültige biologische Fragen (mit leicht unterschiedlicher Verwendung/Interpretation im weiteren Verlauf).
Ich denke, die vorherigen Antworten liefern viele wertvolle und relevante Informationen, aber lassen Sie mich zusätzliche Interessenten hinzufügen:
Lassen Sie mich Ihnen eine Rückseite der Umschlagsberechnung geben. Die Größe des menschlichen Genoms beträgt 3 Milliarden Basenpaare (BP). Es gibt ungefähr 30.000 Gene im menschlichen Genom. Daher würde die Größe eines Gens etwa 100.000 BP betragen (DNA hat nicht codierende Regionen, regulatorische Regionen usw. Auch die Größe eines Gens variiert von einigen hundert BP bis zu mehr als 2 Millionen. Der Einfachheit halber haben wir kann bei dieser Rechnung bleiben). Andererseits gibt es 5 Millionen SNPs im menschlichen Genom. Daher würde alle 600 BP ein SNP vorhanden sein.
Wir können also mit Sicherheit sagen, dass es Gene geben würde, die mehr als einen SNP haben. Mein Vorschlag wäre, wie @BagiM betonte, mikroskopische Konzepte nicht mit makroskopischen zu verwechseln.
Wie bereits gesagt, wenn der Faktor 1 Level hat (dh es ist nur aa oder nur AA), dann ist es kein SNP.
Wenn es in Ihrer Population Unterschiede in dieser Basis gibt, dann handelt es sich um einen SNP, selbst wenn Sie keinen Heterozygoten betrachten.
Wie auch immer, wenn Sie über ein SNP sprechen, werden die Leute es im Allgemeinen mit seiner Basis bezeichnen, nicht mit dem Namen des Allels, das es erzeugt. (Und tatsächlich werden die Allele oft nicht so einfach wie A und a benannt. Diese Notation ist hilfreich, wenn es um perfekt Mendelsche Genetik-Hausaufgaben der Mittelschule geht, aber in der realen Welt passen die meisten Daten nicht zu diesem Paradigma.
Hachiloni
Benutzer257566
David
Benutzer257566
David
Benutzer257566