Das menschliche Genom umfasst 3.234,83 Megabasen und enthält ~ 19.000 Gene. Es wurde geschätzt, dass die Genome des Menschen zu 99,9 % identisch sind. Wie wahrscheinlich ist es, dass ein einzelnes Gen von einem Individuum zum anderen variiert? Nehmen Sie eine durchschnittliche Länge für ein Gen von 3 Kilobasen an.
Sind es immer noch 0,01 %, die gleichen wie für das gesamte Genom? Warum haben wir dann die Anzahl der Gene in dieser Übung zusammen mit einer ungefähren Länge?
Annahmen
Nehmen wir an, dass wir das gesamte menschliche Genom perfekt aufeinander abstimmen können und berechnen daher solche Identitätsstatistiken.
Nehmen wir an, dass die Identitätswahrscheinlichkeit von 99,9 % für neutrale Sequenzen dieselbe ist wie für kodierende Sequenzen. Diese Annahme ist höchstwahrscheinlich falsch, aber es gibt keine andere Möglichkeit, die Frage mit den uns gegebenen Daten zu beantworten.
Wie lautet die Frage genau?
Deine Hausaufgabenfrage ist leider etwas unklar. Ich weiß nicht, was genau gemeint ist
Wie wahrscheinlich ist es, dass ein einzelnes Gen von einem Individuum zum anderen variiert?
Bedeutet das
Sie nehmen zufällig Proben von zwei Menschen und zufällig Proben von einem Gen. Wie groß ist die Wahrscheinlichkeit einer perfekten Identität dieses Gens?
oder bedeutet es
Sie nehmen zufällig ein Gen, wie groß ist die Wahrscheinlichkeit, dass alle Menschen für dieses Gen identisch sind?
Ich nehme an, es bedeutet das erste.
Schritt für Schritt
Ich werde nach Teilfragen vorgehen, um durch den Denkprozess zu führen! Versuchen Sie, die folgenden Fragen nacheinander zu beantworten, und Sie sollten in der Lage sein, selbst zur endgültigen Antwort zu gelangen
Stichproben Sie zufällig zwei Personen und betrachten Sie zufällig ein Nukleotid in ihrem Genom. Wie groß ist die Wahrscheinlichkeit, dass dieses Nukleotid dasselbe ist?
Stichproben Sie zufällig zwei Personen und betrachten Sie zufällig zwei Nukleotide in ihrem Genom. Wie groß ist die Wahrscheinlichkeit, dass diese beiden Nukleotide gleich sind?
Stichproben Sie zwei Personen nach dem Zufallsprinzip und betrachten Sie nach dem Zufallsprinzip n
Nukleotide in ihrem Genom. Wie groß ist die Wahrscheinlichkeit, dass diese n
Nukleotide gleich sind?
Stichproben Sie zwei Personen nach dem Zufallsprinzip und betrachten Sie nach dem Zufallsprinzip n
Nukleotide in ihrem Genom. Wie groß ist die Wahrscheinlichkeit, dass diese n
Nukleotide unterschiedlich sind?
Nehmen Sie eine zufällige Stichprobe von zwei Individuen und betrachten Sie zufällig 3000 Nukleotide in ihrem Genom. Wie groß ist die Wahrscheinlichkeit, dass diese 3000 Nukleotide unterschiedlich sind?
Welche Antwort hast du bekommen? Wenn Sie irgendwo stecken geblieben sind, sagen Sie mir bitte wo!
Hinweise
Es macht keinen Sinn, einen Taschenrechner zu verwenden, er wird sowieso irgendwann zurückkehren Infinite
oder !0
Machen Sie sich keine Sorgen, wenn Sie nicht alle Nummern verwenden, die Ihnen gegeben werden!
Die Antwort : 0,25 % der Gene werden unterschiedlich sein
Ich habe die Antwort erhalten, indem ich zwei Genome mit dem folgenden Code simuliert habe:
lengthGenome=3234.83*10^6
numGenes=19000
lengthGene=3000
fracSim=0.999
trialHolder=1:100
for(trial in 1:100){
genomeA=rep(0,lengthGenome)
genomeB=rep(0,lengthGenome)
genomeA[sample(1:lengthGenome,round((1-fracSim)*lengthGenome))]=1
genomeB[sample(1:lengthGenome,round((1-fracSim)*lengthGenome))]=1
startGenes=sample(1:lengthGenome,numGenes)
equalGene=0
for(i in 1:numGenes){
equalGene=all(genomeA[startGenes[i]:(startGenes[i]+lengthGene)]==genomeB[startGenes[i]:(startGenes[i]+lengthGene)])+equalGene
}
trialHolder[trial]=equalGene/numGenes
}
print(mean(trialHolder))
Um schnell durch den Code zu gehen, erstellen Sie ein Genom der angegebenen Länge und ändern dann 0,01 % des Genoms so, dass es eine Mutation ist und daher dem anderen Genom an derselben Position nicht ähnlich ist. Definieren Sie dann die Startpunkte der angegebenen Anzahl von Genen. Überprüfen Sie für jede Genregion, ob die Gene genau gleich aussehen (wenn eines die Mutation nicht enthält). Verfolgen Sie schließlich einfach den Anteil der Gene, die alle gleich sind.
Ich habe den Code 100 Mal ausgeführt und das Ergebnis gemittelt, es hat eine Weile gedauert. Es gibt wahrscheinlich einen direkteren, wahrscheinlichkeitstheoretischeren Weg, aber ich stelle mir vor, dass das Ergebnis dasselbe wäre.
mgkrebbs
Remi.b
mgkrebbs
Remi.b