Wie ist die Häufigkeitsverteilung jeder Base in einer DNA-Sequenz? [geschlossen]

Können wir sagen, dass die Häufigkeitsverteilung jeder Base in einer DNA-Sequenz gleichwahrscheinlich ist?


Nach der negativen Antwort; i umformulieren: Gibt es einen Anwendungsfall, bei dem die Häufigkeitsverteilung der Basen gleichwahrscheinlich ist?

Ich mache nur eine fundierte Vermutung ... DNA-Sequenzen sind nicht zufällig, daher ist die Wahrscheinlichkeit, dass eine Base an einem bestimmten Ort vorhanden ist, nicht für alle Basen gleich.
Meine Frage bezog sich auf ihre Häufigkeit.
? sollte Ihre Frage also lauten "Was ist die Wahrscheinlichkeitsverteilung" oder "Was ist die Häufigkeitsverteilung"? Ich glaube, ich kann Ihrer Frage nicht folgen - können Sie mir helfen?
Nein ist es nicht. Sehr einfacher Fall - siehe GC-Prozentsatz.

Antworten (2)

Die Häufigkeit der Basen im Genom ist nicht gleich 0,25, die Häufigkeit hängt davon ab, welche Art von Organismus Sie meinen. Schauen wir uns jedoch einige davon an:

  • Bakterien, meistens können wir eine Neigung zu einigen Basen sehen, dies könnte eine GC-Neigung sein, zum Beispiel wenn die Bakterien unter extremen Bedingungen leben, weil GC drei Wasserstoffbrücken bilden kann im Vergleich zu AT, das nur zwei Wasserstoffbrücken bilden kann. Das Genom ist also widerstandsfähiger gegen extreme Temperaturen, weniger Denaturierungsrisiko aufgrund der stärkeren Bindungen. In Bakterien gibt es auch einige Polymerasen, die eine Neigung zu Basen haben, ich werde dies nicht ausführlich diskutieren, um es kurz zu halten, aber aus diesen beiden Punkten können wir bereits schließen, dass das Genom nicht zufällig ist

  • Homo Sapien, zum Beispiel brauchen wir CpG Island in der Nähe unserer Promotorregion, um die Transkription zu regulieren. Außerdem haben wir höhere GC% in Genkodierungsregionen, um die Mutationswahrscheinlichkeit zu verringern, da wir keine überlebensnotwendigen Gene mutieren wollen. Es gibt auch einige Sequenzen, die sehr spezifisch sind, zum Beispiel TATA-Box und Poly-A-Signal, wenn unser Genom zufällig wäre, also alle Basen eine Häufigkeit von 0,25 hätten, könnten diese spezifischen Sequenzen an Stellen auftreten, an denen wir sie nicht wollen oder sie würden nicht dort auftreten, wo wir sie haben wollen. Wir brauchen einen Promotor (mit TATA-Box) für die RNA-Polymerase-Bindung, wenn unser Genom zufällig wäre, hätten wir eine große Chance, dass wir Gene ohne eine TATA-Box haben würden, so dass keine Transkription dieser Gene stattfinden wird

Es gibt noch viel mehr Eigenschaften des Genoms, die wir diskutieren könnten, aber ich denke, dies wird Ihnen genügend Einblick geben, warum die Basen im Genom nicht die gleiche Frequenz von 0,25 haben

AKTUALISIEREN:

Zu deiner zweiten Frage: Ich halte die Chance, ein Genom zu finden, das eine gleiche Verteilung hat, für sehr gering. denn fast alle Organismen haben eine Evolution durchlaufen, und wenn wir eine Evolution haben, gibt es eine natürliche Auslese, und die natürliche Auslese beruht auf Mutationen. Also haben (fast) alle Genome eine Udergo-Mutation, aber dies kann manchmal eine gleichmäßige Verteilung begünstigen, zum Beispiel wenn unser Genom AGAA ist und ein A zu einem G mutiert, haben wir einen gleichen Anteil. Zusammenfassend: Vielleicht können Sie sich NCBI ansehen und nach einem gc 50% suchen, was 50% AT bedeutet, also 25% jeder Base. Wenn Sie ein Genom finden, das genau 50 % gc hat, haben Sie Ihre Antwort gefunden

Hier sind zwei Hauptantriebsfaktoren zu berücksichtigen:

Erstens stellen G/C und A/T komplementäre Basenpaare dar, da G immer mit C gepaart ist (und umgekehrt), während A immer mit T gepaart ist (und umgekehrt). Daher ist die Frequenz von G immer gleich C und die Frequenz von A immer gleich T.

Zweitens ist G über 3 Wasserstoffbrückenbindungen mit C gepaart, während A über 2 Wasserstoffbrückenbindungen mit T gepaart ist. Daher sind G/C-Bas-Paare thermodynamisch stabiler als A/T-Basenpaare und erfordern höhere Temperaturen (mehr Energie), um während der Replikation und auch der Transkription auseinandergezogen zu werden. Aus diesem Grund haben Organismen mit einer höheren Körpertemperatur tendenziell einen höheren Anteil an G/C-Basenpaaren als solche mit einer niedrigeren Körpertemperatur. Beispielsweise ist der G/C-Gehalt bei thermophilen Bakterien höher als bei Säugetieren und bei Säugetieren höher als bei Pflanzen. Diese Feinabstimmung des G/C-Gehalts ermöglicht das optimale Gleichgewicht zwischen Stabilität und der zusätzlichen Energie, die erforderlich ist, um die Stränge auseinander zu ziehen, wenn dies für die Replikation und Transkription erforderlich ist.