Warum gibt es sechs Leserahmen, wenn nur ein DNA-Strang als „kodierender Strang“ bezeichnet wird?

Wir müssen sechs Leserahmen berücksichtigen, wenn wir das Potenzial von DNA zur Codierung von Proteinen berücksichtigen (drei Rahmen für jeden Strang). Aber nur ein Strang wird in RNA umgeschrieben – der sogenannte kodierende Strang . Es scheint mir daher, dass eigentlich nur drei Leserahmen zu berücksichtigen sind. Warum beziehen sich die Leute dann auf sechs?

Ein weiterer Punkt in Bezug auf Leserahmen ist die Definition des Offenen Leserahmens – ORF . Ein Text definiert ORF als:

„Ein ORF ist eine kontinuierliche Reihe von Codons, die mit einem Startcodon (normalerweise AUG) beginnt und mit einem Stoppcodon endet.“

während ein anderer Text es als definiert

„Ein ORF ist eine kontinuierliche Reihe von Codons, die kein Stoppcodon enthalten (normalerweise UAA, UAG oder UGA)“

Die erste Definition scheint mir richtig zu sein. Welche ist die allgemein akzeptierte Definition für ORF?

Ich habe Ihre Frage bearbeitet, nicht nur um das Englisch zu korrigieren, sondern um es zu verdeutlichen. In gewisser Weise habe ich es so eingerichtet, dass ich (wenn ich einen Moment Zeit habe) eine Antwort geben kann, die auf die Quelle der Verwirrung hinweist (nicht nur Ihre, sondern auch die anderer). Das finde ich aber fair. Ich habe auch die Darstellung der beiden alternativen Definitionen des offenen Leserahmens verbessert (Sie sollten die Abkürzung ORF bei der ersten Verwendung definiert haben). Ich verstehe, warum Sie es getan haben, aber im Allgemeinen sollten Sie nicht zwei Fragen stellen erstens, weil es dazu führen kann, dass eine Antwort akzeptiert wird, die beide Teile nicht gut beantwortet.

Antworten (2)

Der kodierende Strang bezieht sich auf den DNA-Strang mit derselben Basenreihenfolge wie das RNA-Transkript für ein bestimmtes Gen. Da auf einem einzelnen DNA-Strang immer ein Gen vollständig vorhanden ist, sind in diesem Strang tatsächlich 3 Leserahmen möglich, von denen nur 1 tatsächlich die richtige Codon-Sequenz für dieses Gen enthält.

Wenn wir jedoch ein gesamtes Genom betrachten, ist es durchaus möglich, dass ein Gen auf einem Strang vorhanden ist und ein anderes Gen auf dem anderen vorhanden ist, was bedeutet, dass der codierende Strang für ein Gen der nicht codierende Strang für das andere ist. Aus diesem Grund gibt es 6 mögliche Leserahmen für das Genom als Ganzes, da beide Stränge Gene enthalten können (und tun).

Beim ORF scheinen beide Definitionen gebräuchlich zu sein . Im Zusammenhang mit dem Versuch, Gene durch die Suche nach langen ORFs zu entdecken, ist die erste Definition wahrscheinlich hilfreicher, da das Befolgen der zweiten Definition zu vielen falsch vorhergesagten Genen führen könnte (als extremes Beispiel eine Sequenz ohne lange Stoppcodons ohne Startcodons). beides würde als mögliches Gen angesehen werden, obwohl dies unmöglich sein sollte).

Danke Koen. Sie meinen bei der ersten Frage, dass sich einige Gene (codierende Gene? Ich bin mir nicht sicher) auf dem nicht codierenden Strang befinden, ja? Könnten Sie mir bitte ein Beispielgen nennen?
@Mary Es ist nicht so, dass sich Gene auf dem "nicht kodierenden Strang" befinden, sondern dass jeder Stand ein kodierender Strang sein kann. Stellen Sie sich ein Buch vor, das so angeordnet ist: Auf allen rechten Seiten wird der Text normal gedruckt, aber auf den linken Seiten wird ein anderer, nicht verwandter Text verkehrt herum gedruckt. Sie würden diese Seite als die "nicht lesende Seite" betrachten. Aber siehe da! Drehen Sie das Buch um 180 Grad und jetzt ist plötzlich die "Nicht-Leseseite" die Leseseite und umgekehrt. Beide Stränge können codierende Stränge sein, aber Sie müssen sie in die entgegengesetzte Richtung lesen .
@KoenvdH - Ich denke, Ihre Antwort ist richtig. Der Grund, warum ich selbst einen gepostet habe, war, mich darauf zu konzentrieren, was meiner Meinung nach die Ursachen für Verwirrung sind. Es ist ein Versuch, einen historischen Kontext zu geben, was ich aufgrund meiner, äh, Geschichte kann.
@David Hah Ich denke, Ihre Antwort ist weitaus besser, um die Terminologieverwirrung zu beseitigen.

Meiner Meinung nach spiegelt diese Frage zwei Dinge wider:

  1. Die Schwierigkeit, die Studenten haben, die historischen experimentellen Anliegen von Forschern in einem Gebiet, das heute gut verstanden wird, zu verstehen und wie es daher die Prägung neuer Fachbegriffe beeinflusst hat.
  2. Die Art und Weise, wie sich die Verwendung von Begriffen im Laufe der Zeit geändert hat, da alte Bedenken verschwinden und neue entstehen. So kann ein ursprünglich in einem bestimmten Sinne verwendeter Begriff später für etwas anderes übernommen worden sein, auch wenn dies nicht streng logisch erscheint.

Was ist ein Codierstrang?

Dies ist der springende Punkt der ersten Frage, und die Antwort lautet, dass der Begriff „Codierungsstrang“ ohne Kontext nichts bedeutet (oder zumindest mehrdeutig ist). Daher denke ich, dass das Poster einen Genomkontext annimmt , und das ist der Irrtum ihrer Argumentation.

Wenn man über den „kodierenden Strang“ eines DNA-Genoms spricht (oder denkt), geht man davon aus, dass viele DNA-Genome doppelsträngig sind, wenn man die beiden Stränge (z. B. eines kleinen DNA-Virus) trennt und eine konzeptionelle Übersetzung durchführt (entschlüsselte die DNA in Aminosäuren unter Verwendung eines genetischen Codes mit T statt U) ein Strang hätte alle Informationen für die Gene und der andere Strang hätte keine. Anders gesagt, Sie gehen davon aus, dass alle Gene im Genom die gleiche Richtung haben (Pfeilrichtung in einem Genomdiagramm, z. B. das von E. coli unten). Dies ist so gut wie nie der Fall. (Die einzigen Beispiele, die mir einfallen, sind die Genome von einzelsträngigen RNA-Viren.)

Abschnitt des E.coli-Genoms

Wenn Sie also den Begriff „codierender Strang“ verwenden, müssen Sie angeben, dass dies im Zusammenhang mit einem einzelnen Gen steht . Jeder DNA-Strang in einem Genom (z. B. E. coli ) enthält DNA-Abschnitte, die codieren, und einige, die im Sinne einer konzeptionellen Übersetzung nicht codieren. (Wenn Sie sich Papiere ansehen, die frühe Isolierungen von Genen beschreiben, werden Sie die Wörter „codierender Strang“ finden, die im Allgemeinen durch „des Gens“ qualifiziert sind.

Aber cDNA hat nur einen codierenden Strang …

Historisch war eines der Anliegen, eukaryotische cDNAs, DNA-Kopien von mRNAs, zu sequenzieren. Diese wären monocistronisch, dh kodieren für ein einzelnes Protein. Hier würde also ein Strang codieren und der andere nicht codieren. War es möglich, die Anzahl der Leserahmen, die in diesem Fall analysiert werden mussten, auf drei zu reduzieren? Nein! Die Tatsache, dass nur ein Strang kodiert, war überhaupt keine Hilfe, da es keine Möglichkeit gab, zu wissen, welcher dies in der zu sequenzierenden cDNA war. Ebenso für ein Fragment eines beliebigen Gens. Sie hatten ein Stück DNA sequenziert, in einen Plasmidvektor kloniert, und es gab keine Möglichkeit zu sagen, von welchem ​​Strang die ausgelesene Sequenz stammte. Daher müssen Sie es in allen sechs Leserahmen übersetzen, um potenzielle Aminosäuresequenzen zu finden.

Was ist also ein offener Leserahmen?

Offener Leserahmen ist ein Begriff, der heute oft anders verwendet wird als damals, als er geprägt wurde. Zu der Zeit, als es geprägt wurde, sequenzierte man kurze Abschnitte von cDNAs oder Virus- oder Bakteriengenen, und es bestand eine geringe Wahrscheinlichkeit, dass man bis zum C-Terminus, dh dem Stoppcodon des Gens, sequenzierte. Man wollte sich auf Leserahmen konzentrieren, die nicht durch Stoppcodons unterbrochen wurden. Diese ursprüngliche Verwendung spiegelt sich in der Definition von Open Reading Frame in Wikipedia wider:

„Ein ORF ist eine kontinuierliche Reihe von Codons, die kein Stoppcodon enthalten (normalerweise UAA, UAG oder UGA)“

Mit zunehmendem Wissen und verbesserter Technologie verlagerte sich der Fokus jedoch auf die Entdeckung von Genen im Genom oder in langen partiellen Genomsequenzen von Organismen. Jetzt arbeitete man mit langen DNA-Sequenzen, die viele ganze Gene enthielten. Der Schwerpunkt lag auf der Suche nach potenziellen Genen basierend auf Start- und Stop-Codons (und einer Cut-Off-Länge). Dies spiegelt sich in der Dokumentation für das EMBOSS-Programm wider, getorf :

„Ein ORF kann als eine Region mit einer bestimmten Mindestgröße zwischen zwei STOP-Codons oder zwischen einem START- und einem STOP-Codon definiert werden.“

Beachten Sie, dass selbst diese letzte Definition mehrdeutig ist.

Welches ist richtig? Das ist ein Anliegen der Studierenden. In der realen Welt muss man erkennen, dass sich die Bedeutung von Ausdrücken ändern kann. Wenn es – wie hier – Unklarheiten gibt , muss man die Art und Weise definieren, in der Sie den Ausdruck verwenden .