Wir müssen sechs Leserahmen berücksichtigen, wenn wir das Potenzial von DNA zur Codierung von Proteinen berücksichtigen (drei Rahmen für jeden Strang). Aber nur ein Strang wird in RNA umgeschrieben – der sogenannte kodierende Strang . Es scheint mir daher, dass eigentlich nur drei Leserahmen zu berücksichtigen sind. Warum beziehen sich die Leute dann auf sechs?
Ein weiterer Punkt in Bezug auf Leserahmen ist die Definition des Offenen Leserahmens – ORF . Ein Text definiert ORF als:
„Ein ORF ist eine kontinuierliche Reihe von Codons, die mit einem Startcodon (normalerweise AUG) beginnt und mit einem Stoppcodon endet.“
während ein anderer Text es als definiert
„Ein ORF ist eine kontinuierliche Reihe von Codons, die kein Stoppcodon enthalten (normalerweise UAA, UAG oder UGA)“
Die erste Definition scheint mir richtig zu sein. Welche ist die allgemein akzeptierte Definition für ORF?
Der kodierende Strang bezieht sich auf den DNA-Strang mit derselben Basenreihenfolge wie das RNA-Transkript für ein bestimmtes Gen. Da auf einem einzelnen DNA-Strang immer ein Gen vollständig vorhanden ist, sind in diesem Strang tatsächlich 3 Leserahmen möglich, von denen nur 1 tatsächlich die richtige Codon-Sequenz für dieses Gen enthält.
Wenn wir jedoch ein gesamtes Genom betrachten, ist es durchaus möglich, dass ein Gen auf einem Strang vorhanden ist und ein anderes Gen auf dem anderen vorhanden ist, was bedeutet, dass der codierende Strang für ein Gen der nicht codierende Strang für das andere ist. Aus diesem Grund gibt es 6 mögliche Leserahmen für das Genom als Ganzes, da beide Stränge Gene enthalten können (und tun).
Beim ORF scheinen beide Definitionen gebräuchlich zu sein . Im Zusammenhang mit dem Versuch, Gene durch die Suche nach langen ORFs zu entdecken, ist die erste Definition wahrscheinlich hilfreicher, da das Befolgen der zweiten Definition zu vielen falsch vorhergesagten Genen führen könnte (als extremes Beispiel eine Sequenz ohne lange Stoppcodons ohne Startcodons). beides würde als mögliches Gen angesehen werden, obwohl dies unmöglich sein sollte).
Meiner Meinung nach spiegelt diese Frage zwei Dinge wider:
Was ist ein Codierstrang?
Dies ist der springende Punkt der ersten Frage, und die Antwort lautet, dass der Begriff „Codierungsstrang“ ohne Kontext nichts bedeutet (oder zumindest mehrdeutig ist). Daher denke ich, dass das Poster einen Genomkontext annimmt , und das ist der Irrtum ihrer Argumentation.
Wenn man über den „kodierenden Strang“ eines DNA-Genoms spricht (oder denkt), geht man davon aus, dass viele DNA-Genome doppelsträngig sind, wenn man die beiden Stränge (z. B. eines kleinen DNA-Virus) trennt und eine konzeptionelle Übersetzung durchführt (entschlüsselte die DNA in Aminosäuren unter Verwendung eines genetischen Codes mit T statt U) ein Strang hätte alle Informationen für die Gene und der andere Strang hätte keine. Anders gesagt, Sie gehen davon aus, dass alle Gene im Genom die gleiche Richtung haben (Pfeilrichtung in einem Genomdiagramm, z. B. das von E. coli unten). Dies ist so gut wie nie der Fall. (Die einzigen Beispiele, die mir einfallen, sind die Genome von einzelsträngigen RNA-Viren.)
Wenn Sie also den Begriff „codierender Strang“ verwenden, müssen Sie angeben, dass dies im Zusammenhang mit einem einzelnen Gen steht . Jeder DNA-Strang in einem Genom (z. B. E. coli ) enthält DNA-Abschnitte, die codieren, und einige, die im Sinne einer konzeptionellen Übersetzung nicht codieren. (Wenn Sie sich Papiere ansehen, die frühe Isolierungen von Genen beschreiben, werden Sie die Wörter „codierender Strang“ finden, die im Allgemeinen durch „des Gens“ qualifiziert sind.
Aber cDNA hat nur einen codierenden Strang …
Historisch war eines der Anliegen, eukaryotische cDNAs, DNA-Kopien von mRNAs, zu sequenzieren. Diese wären monocistronisch, dh kodieren für ein einzelnes Protein. Hier würde also ein Strang codieren und der andere nicht codieren. War es möglich, die Anzahl der Leserahmen, die in diesem Fall analysiert werden mussten, auf drei zu reduzieren? Nein! Die Tatsache, dass nur ein Strang kodiert, war überhaupt keine Hilfe, da es keine Möglichkeit gab, zu wissen, welcher dies in der zu sequenzierenden cDNA war. Ebenso für ein Fragment eines beliebigen Gens. Sie hatten ein Stück DNA sequenziert, in einen Plasmidvektor kloniert, und es gab keine Möglichkeit zu sagen, von welchem Strang die ausgelesene Sequenz stammte. Daher müssen Sie es in allen sechs Leserahmen übersetzen, um potenzielle Aminosäuresequenzen zu finden.
Was ist also ein offener Leserahmen?
Offener Leserahmen ist ein Begriff, der heute oft anders verwendet wird als damals, als er geprägt wurde. Zu der Zeit, als es geprägt wurde, sequenzierte man kurze Abschnitte von cDNAs oder Virus- oder Bakteriengenen, und es bestand eine geringe Wahrscheinlichkeit, dass man bis zum C-Terminus, dh dem Stoppcodon des Gens, sequenzierte. Man wollte sich auf Leserahmen konzentrieren, die nicht durch Stoppcodons unterbrochen wurden. Diese ursprüngliche Verwendung spiegelt sich in der Definition von Open Reading Frame in Wikipedia wider:
„Ein ORF ist eine kontinuierliche Reihe von Codons, die kein Stoppcodon enthalten (normalerweise UAA, UAG oder UGA)“
Mit zunehmendem Wissen und verbesserter Technologie verlagerte sich der Fokus jedoch auf die Entdeckung von Genen im Genom oder in langen partiellen Genomsequenzen von Organismen. Jetzt arbeitete man mit langen DNA-Sequenzen, die viele ganze Gene enthielten. Der Schwerpunkt lag auf der Suche nach potenziellen Genen basierend auf Start- und Stop-Codons (und einer Cut-Off-Länge). Dies spiegelt sich in der Dokumentation für das EMBOSS-Programm wider, getorf :
„Ein ORF kann als eine Region mit einer bestimmten Mindestgröße zwischen zwei STOP-Codons oder zwischen einem START- und einem STOP-Codon definiert werden.“
Beachten Sie, dass selbst diese letzte Definition mehrdeutig ist.
Welches ist richtig? Das ist ein Anliegen der Studierenden. In der realen Welt muss man erkennen, dass sich die Bedeutung von Ausdrücken ändern kann. Wenn es – wie hier – Unklarheiten gibt , muss man die Art und Weise definieren, in der Sie den Ausdruck verwenden .
David