Unterschied zwischen CDS und cDNA

Was ist der Unterschied zwischen codierenden Sequenzen (CDS) und cDNA?

Sind codierende Sequenzen die Sequenzen, die in mRNA und cDNA transkribiert werden, im Gegensatz zu DNA, die durch reverse Polymerisation von gereifter mRNA erhalten wird?

Antworten (2)

Der Unterschied läuft auf UnTranslated Regions hinaus . Eine CDS oder kodierende Sequenz ist der Teil eines Transkripts, der tatsächlich in Protein übersetzt wird. Daher beginnt ein CDS (fast) immer mit einem AUG-Codon und endet bei einem der drei STOP-Codons (UAA, UGA, UAG).

Das Transkript jedoch (beachten Sie, dass ich mich auf reife Transkripte beziehe, die bereits gespleißt wurden, sodass Introns entfernt wurden) enthält auch die UTRs, die nicht tatsächlich in Protein übersetzt werden. Eine cDNA-Sequenz wird aus dem Transkript durch reverse Transkription abgeleitet und enthält daher auch die 5'- und 3'-UTRs. Sehen Sie sich zum Beispiel dieses schematische Diagramm eines ungespleißten Transkripts an:

Geben Sie hier die Bildbeschreibung ein

Die CDS des oben abgebildeten Gens enthält nur das ATG, das STOP und die beiden grünen Regionen (Exons). Die cDNA enthält all das und zusätzlich die beiden UTRs. Natürlich werden sowohl die cDNA als auch die CDS die Introns nicht enthalten.

Tatsächlich umfassen Exons 5' UTR, CDS und 3'UTR. Und CDS sollte kein STOP-Codon enthalten, da es nicht in eine Aminosäure übersetzt wird. Ihr Diagramm ist nicht sehr genau, wo Sie Exon 1 und Exon 2 zeichnen.
@olala, das ist nur ein einfaches Diagramm, um die Existenz von UTRs zu veranschaulichen. Ja, natürlich sind sie exonisch, aber das ist hier nicht wirklich relevant. Was das CDS betrifft, nein, es enthält auch das Stoppcodon. Erstens, weil die Stopps von spezifischen tRNAs erkannt werden, genau wie jedes andere Codon, und weil dies die Konvention auf diesem Gebiet ist. Siehe zum Beispiel das hier beschriebene CDS: p53.iarc.fr/p53Sequence.aspx
Ich muss CDS widersprechen und Codon stoppen. Wenn Sie sich die Anmerkungen im GTF-Format ansehen, haben sie das Stoppcodon getrennt von CDS aufgelistet. Siehe ein Beispiel aus diesem Beitrag unten auf der Seite: mblab.wustl.edu/GTF22.html , siehe auch die Antwort von Istvan auf biostars.org/ p/65162

Die Definition der Codierungssequenz ist meiner Meinung nach etwas verwirrend. Es ist tatsächlich die DNA-Sequenz im Gen, die dieselbe Sequenz wie die entsprechende mRNA hat (außer dass sie T anstelle von U hat). Nun werden Sie oft Definitionen sehen, die besagen, dass die codierende Sequenz die DNA ist, die transkribiert wird, aber das ist nicht wirklich korrekt, da die RNA-Polymerase während der Transkription tatsächlich den anderen Strang der DNA (dh den, der ist) kopiert (transkribiert). komplementär zur codierenden Sequenz). Und ich würde noch einen Schritt weiter gehen und sagen, dass die kodierende Sequenz Introns ausschließt. Sie könnten sich auch auf den Codierungsstrang beziehender DNA, um die gesamte Transkriptionseinheit einschließlich Introns zu umfassen, um sich auf den Strang zu beziehen, der die codierende Sequenz trägt.

Sie haben Recht mit Ihrer Definition von cDNA (mit Ausnahme der reversen Transkription, nicht der reversen Polymerisation). Die cDNA-Sequenz in voller Länge für ein Protein-kodierendes Gen umfasst die CDS, aber, wie @terdon in seinem Kommentar betont, auch untranslatierte Regionen an den 5'- und 3'-Enden.

der Unterschied in der Sequenz zu einem gegebenen Gen unter seinen CDS und cDNA wäre also?
Die CDS-Sequenz ist nicht identisch mit der cDNA-Sequenz. Dies gilt nur für Gene ohne UTR-Regionen.
Ja, @terdon hat Recht - ich bin so proteinorientiert, dass ich das übersehen habe. Die cDNA-Sequenz umfasst also die CDS. Wird der Antwort eine Korrektur hinzufügen.