Gibt es eine Standardmethode, um die Proteinsequenzlänge von der Gen-DNA-Sequenzlänge des dafür codierenden Gens abzuleiten?
Naiverweise hatte ich angenommen, dass amino_acid_seq_length / 3 -1
(Löschen eines für das Stoppcodon) funktionieren sollte, aber anscheinend nicht immer. Gibt es einen besseren Weg?
Nehmen wir an, das Gen ist eukaryotisch, speziell ein Pflanzengen.
z.B
Oder
Wenn Sie sich die DNA-Sequenz im Patent ansehen , werden Sie sehen, dass sie nicht mit ATG beginnt und nicht mit einem Stoppcodon endet. Die offenbarte Sequenz enthält einige zusätzliche Basen, daher die Diskrepanz in Protein- und DNA-Länge. Diese zusätzlichen Basen kommen fast immer in cDNA vor, z. B. aufgrund von Polyadenylierung, Kozak-Sequenzen usw.
Wissenschaftler
neugierige_katze
Wissenschaftler