Ich habe mit dem SSRLocator-Programm einige SSR-Wiederholungen auf dem interessierenden Gen vorhergesagt, wobei das Ergebnis eine Frage für mich aufwirft. Bitte beachten Sie die folgende Sequenz, die Teil der interessierenden Gensequenz (kodierende Sequenz) ist:
GGTGATGAGGTAGAGGAAGAGGCTGAGGAACCCTACGAAGAAGCCACAGA GAGAACCACCAGCATTG CCACCACCACCACCACCACCA CAGAGTCTGTGG AAGAGGTGGTTCGAGAGGTGTGCTCTGAACAAGCCGAGACGGGGCCGTGC
Das Programm meldete das CCA-Motiv als Wiederholung; Da sich diese Wiederholung auf CDS befindet, erwartete ich, die verwandte Aminosäurespur (Prolin) zu finden, aber ich beobachtete die Threoninspur in der entsprechenden Proteinsequenz. Threonin wird von ACC codiert. Jetzt würde ich gerne wissen, welches Motiv wirklich ein Rapport ist, CCA oder ACC. Ist es möglich, CCA als Wiederholung zu betrachten, aber nur auf Transkriptebene, nicht als Proteinsequenz, oder die echte Wiederholung ist ACC und die Software hat hier nicht gut funktioniert? Bitte teilen Sie mir Ihre diesbezügliche Meinung mit.
Vielen Dank für Ihre Hilfe und Teilnahme.
SSR-Suchwerkzeuge haben im Allgemeinen keine Ahnung von CDS: Sie betrachten DNA/RNA-Sequenzen als Zeichenfolgen und suchen nach sich wiederholenden Mustern, sonst nichts. Es ist auch wichtig, sich daran zu erinnern, dass in vielen realen Fällen verschiedene Programme mit unterschiedlichen Einstellungen unterschiedliche Ergebnisse liefern.
[Da man weiß, dass man immer zwei Stränge in der genomischen DNA hat, muss man bedenken, dass auch SSRs in beide Richtungen "gelesen" werden können, so dass für einen Abschnitt die Einheit als oder ACCACCACC
angegeben werden kann . Einige Programme melden standardmäßig nach Alphabet sortierte SSR-Einheiten: in diesem Fall. Bei kodierenden Sequenzen ist die Geschichte etwas anders: RNA hat nur einen Strang, dh sie hat eine Richtung, was bedeutet, dass Sie RNA-Sequenzen nicht "umdrehen" können.]ACC
GGT
ACC
mRNA hat nicht nur eine Richtung, sondern kodiert auch für Proteine, wobei die Proteinsequenzen manchmal ihre eigenen sich wiederholenden Muster zeigen. SSRs in mRNA sind meistens Trinukleotide oder mit durch drei teilbaren Einheitslängen und fallen mit den Tandem-Aminosäure-Wiederholungen zusammen. Aus funktioneller Sicht handelt es sich also um eine Wiederholung ACC|ACC|ACC|ACC|ACC|ACC|ACA
(beachten Sie, dass das letzte Element ) ist , die für die jeweilige Aminosäurewiederholung ACA
kodiert . T|T|T|T|T|T|T
Um diese Idee zu formalisieren, suchen Sie nach SSRs in der RNA-Sequenz und in der Proteinsequenz und versuchen, die Überlappung zu finden.
Aus Sicht der DNA-Polymerase [dem Enzym, das die SSR-Länge verändert] handelt es sich um eine perfekte CCACCACCACCACCACCACCA
Wiederholung: Innerhalb dieser Grenzen neigt das Fragment zum Verrutschen . Aber für ein tatsächliches Schlupfereignis spielt die Einheitsgrenze keine Rolle. Stellen Sie sich vor, die Polymerase "überspringt" eine CAC
Einheit in der Mitte: CCACCAC[CAC]CACCACCACCA
. Das Ergebnis für die Proteinsequenz wird dasselbe sein: minus ein Threonin.
Maria
alephreisch
AGC
,GCA
oderCAG
es wird gemeldetAGC
.Maria
alephreisch
alephreisch
CCACCACCACCACCACCACCAC
.