Diese Sequenzdaten (DNA) haben sehr wenige Methionin-Starts. Wie ist das möglich?

Ich arbeite an meinem ersten sequenzierungsbezogenen Projekt und versuche, Proteine ​​mit einer bestimmten PFAM-ID ( PF11999 ) zu finden. Das Projekt heißt "MMETSP", ich habe die Annotationen nach dieser ID durchsucht, Signalpeptide mit SignalP identifiziert und ihre Zielorte mit einem Tool namens MultiLoc2 (ich habe nur nach extrazellulären Zielen gesucht).

Von den sehr wenigen Sequenzen, die nach all dieser Filterung übrig blieben, begann keines der DNA-Bits mit dem Basenpaar-Code "ATG", für Methionin. Wie kann das sein?

Ich habe die Shell verwendet, um zu berechnen, dass nur 1,83% aller Sequenzen mit ATG beginnen.
Irgendwelche Ideen dazu?

Welche Sequenzen suchen Sie genau?
Ich suche Frostschutzproteine ​​(PF11999) in marinen Diatomeen, die sich im extrazellulären Bereich befinden. Unter Verwendung der von SignalP bereitgestellten Spaltungsstelle kann ich das Targeting-Peptid isolieren. Diese Peptide scheinen jedoch keinen "Start"-Code zu haben. Ich habe die Sequenzen erhalten, indem ich die Protein-IDs in den Fasta-Dateien nachgeschlagen habe, die ich aus der Annotationssuche erhalten habe.
Sie sehen sich also nur die gespaltene Peptidsequenz an? Es gibt keinen Grund, warum diese mit einem Methionin beginnen müssen, es sei denn, sie sind vom Typ I und erhalten keine weitere N-terminale Verarbeitung.
Nun, ich schaue mir die DNA an, die das Peptid kodiert. Das Peptid befindet sich vor dem "mütterlichen" Protein, also sollte der ORF mit einem Methionin beginnen, oder?
Wenn es in dieser Art keine UTRs gibt und die CDS in voller Länge annotiert ist, dann ja. Sonst nein.
Dann sollte es ja sein. Ich werde Montag mit meinem Vorgesetzten sprechen. Vielen Dank für Ihre Zeit!

Antworten (1)

Wenn jemand über diese Frage stolpert, habe ich am Ende herausgefunden, was das Problem war:
Entgegen meiner Annahme, dass die DNA-Sequenzen alle in der richtigen 5'3'-Richtung waren, stellte sich heraus, dass wir den genauen ORF auf dem komplementären Strang fanden in die andere Richtung und wer weiß wo noch. Glücklicherweise enthielten die MMETSP-Daten auch ein /pep-Verzeichnis, in dem die benötigten Sequenzen in einer sauberen Version gefunden wurden. Danke fürs Lesen und viel Glück.