Ich schaue mir RNA-Seq-Daten in Geneious für Salmonella typhimurium an und sehe gelegentlich eine Spitze in der Abdeckung für eine RNA-Sequenz innerhalb eines Gens. Warum scheint ein Abschnitt des Gens viel häufiger transkribiert zu werden als jeder andere Teil davon? Der Name des fraglichen Gens ist ftsI, das ein essentielles Zellteilungsprotein ist, das stromaufwärts gelegene zytoplasmatische Zellteilungsproteine mit stromabwärts gelegenen periplasmatischen Zellteilungsproteinen verbinden kann.
Ohne zu wissen, wie Ihre Bibliotheken hergestellt und sequenziert wurden, ist es schwer zu sagen, ob dies auf eine technische oder biologische Quelle zurückzuführen ist.
Es gibt jedoch einige Verzerrungsquellen in der RNA-Seq (die bei der DNA-Seq kein Problem darstellen).
Eine davon ist, dass, wenn Sie ein "Random-Hexamer" -Protokoll verwenden, diese bekanntermaßen doch nicht so zufällig sind. Siehe: Hansen KD, Brenner SE, Dudoit S. Biases in Illumina Transkriptom-Sequenzierung verursacht durch zufälliges Hexamer-Priming. Nukleinsäuren res. 2010;38:e131.
Sie könnten auch eine Kontamination von anderen Arten haben, die eine genauere Sequenzidentität für diesen Teil darstellen würde.
Einige Regionen können in den Sequenzierungsdaten häufiger vorhanden sein als andere, da einige Exons möglicherweise häufiger im reifen Transkript enthalten sind (alternatives Spleißen). Überprüfen Sie, ob die Peaks mit Exons übereinstimmen. Bearbeiten: Dies wird wahrscheinlich nicht der Fall sein, da Sie es mit Bakterien zu tun haben: Soweit ich weiß, ist Spleißen bei Bakterien sehr ungewöhnlich
Eine andere wahrscheinliche Erklärung könnte sein, dass während der Bibliotheksvorbereitung oder -sequenzierung Verzerrungen auftreten.
In beiden Szenarien wären die Verzerrungen posttranskriptionell.
Eine weitere Möglichkeit wäre, dass andere Transkriptionseinheiten in Ihrem interessierenden Gen vorhanden sind. Dies kommt manchmal vor, besonders wenn es um kompakte Genome geht.
David