Warum sollte es innerhalb eines Gens in RNA-Seq-Daten einen Anstieg der Abdeckung geben? [geschlossen]

Ich schaue mir RNA-Seq-Daten in Geneious für Salmonella typhimurium an und sehe gelegentlich eine Spitze in der Abdeckung für eine RNA-Sequenz innerhalb eines Gens. Warum scheint ein Abschnitt des Gens viel häufiger transkribiert zu werden als jeder andere Teil davon? Der Name des fraglichen Gens ist ftsI, das ein essentielles Zellteilungsprotein ist, das stromaufwärts gelegene zytoplasmatische Zellteilungsproteine ​​mit stromabwärts gelegenen periplasmatischen Zellteilungsproteinen verbinden kann.

Willkommen bei SE Biologie. Ihre Frage scheint möglicherweise akzeptabel zu sein, erfordert jedoch einige Änderungen, bevor Sie wahrscheinlich eine Antwort erhalten. In der Zwischenzeit riskiert er die Entfernung als "unklar, was Sie meinen". Zuerst hatte ich keine Ahnung, was genial war. Sie sollten proprietäre Software groß schreiben und angeben, was es ist. Noch wichtiger ist, dass Sie ein Bild des Peaks einfügen, den Sie sehen, und angeben, um welchen Organismus es sich handelt. Es kann nicht erwartet werden, dass wir wissen, was ftsl ist, und CDS ist nicht der Name eines Gens, sondern ein Akronym für „kodierende Sequenz“. Bitte bearbeiten Sie es.

Antworten (2)

Ohne zu wissen, wie Ihre Bibliotheken hergestellt und sequenziert wurden, ist es schwer zu sagen, ob dies auf eine technische oder biologische Quelle zurückzuführen ist.

Es gibt jedoch einige Verzerrungsquellen in der RNA-Seq (die bei der DNA-Seq kein Problem darstellen).

Eine davon ist, dass, wenn Sie ein "Random-Hexamer" -Protokoll verwenden, diese bekanntermaßen doch nicht so zufällig sind. Siehe: Hansen KD, Brenner SE, Dudoit S. Biases in Illumina Transkriptom-Sequenzierung verursacht durch zufälliges Hexamer-Priming. Nukleinsäuren res. 2010;38:e131.

Sie könnten auch eine Kontamination von anderen Arten haben, die eine genauere Sequenzidentität für diesen Teil darstellen würde.

Einige Regionen können in den Sequenzierungsdaten häufiger vorhanden sein als andere, da einige Exons möglicherweise häufiger im reifen Transkript enthalten sind (alternatives Spleißen). Überprüfen Sie, ob die Peaks mit Exons übereinstimmen. Bearbeiten: Dies wird wahrscheinlich nicht der Fall sein, da Sie es mit Bakterien zu tun haben: Soweit ich weiß, ist Spleißen bei Bakterien sehr ungewöhnlich

Eine andere wahrscheinliche Erklärung könnte sein, dass während der Bibliotheksvorbereitung oder -sequenzierung Verzerrungen auftreten.

In beiden Szenarien wären die Verzerrungen posttranskriptionell.

Eine weitere Möglichkeit wäre, dass andere Transkriptionseinheiten in Ihrem interessierenden Gen vorhanden sind. Dies kommt manchmal vor, besonders wenn es um kompakte Genome geht.

Salmonella hätte keine Exons/Introns.
@emilliman5 In der Tat hatte ich nicht berücksichtigt, dass die Frage des Posters ein Bakterium beinhaltete.