Soweit ich weiß, bilden mehrere DNA-Stränge ein Gen, wie kann es also für jedes Gen nur eine entsprechende RNA geben und umgekehrt? Ist mein Wissen falsch?
Nur sehr wenige Dinge sind in der Biologie so eindeutig. Hier sind vor allem drei Dinge zu beachten.
Die meisten eukaryotischen Gene sind gespleißt . Dies ist im Grunde ein Prozess, bei dem ein einzelnes Gen in mehrere verschiedene mRNAs transkribiert werden kann, von denen jede dann in ein anderes Protein übersetzt wird.
Daher besteht normalerweise (einige Gene werden nicht gespleißt) keine Eins-zu-Eins-Entsprechung zwischen einem Gen und den mRNAs, die es produzieren kann.
Das nächste Problem ist, dass einige Gene in mehreren, ähnlichen Kopien im Genom existieren. Bei solchen Genen ist es nicht immer möglich zu wissen, welches der Duplikate tatsächlich gelesen wurde, um eine bestimmte mRNA zu produzieren.
Es besteht daher nicht immer eine direkte Eins-zu-Eins-Entsprechung zwischen einer mRNA und dem Gen, von dem sie transkribiert wurde. Dies ist jedoch weitaus seltener als das oben erwähnte Spleißproblem und kann in den meisten Fällen ignoriert werden.
Jedes Gen befindet sich nur auf einem einzigen DNA-Strang. Ja, DNA ist doppelsträngig, aber jedes Gen befindet sich nur auf einem der beiden Stränge (der andere Strang ist das umgekehrte Komplement des Gens).
Trotz der oben genannten Punkte ist es tatsächlich normalerweise möglich, ein mRNA-Molekül dem Gen zuzuordnen, das es produziert hat. Bei doppelten Genen erhalten Sie nur mehrere Treffer. Die Programme, die für diese Art von Analyse existieren, können meistens mit dem Spleißen umgehen. Wenn Sie also beispielsweise die Sequenz des menschlichen Chromosoms 21 und die mRNA-Sequenz des ERG-Gens haben, können Sie Folgendes tun (auf einem *nix-System mit exonerate
installiertem):
exonerate -m coding2genome -t chr21.fasta -q dscam.fasta > out
Was wird produzieren:
Command line: [exonerate -m est2genome -n 1 -t chr21.fasta -q erg.fasta]
Hostname: [oregano]
C4 Alignment:
------------
Query: gi|609878487|ref|NM_001291391.1| Homo sapiens ERG, ETS transcription factor (ERG), transcript variant 8, mRNA
Target: gi|528476536|ref|NC_018932.2| Homo sapiens chromosome 21, alternate assembly CHM1_1.1, whole genome shotgun sequence:[revcomp]
Model: est2genome
Raw score: 7669
Query range: 0 -> 1546
Target range: 39594417 -> 39332536
1 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 54
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594417 : GTTTTCACTTGGTCGGAATGGGGAGAGTGTGCAAGAGATCGCTGCGGGACAGGT : 39594364
55 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 108
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39594363 : TCCTAGAGATCGCTCCGGGACGGTCGTGACGGCCCCCGAGGGACATGAGAGAAG : 39594310
109 : AGGAGCGGCGCTCAG >>>> Target Intron 1 >>>> GTTATTCCAG : 133
|||||||||||||||++ 76685 bp ++||||||||||
39594309 : AGGAGCGGCGCTCAGgt.........................agGTTATTCCAG : 39517600
134 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 187
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39517599 : GATCTTTGGAGACCCGAGGAAAGCCGTGTTGACCAAAAGCAAGACAAATGACTC : 39517546
188 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAG >>>> Target In : 226
||||||||||||||||||||||||||||||||||||||++ 9093
39517545 : ACAGAGAAAAAAGATGGCAGAACCAAGGGCAACTAAAGgt.............. : 39517505
227 : tron 2 >>>> CCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 266
bp ++|||||||||||||||||||||||||||||||||||||||||
39517504 : ...........agCCGTCAGGTTCTGAACAGCTGGTAGATGGGCTGGCTTACTG : 39508374
267 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAG >>>> Ta : 312
|||||||||||||||||||||||||||||||||||||||||||||++
39508373 : AAGGACATGATTCAGACTGTCCCGGACCCAGCAGCTCATATCAAGgt....... : 39508326
313 : rget Intron 3 >>>> GAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 345
130340 bp ++||||||||||||||||||||||||||||||||||
39508325 : ..................agGAAGCCTTATCAGTTGTGAGTGAGGACCAGTCGT : 39377955
346 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 399
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377954 : TGTTTGAGTGTGCCTACGGAACGCCACACCTGGCTAAGACAGAGATGACCGCGT : 39377901
400 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 453
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377900 : CCTCCTCCAGCGACTATGGACAGACTTCCAAGATGAGCCCACGCGTCCCTCAGC : 39377847
454 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 507
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39377846 : AGGATTGGCTGTCTCAACCCCCAGCCAGGGTCACCATCAAAATGGAATGTAACC : 39377793
508 : CTAGCCAGGTGAATGGCTCAAG >>>> Target Intron 4 >>>> GAA : 532
||||||||||||||||||||||++ 21741 bp ++|||
39377792 : CTAGCCAGGTGAATGGCTCAAGgt.........................agGAA : 39356027
533 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 586
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39356026 : CTCTCCTGATGAATGCAGTGTGGCCAAAGGCGGGAAGATGGTGGGCAGCCCAGA : 39355973
587 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 640
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39355972 : CACCGTTGGGATGAACTACGGCAGCTACATGGAGGAGAAGCACATGCCACCCCC : 39355919
641 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAG >>>> Target : 682
|||||||||||||||||||||||||||||||||||||||||++ 19
39355918 : AAACATGACCACGAACGAGCGCAGAGTTATCGTGCCAGCAGgt........... : 39355875
683 : Intron 5 >>>> ATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 719
698 bp ++||||||||||||||||||||||||||||||||||||||
39355874 : ..............agATCCTACGCTATGGAGTACAGACCATGTGCGGCAGTGG : 39336142
720 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 773
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336141 : CTGGAGTGGGCGGTGAAAGAATATGGCCTTCCAGACGTCAACATCTTGTTATTC : 39336088
774 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 827
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336087 : CAGAACATCGATGGGAAGGAACTGTGCAAGATGACCAAGGACGACTTCCAGAGG : 39336034
828 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 881
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39336033 : CTCACCCCCAGCTACAACGCCGACATCCTTCTCTCACATCTCCACTACCTCAGA : 39335980
882 : GAGA >>>> Target Intron 6 >>>> CTCCTCTTCCACATTTGACTT : 906
||||++ 867 bp ++|||||||||||||||||||||
39335979 : GAGAgt.........................agCTCCTCTTCCACATTTGACTT : 39335088
907 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 960
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39335087 : CAGATGATGTTGATAAAGCCTTACAAAACTCTCCACGGTTAATGCATGCTAGAA : 39335034
961 : ACACAG >>>> Target Intron 7 >>>> GGGGTGCAGCTTTTATTTT : 985
||||||++ 1911 bp ++|||||||||||||||||||
39335033 : ACACAGgt.........................agGGGGTGCAGCTTTTATTTT : 39333098
986 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 1039
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333097 : CCCAAATACTTCAGTATATCCTGAAGCTACGCAAAGAATTACAACTAGGCCAGG : 39333044
1040 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 1093
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39333043 : TACGAAAACACCCCTGTGTGATCTCTTCATTGAGAGACATCCCAGATGTCCTGC : 39332990
1094 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 1147
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332989 : TGAGATCCGTGCCCTAAGTCACGTGATACAAAGAGAGCTGATCCCGGAGCTGAA : 39332936
1148 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 1201
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332935 : GCCAGTCCCAGACAGTCTTATTCTGCCTCTGTTGATTTGGAGACTAAATCCACT : 39332882
1202 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 1255
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332881 : CAAACCATTTCATTCAAAGACCACACTAAAGGAATTAAGAGCAGATTAGCCCTT : 39332828
1256 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 1309
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332827 : TAACTAGCTTTTCAGAAAGACAGATGGGCAAAGAAGGCATCCTGGATGCCTGGC : 39332774
1310 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 1363
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332773 : AGTTAGGAATAGGCCGACTTTTGAACTAACAGAAGGATCTGTCCCTCCTCGGGG : 39332720
1364 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 1417
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332719 : GAAGAGCACAAAACAAGGACACTCCCCAGATTCACAGTGACCGATTATCAGTAT : 39332666
1418 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 1471
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332665 : GTCACAAGAAGCCAGTCTTGCAGAGCAGAAGCATGCAACCAGTAGTATTTACAT : 39332612
1472 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 1525
||||||||||||||||||||||||||||||||||||||||||||||||||||||
39332611 : CTGAATCTTACTGCCTGTCCTCCAAATGATTTAATTAGGTAATAAATTTACATG : 39332558
1526 : CCATTCATGCAAAAAAAAAAA : 1546
||||||||||||||| ||| |
39332557 : CCATTCATGCAAAAATAAACA : 39332537
vulgar: gi|609878487|ref|NM_001291391.1| 0 1546 + gi|528476536|ref|NC_018932.2| 39594417 39332536 - 7669 M 123 123 5 0 2 I 0 76681 3 0 2 M 102 102 5 0 2 I 0 9089 3 0 2 M 86 86 5 0 2 I 0 130336 3 0 2 M 218 218 5 0 2 I 0 21737 3 0 2 M 152 152 5 0 2 I 0 19694 3 0 2 M 204 204 5 0 2 I 0 863 3 0 2 M 81 81 5 0 2 I 0 1907 3 0 2 M 580 580
-- completed exonerate analysis
Alternativ können Sie eine Online-Ressource wie die BLAT-Seite der UCSC verwenden, um die mRNA mit dem Genom abzugleichen. Sie können die Ergebnisse hier und im Bild unten sehen:
Wie Sie sehen können, überlappt unsere Abfrage-mRNA-Sequenz (NM_001291391.1) perfekt mit dem ERC-Gen.
Es gibt keine Eins-zu-Eins-Entsprechung zwischen RNA und Genen, aber nicht so sehr aus dem Grund, den Sie im Sinn zu haben scheinen (obwohl ich nicht sicher bin, was Sie im Sinn haben).
Sie sollten den Wikipedia-Artikel über RNA-Spleißen lesen , er wird Ihnen viel beibringen, was Sie brauchen, um zu der Antwort zu gelangen, nach der Sie vielleicht suchen.
Vielleicht möchten Sie auch an einem Einführungskurs wie der Serie DNA to RNA to Protein der Khan Academy teilnehmen .
Vance L. Albaugh
Tyto alba
StarckOverflar
Terdon