Bioinformatik-Tool zum "paarweisen Alignment" komplementärer Sequenzen?

Ich arbeite derzeit an einer Ribozymbindung und suche nach einem Werkzeug, das im Wesentlichen die Regionen des Komplementaritätsgrades in zwei Sequenzen analysiert, um die Bindungseffizienz zu extrapolieren. Nachdem ich darüber nachgedacht habe, suche ich im Wesentlichen nach dem "Gegenteil" von BLAST, indem BLAST nach Regionen mit Ähnlichkeit in Sequenzen in derselben Orientierung sucht, während ich nach Regionen mit Komplementarität in Sequenzen in der entgegengesetzten Orientierung suche.

Gibt es ein solches Tool?

BEARBEITEN 1

Zur Verdeutlichung suche ich nach einem Werkzeug, das die optimalsten Komplementaritätsregionen in zwei Sequenzen erkennen kann, wenn beide als solche ausgerichtet sind:

5' TCGAAUAACTCGTCUGAGUCGCUGAAAUGCGACGAAACCGTTAACGGA 3'

3' GTTTTACGCAAAGCACGGTAAAGTCGCTGAGTAGTCACTTTAATGAC 5'

Das Gegenteil? Sie meinen Regionen mit geringer Ähnlichkeit oder tatsächlich komplementär? Wenn letzteres der Fall ist, verwenden Sie einfach übersetzte Explosionsaromen. Wenn Sie zur Verdeutlichung eine Beispielsequenz posten, sollte ich Ihnen eine genaue Antwort geben können.
Entschuldigung für die Verwirrung: Suche nach Regionen mit hoher Komplementarität. Werde die Frage gleich bearbeiten.

Antworten (3)

Ich bin mir nicht sicher, ob Sie das brauchen, da die von Ihnen geposteten Sequenzen meines Wissens nicht wirklich komplementär sind. Es ist jedoch exonerateeines der leistungsstärksten Tools auf dem Markt und kann dies auch tun. Verwenden Sie diese Sequenzen als Beispiele:

>Abfrage TAGCTTATTGATGGGAGGAGAGTTCCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGCCCAGG
>Ziel CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGTCTGTTATGTGCACGTACTCTCCTCCCCTCAATAAGCTA

Und dieser Befehl (sollte auf einem *nix-System ausgeführt werden):

exonerate -m coding2coding -q qq.fa -t test.fa -s 0

Ich bekomme diese Ausgabe:

C4 Alignment:
------------
         Query: query [revcomp]
        Target: target
         Model: genome2genome
     Raw score: 312
   Query range: 71 -> 0
  Target range: 0 -> 70

 71 :                                                          CCA       :  6
      CCTGGGCTTCCTGCAGTCTGGGACAGCCAAGGTCTGTCATGTGCACGGACTCTCCTCProTCAATA
      |||||||||||||||||||||||||||||| |||||| ||||||||| |||||||||||+||||||
      CCTGGGCTTCCTGCAGTCTGGGACAGCCAA-GTCTGTTATGTGCACGTACTCTCCTCProTCAATA
  1 :                                                          CCC       : 65

  5 : AGCTA :  1
      |||||
 66 : AGCTA : 70

vulgar: query 71 0 - target 0 70 + 312 M 30 30 G 1 0 M 26 26 C 3 3 M 11 11

C4 Alignment:
------------
         Query: query
        Target: target [revcomp]
         Model: genome2genome
     Raw score: 309
   Query range: 0 -> 71
  Target range: 70 -> 0

  1 :                      GTC                                           : 66
      TAGCTTATTGATGGGAGGAGAValCGTGCACATGACAGACCTTGGCTGTCCCAGACTGCAGGAAGC
      ||||||||||| |||||||||||+||||||||| ||||| ||||||||||||||||||||||||||
      TAGCTTATTGAGGGGAGGAGAValCGTGCACATAACAGA-CTTGGCTGTCCCAGACTGCAGGAAGC
 70 :                      GTA                                           :  6

 67 : CCAGG : 71
      |||||
  5 : CCAGG :  1

vulgar: query 0 71 + target 70 0 - 309 M 21 21 C 3 3 M 15 15 G 1 0 M 31 31

Grundsätzlich gibt es Ihnen zwei Ausrichtungen, eine liest das Ziel 3->5 und die Abfrage 5->3 und eine umgekehrt.

Alternativ könnten Sie eine übersetzte Blast-Suche durchführen, tBLASTx, die sowohl die Ziel- als auch die Abfragesequenz übersetzt und so komplementäre Regionen finden sollte.

Hast du dir da deine geholt? Ich habe es gerade installiert und andere Ergebnisse erhalten. Einiges davon ist visuell (AA-Namen, 1- versus 0-basierte Indizierung), aber die Punktzahlen sind ziemlich unterschiedlich.
@Amory Ich verwende die aus den Debian-Repos, v. 2.2.0. Ja, die Seite, auf die Sie verlinkt haben, ist die Homepage, also vermute ich, dass Sie gerade eine neuere Version haben und sie den Algorithmus ein wenig geändert haben. Vielleicht eine andere Bewertungsmatrix. In jedem Fall ist die Punktzahl hier irrelevant, da sie direkt von der Länge der Sequenz abhängt.
@terdon Würde beim zweiten Gedanken eine regelmäßige paarweise Ausrichtung mit der umgekehrten Ergänzung von nur den Sequenzen das gleiche Ergebnis liefern?
@LanceLafontaine wahrscheinlich, aber es wird langsamer und vielleicht weniger genau sein. Wenn Sie nach möglicherweise komplementären Sequenzen suchen, die aneinander binden können, würde ich eher etwas wie Exonerate oder Blast als einen Sequence Aligner verwenden.
@terdon: Ich verstehe nicht, warum du tblast vorgeschlagen hast. Übersetzung hat nichts mit Komplementarität zu tun.
@WYSIWYG Ich habe tBLASTx empfohlen. tBLASTx translatiert Eingabesequenzen in allen 6 Rahmen, die den --Strang einschließen, der das umgekehrte Komplement des +-Strangs ist. Daher kann es verwendet werden, um komplementäre Sequenzen zu finden, da die 5'->3'-Translation des Plus-Strangs die 3'->5'-Translation des --Strangs sein wird.
Ja, aber dasselbe Translationsprodukt kann mit unterschiedlichen Codons entstehen, und daher können Sie die Komplementarität nicht beurteilen.
@WYSIWYG in der Tat, ich bin nur sehr an übersetzte Explosionssuchen gewöhnt, und es war das erste, woran ich dachte, weil sie auch eine schwächere Komplementarität aufweisen werden. Da sich die meisten homonymen Codons nur in der Wobble-Position ändern, können Sie die Komplementarität aufgrund der Redundanz des Codes möglicherweise leichter erkennen. Auf jeden Fall exoneratewar mein erster Vorschlag, und ich stimme zu, dass Ihre einfache Nukleotidexplosion wahrscheinlich besser ist als Übersetzungen.

Sie könnten versuchen, ein Tool zu verwenden, um die Bindungsaffinitäten der beiden Sequenzen abzuschätzen, dh OligoCalc

http://www.basic.northwestern.edu/biotools/OligoCalc.html

Führen Sie einfach Blast nur mit den Plus-MinusAusrichtungen aus. Siehe diesen Beitrag in Biostar; Es ähnelt dem, woran Sie interessiert sind. Dies gilt für die Standalone-Version. Ich bin mir nicht sicher, wie ich es in der Online-Explosion machen soll. Wenn Sie nur zwei Sequenzen haben, können Sie UNAfold zum Überprüfen der Komplementarität verwenden.