Homologe Gene finden und vergleichen

Ich habe ein interessantes Gen, das ich zwischen Homologen vergleichen möchte. Wie findet man ein Gen aus bekannten kodierenden Sequenzen in allen Stämmen? Danach stelle ich mir vor, ich könnte ein Clustal-Sequenz-Alignment durchführen, um zu sehen, wie die Sequenzen übereinstimmen.

Antworten (5)

Es gibt verschiedene Datenbanken von Homologen, zum Beispiel:

Der Vorteil der Verwendung einer vorhandenen Datenbank besteht darin, dass ausgefeiltere Methoden zum Erkennen von Orthologen als einfache BLAST-Suchen verwendet wurden (siehe " Berechnungsmethoden für Gen-Orthologie-Inferenz " für eine Übersicht) und alles bereits vorberechnet ist, sodass es viel schneller ist. Der Nachteil ist, dass alle vorberechneten Methoden eine Momentaufnahme der Genome aus der Vergangenheit verwenden müssen, sodass nicht alle derzeit verfügbaren Genome vorhanden sind.

Wenn ich Ihre Frage richtig verstehe, ist der Genome Browser an der UCSC ein guter Ausgangspunkt. Wenn Sie den Namen des Gens kennen, können Sie danach suchen. Hier ist zum Beispiel die Seite für Humaninsulinrezeptor 1 . Von dort aus können Sie 46 Genome mit Alignments vergleichen.

Wow, das ist eine hässliche Schnittstelle. Wie benutze ich das Ding? Ich denke, das ist es, wonach ich suche. Wenn ich mir das INS-R1-Gen als Beispiel anschaue, sehe ich Hühner, Zebrafische, eine Ansammlung von 46 Wirbeltieren. Kann ich dieses Tool verwenden, um eine Konsensussequenz der konservierten Regionen zu erstellen?

Wenn Sie keine Ahnung haben, wo Ihr Gen mit anderen Genen übereinstimmt, versuchen Sie etwas wie Blast auf der NCBI-Website .

Dadurch erhalten Sie eine Trefferliste, die Sie dann zum Alignment mit einem Multiple Sequence Aligner (MSA) verwenden können. Dieselbe NCBI-Seite kann Ihnen einen aus den Ergebnissen des Suchvorgangs rekonstruierten Baum geben, obwohl es eine Vielzahl von Methoden gibt, die verwendet werden können, wenn Sie einfach die Sequenzen herunterladen und versuchen, das Genfamilien-Alignment selbst mit „[x] Select All -- Get selected sequences" auf der NCBI-Blast-Ergebnisseite, und laden Sie sie dann in FASTA oder einem anderen Format mit "Send to -- File -- Format FASTA -- Create File" herunter.

Wenn Sie stattdessen Ihre Gensequenz an der Stelle mit der besten Ausrichtung in einem bestehenden Genfamilien-Alignment einfügen möchten, können Sie es mit PAGAN versuchen .

vielleicht möchten Sie stattdessen NCBI/Homologen. http://www.ncbi.nlm.nih.gov/homologene

oder einfach Psiblast gegen NR verwenden, wenn Sie eine Nukleotid- oder Proteinsequenz haben.

http://blast.ncbi.nlm.nih.gov/Blast.cgi

Wenn ich nur meine 5 Cent hinzufüge, gibt es eine aktuelle Datenbank namens Metaphern :

MetaPhOrs ist ein öffentliches Repository für phylogenetische Orthologie- und Paralogievorhersagen, die unter Verwendung von Ressourcen berechnet wurden, die in sieben gängigen Homologievorhersagediensten (PhylomeDB, EnsemblCompara, EggNOG, OrthoMCL, COG, Fungal Orthogroups und TreeFam) verfügbar sind. Derzeit sind über 306 Millionen einzigartiger homologer Proteinpaare in der MetaPhOrs-Datenbank hinterlegt. Diese Vorhersagen wurden von 705.123 Stammbäumen für 829 Genome abgerufen. Für jede Vorhersage bietet MetaPhOrs einen Konsistenzwert und ein Evidenzniveau, die ihre Güte beschreiben, zusammen mit der Anzahl der Bäume und Links zu ihren Quelldatenbanken.

Es ist besonders gut, weil:

  • Es ist die einzige mir bekannte Homologiedatenbank, die Informationen über Paralogie und Orthologie enthält.

  • Es ist mit UniProt-Namen verknüpft

  • Es bietet eine ziemlich gute Python-API für Stapelabfragen