Wie ordnet man den Gennamen seinem Gensymbol zu?

Ich lerne in letzter Zeit in Gendaten, also entschuldige ich mich im Voraus für die dummen Fragen. Ich habe einen Artikel über einen Krebs beim Menschen gelesen, der einige wichtige Gene gefunden hat. Zum Beispiel führte das Papier eines der Gene in seinem Namen als auf

gene1:    chromosome 12 open reading frame 52

Darf ich wissen, wie ich das entsprechende Gensymbol wie finden kann

C12orf52

Gibt es eine Zuordnungstabelle oder ein Tool, das ich verwenden kann?

Vielen Dank,

Welche Arten interessieren Sie?

Antworten (3)

Leider ist die Kartierung von Protein- und Gennamen eines der lästigsten Probleme in der modernen Computerbiologie. Dafür gibt es keinen sicheren Weg. Besonders von hoffnungslosen Gennamen wie dem in dem von Ihnen zitierten Artikel. Hier sind ein paar Dienste, die Sie ausprobieren können:

  1. Allgemein, Textsuche, nützlich, wenn Sie eine Genbeschreibung haben (wie in dem in Ihrer Frage beschriebenen Fall):

  2. Zuordnungsserver, nützlich, wenn Sie ein tatsächliches Gen-/Proteinsymbol/Name haben (z. B. P53_HUMAN, AF240684, NP_001119585 usw.)

„eines der größten Probleme“ – äh.
@KonradRudolph, du bist anderer Meinung? Glaub mir, das ist es. Ich meine Problem nicht im Sinne eines wissenschaftlichen Problems, sondern eines technischen. Jede Datenbank verwendet häufig ihre eigenen Identifikatoren, die Identifikatoren ändern sich im Laufe der Zeit, ebenso wie die Reihenfolge, wenn Fehler korrigiert werden. Für die Liste von ~15000 Proteinen (UniProt), mit der ich arbeite, ändern sich durchschnittlich 1-2 Identifikatoren PRO WOCHE. Die korrekte Zuordnung der Namen zwischen den verschiedenen Datenbanken und anderen Informationsquellen, die ich verwende, bereitete meinem Post-Doc große Kopfschmerzen.
Nun, ich stimme zu, dass es ein Ärgernis ist, aber wir haben stabile Identifikatoren (= nicht ändern) und Dienste, um zwischen den verschiedenen zu übersetzen. Es ist ein gelöstes Problem (da es möglicherweise immer noch manuelle Arbeit erfordert, aber keine intellektuelle Arbeit).
@Konrad, leider sind die stabilen Bezeichner nur gut, wenn Ihre Eingabedaten sie verwenden. Wenn Sie Interaktionsdaten aus 15 Datenbanken kombinieren müssen, von denen jede ein anderes ID-Schema verwendet (RefSeq, GIs, UniProt, HUGO, Flybase, Wormbase usw.), werden die Identifikatoren zu einem sehr realen Problem. Die Übersetzungsdienste sind oft fehlerhaft (UniProt zum Beispiel erstellte keine eindeutigen IDs für jede Auftragsübermittlung und gab meine Anfragen durcheinander mit denen von jemand anderem zurück!), beschränkt auf bestimmte Arten oder ID-Typen. Es mag in der Tat kein intellektuelles Problem sein, aber es ist ein sehr reales technisches.

Wenn die Originalquelle die offizielle menschliche Nomenklatur verwendet hat, können Sie die Website des HGNC (HUGO Gene Nomenclature Committee) durchsuchen .

Verwenden Sie einfach eine Genomdatenbank wie Ensembl . Fügen Sie Ihren Gennamen in das Suchfeld ein und klicken Sie auf „Los“ . Der erste Treffer in der Ergebnisliste ist das, wonach Sie suchen.

Es funktionierte. Aber ich konfiguriere immer noch, wie man eine Liste von Gennamen eingibt, nicht nur einen nach dem anderen.