Konvertieren Sie den Gennamen in die Uniprot-ID

Ich habe eine Liste mit Gennamen in einer Datei

CHRNB2
EGR2
GCK
KRT14
LMNA
FGF3
TK2
ABCC8

Wie kann ich sie der Uniprot-ID zuordnen?
PS Ich habe Uniprot "ID-Mapping" (von-"GENEID" zu-"UNIPROTKB AC") ausprobiert, aber es konnte nicht zugeordnet werden.
Bitte schlagen Sie mir vor, was zu tun ist.

Ich denke, das sind menschliche Gene?
ja du hast recht.
Probieren Sie Biomart.. ..
Das ist auch meine Empfehlung. Biomart ist das Werkzeug der Schweizer Armee für diese Art der Konvertierung.
Biomart hat geholfen ... vielen Dank
Entschuldigung für die Verzögerung. Ich werde es so schnell wie möglich tun ...

Antworten (2)

ID-Mapping

Dies wird ID-Mapping genannt. Früher war es ein Problem, da der programmgesteuerte Zugriff der einzige wirkliche Weg war, aber heutzutage ist es ziemlich trivial.

Wie in den Kommentaren erwähnt, ist die bei weitem beliebteste und einfachste Methode, den Listen-Uploader von Uniprot für das Mapping zu verwenden . Die entsprechende Veröffentlichung finden Sie hier . Sie müssen den Gennamen in die Uniprot-KB-ID konvertieren

Programmgesteuerter Zugriff

Die Uniprot-Webbenutzeroberfläche funktioniert für Tausende von IDs, führt jedoch bei Abfragen von mehr als 10.000 IDs zu Fehlern. In diesem Fall sind programmgesteuerte Abfragen wahrscheinlich besser. Ich habe dies aus den Uniprot-Dokumenten leicht geändert , sodass die IDs einzeln abgefragt werden, um Fehler beim Überschreiten der Abfragegröße zu vermeiden. Der Python-Code wäre:

import urllib,urllib2

list_to_convert = ["CHRNB2", "EGR2", "GCK", "KRT14", "LMNA", "FGF3", "TK2", "ABCC8"]
url = 'http://www.uniprot.org/mapping/'

print "From To"
for i in list_to_convert:
    params = {
    'from':'GENENAME',
    'to':'ACC',
    'format':'tab',
    'query':i
    }

    data = urllib.urlencode(params)
    request = urllib2.Request(url, data)
    contact = "" # Please set your email address here.
    request.add_header('User-Agent', 'Python %s' % contact)
    response = urllib2.urlopen(request)
    page = response.read(200000)
    print page.splitlines()[1] #Ignores the header line returned by uniprot

Die Ausgabe davon sieht so aus:

From    To
CHRNB2  A0A096MXS8
EGR2    A0A096P554
GCK     A0A021WXA1
KRT14   A0A024R1X6
LMNA    A0A096MQV4
FGF3    A0A096NXI3
TK2     A0A096NJ58
ABCC8   A0A088S7J5

für Biomart gehen Sie zum folgenden Link
http://central.biomart.org/converter/#!/ID_converter/gene_ensembl_config_2

Außerdem gibt es einen weiteren Konverter, den ich ziemlich nützlich fand:
http://biodbnet.abcc.ncifcrf.gov/db/db2db.php#biodb

Können Sie erklären, was diese Links bewirken? Nur Links als Antwort zu posten ist eine schlechte Praxis: meta.stackexchange.com/questions/8231/…
Es ist ziemlich selbsterklärend ... es ist im Grunde für die Zuordnung von zwei Identifikatoren. Bitte beachten Sie die Frage für weitere Details.
Der Biomart-Link ist unterbrochen. Warum sollten Sie biodb.net Uniprot vorziehen? (Ich schlage es nicht zu, ich habe nur noch nie davon gehört und bin gespannt, ob es einen großen Vorteil hat.)