Ich habe eine Liste mit Gennamen in einer Datei
CHRNB2
EGR2
GCK
KRT14
LMNA
FGF3
TK2
ABCC8
Wie kann ich sie der Uniprot-ID zuordnen?
PS Ich habe Uniprot "ID-Mapping" (von-"GENEID" zu-"UNIPROTKB AC") ausprobiert, aber es konnte nicht zugeordnet werden.
Bitte schlagen Sie mir vor, was zu tun ist.
Dies wird ID-Mapping genannt. Früher war es ein Problem, da der programmgesteuerte Zugriff der einzige wirkliche Weg war, aber heutzutage ist es ziemlich trivial.
Wie in den Kommentaren erwähnt, ist die bei weitem beliebteste und einfachste Methode, den Listen-Uploader von Uniprot für das Mapping zu verwenden . Die entsprechende Veröffentlichung finden Sie hier . Sie müssen den Gennamen in die Uniprot-KB-ID konvertieren
Die Uniprot-Webbenutzeroberfläche funktioniert für Tausende von IDs, führt jedoch bei Abfragen von mehr als 10.000 IDs zu Fehlern. In diesem Fall sind programmgesteuerte Abfragen wahrscheinlich besser. Ich habe dies aus den Uniprot-Dokumenten leicht geändert , sodass die IDs einzeln abgefragt werden, um Fehler beim Überschreiten der Abfragegröße zu vermeiden. Der Python-Code wäre:
import urllib,urllib2
list_to_convert = ["CHRNB2", "EGR2", "GCK", "KRT14", "LMNA", "FGF3", "TK2", "ABCC8"]
url = 'http://www.uniprot.org/mapping/'
print "From To"
for i in list_to_convert:
params = {
'from':'GENENAME',
'to':'ACC',
'format':'tab',
'query':i
}
data = urllib.urlencode(params)
request = urllib2.Request(url, data)
contact = "" # Please set your email address here.
request.add_header('User-Agent', 'Python %s' % contact)
response = urllib2.urlopen(request)
page = response.read(200000)
print page.splitlines()[1] #Ignores the header line returned by uniprot
Die Ausgabe davon sieht so aus:
From To
CHRNB2 A0A096MXS8
EGR2 A0A096P554
GCK A0A021WXA1
KRT14 A0A024R1X6
LMNA A0A096MQV4
FGF3 A0A096NXI3
TK2 A0A096NJ58
ABCC8 A0A088S7J5
für Biomart gehen Sie zum folgenden Link
http://central.biomart.org/converter/#!/ID_converter/gene_ensembl_config_2
Außerdem gibt es einen weiteren Konverter, den ich ziemlich nützlich fand:
http://biodbnet.abcc.ncifcrf.gov/db/db2db.php#biodb
Chris
dhvlnyk
WYSIWYG
Chris
dhvlnyk
dhvlnyk