Kombinieren von Genexpressionsdaten von zwei Arten

Ich habe derzeit zwei Sätze von Genexpressionsdaten. Der erste ist ein Datenrahmen von Genen, die durch Annotations-ID-CG-Nummern (z. B. „CG10005“) in einer Spalte und einer numerischen Variablen von Interesse, die jedem dieser Gene zugeordnet ist, in der anderen Spalte identifiziert werden (der wichtige Teil ist, dass die Gene durch die identifiziert werden CG-Nummer). Der zweite Datensatz ist diese Studie von mehreren Arten, bei denen Gene durch "GLEANR"-IDs wie diese identifiziert werden: "dsim_GLEANR_10060".

Ich möchte alle Werte aus dieser Studie für die D. melanogaster- und D. simulans-Daten extrahieren und diese dann mit den Anmerkungs-IDs im ersten Datensatz verknüpfen (um meine interessierende Variable mit der Geschlechtsverzerrung im Ausdruck für jede Art zu verbinden ). Das Problem, das ich habe, besteht darin, die orthologen Gene innerhalb der zweiten Studie miteinander zu verbinden und sie dann mit den CG-Identifikatoren in der ersten Studie zu verbinden.

Hat jemand Vorschläge zu Ressourcen, die verwendet werden können, um dies alles zu verknüpfen?

Antworten (2)

Dies ist die FlyBase-Seite für das Beispielgen: Dsim\GD10095 . Dort haben Sie einen Abschnitt "orthologs", der auf OrthoDB verlinkt . Mein Vorschlag ist also: Finden Sie die Liste der Synonyme für D. simulans auf FlyBase ( vielleicht hier? ), laden Sie den Drosophila-Abschnitt von OrthoDB herunter und finden Sie schließlich die 1:1-Orthologe.

Danke, ich schaue mir das jetzt an - ich nehme an, dass jedes Gen ein einzigartiges FBgn hat und ihre Orthologe durch die ODB6_OG_ID (?) und die durch DROME, DROSI, DROSE identifizierten Arten identifiziert werden ... wenn ich nur diese drei Variablen nehme, die ich erstellen kann a Datenrahmen jeder ODB6_OG_ID in der ersten Spalte und Spalten für jede Art, die ihre orthologe FBgn-ID für jede interessierende Art angeben? Aber wie finde ich "die 1:1 Orthologen"?
Manchmal haben Sie eine stammspezifische Genduplikation, die Sie wahrscheinlich ausschließen möchten, um die Dinge einfach zu halten. Sie können also für jede Art prüfen, ob mehr als ein Gen mit einer ODB6_OG_ID verknüpft ist, und diese entfernen.
Ich habe das alles heute nach einem guten, altmodischen Wrestling mit R zum Laufen gebracht - vielen Dank für die Hilfe!

Sie können für diese Zwecke auch Biomart verwenden.

Klicken Sie im Bereich „Tools“ (links) auf die Registerkarte „ID Converter“.