Kombinieren von Genexpressionsdaten von zwei Arten

Question

Kombinieren von Genexpressionsdaten von zwei Arten

Biologie
Genomik
drosophila
Bioinformatik
Gen-Annotation
Genexpression

rg255

Ich habe derzeit zwei Sätze von Genexpressionsdaten. Der erste ist ein Datenrahmen von Genen, die durch Annotations-ID-CG-Nummern (z. B. „CG10005“) in einer Spalte und einer numerischen Variablen von Interesse, die jedem dieser Gene zugeordnet ist, in der anderen Spalte identifiziert werden (der wichtige Teil ist, dass die Gene durch die identifiziert werden CG-Nummer). Der zweite Datensatz ist diese Studie von mehreren Arten, bei denen Gene durch "GLEANR"-IDs wie diese identifiziert werden: "dsim_GLEANR_10060".

Ich möchte alle Werte aus dieser Studie für die D. melanogaster- und D. simulans-Daten extrahieren und diese dann mit den Anmerkungs-IDs im ersten Datensatz verknüpfen (um meine interessierende Variable mit der Geschlechtsverzerrung im Ausdruck für jede Art zu verbinden ). Das Problem, das ich habe, besteht darin, die orthologen Gene innerhalb der zweiten Studie miteinander zu verbinden und sie dann mit den CG-Identifikatoren in der ersten Studie zu verbinden.

Hat jemand Vorschläge zu Ressourcen, die verwendet werden können, um dies alles zu verknüpfen?

Antworten (2)

Kombinieren von Genexpressionsdaten von zwei Arten

Michael Kühn · Answer 1

Michael Kühn

Dies ist die FlyBase-Seite für das Beispielgen: Dsim\GD10095 . Dort haben Sie einen Abschnitt "orthologs", der auf OrthoDB verlinkt . Mein Vorschlag ist also: Finden Sie die Liste der Synonyme für D. simulans auf FlyBase ( vielleicht hier? ), laden Sie den Drosophila-Abschnitt von OrthoDB herunter und finden Sie schließlich die 1:1-Orthologe.

rg255

Danke, ich schaue mir das jetzt an - ich nehme an, dass jedes Gen ein einzigartiges FBgn hat und ihre Orthologe durch die ODB6_OG_ID (?) und die durch DROME, DROSI, DROSE identifizierten Arten identifiziert werden ... wenn ich nur diese drei Variablen nehme, die ich erstellen kann a Datenrahmen jeder ODB6_OG_ID in der ersten Spalte und Spalten für jede Art, die ihre orthologe FBgn-ID für jede interessierende Art angeben? Aber wie finde ich "die 1:1 Orthologen"?

Michael Kühn

Manchmal haben Sie eine stammspezifische Genduplikation, die Sie wahrscheinlich ausschließen möchten, um die Dinge einfach zu halten. Sie können also für jede Art prüfen, ob mehr als ein Gen mit einer ODB6_OG_ID verknüpft ist, und diese entfernen.

rg255

Ich habe das alles heute nach einem guten, altmodischen Wrestling mit R zum Laufen gebracht - vielen Dank für die Hilfe!

Steve Lianoglou · Answer 2

Sie können für diese Zwecke auch Biomart verwenden.

Klicken Sie im Bereich „Tools“ (links) auf die Registerkarte „ID Converter“.

Kombinieren von Genexpressionsdaten von zwei Arten

rg255

Antworten (2)

Michael Kühn

rg255

Michael Kühn

rg255

Steve Lianoglou

Enthält DNA Informationen über die Proteinsynthese hinaus?

Wie viele Gene hat D. melanogaster?

Welche Informationen können aus Zeitverlauf-RNA-Seq-Daten extrahiert werden?

Wie validiert man die aus Genexpressionsdaten abgeleiteten regulatorischen Wechselwirkungen?

Ermittlung des Konfidenzniveaus von miRNA-Erkrankungsassoziationen

IC50-Berechnung [geschlossen]

Parameter der Varianten-Calling-Analyse [geschlossen]

Vergleich von Genexpressionszeitreihen in vitro und in vivo

Biologische Bedeutung der Leselänge

Datenbanken für genregulatorische Netzwerkgraphen?