Es ist das erste Mal, dass ich in diesem Forum poste, aber ich suchte nach Hilfe zu den Datenaspekten dieses Projekts.
Meine Werkzeuge der Wahl wären in python/R .
Ziel: Ich möchte ein krankheitsspezifisches Profil nur von SNPs und SNPs in miRNAs und miRNA-Zielstellen erstellen.
TEIL 1: TCGA Mein erster Schritt ist die Verwendung von TCGA-Daten, die eine Menge schädlicher Mutationen in einem LOH .txt-Format auflisten. Ich würde gerne in der Lage sein, diese Mutationen SNPs oder Genen oder miRNAs (zu welchen Entitäten sie auch immer gehören) zuzuordnen. Das TCGA-Datenblatt ist hier . Beispieldaten sind hier. für Brustkrebs. Ich denke, ich kann diese miRNA- und mRNA-Daten auch verwenden.
Fragen hier:
miRNA/Targets und SNPs Als nächstes stehen krebsspezifische miRNAs und mRNAs und die Zuordnung von SNPs zu ihnen an? Ich gehe davon aus, dass ich dbSNP- oder Sanger-miRNA-Datenbanken verwende, um miRNA/Targets und Seed-Sequenzen zu erhalten.
Ich bin ein bisschen verloren, wie ich all diese Informationen kombinieren soll, welche Formate für die Ausgabe verwendet werden sollen (verknüpft mit einzelnen Teilen) und welche Tools, wenn überhaupt, verwendet werden, um all diese Daten mit Python zu sammeln. Dieses Tool ist ein nützliches Tool mirdsnp.
Sie können sich dieses Tutorial ansehen, um TCGA MAF-Dateien zu verstehen. Und Sie finden eine Liste von TCGA-MAF-Dateien mit Mutationen, die Genen und miRNA zugeordnet sind, unter https://www.synapse.org/#!Search:syn1710680
blöd
Preußen
blöd