Verwenden des IMGT/GENE-DB-Dienstes, um RSS zu finden

Ich versuche, die Daten für die Wiedererkennungssignalsequenzen (RSS) 12 und 23 von Mensch und Maus zu erhalten, um einen Klassifizierungsalgorithmus darauf auszuführen. Ich bin kein Biologe, also entschuldige ich mich im Voraus für meine Missverständnisse und Verwirrung.

Eine Version der Daten ist hier verfügbar , aber ich dachte, ich würde versuchen, sie wenn möglich von www.imgt.org zu bekommen. Für die Maus gibt es hier auch noch eine etwas andere Version .

Ich versuche, den Anweisungen in IMGT-FAQ zu folgen, um Rekombinationssignalsequenzen für die Maus zu erhalten.

Folgendes habe ich auf der Suchseite ausgewählt :

Identification:
Species : Mus Musculus
GeneType: any
Functionality: functional
MolecularComponent: any
Clone name: <blank>

IMGT group: IGHV
IMGT subgroup: any
IMGT gene: <blank>

Mir ist nicht klar, was "Locus", "Main Locus" und "IGMT-Gruppe" hier genau bedeuten. Was ist speziell der Unterschied zwischen "Locus" und "Main Locus"?

Ich denke, bin mir aber nicht sicher, dass IGHV V-Genen im Immunglobulin Heavy Locus (IGH@) auf Chromosom 14 entspricht, wobei Locus hier Sammlungen von Genen bezeichnet. Klarstellungen und Korrekturen erwünscht.

Ich hätte erwartet, dass der IGH-Locus Einträgen der "IMGT-Gruppe" wie "IGHJ, IGHV" usw. entsprechen würde, und der IGK-Locus würde IMGT-Gruppeneinträgen wie "IGK, IGKJ, IGKV" entsprechen, aber egal, was ich auswähle für Locus, es ändert nicht die möglichen Einträge für "IMGT-Gruppe".

Das Ausführen der Suche gibt

Anzahl der resultierenden Gene: 218 Anzahl der resultierenden Allele: 350

Wie angewiesen, ging ich nach unten, wählte "Alle Gene auswählen", klickte auf "Etikett(en) für Extraktion auswählen" und wählte "V-RS".

ich habe

Anzahl der Ergebnisse = 98

Die ersten Ergebnisse waren

>X02459|IGHV1-4*02|Mus musculus_BALB/c|F|V-RS|395..432|38 nt|NR| | | | 
|38+0=38| | |
cacagtggtgcaaccacatcccgactgtgtcagaaacc

>X02064|IGHV1-54*02|Mus musculus|F|V-RS|295..332|38 nt|NR| | | | |38+0=38| 
| |
cacagtgttgcaaccacatcctgagtgtgtcagaaatc

>M34978|IGHV1-58*02|Mus musculus_A/J|P|V-RS|554..560|7 nt|NR| | | | 
|7+0=7|partial in 3'| |
cacagtg

Ok, jetzt bin ich verwirrt. Die Längen der RSS sollten 28 oder 39 sein. Aber ich habe Längen von 4,7, 31, 38 und 39 gezählt. Sollen die Ergebnisse hier nicht die 12 und 23 RSS enthalten?

Also muss ich hier einiges falsch verstehen. Möglicherweise viele Dinge. Alle Erklärungen und Klarstellungen sind willkommen.

Antworten (1)

Mir ist nicht klar, was "Locus", "Main Locus" und "IGMT-Gruppe" hier genau bedeuten. Was ist speziell der Unterschied zwischen "Locus" und "Main Locus"?

Von derselben Seite:

Ein Locus ist ein Satz von IG- oder TR-Genen, die geordnet und in einer bestimmten Art an derselben chromosomalen Stelle lokalisiert sind. […]
Ein Locus umfasst die Gene verschiedener Gruppen, die potenziell an der Synthese eines Polypeptids desselben „Kettentyps“ beteiligt sind.

Main locushätte Locusminus sein sollen orphons:

Ein chromosomaler Orphon-Satz ist ein Satz von IG- oder TR-Orphonen (Gene außerhalb der Hauptloci), die zu derselben Gruppe gehören und auf demselben Chromosom in einer bestimmten Art lokalisiert sind.


Allerdings haben die Main Locusund Locusdie gleichen Optionen; Optionen für die Locussollten Chromosomen gewesen sein. Sie müssen die Site überarbeitet, aber vergessen haben, die Hilfe zu ändern. Ich habe versucht, alle Optionen außer anyin Locuseinzustellen und allfür die Orphons; es ergibt kein Ergebnis. Es funktioniert nur, wenn du es anyeingibst Locus. Es scheint also, dass die LocusOption nutzlos ist; Sie können das Locusals anyStandard festlegen.
Zur Bestätigung fragen Sie am besten die Autoren .

Aus dem Changelog:

16. April 2012

  • Aktualisierung der IMGT/GENE-DB-Abfrageseite:

    Die Suchkriterien sind nach den Axiomen IDENTIFIKATION, LOKALISIERUNG und KLASSIFIZIERUNG der IMGT-ONTOLOGIE organisiert. Hinzufügen neuer Suchkriterien:

    • MolekulareKomponente (IDENTIFIKATION)
    • Locus (LOKALISIERUNG): umfasst Hauptloci und chromosomale Orphon-Sets. Hauptlocus: Der Wert "alle" ermöglicht die Suche nach Genen aller Hauptloci. Chromosomaler Orphonsatz: Der Wert „alle“ ermöglicht die Suche nach Genen aller chromosomalen Orphonsätze

Einzelheiten zur IMGT-Klassifizierung finden Sie in diesem Dokument .

Durch das Korrigieren einer Option wird die Dropdown-Box-Option Locusnicht geändert , aber die Ergebnisse sind unterschiedlich. IMGTWenn Sie Ihr Beispiel ausprobieren und Main Locuswie IGHund IMGT Groupso einstellen IGKJ, erhalten Sie keine Ergebnisse. Es ist nur ein Problem des Webinterfaces. Anscheinend funktioniert die Suche einwandfrei.


Suche ausführen

Ich habe mit genau dem gleichen Kriterium gesucht, das Sie erwähnt haben, und keine Sequenzen erhalten, die kleiner als 38nt sind. Es muss einen Fehler gegeben haben, der behoben zu sein scheint.