Was bedeutet chrUn in der Ausgabe eines Bowtie-Laufs auf menschliche Sequenzen?

Nachdem ich ein Alignment mit bowtie2 und GRCh38 als Referenzsequenz durchgeführt hatte, erhielt ich ungewöhnliche Übereinstimmungen auf chrUn. Hier ein kleiner Teil der SAM-Datei :

@SQ     SN:chr22   LN:50818468
@SQ     SN:chrX    LN:156040895
@SQ     SN:chrY    LN:57227415
@SQ     SN:chrM    LN:16569
@SQ     SN:chrUn_KI270424v1     LN:2140

Alle anderen chrWerte sind mir klar (M gibt die mitochondriale DNA an, während 22, Y und X nur die übliche Chromosomennummer / der übliche Name sind), aber ich konnte nicht herausfinden, was chrUnfür steht und was mit diesem Code nach dem _?

Normalerweise "Unbekannt". Sequenzen, die keinem der Chromosomen zugeordnet wurden. Ich denke, das stammt vom menschlichen Genom, das mehrere Sequenzen hat, die keinem Chromosom zugeordnet sind, also haben sie Identifikatoren (das KI ...)
@Skymningen Danke. Wenn Sie eine Referenz hinzufügen und als Antwort posten, werde ich sie akzeptieren.
Es gibt keine Referenz dafür, außer Erfahrung, sorry.

Antworten (2)

Ich nehme an, chrUn_KI270424v1 bezieht sich auf ein Gerüst oder eine Sequenz, die noch keinem Chromosom zugeordnet wurde. Die Bezeichnung nach dem Un (unbekannt oder nicht zugeordnet?) kann sich auf eine bestimmte Einzelsequenz oder ein Gerüst beziehen. Sie können dies feststellen, indem Sie die Referenzsequenz und ihre Dokumentation untersuchen.

(Meine Vermutung basiert auf dem, was man in den verschiedenen Versionen von Drosophila- Referenzgenomen findet, mit denen ich vertraut bin. Daher kann ich Ihnen bei den Besonderheiten des menschlichen Genoms nicht helfen.)

Es ist für nicht zugewiesene Sequenzen. Siehe diese Referenz aus den häufig gestellten Fragen zum UCSC-Genombrowser: https://genome.ucsc.edu/FAQ/FAQdownloads.html#download11