Wie genau werden Lücken in der Genomik definiert?

Mein Verständnis ist, dass sich beim Sequenzieren eines Genoms "Lücken" auf Fragmente beziehen, die im Sequenzer nicht sequenziert wurden.

Ist das richtig? Welche anderen Bedeutungen hat der Begriff „Lücke“?

Antworten (2)

Du liegst nicht falsch, aber Lücke kann mehr als das bedeuten. Eine gute neuere Referenz ist dieses Papier: Genetische Variation und die De-novo-Assemblierung menschlicher Genome .

Im Wesentlichen entsteht eine Lücke, wenn etwas in unserem Genom passiert, das nicht durch Einheitlichkeit erklärt werden kann. Da unser Genom sehr kompliziert ist, können Sie davon ausgehen, dass die Lücke auch mehr als nur eine falsche Sequenzierung ist. Die Lücke, die Sie erwähnen, ist die sequence-coverage gapsunten erwähnte.

Dieses Papier enthält einen Abschnitt über die Arten von Lücken.

Geben Sie hier die Bildbeschreibung ein

1. Sequenzabdeckungslücken

Sequenzierungslücken treten unter der einfachsten Bedingung auf, wenn für einen bestimmten Teil des Genoms keine Sequenz-Reads abgetastet wurden.

2. Mit segmentalen Duplikationen verbundene Lücken

Über ein Drittel (206/540) der euchromatischen Lücken im menschlichen Referenzgenom (GRCh38) werden von großen, höchst identischen segmentalen Duplikationen flankiert.

3. Satellitenbezogene Lücken

Dazu gehören kurze und lange Folgen von Tandem-Wiederholungen, die als kurze Tandem-Wiederholungen (STRs; auch bekannt als Mikrosatelliten) bezeichnet werden, variable Anzahl von Tandem-Wiederholungen (VNTRs; auch bekannt als Makrosatelliten) und Zentromer-Satelliten-Wiederholungen in Mb-Größe.

4. Gedämpfte Lücken

Gedämpfte Lücken sind definiert als Bereiche, die in einer Anordnung versehentlich geschlossen sind, die jedoch bei der großen Mehrheit der Individuen tatsächlich zusätzliche oder andere Sequenzen aufweisen

5. Allele Variationslücken

Einige Regionen eines Genoms zeigen auch außergewöhnliche Muster allelischer Variation, die oft eine tiefe evolutionäre Koaleszenz widerspiegeln.

Das Wort „Lücke“ kann sowohl lose als auch in bestimmten genomischen Kontexten verwendet werden, wie von @Student T aufgelistet . Ich reproduziere unten eine modifizierte Form einer (gemeinfreien) Illustration davon.

Gerüst, Contig und Gap

Die Sequenzen der „Contigs“ (siehe Legende) sind vollständig bekannt, da sich die „Reads“ (durchgezogene blaue Pfeile in der Legende) überlappen, obwohl die „Fragmente“ (siehe Legende) nicht sequenzierte Regionen enthalten. Da aber die Länge der Fragmente grob bestimmt werden kann (z. B. durch Gelelektrophorese) – hier ist Fragment 5 der Schlüssel – können die beiden Contigs zu einem „Gerüst“ mit einer Lücke von (ungefähr) bekannter Länge zusammengesetzt werden. Ich habe dies als "Lücke" in Grün markiert.

Danke für die Erklärung. Bitte überprüfen Sie auch meine Antwort.
Schöne Kategorisierung @Student T! Ich habe den Eröffnungsabsatz meiner Antwort geändert, um ihn mit Ihrem in Beziehung zu setzen. Ich denke, es lohnt sich, es beizubehalten, da es detaillierter auf Lücken in der Sequenzabdeckung eingeht und einige andere relevante Begriffe einführt.