Gesamtgenomsequenzierung und Chromosomenzahlen

Stützen sich Standardtechniken zur Sequenzierung des gesamten Genoms im Allgemeinen mehr auf bekannte Chromosomenzahlen, kommen sie unabhängig zu Chromosomenzahlen und/oder gehen sie Probleme wie Basenzahl, Aneuploidie und Polyploidie nicht direkt an?

Hätten zum Beispiel normale Techniken zur Sequenzierung des gesamten Genoms festgestellt, dass Menschen 46 statt 48 Chromosomen haben?

Vielleicht wäre eine bessere Art, diese Frage zu stellen, wie folgt:

Angesichts der gesamten Genomsequenz für Menschen und der Überzeugung, dass der Schimpanse 46 Chromosomen hatte, würde die Sequenzierung des gesamten Genoms des Schimpansen höchstwahrscheinlich sagen

1) Hier sind die Sequenzen für diese 46 und übrigens war noch Material übrig.

2) Hier ist die beste Darstellung der gesamten DNA des Schimpansen, die auf 46 Chromosomen abgebildet ist.

3) Hier sind die Sequenzen für diese 46 und Schimpansen scheinen 48 Chromosomen zu haben.

Antworten (3)

Ich bin mir ziemlich sicher, dass es auf einem Referenzgenom beruht. Seit der ursprünglichen Sequenzierung des menschlichen Genoms verlassen sich die meisten der heute verwendeten Techniken auf diese ursprüngliche Konstruktion (mit Modifikationen).

Auf diese Weise verwenden die Leute es, um Kopienzahlvariationen (CNVs) und Einzelnukleotidpolymorphismen (SNPs) mit diesen Sequenzierungstechniken (und auch Aneuploidie) zu erkennen.

Die Reads aus dem Sequenzierungslauf werden mit dem Referenzgenom verglichen und bei statistisch signifikanten Unterschieden in der Anzahl der Reads als Unterschiede im Genom vermerkt. Wenn es zusätzliche nicht kartierte DNA gibt, weiß es wahrscheinlich einfach nicht, wo es abgelegt werden soll, und nennt es "zusätzliches Material".

Also Nr. 1.

Was Biomed_guy sagt, ist im Grunde die Antwort, ich wollte nur ein bisschen klarstellen. Wenn Sie DNA sequenzieren, tun Sie während der Vorbereitung Ihrer DNA-Bibliothek etwas, um sie in kleine Fragmente umzuwandeln, wenn dies nicht bereits der Fall ist, wie das Scheren der DNA. Dadurch erhalten Sie sehr kleine DNA-Stücke, die beim Abgleich mit dem Referenzgenom immer noch ziemlich einzigartig sein sollten.

Aber wie bereits beantwortet, ist der entscheidende Faktor dafür, wie DNA dann kartiert wird, das Referenzgenom, das Sie verwenden. Die Antwort ist also, was Sie in 1 und 2 angeben. Wenn Sie versuchen, herauszufinden, welche DNA Sie haben, beginnen Sie mit einer Referenzsequenz, die die gesamte genomische DNA "angelegt" enthält, damit Ihre Fragmente dann damit verglichen werden können und basierend auf einer übereinstimmenden Sequenz an eine am besten passende Region angepasst. Alles, was nicht mit dem Ref-Genom übereinstimmt, wird in eine „Junk“-Ausgabedatei geworfen.

Viele Gensequenzen sind also konzeptionell zwischen Menschen und Schimpansen hochgradig konserviert. Dies würde bedeuten, dass Sie Ihre Sequenzfragmente erfolgreich an beiden Genomen ausrichten könnten. Wichtig ist, dass die Anzahl der Chromosomen agnostisch ist. Auf die Gene kommt es an.

Stellen Sie sich vor, wenn Ras, Myc und Erk bei Menschen alle auf Chr. 12 des Menschen liegen, aber in Schimpansen aufgeteilt sind, so dass Ras auf Chr. 12, Myc auf Chr. 13 und Erk auf Chr. 24 liegt, würde dies bei der Kartierung keinen Unterschied machen zurück zum Genom unter der Annahme, dass die Gene zwischen Mensch und Schimpanse konserviert sind. Wenn Sie ein sequenziertes Fragment von menschlichem Myc haben, das mit Chimp Myc identisch ist, würde es sich an einer Stelle auf Chr. 12 ausrichten, wenn Sie menschliche DNA als Referenz verwenden, oder es würde sich an einer Stelle auf Chr. 13 ausrichten, wenn Sie Chimp als Referenz verwenden . Sinn ergeben?

Sie verstehen, es ist nicht so, dass Schimpansen viel zusätzliche DNA haben, die Menschen nicht haben, sie haben zwei Chromosomen, die beim Menschen verschmolzen sind.

Theoretisch könnten Diskrepanzen zwischen den Reads und der Referenz entdeckt werden. In der Praxis wäre es mit der aktuellen Short-Read-Technologie schwierig, eine Diskrepanz auszusortieren, die eine Region des Genoms betraf, die repetitiv war, nämlich die Telomere des Schimpansen 2A und 2B und die Telomer-ähnlichen Sequenzen in den Regionen, in denen diese fusionierten Menschen, wäre.