Anpassungsgüte: Wie entscheidet man, mit welchem ​​Verhältnis man umgeht?

Beim Lösen von Problemen der Anpassungsgüte stehe ich vor einem Problem, wie ich entscheiden soll, welches Verhältnis berücksichtigt werden soll, um die Teststatistik aus einem bestimmten Satz von Beobachtungen zu finden.

ZB 1

Eine gelieferte Probe enthält vier Arten von Samen, und die Gesamtzahl beträgt 64. Die Arten von Samen sind groß rot 42, groß weiß 8, klein rot 10 und klein weiß 4. Berechnen Sie die Anpassungsgüte.

Problem: Da df=3, Ratio= 9:3:3:1 / 1:1:1:1?

ZB2

Sie werden mit zwei verschiedenen Arten von Pflanzenmustern geliefert: groß-76 und kurz-24. Bestimmen Sie die beobachtete Zahl, wenden Sie den Chi-Quadrat-Test an, um festzustellen, ob sie mit dem erwarteten Verhältnis übereinstimmt.

Problem: Da df=1, Ratio= 3:1 /1:1?

Mir wurde vage von meinem Professor gesagt, dass wir jedes Verhältnis, das zutreffen scheint (durch logische Vermutung), wählen sollten, um die erwarteten Werte und damit die Statistik zu bestimmen.

Ich konnte diesbezüglich keine gute Lektüre finden, außer denen, die voller Fehler sind. Ich habe Statistik-Blogs gelesen, um die Konzepte zu verstehen, aber sie decken diese typischen biologischen Probleme nicht ab, und diejenigen, bei denen die genannten Verhältnisse auftraten.

Ich habe eine andere Frage im Hinterkopf, aufgrund des experimentellen Ergebnisses ist es auch wahrscheinlich, dass wir keine der vier Arten von Samen erhalten (da die Paarung zufällig ist und die Nachkommen durch Dihybrid-Kreuzungen erschienen), sodass die Bestimmung des tatsächlichen Verhältnisses dahinter mehr wird schwierig wie df = 2 =/= 3!

Ohne weitere Informationen, wie z. B. bei einer bestimmten zu testenden Hypothese (die von Ihrem Professor stammen sollte), kann nicht erwartet werden, dass Sie selbst auf die Hypothese kommen. Wenn Ihr Professor mit den Fragen nicht klarer wird, dann sage ich, Sie erwarten ein Verhältnis von 42: 8: 10: 4 für die erste und 76: 24 für die zweite. Chi^2 = 0 und du bist fertig.
Ich denke, sie soll entscheiden, welche Hypothese getestet wird, basierend darauf, wie Gene vererbt werden
Für den Pearson-χ²-Test können Sie eine beliebige Frequenz verwenden (z. B. die Frequenz von Heterozygoten). In beiden Beispielfragen fehlen jedoch wichtige Informationen zur erwarteten Häufigkeit. Warum sollte man überhaupt mit 3:1 rechnen? Jedes erwartete Modell muss eine Grundlage haben. Diese Beispiele geben keine an. Der erste Schritt eines statistischen Tests besteht darin, die Nullhypothese zu definieren.
@WYSIWYG 3: 1, weil es zwei Klassen der nominierten Variablen gibt (so sollten wir von unserem Professor lösen). Wir können also nicht ohne Informationen (wie in dieser Frage) fortfahren, da welche Null zu widerlegen ist? Ich habe auch einige Fragen aus einem Buch gefunden. Ich kann nicht verstehen, wie sie die H0 entscheiden? (Soll ich sie als eine andere Frage posten?)
@SanjuktaGhosh Sie müssen nicht herausfinden, was das H₀ ist. Die Nullhypothese ist Ihre Grundfrage. Das wissen Sie natürlich, bevor Sie das Experiment durchführen. In Ihrem Fall von 3:1 werden Sie Annahmen haben wie: Es gibt Dominanz, die Kreuzung liegt zwischen zwei Heterozygoten usw. Dies scheint der Fall zu sein, aber ich kann beliebige Fälle erfinden, in denen Sie 3:1-Verhältnisse sehen können. Ich kann auch argumentieren, dass 76:24 nicht 3:1 ist, sondern sich tatsächlich davon unterscheidet. Wenn Sie nicht mehrere Proben haben, gibt es keine Möglichkeit, dies zu beweisen.
@SanjuktaGhosh, Sie müssen die Nullhypothese nicht immer widerlegen. In manchen Fällen ist es sinnvoller, mit einem Modell zu prüfen, ob die Nullhypothese richtig ist – insbesondere dann, wenn Sie sich nicht ganz sicher sind, wie die Alternativhypothese lauten könnte. Dafür ist die Chi-Quadrat-Analyse da. Sie müssen bestimmen, welches Verhältnis logischerweise am sinnvollsten wäre. Dann vergleichen Sie die beobachteten Werte mit dem Verhältnis der Nullhypothese – mit der gleichen Anzahl von Stichproben. Führen Sie also einen Chi-Quadrat-Test mit einem Verhältnis von 75:25 gegenüber dem beobachteten Verhältnis von 76:24 durch.
Beispiel: ∑ ( (Beobachtung - Erwartet) ^2) / Erwartet = χ^2
( (24-25) ^2) / 25) + ( (76-75) ^2) / 75) = 0,0533.. Was ungefähr einem Alpha-Wert von 0,9 entspricht. Daher ist der p-Wert = 0,45, und Sie können die Alternativhypothese zugunsten der Nullhypothese verwerfen: Es gibt keinen Unterschied zwischen dem beobachteten Verhältnis und dem erwarteten Verhältnis
@WYSIWYG Vielen Dank für Ihren Einblick. Es hat die Dinge wirklich aufgeklärt. Aber wenn ich eine Frage wie diese finde, muss ich nach Mustern suchen, wie sie von uns erwarten, dass wir sie annehmen.
Für jeden statistischen Test müssen Sie die Nullhypothese kennen. Die Alternativhypothese spielt keine Rolle. Tatsächlich prüfen alle Tests, ob die Nullhypothese gültig ist oder nicht. Sie haben nicht wirklich irgendwelche Informationen über die Alternativhypothese. Die Alternativen können unendlich sein
Gibt es Fälle, in denen wir keine etablierte wissenschaftliche Theorie haben (das wäre unser Ho gewesen), mit der wir unsere Daten vergleichen könnten? Was nehmen wir unser Ho denn an? @WYSIWYG
Wenn der p-Wert 5 % übersteigt, wird das Ergebnis als signifikant bezeichnet und bei 1 % als hochsignifikant (unter der Voraussetzung, dass der Test durch Ablehnung der Null motiviert ist). Aber was ist mit einem p-Wert, der den kritischen Wert nicht überschreitet (was etwas Bestimmtes ist, wenn das Ho wahr ist, also Fehler 1. Art ausgeschlossen), nennen wir das Ergebnis dann signifikant? Wie nennen wir in diesem Fall das Ergebnis?@WYSIWYG
Der statistische Test kann nicht durchgeführt werden, wenn Sie keine vorherige Hypothese haben. Ihre Hypothese kann so einfach sein wie "beide Proben sind gleich". Wenn Sie einen t-Test durchführen, haben Sie eine zusätzliche Klausel, dass beide Stichproben normalverteilt sind. P-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese richtig ist. Je kleiner dieser Wert ist, desto höher ist Ihr Vertrauen. Im Allgemeinen definieren wir unser Konfidenzintervall, bevor wir den Test durchführen. Die Wahl des Konfidenzintervalls ist willkürlich; Die übliche Wahl ist 95 % (p < 0,05 wird als signifikant angesehen), aber Sie können je nach Situation strenger sein.

Antworten (1)

Um diese Frage zu lösen, müssen Sie ein grundlegendes Verständnis der Mendelschen Genetik haben. Im Gegensatz zu den Kommentaren der Leute liefert dieses Problem genügend Informationen.

Gene werden von zwei Elternteilen vererbt. Das heißt, die Nachkommen erben ein Allel von jedem Elternteil. Gene interagieren auch dominant/rezessiv miteinander. Ein dominantes Merkmal wird zum Ausdruck kommen, ganz gleich, ob es von einem Organismus getragen wird. Ein rezessives Merkmal wird nur exprimiert, wenn der Organismus zwei Kopien desselben Allels trägt – der Organismus muss das rezessive Gen von beiden Elternteilen erhalten.

In der ersten Frage gibt es vier Gene. Ein Gen kodiert für große Samen. Ein Gen kodiert für kleine Samen. Über das Gen, das für rote Samen kodiert. Ein Gen kodiert für weiße Samen.

Die dominanten Gene sind diejenigen, die codieren für: groß und rot. Die rezessiven Gene sind diejenigen, die codieren für: klein und weiß

Bei dieser Frage gehen Sie davon aus, dass beide Elternteile eine einzige Kopie jedes Gens tragen. Das bedeutet, dass jeder Elternteil eine Kopie eines Gens hat, das für große Samen kodiert, eine Kopie eines Gens, das für kleine Samen kodiert, eine Kopie eines Gens, das für rote Samen kodiert, und eine Kopie eines Gens, das für weiße Samen kodiert.

Als Nebenbemerkung würde dies bedeuten, dass jeder Elternteil aus einem großen roten Samen stammt. Es besteht auch die Möglichkeit, dass eines der vier Gene an die Nachkommen weitergegeben wird.

Jeder Elternteil könnte die Gene weitergeben für: große rote Samen, große weiße Samen, kleine rote Samen oder kleine weiße Samen.

Das bedeutet, dass folgende Genkombinationen möglich sind:

-groß rot, groß rot

-groß rot, groß weiß

-groß rot, klein rot

-groß rot, klein weiß

-groß weiß, groß rot

-groß weiß, groß weiß

... usw ...

Und, tut mir leid, ich versuche seit zwanzig Minuten, ein Bild hochzuladen, um Ihnen zu zeigen, was ich meine. Aber Sie können dies auch selbst tun, um zu sehen, was ich meine:

Zeichnen Sie ein 4x4-Raster und tragen Sie in jedes Kästchen alle möglichen Kombinationen von Genen ein, die von einem Nachkommen vererbt werden können. Sie nennen dies ein Punnett-Quadrat und es wird verwendet, um den Phänotyp eines von zwei Elternteilen gezüchteten Nachwuchses vorherzusagen. Wenn Sie den Punett-Platz durchsuchen, werden Sie verstehen, wie das funktioniert.

Aber die Sache, an die man sich erinnern sollte, ist Folgendes: Wenn die Nachkommen eine Kopie eines dominanten Gens (großer Samen, roter Samen) tragen, werden diese Phänotypen exprimiert. Damit ein rezessives Merkmal exprimiert werden kann, müssen die Nachkommen zwei Kopien der Gene (kleiner Samen, weißer Samen) tragen , dh. es muss von beiden Eltern dasselbe rezessive Allel erhalten haben.

Um das Problem nun statistisch zu lösen, verwenden Sie das Verhältnis 9:3:3:1. Die Nullhypothese besagt, dass es keinen Unterschied zwischen der Beobachtung und diesem Verhältnis gibt . Die alternative Hypothese ist, dass ein statistisch signifikanter Unterschied zwischen der Stichprobe und dem Testverhältnis beobachtet wird .

Das bedeutet, dass ein p-Wert < 0,05 anzeigt, dass das Verhältnis 9:3:3:1 falsch ist. Und die Geninteraktion muss auf andere Weise erklärt werden – nicht durch Mendelsche Vererbung . Oder ich nehme an, es könnte auch darauf hindeuten, dass die Eltern tatsächlich keine Kopie jedes Allels und eine andere Kombination trugen, die Sie vielleicht finden müssen. Z.B. Ein Elternteil hätte zwei Kopien von jedem rezessiven Merkmal haben können, während der andere Elternteil eine Kopie von jedem Merkmal gehabt haben könnte. (Spielen Sie mit dem Punnett-Quadrat, und vielleicht können Sie herausfinden, ob das stimmt.)

Oh ja, und offensichtlich sind sie nicht im Verhältnis 1:1:1:1. Ist diese Frage also nicht im Grunde "freie Markierungen"?
@Sanjukta Ghosh, ich entschuldige mich - als ich Ihre Frage zum ersten Mal beantwortete, ging ich davon aus, dass Sie Mendelsche Genetik und Vererbung verstehen. Ich habe meine Antwort bearbeitet und Ihnen einige Hintergrundinformationen zur Verfügung gestellt, die zur Lösung dieser Frage erforderlich sind. Ich habe auch versucht, Bilder hochzuladen, aber ich hatte kein Glück damit. Es tut mir Leid. Ich hoffe, meine neue Antwort klärt die Dinge für Sie auf. Wenn Sie weitere Fragen haben, können Sie diese gerne stellen.
Und dies ist eine Verbindung zu Dihybrid-Kreuzungen. Es wird erklären, warum 9:3:3:1-Verhältnisse erwartet werden. en.wikipedia.org/wiki/Dihybrid_cross
Ich bin mir der Mendelschen Genetik bewusst. Danke für deine Bemühungen und diesen Kommentar. Ich stimme ihnen zu, dass die bereitgestellten Informationen (Daten) nicht ausreichen, um eine wissenschaftliche Hypothese aufzustellen, aber Fragen wie diese werden in Büchern erwähnt, denen meine Universität folgt. Ich bevorzuge jedoch Ihre vorherige Antwort. Ich möchte Sie fragen, ob Sie Ihre Antwort mit einer maßgeblichen Referenz untermauern können.
Mit your answermeinte ich die vorherige Version, in der Sie über die Technik gesprochen haben.
Möchten Sie, dass ich es wieder auf die unbearbeitete Version zurückändere, oder könnte ich meine Antwort vielleicht noch einmal aktualisieren, wenn wir zu einer Schlussfolgerung zu diesem Problem gelangen können? Und ich habe kürzlich diese Website der University of Arizona gefunden, die den Zweck von Dihybrid-Kreuzungen erklärt. Ich denke, ihre Links mit den Nummern 10 und 11 zeigen Beispielsituationen, in denen ein statistisches Modell die Nullhypothese erfolgreich zurückweisen würde.