Update Diese Frage wird in Abschnitt 3.2 dieser Hinweise beantwortet .
Als Wahrscheinlichkeitsanfänger kämpfe ich damit, die Definition einer Markov-Kette als Folge von Zufallsvariablen vollständig zu verstehen.
Betrachten Sie der Einfachheit halber zeitdiskrete, homogene Markov-Ketten mit endlichen Zustandsräumen wofür wir halten . Ich verstehe in diesem Zusammenhang die folgende Definition einer Markov-Kette:
Eine Markov-Kette ist ein Paar Wo ist eine Übergangsmatrix .
Mit dieser Definition kann man eine Trajektorie der Markov-Kette erzeugen, die aus einer unendlichen Folge besteht von Elementen von durch Initialisierung in einem Zustand und sich gemäß den Übergangswahrscheinlichkeiten vorwärts entwickeln .
So weit so gut – das ist alles ganz intuitiv.
Nehmen wir stattdessen an, dass man eine Markov-Kette als Folge betrachtet von Zufallsvariablen mit Werten in mit der Markov-Eigenschaft - gibt es eine Standardzuordnung zwischen diesen Definitionen? Insbesondere da jeder ist eine Zufallsvariable, deren Domäne ein Abtastraum ist ;
und da die Übergangswahrscheinlichkeiten üblicherweise als bedingte Wahrscheinlichkeiten beschrieben werden;
oder die Transponierung davon abhängig von Ihren Konventionen, vermutlich gibt es einen Sample-Raum und ein Wahrscheinlichkeitsmaß irgendwo sitzen ?
Eine Vermutung wäre das kann als Menge aller Folgen angenommen werden von Elementen von , die Zufallsvariable ordnet jede solche Sequenz ihrer zu Element,
Und ein beliebiges Wahrscheinlichkeitsmaß für die Menge der Teilmengen von ist die die Markov-Eigenschaft erfüllt.
Ist diese Beschreibung (einer Richtung) der Entsprechung zwischen diesen Markov-Kettendefinitionen korrekt und/oder Standard ?
Ich bin mir nicht sicher, ob dies Ihre Fragen vollständig beantwortet, und ich bin definitiv kein Experte, aber es ist das Beste, was ich tun konnte. Entschuldigung, es ist ein bisschen lang und mäandrierend, aber ich komme schließlich zu Ihren Fragen.
Ja, hinter einer Zufallsvariablen sitzt immer ein Zustandsraum , aber wie Sie bemerkt haben, wird es normalerweise unterdrückt, da es in gewissem Sinne die "Welt" und alle möglichen Zustände beschreibt, in denen sich die Welt befinden könnte, und daher viel zu kompliziert ist , um direkt damit umzugehen.
Unser Ziel bei der Definition einer Zufallsvariablen ist in einem sehr realen Sinne, unser Modell der "Welt" zu vereinfachen, indem wir viele Zustände auf dasselbe Ergebnis abbilden. Zum Beispiel wenn Ist oder Je nachdem, ob mein Münzwurf Kopf oder Zahl ist, wird dieses Ergebnis vermutlich unabhängig davon sein, ob es morgen regnet oder die politische Dynamik in China usw.
Genauer gesagt, da der Münzwurf eine 50/50-Chance ist und unabhängig davon, ob es morgen regnet oder nicht, bedeutet dies, dass sich die Menge der Staaten, in denen es regnet, gleichmäßig (in Bezug auf das Maß der beiden Überlappungen) mit dem überlappt zwei disjunkte Coin-Flip-Sets, die unseren Zustandsraum unterteilen, außerdem werden die Überlappungen allein durch die Unabhängigkeit so sein, dass die Konditionierung auf Köpfe die Regenwahrscheinlichkeit nicht ändert. Das heißt
Somit wird der Zustandsraum mit dieser unvorstellbar komplexen Sammlung von Mengen (messbaren Ereignissen) mit allen möglichen komplizierten Mustern überlappender Symmetrien überlagert.
Zum Glück bei der Vereinfachung unserer Sicht auf die "Welt" über eine Zufallsvariable , selbst erbt die Eigenschaft, ein Wahrscheinlichkeitsraum zu sein, in dem wir die Wahrscheinlichkeit eines Ereignisses messen durch Zurückziehen zurück zu folgendermaßen:
Somit können wir nicht nur den ursprünglichen Zustandsraum unterdrücken , aber wir können sogar die ursprüngliche Zufallsvariable unterdrücken, wenn wir wollen, oder anders gesagt, wir könnten eine neue Zufallsvariable definieren das ist nur die Identitätsfunktion. Darüber hinaus können wir dieses vererbte Maß unter einigen milden Annahmen als das Lebesgue-Integral einer nicht negativen Funktion schreiben mit Gesamtmaß , das ist nur unser bekanntes pdf. Deshalb ist nur .
Das Wichtigste für die Leute ist, dass das meiste Modellieren hier beginnt, nicht damit , aber mit . Aus diesem Grund beginnen wir in Anwendungen unser Modell so oft mit der Angabe einer Verteilungs-/Dichtefunktion, die uns etwas sagt direkt, und dann winken wir nur mit den Händen darüber, wie sich dieses "in der Theorie" auf einen a priori konsistenten, aber letztendlich unerkennbaren Zustandsraum zurückzieht .
Daher ist es für Ihre Markov-Kette im endlichen Zustandsraum wichtig, dies zu klären sind keine Zustände deiner Markov-Kette, sie sind die sich entwickelnden vererbten Wahrscheinlichkeitsmassenfunktionen . Wo Ihre Übergangsmatrix Ihnen sagt, wie Sie von einem pmf zum nächsten gehen. Natürlich hinter jedem ist eine Zufallsvariable was Wert nimmt mit Wahrscheinlichkeit und hat einen zugrunde liegenden Zustandsraum so dass
Daher möchte ich klarstellen, dass in der Übergangsmatrix-Markov-Kettenformulierung sowohl der Zustandsraum und die Folge von Zufallsvariablen unterdrückt und Sie beobachten stattdessen nur die Entwicklung der Folge der zugehörigen Wahrscheinlichkeitsmassenfunktionen die Ihnen die Wahrscheinlichkeit mitteilen, dass sich Ihre Markov-Kette zu einem bestimmten Zeitpunkt in einem bestimmten Zustand / Knoten befindet .
Deine zweite Formulierung ist somit gleichbedeutend mit Setzen gleich dem Standardbasisvektor und überprüfen Sie dann den Wert bei der Koordinate des Vektors ; das wird natürlich gleich sein .
Als du geschrieben hast Ich denke, woran Sie vielleicht denken, ist die Wahrscheinlichkeit verschiedener Folgen von Zuständen Ihrer Markov-Kette, was etwas anderes ist.
Abschließend wofür Ich würde mir darüber keine Gedanken machen, wenn Sie wirklich wollen, können Sie mit einer endlichen Menge herumspielen und versuchen Sie, einige Mengen auf verschiedene Weise zu überlappen, um zu sehen, wie es beim Konzept der Unabhängigkeit wirklich darum geht, wie sich Mengen in einer Art symmetrischer Kaskadierung überlappen.
ALS
JoshPhysik