notation (ab)gebrauch für Zufallsvariablen, Verteilungen, pdfs/pmfs

Bei dieser Frage geht es um die Notation für Zufallsvariablen (RVs), Verteilungen und PDFs / PMFs und deren häufige (Miss-) Verwendung, da ich kürzlich verwirrt war.

Lassen X , Y bezeichnen Zufallsvariablen.

Erstens, Notationen, denen ich normalerweise begegne. Bitte korrigiere mich:

  • Werte, die ein RV annimmt, werden normalerweise durch Kapitälchen gekennzeichnet P ( X = X ) [ 0 , 1 ] bezeichnet die Wahrscheinlichkeit des RV X den Wert annehmen X
  • X 1 , . . . , X N X bedeutet "es seien X_1,...,X_n RV mit gleicher Verteilung wie X " (oft iid )
  • Wenn X ist diskret, sein pmf wird normalerweise mit bezeichnet P ( X ) = P X ( X ) = P ( X = X ) [ 0 , 1 ]
  • Wenn X ist nicht diskret, sein pdf wird normalerweise mit bezeichnet F ( X ) = F X ( X ) [ 0 , ) oder P ( X ) = P X ( X ) um gleichzeitig über diskrete und nicht-diskrete RVs zu sprechen
  • die cdf wird normalerweise geschrieben als F ( X ) = F X ( X ) = P ( X X ) das ist eine Summe/Integral mit dem pdf/pmf

Die folgenden Notationen habe ich normalerweise "intuitiv" verstanden oder für schlampig gehalten, aber für einige Verwirrung gesorgt:

  • "Lassen X ein Wohnmobil mit Verteilung sein X P ( X ) " -- Was genau ist gemeint? Soll ich denken P -Robability hier oder ist es ein Symbol, das lautet: "Dies bezeichnet/repräsentiert die Verteilung von X "?
  • " P ( X , Y ) , P ( X ) , P ( X | Y ) bezeichnen die gemeinsamen, marginalen, bedingten Wahrscheinlichkeitsdichtefunktionen" - Wie soll ich das verstehen? Ich meine, sie sollten Funktionen von Werten sein, die die RVs annehmen können, aber hier nehmen sie die RVs selbst als Argument?
  • " Lassen P ( X , j ) eine (unbekannte) gemeinsame Wahrscheinlichkeitsverteilung auf Instanzen und Labels sein X × Y . Gegeben eine Trainingsprobe ( X ich , j ich ) ich = 1 N iid P ( X , j ) ..." - Wie ist das zu lesen?

Könnte mir jemand helfen und etwas Licht in die oben genannten Punkte bringen?

Sorry, falls meine Fragen doof sind. Ich habe nur das Gefühl, dass die Notation viel schlampiger wird, wenn ich angewandtes Zeug lese, und es würde mir helfen, festzuhalten, was eigentlich gemeint ist, oder zu wissen, dass man sich entspannen und lernen muss, wie man das schlampig-korrekt liest.

Antworten (1)

Du liegst ziemlich richtig. Die zweite Aufzählung ist voller verworrener Notationen, was zeigt, dass der Autor vage und verworrene Vorstellungen von Wahrscheinlichkeiten hat. Anstatt zu versuchen, diese Art von Zeug zu interpretieren und daraus zu lernen, sollten Sie sich viel besser an Material von Autoren halten, deren Notation sinnvoll ist.

Danke. Ich vermute dennoch, dass diese Notation Sinn macht, da sie zB auch in Folien eines selbst durchgearbeiteten Kurses erfolgt. Aber definitiv eine sehr ungewöhnliche Notation. Bisher habe ich es so genommen P X , Y P ( X , Y ) , P X P ( X ) , P X | Y P ( X | Y ) was intuitive Vorstellungen wie ermöglichen würde P ( X , Y ) = P ( X | Y ) P ( Y ) . Macht das Sinn? (zB gatsby.ucl.ac.uk/teaching/courses/ml1-2008/lect1-handout.pdf Folien 24, 31)
Trotzdem sind diese furchtbar schlampig und haben schreckliche Folgen für das Verständnis der Schüler (für jede Menge Beispiele siehe math.se-Fragen...).
@JamHei: Großzügig genug interpretiert, macht alles Sinn; und deine Interpretation von " P ( X , Y ) „als Sinn P X , Y würde hier Sinn machen. Aber mit dieser Art von Wirrwarr umgehen zu müssen, ist ein großes Handicap für Lernende.
Danke. Ich verteidige diese Notation nicht für Lernende. Tatsächlich sind sie der Grund für meine Verwirrung. Ich möchte nur einen Sinn daraus machen und verstehen, "wie man sie liest" in diesem Zusammenhang, zB dieses Kurses oder andere eher anwendungsorientierte Artikel, in denen ich sie auch gesehen habe. Wie zum Beispiel zusammenzufassen, was sie tatsächlich bedeuten oder welche schlampigen Notationen üblicherweise verwendet werden. Was ist mit den anderen beiden Kugeln?
PS. Auf Wikipedia ( en.wikipedia.org/wiki/Posterior_probability#Definition ) verwenden sie beispielsweise den Begriff "Wahrscheinlichkeitsverteilungsfunktion" ( en.wikipedia.org/wiki/Probability_distribution_function ) im Falle von P ( θ | X ) das ist irgendwie dasselbe (wie ich nehme θ Und X hier Wohnmobile sein). Also könnte es in diesem Bereich üblich sein?
Auch zB "Randverteilung P ( X ) “ im Vorlesungsskript zum Graphenlernen.
@JamHei: In Bezug auf die anderen beiden Beispiele mit Aufzählungszeichen: Ihre Vermutung ist so gut wie meine. Vielleicht interessiert sich ja noch jemand für die Interpretation. Ich würde Dids obigen Kommentar unterstreichen. Es ist am besten, sich nicht mit Lehrmaterial wie diesem einzulassen, zumindest bis Sie genug wissen, um es in konsistenter Notation umzuschreiben.