Wahrscheinlichkeit von mindestens 333 Personen, die in einer Gruppe von nnn Personen denselben Geburtstag haben

Haftungsausschluss: Ich habe Beiträge mit guten Antworten für den Fall "mindestens 2 Leute" oder "genau 2 Menschen". Beiträge mit "mindestens k Leute" nehmen normalerweise an, dass der gemeinsame Geburtstag ein fester Tag ist (zB der 2. Januar) und wenden die Binomialverteilung an. Dieser Beitrag hat mit der Wahrscheinlichkeit von zu tun 2 Personen mit demselben (zufälligen) Geburtstag in einer Gruppe von N Menschen.


Versuchen:

Die Wahrscheinlichkeit von mind 2 Personen mit demselben Geburtstag in einer Gruppe von N Personen ist das Komplement der Wahrscheinlichkeit, dass jeder einen anderen Geburtstag hat. Das ist:

P ( N , k 2 ) = 1 365 364 ( 365 N + 1 ) 365 N
Nehmen wir nun an, wir wollen finden P ( N 3 ) . Indem man davon ausgeht, dass 2 Menschen bereits denselben Geburtstag haben, können wir diese beiden als eine Person behandeln. Also die Wahrscheinlichkeit von mind 2 Personen, die denselben Geburtstag in einer Gruppe von haben N 1 Menschen ist:
P ( N 1 , 2 ) = 1 365 364 ( 365 N + 2 ) 365 N 1
Dann denke ich daran, die Wahrscheinlichkeit zu finden P ( N , k = 2 ) von genau 2 Personen, die denselben Geburtstag in einer Gruppe von haben N Leute und irgendwie berechnen:
P ( N , k 3 ) = P ( N 1 , k 2 | N , k = 2 )
aber möglicherweise irre ich mich. Irgendwelche Gedanken?

Der Grund, warum die Leute dazu neigen, es nicht aufzuschreiben, ist, dass es für den Allgemeinen sehr chaotisch wird k , N . Sogar für 3 , N , es ist chaotisch, weil Sie die Möglichkeit in Betracht ziehen müssen, dass keine zwei einen Geburtstag haben, genau zwei einen Geburtstag haben, genau zwei Personenpaare einen Geburtstag haben (wenn auch nicht denselben Geburtstag) und so weiter. Keine schwierige Berechnung auf einer Maschine, aber schwer mit Bleistift und Papier zu bewerkstelligen.

Antworten (2)

Soweit ich das beurteilen kann, funktionieren Ihre Methoden nicht und können nicht gerettet werden.

Dies ist ein schwieriges Problem, das mit herkömmlichen Mitteln nicht gelöst werden kann. Um die Wahrscheinlichkeit zu finden, dass mindestens drei Personen einen gemeinsamen Geburtstag haben, berechnen wir stattdessen die Wahrscheinlichkeit, dass keine drei Personen einen gemeinsamen Geburtstag haben. Dies ist gleich

(1) N ! [ X N ] ( 1 + X + X 2 / 2 ) 365 365 N .
Hier, [ X N ] F ( X ) ist der Koeffizient von X N im Polynom F ( X ) . Sie wollen eins minus der oben genannten. Eine andere Möglichkeit, dies zu schreiben, ist
(2) A 1 , A 2 , , A 365 1 365 N N ! A 1 ! A 2 ! A 365 ! .
wobei die Summe über alle Vektoren geht ( A 1 , A 2 , , A 365 ) von ganzen Zahlen zwischen 0 Und 2 dessen Summe ist N . Dies funktioniert, weil jeder Vektor eine gültige Verteilung von Geburtstagen angibt, bei der sich kein Geburtstag dreimal oder öfter wiederholt, und der Multinomialkoeffizient die Anzahl der geordneten Auswahlen von Geburtstagen angibt, die diese Verteilung haben, und jeder dann mit der Wahrscheinlichkeit multipliziert wird ( 1 / 365 ) N dieser geordneten Auswahl auftritt. Das kannst du beim Erweitern prüfen ( 1 ) und sammeln Sie den Koeffizienten von X N , du bekommst genau ( 2 ) .


Wenn Sie mit einem ungefähren Ergebnis einverstanden sind, beträgt die erwartete Anzahl von Drillingen von Personen, die einen gemeinsamen Geburtstag haben λ = ( N 3 ) 1 365 2 , und die Anzahl der Drillinge mit einem gemeinsamen Geburtstag ist ungefähr Poisson mit Parameter λ . Daher ist die Wahrscheinlichkeit, dass einige Drillinge einen gemeinsamen Geburtstag haben, ungefähr

1 e ( N 3 ) / 365 2 .

Können Sie erläutern, wie Sie das erste Ergebnis hergeleitet haben, auch bekannt als die Wahrscheinlichkeit, dass keine drei Personen einen Geburtstag haben?
@LoneBone Siehe Bearbeiten.

Obwohl es keine einfache Formel für den exakten Ausdruck in Mike Earnests Gleichung (2) gibt, gibt es effiziente Möglichkeiten, ihn für jeden gegebenen Wert auszuwerten   N   pmultinom, von denen eines das Paket der statistischen Programmiersprache R implementiert hat . Hier ist ein R-Programm zum Vergleichen der genauen Wahrscheinlichkeiten von mindestens drei Personen, die einen gemeinsamen Geburtstag haben, mit der Poisson-Näherung für N = 90   Zu   100   :

library(pmultinom)
us<-1:365
ps<-1:365
for (i in 1:365){
  us[i]<-2
  ps[i]<-365^(-1)
}
for(n in 90:100){
  a = 1-pmultinom(upper=us,size=n,probs=ps,method="exact")
  b=1-exp(-n*(n-1)*(n-2)/(6*365^2))
  v<-c(n,a,b)
  print(v)
}

Wenn Sie es hier online ausführen , erhalten Sie die folgenden Ergebnisse:

N genau Poison ca. 90 0,5341956 0,5859698 91 0,5456984 0,5982312 92 0,5571482 0,6103927 93 0,5685366 0,6224440 94 0,5798554 0,6343752 95 0,5910964 0,6461763 96 0,6022517 0,6578381 97 0,6133135 0,6693514 98 0,6242745 0,6807075 99 0,6351272 0,6918979 100 0,6458645 0,7029148
Für diesen Wertebereich gilt also die Poisson-Näherung 10 % zu spät.