100-Münzen-Paradoxon [geschlossen]

Ich habe mich gefragt, was in der Literatur einige Lösungsvorschläge für das folgende bekannte Paradoxon sind:

Angenommen, zwei rationale, intelligente Spieler A und B stehen vor einem Stapel mit 100 Münzen und spielen das folgende Spiel: In jeder Runde kann ein Spieler wählen, ob er eine Münze aufheben möchte, dem anderen Spieler die nächste Runde gibt oder 2 aufhebt Münzen und beenden Sie das Spiel genau dort. A und B wollen beide ihren Gewinn maximieren. Sie können nicht miteinander sprechen oder in irgendeiner Weise interagieren (außerhalb des Spiels selbst natürlich).

Ein Grund könnte folgender sein: Wenn wir nur 2 Münzen haben, nehme ich gleich 2 Münzen und beende das Spiel. Aber B, der sich dessen bewusst ist, wird sich dann dafür entscheiden, 2 Münzen zu nehmen, wenn 3 übrig sind (weil er dann am Ende 1 Münze mehr hat). Wenn wir mit dieser Induktion fortfahren, kommen wir schließlich zu dem Schluss, dass das rationalste Verhalten darin besteht, zwei Münzen in A's erstem Zug aufzuheben. Offensichtlich eine sehr ungewöhnliche Schlussfolgerung.

Danke!

(Ich habe diese Frage wegen der Verbindung zum „Unerwartet hängenden Paradoxon“ mit „Erkenntnistheorie“ markiert.)

Willkommen auf der Seite! :) Meine erste Frage an euch lautet: Können die Spieler miteinander sprechen? Zwei „rationale“ Spieler würden einfach sagen: „Hey, dieses Spiel ist lahm. Das würde ihre Gewinne maximieren. Ich denke, die "Schlussfolgerung" im Beispiel gilt nur, wenn sie jeden ihrer Gewinne unter Ausschluss der anderen Person maximieren wollten (dh das Ziel ist nicht, an sich tatsächlich zu profitieren , sondern mehr als die andere Person zu verdienen).
Danke! In den meisten Versionen, die ich kenne, können die Spieler nicht miteinander sprechen, und das Ziel ist es, den maximal möglichen Gewinn für sich selbst zu erzielen (der Gewinn des anderen Spielers spielt keine Rolle). Ich habe meinen Beitrag bearbeitet, um die frühere Annahme aufzunehmen.
Wenn es egal ist, wie mich die andere Person versteht, ist die rationale Strategie, wie Stoicfury sagt, immer 1 zu nehmen, und Sie werden mit 50 enden. Was für ein Paradoxon gibt es dann?
Nun, meine Frage richtet sich eher an Leute, die mit diesem Paradoxon bereits vertraut sind, aber ... kurz gesagt, stellen Sie sich den Fall vor, dass es nur zwei Münzen gibt. Nehmen wir an, A ist an der Reihe. Dann wäre es am vernünftigsten, wenn A diese beiden Münzen aufheben würde. Stellen Sie sich den Fall vor, es gibt 3 Münzen und B ist an der Reihe – das Vernünftigste für B ist, 2 Münzen aufzuheben. Stellen Sie sich den Fall vor, es gibt 4 Münzen und A ist an der Reihe - A weiß, dass B, wenn er eine Münze nimmt, also 3 Münzen übrig bleiben, B zwei nehmen würde und das Spiel mit einem geringeren Gewinn für A enden würde, also nimmt A wieder zwei Münzen. ..
@yorei: Ich habe noch nie von diesem Spiel oder der Beschreibung gehört, es ist unklar, was die Regeln Ihres Spiels sind. Haben Sie eine Online-Referenz?
Leider habe ich keine Referenz zur Hand (Ich habe von diesem Paradoxon einmal von meinem Dozenten gehört, der erwähnt hat, dass es bekannt ist) ... vielleicht trägt dieses Paradoxon allgemein einen anderen Namen. Ich werde dies untersuchen und auf Sie zurückkommen, wenn ich etwas finde (ich denke, ich sollte den Umfang der Frage erweitern auf „Gibt es einen bekannten Namen für dieses Paradoxon“).
Meinst du das Tausendfüßler-Spiel ? Die beschriebenen Regeln sind nicht genau das, was Sie angegeben haben, aber ähnlich ...
Wir brauchen wirklich etwas mehr Kontext zu diesem Problem. Können Sie uns auch sagen, was Sie dazu motiviert haben könnte, nach einer Erklärung zu fragen? Was hast du vielleicht schon herausgefunden?
Das erinnert mich an das Gefangenendilemma .

Antworten (3)

Der Fall mit 4 Münzen entspricht funktional dem Fall mit 100 Münzen oder jeder anderen Münzprägung über 3 hinaus.

Nehmen Sie der Einfachheit halber an, dass A immer zuerst geht.
PP = Persönlicher Gewinn

1 Münze
A : Nimmt 1 Münze. PP = 1
B : (Spiel ist bereits vorbei)

2 Münzen
A : Nimmt 2 Münzen. PP = 2
B : (Spiel ist bereits vorbei)

3 Münzen
A : Nimmt 2 Münzen. PP = 2
B : (Spiel ist bereits vorbei)

Bisher kann A in Bezug auf die Gewinnmaximierung unmöglich besser abschneiden. Sobald Sie 4 oder mehr Münzen erreichen, kommt ein neuer Faktor ins Spiel: Die Leistung des anderen Spielers und "was rational ist" wird drastisch verändert. Wenn Sie wissen, dass die Person eine rationale Person wie Sie selbst ist, können Sie 1 nach dem anderen auswählen und hoffen, dass sie dasselbe tun, um Ihre beiden Gewinne zu maximieren. Wenn Sie wissen, dass es sich um eine gemeine, gierige Person handelt, können Sie mit 2 Münzen eröffnen, um das Spiel zu beenden. Wenn Sie nichts über die andere Person wissen , würde die rationalste Entscheidung darauf basieren, was der durchschnittliche Spieler B in einer solchen Situation tun würde. Wenn die durchschnittliche Person in der Position von Spieler B das Spiel einfach genau dort mit 2 Münzen beenden wird, ist Ihr vernünftigster Zug (als SpielerA ) wäre, es in der ersten Runde zu beenden. Andernfalls ist es am vernünftigsten, jeweils 1 zu nehmen.

4 Münzen
A : Nimmt 2 Münzen. PP = 2
B : (Spiel ist bereits vorbei)

ODER

A : Nimmt 1 Münze. PP = 1
B : Nimmt 2 Münzen.
Das Spiel ist vorbei.

ODER

A : Nimmt 1 Münze. PP = 1 bisher
B : nimmt 1 Münze. PP = 1
A : Nimmt 2 Münzen. PP = 3 insgesamt

ODER

A : Nimmt 1 Münze. PP = 1 bisher
B : nimmt 1 Münze. PP = 1
A : Nimmt 1 Münze. PP = 2 insgesamt
B : Nimmt 1 Münze. PP = 2 insgesamt

Bei vier Münzen würden Sie immer zwei Münzen als A nehmen. Dies aus folgendem Grund: Da es B nur darum geht, seinen Gewinn zu maximieren, ist es bei 3 Münzen am sichersten, nur 2 Münzen zu nehmen. Wenn Sie also 1 Münze bei 4 auswählen, würde B dann 2 Münzen auswählen, und Sie würden am Ende einen Gewinnverlust erleiden. Ich nehme an, man könnte sagen, dass das Paradoxon davon ausgeht, dass beide Spieler sich gegenseitig als kalte, rationale Maschinen betrachten.
Aber ich möchte betonen: Mich interessieren /bereitsbekannte/ Lösungen in der Literatur, nicht Originalforschung. Sie könnten hier einen sehr guten Punkt haben, aber Ihre Antwort fällt nicht in den Rahmen meiner Frage. Trotzdem vielen Dank für deine Mühe!
Nun, wie Mitch habe ich noch nie von diesem Problem gehört, also kann ich Ihnen da nicht helfen. In Bezug auf 4 Münzen: Nein, daraus folgt nicht, dass bei 4 Münzen die vernünftigste Wahl von Anfang an 2 ist. Es ist möglich, insgesamt 3 zu bekommen; Vielleicht ist dein Gegner schlecht in Strategie, wer weiß? Sobald man Menschen dazu bringt, ist es ein anderes Spiel. Hätten Sie im ursprünglichen Beitrag jedoch "kalte, rationale Maschine" anstelle von "Mensch" behauptet, würde dies nur diese beiden Schlussfolgerungen (4 & 5 Münzen) ändern. Nach 5 gibt es selbst bei "kalten, rationalen Maschinen" keine Szenarien, in denen es sinnvoll ist, mit 2 zu eröffnen, um das Spiel zu beenden.
@stoicfury das ist falsch. Wenn Sie für "kalte, rationale Maschinen" anerkennen, dass der richtige Zug für 4 Münzen darin besteht, 2 zu nehmen, muss Spieler A im Fall von 5 mit 2 Münzen eröffnen. Andernfalls, wenn er 1 nimmt, ist die logische Wahl von B, 2 zu nehmen , sodass Spieler A 1 PP weniger hat.
@zephyr: Du hast recht, es war ein Fehler. Ich wollte "Nach 5" schreiben, nicht 4. :) Ich werde es bearbeiten, danke.

Dies scheint mir dem Gefangenendilemma sehr ähnlich zu sein, und das logisch korrekte Verhalten hängt davon ab, ob es sich um eine einzelne Begegnung mit einem unbekannten Gegner oder um eine Reihe wiederholter Spiele handelt.

Antwort der Spieltheorie: Ja, das Zeug ist seltsam. Menschen handeln nicht so, weil sie irrational sind. Machen wir mehr Beweise!

Empiristische Antwort: Betrachtet man historische Daten, teilen die Menschen im Allgemeinen bis zu den letzten zwei oder drei. Sie verspüren auch sehr stark den Wunsch nach Gegenseitigkeit. Wenn P(sie teilen)*(verbleibende Münzen) -(P(sie teilen)-1)*2 > 0, dann wird der Empiriker teilen.

Timeless Decision Theory : Unter der Annahme, dass beide Spieler nur an ihrem eigenen Profit interessiert und völlig logisch sind und absolut sicher sind, dass ihr Gegner ebenso rational und eigennützig ist, erkennen beide, dass der andere Spieler genau dasselbe tun wird wie sie. Angesichts dessen erkennen beide Menschen, dass ihr Partner es auch tun wird, wenn sie es teilen. Daher ist die rationale Entscheidung, eine Münze zu nehmen.

Zur "empiristischen Antwort": Der Durchschnittsmensch würde am Ende des Spiels um die letzten 2 oder 3 (von 100) Münzen geizig werden? Ich sehe das empirisch überhaupt nicht, obwohl es völlig vom Kontext abhängen würde. Ich denke, die meisten Leute werden sich nicht um 3 Münzen kümmern, wenn sie bereits 47 haben, und werden im Geiste der Zusammenarbeit treu weitermachen, wenn die Münzen 1-Cent-Münzen sind. Wenn es sich bei den Münzen um 5000-Dollar-Münzen handelt, bekommen Sie vielleicht ein paar hinterhältigere Leute, die die letzten 2 nehmen, um das Spiel zu beenden, anstatt es 50/50 zu teilen. Aber trotzdem, wäre das die durchschnittliche Person? Ich glaube nicht.
Wenn man davon ausgeht, dass jeder Spieler erwartet, dass der andere die Strategie anwendet, die er selbst an einer bestimmten Stelle anwenden würde, dann würde ein Spieler, nachdem mindestens zwei Münzen genommen wurden und genau drei übrig bleiben, eine Münze werfen, bis Kopf kommt, und dann eine Münze nehmen Wenn dies eine ungerade Anzahl von Würfen erfordert und zwei, wenn gerade, dann hat ein Spieler, der eine Münze nimmt, wenn noch vier übrig sind, einen Erwartungswert, der unendlich viel größer als 2 ist, und würde daher davon profitieren, nur einen zu nehmen. Ein Spieler mit fünf oder mehr Münzen würde von dieser Strategie profitieren, indem er den Vier-Münzen-Spieler dazu verleitet, nur eine zu nehmen.