fbpx
il dilemmma del prigioniero

@Top1Percent

Il dilemma del prigioniero e il poker, a partire da Liv Boeree

Se sei un giocatore di poker, le probabilità dicono che tu sia sufficientemente interessato e incuriosito dalla teoria dei giochi.
Del resto, il padre stesso della teoria dei giochi John Von Neumann ha preso in considerazione il poker nel suo libro “Theory of games and economic behavior” nel lontano 1944, e il primo teorico del poker David Sklanksy ha attinto molto dalla game theory per le sue strategie. E non dimentichiamo l’importanza pokeristica di John Nash e del suo equilibrio.

Il dilemma del prigioniero

Tutto questo era per introdurvi al dilemma del prigioniero, un problema della teoria dei giochi che molti di voi conosceranno già.
Il problema è apparentemente molto semplice: due criminali vengono accusati di un reato, e una volta arrestati non possono più comunicare tra loro. Gli investigatori dicono ad ognuno dei due che avrà la possibilità di collaborare o non collaborare, con questi esiti possibili:
Se entrambi collaborano, sconteranno 6 anni di carcere
Se entrambi non collaborano, sconteranno 1 anno di carcere
Se uno solo dei due collabora, questo eviterà la pena, ma l’altro verrà condannato a 7 anni
Si tratta di un problema interessante, perché a conti fatti l’intuito suggerisce che la scelta migliore sia non collaborare, così entrambi i criminali sconteranno un solo anno di carcere.

La soluzione è svantaggiosa?

La risposta matematica, però, indica esattamente il contrario, e il motivo è che non possiamo avere certezza di cosa sceglierà di fare l’altro.
La migliore strategia per ognuno è di minimizzare la propria condanna, e si nota come non collaborando si rischino 1 o 7 anni di carcere, superiori al rischio di 0 o 6 anni che si ottengono collaborando.
In altre parole, il risultato migliore non è un equilibrio, in quanto la strategia “non collabora” è dominata dalla strategia “collabora”.
Per alcuni questo corrisponde a un paradosso, in quanto il risultato che si verifica (6 anni di carcere) se giocano entrambi in equilibrio, procura più danno ad entrambi i giocatori dell’altra possibilità.
In effetti esiste una soluzione non riconosciuta da tutti che preveda il non collaborare come unica opzione, se diamo per scontato che entrambi abbiano una capacità logica perfetta che porti a escludere completamente altre possibilità.

Liv Boeree e Split or Steal: una poker player alle prese con il dilemma del prigioniero

Liv Boeree non dovrebbe aver bisogno di presentazioni: giocatrice di poker inglese di gran successo, volto di PokerStars per lunghi anni e vincitrice di un braccialetto WSOP in tag team con il compagno di vita Igor Kurganov. Oltre a pokerista Liv è anche modella e soprattutto astrofisica, e il suo percorso di studi solidamente matematico non può che aver giovato alla sua carriera da poker player… e da partecipante ai quiz show!Poco prima di avere successo come giocatrice, nel 2007 per essere esatti, Liv ha partecipato al programma “Split or Steal”, trovandosi alle prese appunto con il dilemma del prigioniero (sebbene in una forma alternativa).

In questo gioco i due concorrenti si contendono una certa somma, che in questo caso ammontava a £6.500,50 e dopo una breve discussione potranno scegliere tra Split (dividi) o Steal (ruba).
Se entrambi scelgono “Split” andranno a casa con $3.250,25 ciascuno, se entrambi scelgono “Steal” se ne usciranno con le tasche vuote. Ma se uno solo tra i due sceglie “Steal”, metterà le mani sull’intera somma lasciando l’altro giocatore con le pive nel sacco.

La psicologia da poker in Split or Steal

È evidente che Liv ha messo in gioco più di qualche conoscenza utile nel poker, a partire dal gioco psicologico. Tralasciando per un secondo che Liv sia una bellissima ragazza, e che l’estetica abbia un valore di bias non indifferente, la Boeree è stata capace di bluffare davvero bene convincendo il povero Stuart a fare la scelta sbagliata. Con il senno di poi è anche tutto molto evidente: sorridere e annuire, indicare la sfera che contiene (spoiler: non era vero) lo “Split”, fare complimenti all’avversario (“I really like you”), giocare sui sensi di colpa (“Please don’t let me down”) e battere le mani come interruzione di pattern, classica mossa utilizzata nell’ipnosi.

Le differenze con il dilemma del prigioniero

Tra Split or Steal e il dilemma del prigioniero c’è però una grandissima differenza (sebbene l’idea di fondo sia la stessa): qui è collaborare che porta il rischio di perdere tutto e il guadagno minore, mentre rubare dà la possibilità di guadagno maggiore e il rischio di perdere tutto.
Split dà la possibilità di vincere £3.250 o £0, Steal £6.500 o £0. Qui la mossa giusta potrebbe essere steal, ma in caso di due giocatori perfettamente preparati, questo non potrebbe che portare a una perdita di entrambi. Che è la situazione peggiore di tutte. Paradossalmente sarebbe meglio se un giocatore decidesse di Splittare pur sapendo di perdere: a lui non cambierebbe nulla, ma almeno qualcuno prenderebbe quei soldi…

DILEMMA DEL PRIGIONIERO
Collabora Non collabora
Collabora 6 – 6 0 – 7
Non collabora 7 – 0 1 – 1
SPLIT OR STEAL
Split Steal
Split 3 – 3 0 – 6
Steal 6 – 0 0 – 0

 

La vera grande differenza tra i due giochi però è che in Split or Steal i protagonisti possono comunicare, dettaglio importantissimo.
Solitamente, come nel video di Liv, si tenta di rassicurare l’altro e convincerlo che splitteremo, per poi ogni tanto tradirlo e soffiare tutto il montepremi.
Probabilmente la strategia migliore è una di quelle che nel poker volgare si chiama “mossa di durezza”. Dire all’altro che qualunque cosa succeda, noi sceglieremo steal, ma gli daremo la sua fetta di montepremi fuori dal gioco.
In questo modo per l’opponent l’unico modo di fare qualche soldo è avere fede e scegliere split, altrimenti sicuramente uscirà perdente. Per la cronaca, questo è accaduto una volta in trasmissione, e alla fine il giocatore determinato a scegliere steal ha sorpreso tutti con uno split. Voleva solo assicurarsi che l’altro non potesse scegliere steal a nessun costo.

Le partite tra umani ed intelligenze artificiali saranno la normalità nel prossimo futuro?

(Vi diremo di più: ci si potrebbe anche assicurare un premio maggiore convincendo l’avversario che sceglieremo steal e poi gli daremo il 40% del montepremi. In quel caso per lui sarà comunque meglio prendersi quell’ammontare che nulla).

Il dilemma del prigioniero e il poker: dove si può applicare?

Il dilemma del prigioniero non si può applicare direttamente al poker per vari fattori, non per ultimo il fatto che il dilemma del prigioniero sia un gioco a informazione completa (nel poker è imperfetta) e che il dilemma preveda che la situazione si verifichi una sola volta (nel poker è spesso ripetuta).

Avrete notato che la situazione del dilemma del prigioniero non è facile da trovarsi nel poker, ma qualcosa lo possiamo sempre imparare.

Per esempio, il valore di un randomizzatore e di bilanciare le frequenze. In teoria se entrambi i giocatori lanciassero una moneta per decidere cosa fare, otterrebbero una media di 3,5 anni di carcere, molto migliore dei 6 detti dalla teoria, e sarebbe quindi la scelta migliore.

Peccato che se due giocatori potessero accordarsi e fidarsi dell’altro a tal punto, tanto varrebbe decidere per un non collaborare collettivo.

Quello che però insegna di utile, è l’importanza di capire l’avversario e di quanto fidarsi di ciò che si sa. Infatti il dilemma diventa molto più semplice se conosciamo la decisione dell’altro, e il valore atteso cambia se sappiamo che l’avversario ha tendenze particolari. È a tutti gli effetti un passaggio da GTO a exploit.

I Livelli di pensiero

Se la matematica ha una risposta, il dilemma del prigioniero, infatti, non è per nulla esente da quello che conosciamo come leveling, o livelli di pensiero.

Livello 1.  Entrambi non confessiamo
Livello 2.  Se lui non confessa, io confesso e me la passo liscia
Livello 3.  Se lui confessa, anche io devo confessare
Livello 4.  Se ha capito il livello 3, sa che non confessare è la scelta migliore per entrambi
Livello 5.  …

E nel poker come in questo dilemma, la teoria dei giochi nasce proprio per non doversi preoccupare di queste cose (o difendersi da esse).

Se consideriamo l’EV complessivo di una mossa, e la diamo in pasto a un solver, questo troverà il miglior equilibrio possibile. Dovrebbe tendere alla parità tra i due, e viene infranto se uno dei due adotta un gioco non ottimale.

Ci troveremo quindi a fare delle mosse previste dalla Game Theory che si riveleranno perdenti, ma saranno utili a bilanciare il gioco rendendoci vincenti nel long term.

Una teoria “impossibile”

Questo articolo stava per concludersi, quando ci è venuta in mente una possibile rappresentazione pokeristica del dilemma del prigioniero, fateci sapere se vi trovate d’accordo:

Giocare dai blinds significa perdere soldi, ma lasciare che gli avversari li rubino sempre è molto più costoso. La scelta migliore per non perdere, sarebbe accordarsi per far sì che nessuno rubi i blinds e giochi solo per valore, ma nel momento in cui uno dei due ne approfitta, l’altro deve difendersi. E così nasce tutta l’aggressività delle dinamiche di steal.

Top1Percent

Puntiamo sul valore

© Top1Percent Lug 21, 2024 Tutti i diritti riservati

Chi siamo

La scuola di poker che ti mette a disposizione tutti gli strumenti per iniziare il tuo percorso verso il professionismo.

Pagine Utili

Home

Lo staking

Rakeback

Team