Il dilemma del prigioniero: come funziona | Ep1

A tutti è capitato, e in genere accade spesso, di trovarsi di fronte ad un dilemma: una di quelle situazioni apparentemente insolubili in cui qualsiasi strategia ha i suoi pro e i suoi contro.

In questi casi qual è la cosa migliore da fare? Analizzare le possibilità e optare per la scelta che consenta di correre i minori rischi possibili e, allo stesso tempo, di garantire il risultato più alto.

Il dilemma del prigioniero è la chiave di volta “razionale” per risolvere tutti i dilemmi.

Il dilemma del prigioniero

Due sospettati, A e B, sono arrestati dalla polizia. La polizia non ha prove sufficienti per trovare il colpevole e, dopo aver rinchiuso i due prigionieri in due celle diverse, interroga entrambi offrendo loro le seguenti prospettive: se uno confessa (C) e l’altro non confessa (NC) chi non ha confessato sconterà 10 anni di detenzione mentre l’altro sarà libero; se entrambi non confesseranno, allora la polizia li condannerà ad un solo anno di carcere; se, invece, confesseranno entrambi la pena da scontare sarà pari a 5 anni di carcere. Ogni prigioniero può riflettere sulla strategia da scegliere tra, appunto, confessare o non confessare. In ogni caso, nessuno dei due prigionieri potrà conoscere la scelta fatta dall’altro prigioniero.

Quindi, la domanda che questo dilemma pone è la seguente:

Cosa accadrà? Come si comporteranno i due prigionieri?

Questa è la “forma base” con cui è noto il Dilemma del prigioniero, studiato da Merrill Flood e Melvin Dresher nel 1950 e successivamente formalizzato da Albert W. Tucker, a cui dobbiamo anche il nome del dilemma, tramite la matrice dei payoff.

Ma procediamo con ordine.

Il Dilemma del Prigioniero è un classico esempio della Teoria dei Giochi. Chiariamo, innanzitutto, cosa sia, in realtà, un gioco: la Teoria dei Giochi considera tali le situazioni in cui i giocatori prendono “decisioni strategiche”, cioè decisioni in cui ciascun giocatore tiene conto delle azioni e delle reazioni di ognuno degli altri.

Un primo distinguo è da operare tra “giochi cooperativi” e “giochi non-cooperativi”.

  1. Sono considerati “giochi cooperativi” quei giochi in cui i partecipanti possono accordarsi in modo tale da programmare strategie congiunte.
  2. Sono considerati, invece, “giochi non-cooperativi” quelli in cui non è possibile, da parte dei giocatori, accordarsi preventivamente per adottare la strategia più vantaggiosa per entrambi.

Il Dilemma del Prigioniero è un gioco NON-cooperativo, quindi, come già detto, i due prigionieri sono stati interrogati separatamente, non avendo potuto accordarsi preventivamente né potendo mai venire a conoscenza della strategia adottata dall’altro giocatore/prigioniero.

Il modo più comodo per rappresentare il Dilemma del prigioniero è la “Matrice dei Payoff”, ovvero una matrice che rappresenta i payoff  generati dalle decisioni strategiche dei giocatori. I Payoff non solo altro che gli esiti del gioco e rappresentano i benefici che deriveranno all’uno e all’altro giocatore in funzione della giocata. Un importante obiettivo della Teoria dei Giochi è, ovviamente, la determinazione della strategia ottimale di ogni giocatore, ovvero di quella strategia che massimizza il suo payoff atteso.

Rappresentiamo la matrice dei payoff del dilemma del prigioniero:

Il primo ad essere interrogato è il prigioniero A. Trattandosi di un gioco non-cooperativo, per ogni prigioniero è “meglio” confessare perché, indipendentemente dalla scelta dell’altro giocatore, il suo payoff è più alto confessando. Infatti, indipendentemente dalla giocata di A, per B sarà più conveniente confessare. Esaminiamo il perché: se A avesse confessato (C), a B converrebbe confessare (C) perché in questo modo sconterebbero entrambi 5 anni di carcere; se A non avesse confessato (NC), a B converrebbe a maggior ragione confessare (C) perché così facendo lui sarebbe libero, mentre A sconterebbe 10 anni di carcere.Come evidenziato dalla matrice, i prigionieri in questione sono di fronte ad un dilemma. Se entrambi fossero in grado di concordare di non confessare, allora ciascuno verrebbe condannato ad 1 solo anno di carcere. Ma essi non possono comunicare e, anche se potessero farlo, potrebbero fidarsi l’uno dell’altro?

L’equilibrio del gioco è posto dunque in C-C: i due prigionieri sconteranno entrambi 5 anni di carcere. Questa situazione di equilibrio è detta “pareto-inefficiente” perché, pur essendo quella razionale, essa non rappresenta la migliore delle situazioni possibili.

Secondo la Teoria dei Giochi, la scelta di confessare (C) operata dai due prigionieri alla luce del precedente ragionamento è detta “strategia dominante”: essa è infatti definita come la strategia ottimale indipendentemente da ciò che fa l’avversario.

Tuttavia, appare evidente come in realtà sarebbe molto più conveniente per entrambi i prigionieri non confessare (NC-NC), poiché così facendo sconterebbero entrambi soltanto 1 anno di detenzione. Ma questa giocata non sarà mai possibile!

Infatti essa risulta estremamente rischiosa, poiché se l’avversario confessasse (come è razionale che faccia) allora chi non ha confessato sconterebbe ben 10 anni di carcere, mentre l’avversario sarebbe libero.

L’unica variante che renderebbe vantaggioso per entrambi NC è che si tratti di un gioco cooperativo, ovvero che i due giocatori abbiano la possibilità di accordarsi preventivamente sulla strategia da adottare. Ma anche in questo caso, anzi, soprattutto in questo caso, la tentazione di non cooperare (e dunque di confessare) sarebbe ancora maggiore, poiché così facendo (certi del fatto che l’avversario cooperante giocherà NC) il prigioniero “leale” starà in carcere 10 anni, mentre il prigioniero “traditore” (che non ha rispettato l’accordo preventivo) sarà immediatamente libero.

E’ ovvio, come già dimostrato, che se si gioca una singola partita la strategia ottimale per entrambi è optare per la strategia dominante e dunque confessare.

La situazione di equilibrio posta in C-C appena descritta è detta “Equilibrio in strategie dominanti”.

E’ utile sottolineare come l’equilibrio in strategia dominanti sia un caso particolare dell’Equilibrio di Nash (dal nome del matematico John Nash, premio Nobel, che per primo spiegò questo concetto nel 1951).

Confrontiamo per chiarezza i due concetti di equilibrio:

Eq.Strategie dominanti:

  • Io faccio meglio che posso indipendentemente da ciò che fai tu.
  • Tu fai meglio che puoi indipendentemente da ciò che faccio io.

Equilibrio di Nash:

  • Io faccio meglio che posso dato ciò che fai tu.
  • Tu fai meglio che puoi dato ciò che faccio io.

Nei prossimi episodi analizzeremo tutte le possibili applicazioni del dilemma.


Bianca Misino



Lascia un commento

%d blogger hanno fatto clic su Mi Piace per questo: