Siete di fronte a N porte, dietro una delle quali si nasconde un premio, mentre dietro le altre ci sono scimmie o caprette. Per visualizzare il probelma, poniamo che N sia pari a 3. Dopo aver scelto una porta, l’ospite (Monty Hall) apre un’altra porta che nasconde un premio di consolazione. Ora avete l’opportunità di rimanere con la vostra scelta iniziale o di cambiarla, per cui la domanda è: è più vantaggioso rimanere con la scelta originale oppure cambiare porta, allo scopo di massimizzare le probabilità di vincere il premio principale? Quando si analizzano questioni annesse alla statistica e alla probabilità è vero che l’intuito, in molti casi, porta sulla strada sbagliata, determina dei misleanding, delle incomprensioni, dei bias molto marcati che portano a conclusioni errate di cui non è facile rendersi conto. Il paradosso di Monty Hall è forse uno degli esempi più clamorosi di quanto possa essere contro-intuitiva la statistica e il calcolo delle probabilità, in particolare.
Let’s make a deal era il programma TV anni 70 condotto da Monte Halparin, noto più che altro come Monty Hall. La dinamica del quiz presente nel programma prevedeva che il pubblico si vestisse in modo stravagante, ed il conduttore scegliesse uno di loro, ad ogni puntata, in modo da massimizzare l’audience. Monty, a quel punto, offriva 100 dollari al prescelto per fargli una controproposta: saresti disposto a ridarmi quei 100 dollari per avere la possibilità di partecipare al nostro gioco? Chiaramente, l’uomo o la donna del pubblico accettava.
Il gioco delle tre porte consisteva nell’indovinare dietro quale porta fosse nascosta una macchina nuova di zecca (il premio del gioco), evitando le altre due (che di solito celavano una scimmia o una capra, simbolicamente inutili). Da un punto di vista del calcolo delle probabilità il giocatore possiede inizialmente una possibilità su tre di indovinare, che corrisponde al 33% circa di probabilità a favore, contro il 66% circa contro.
Il gioco pero’ seguiva una specifica dinamica,: se un giocatore scegliere la porta numero 1, ad esempio, prima di svelarla Monty Hall faceva scoprire (conoscendo la porta con la macchina, s’intende) ad un’assistenza la porta numero 3, che mostrava sempre una capra. A questo punto il dilemma, che conduce ad un dibattutissimo e curioso paradosso probabilistico: al giocatore conviene cambiare la scelta della porta 1 e andare sulla 2, oppure conviene una scelta conservativa e rimanere sulla porta 1? La probabilità di indovinare è pari adesso a 50 e 50, oppure a 2 probabilità su 3 (circa il 66%, per cui la probabilità sarebbe raddoppiata)?
Il dibattito è infuriato per molto tempo su una rivista americana (Parade Magazine), dove fior di matematici e statistici hanno sostenuto in modo convinto, indignato ed altrettanto errato che la probabilità fosse del 50%. In realtà le probabilità cambiando porta raddoppiano. La cosa sembra banale da accettare ma non lo è, tanto che – già all’epoca, nei pieni anni Novanta – molte furono le risposte piccate e indignate in merito: tra indignazione e allerta morale generalizzata, i critici della risposta al problema (fornita da Marilyn vos Savant) furono talmente numerose che un lettore arrivò a chiedersi, grottescamente, quanti altri matematici arrabbiati debbano ancora scrivere perchè tu possa convincerti di aver sbagliato? Proof by intimidation, prova mediante intimidazione, fu l’ironica considerazione del professor Tom Leighton del MIT che si è occupato del problema in una citatissima (e molto divertente) lezione sui concetti probabilistici associati all’informatica (la lezione è disponibile su Youtube a questo indirizzo, ed è stata riassunta qui).
Il concetto di fondo del paradosso di Monty Hall è che conviene cambiare scelta, dato che facendolo la probabilità raddoppia da 1/3 a 2/3 (cioè dal 33% al 66% circa). Ma allora perchè non è vero che la probabilità diventa del 50%, come peraltro gran parte dei lettori della rivista (tra cui moltissimi matematici) aveva sostenuto con tanta virulenza? Il punto che molti non hanno inteso è che, in questioni probabilistiche del genere, non è l’intuito lo strumento più adeguato a risolvere il problema, dato che finisce per fuorviare la questione: è il metodo, semmai, a essere importantissimo.
Se proviamo ad astrarre il problema in termini probabilistici, possiamo immaginarlo come dominato da uno spazio campionario (sample space) nel quale sono presenti tutti i possibili risultati dell’esperimento. È necessario ricorrere a questo tipo di astrazione metodologica perchè altrimenti, come abbiamo accennato, il rischio concreto è che l’intuizione ci porti fuori strada. Lo spazio campionario di un esperimento (probability game, nel caso specifico quello di Monty) è l’insieme di tutti i risultati che possono potenzialmente avvenire.
Si parla più precisamente di sample point (campioni), ovvero tutte le informazioni utili di cui disponiamo in merito allo spazio campionario, incluse le possibili scelte che possono essere operate dal giocatore. Ad esempio il caso in cui un giocatore si trovi di fronte ad una porta aperta con una capretta dietro, con la possibilità di rimanere sulla scelta iniziale (porta 1) o switchare sulla porta 2 potrebbe essere rappresentato da una tupla nello spazio probabilistico del tipo:
- la porta con il premio (la 2, ad esempio);
- la porta scelta dal giocatore (la 1, nell’esempio);
- la porta che viene aperta (la 3, nell’esempio);
Con queste tre informazioni in forma di tupla, di fatto, sappiamo tutto quello che ci serve sul problema in esame. Per cui avremo ad esempio:
(2,1,3)
detto sample point (2, 1, 3) che sarà quello in cui, discorsivamente:
- il premio si trova dietro la porta 2,
- il giocatore ha scelto inizialmente la porta 1,
- la porta che viene mostrata è la numero 3.
Una volta familiarizzato con questa notazione, è facile accorgersi che in questo caso il giocatore vince, perchè aveva scelto una porta con la capra e sceglie correttamente quella con la macchina dietro. Peraltro, è bene notare, non tutte le combinazioni di numeri interi appartengono allo spazio campionario:
(1, 2, 1)
non ne fa parte, ad esempio, perchè significherebbe che la porta con il premio è la numero 1, il giocatore sceglie la 2 e viene aperta la porta 1. Per lo stesso motivo (2, 1, 1) non è nello spazio campionario, mentre invece:
(1, 1, 2)
lo è, così come:
(1, 1, 3)
rappresenta una possibilità concreta nella dinamica del nostro gioco. Le due istanze sono casistiche possibili in quello che viene definito tecnicamente universo di possibilità.
Possiamo enumerare le varie casistiche, senza scendere in dettagli troppo tecnici (sfruttando un albero n-ario in cui generiamo vari path che rappresentano la strada intrapresa dal giocatore), distinguendo le tre fasi in cui avviene il gioco, che coincidono con i tre numeri componenti un certo sample point in un determinato momento.
Nella prima abbiamo la porta in cui è presente la macchina, che il giocatore può teoricamente indovinare con 1 probabilità su 3; abbiamo poi la scelta effettiva del giocatore, che presenta comunque probabilità 1/3, e poi abbiamo il momento in cui viene aperta una porta che mostra una capra.
Qui è fondamentale capire che non tutte le casistiche sono equiprobabili, ovvero che se consideriamo tutti i casi possibili, che riporto di seguito.
Se l’auto si trova nella porta 1, possono capitare i seguenti casi, modellati da rispettive triple di valori interi:
(1,1,2) L (l’auto era nella porta 1, viene rivelata la porta 2, il giocatore aveva scelto la porta 1 e la cambia: il giocatore perde)
(1,1,3) L (l’auto era nella porta 1, viene rivelata la porta 3, il giocatore aveva scelto la porta 1 e la cambia: il giocatore perde, di nuovo)
(1,2,3) W (l’auto era nella porta 1, viene rivelata la porta 3, il giocatore aveva scelto la porta 2 e la cambia: il giocatore stavolta vince)
(1,3,2) W (l’auto era nella porta 1, viene rivelata la porta 2, il giocatore aveva scelto la porta 3 e la cambia: il giocatore vince)
Se l’auto si trovava dietro la porta 2:
(2,1,3) W (l’auto era nella porta 2, viene rivelata la porta 3, il giocatore aveva scelto la porta 1 e la cambia: il giocatore vince)
(2,2,1) L (l’auto era nella porta 2, viene rivelata la porta 1, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)
(2,2,3) L (l’auto era nella porta 2, viene rivelata la porta 3, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)
(2,3,1) W (l’auto era nella porta 2, viene rivelata la porta 1, il giocatore aveva scelto la porta 3 e la cambia: il giocatore vince)
Se invece l’auto era dietro la porta 3:
(3,1,2) W (l’auto era nella porta 3, viene rivelata la porta 2, il giocatore aveva scelto la porta 1 e la cambia: il giocatore vince)
(3,2,1) W (l’auto era nella porta 3, viene rivelata la porta 1, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)
(3,3,1) L (l’auto era nella porta 3, viene rivelata la porta 1, il giocatore aveva scelto la porta 3 e la cambia: il giocatore perde)
(3,3,2) L (l’auto era nella porta 3, viene rivelata la porta 2, il giocatore aveva scelto la porta 3 e la cambia: il giocatore perde)
W ed L fanno riferimento a Win e Lose, ovviamente, e li abbiamo lasciati come riferimento generale per sintetizzare l’esito del gioco.
Di base è sbagliato assumere che siano equiprobabili, per cui basti dividere i casi di vittoria (indicati con W) con i casi totali (che sono 12), ottenendo 50 e 50 come risultato. Il metodo generale prevede infatti che si definisca una funzione che opera nello spazio di probabilità, che opererà in modo specifico rispetto alle regole del gioco, così come al numero di scatole (N) che sono in gioco nello specifico. Se ogni sample point viene etichettato con la probabilità rispettiva che avvenga, andiamo a calcolare il prodotto della probabilità di tutto ciò che incontriamo in quel caso, quindi attraversando i tre momenti che abbiamo distinto all’inizio.
Calcolando le probabilità solo degli eventi vincenti avremo pertanto che:
P(1,2,3) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9
P(1,3,2) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 3 * P che che sia rivelata la porta 2 = 1/3 * 1/3 * 1 = 1/9
P(2,1,3) = P che il premio sia dietro la porta 2 * P che il giocatore scelga la porta 1 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9
P(2,3,1) = P che il premio sia dietro la porta 2 * P che il giocatore scelga la porta 3 * P che che sia rivelata la porta 1 = 1/3 * 1/3 * 1 = 1/9
P(3,1,2) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9
P(3,2,1) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9
I sei eventi di potenziale vittoria sono mutuamente esclusivi, cioè se ne avviene uno non possono avvenirne altri contemporaneamente: quindi possono essere sommati tra loro (non moltiplicati, il che implicherebbe una probabilità condizionata come abbiamo visto). La probabilità che cercavamo, quella di valutare la bontà della scelta “cambiare porta” per massimizzare le chance di vittoria, sarà data da:
P = 6 * 1/9 = 3/2