Dilema del prisionero

3 min

El dilema del prisionero es un problema de la teoría de juegos. El dilema del prisionero analiza los incentivos que tienen dos sospechosos de un crimen para delatar a su compañero o proclamar su inocencia.

Se trata de un juego no cooperativo, con suma no nula y de la categoría equilibrio de Nash. Gracias a este ejercicio podemos comprender la dificultad que pueden tener dos personas para cooperar incluso si esa cooperación fuera la mejor opción para las dos. En la mayoría de sus versiones es un juego simétrico. Es decir, los castigos de cada prisionero son las mismos.

Ejemplo del dilema del prisionero

El ejercicio se basa en dos sospechosos de un crimen. Para nuestro ejemplo les vamos a llamar Luis y Mario. La policía les arresta y, en la comisaría, les sitúa en dos habitaciones separadas. Dado que no hay pruebas suficientes para condenarlos la policía les ofrece el mismo trato a los dos. Pueden elegir entre dos opciones, delatar a su compañero o decir que son inocentes. Veamos qué le pasa a cada prisionero según la opción que coja:

  • Si Mario dice que son inocentes:

–           Pero Luis le delata a él, Mario tendrá que pasar 7 años en la cárcel y Luis saldrá libre.

–          Y Luis también dice que ambos son inocentes, les condenan a los dos por un delito menor y los dos tendrán que pasar un año en la cárcel.

  • Si Mario acusa a Luis:

–          Y Luis a su vez delata a Mario, ambos tendrán que pasar 3 años entre rejas.

–          Pero Luis dice que son inocentes, Mario saldrá libre pero Luis tendrá que pasar 7 años en prisión.

Si observamos este dilema desde un punto de vista cooperativo, lo que beneficia a los dos en conjunto sería comportarse como buenos amigos y decir que son inocentes, así los dos tendrán que pasar solo un año en prisión.

Sin embargo, si analizamos esta situación individualmente la situación cambia, porque los dos están separados y no pueden saber lo que el otro ha respondido. La mejor solución individual sería culpar al otro. Para verlo mejor vamos a ponernos de nuevo en la piel de Mario.

–          Si Luis le ha culpado y Mario dice que son inocentes pasará 7 años en la cárcel, pero si él también decide culpar a su compañero su situación mejora. Culpando a Luis su condena se reduce de 7 a 3 años.

–          Si Luis ha dicho que son inocentes y Mario también, los dos pasarán un año en la cárcel, pero si Mario decide culpar a Luis saldrá libre directamente. Por tanto, si culpa a Luis del crimen, su condena se reduce de un año a cero, mejorando también en este caso si culpa a su compañero.

Culpar a Luis sería la mejor respuesta racional de Mario (sin tener en cuenta las emociones, si es amigo o no de Luis). En la imagen de arriba vemos como Mario siempre mejorará si su respuesta está en la columna de la derecha (delatar).

Como cada uno persigue su propio interés y no pueden confiar en lo que el otro dirá, la mejor opción para los dos es adoptar la estrategia de declarar, lo que desemboca en la situación de equilibrio (3,3) en la cual cada uno minimiza su posible pérdida, pero la solución conjunta es peor. A este equilibrio (3,3) se le denomina Equilibrio de Nash.