El Dilema del Prisionero


Al darse a conocer a partir de la Segunda Guerra Mundial gracias a John von Neumann y siendo ampliada posteriormente por referentes en matemáticas como John Nash o Albert Tucker, puede decirse que la teoría de juegos todavía es una disciplina joven, lo cual no debe llevarnos a restarle importancia. La teoría de juegos ha sido aplicada a ámbitos tan variados como la economía (para estudiar, por ejemplo, los mercados oligopolísticos) o las relaciones internacionales (como argumento de Estados Unidos para la guerra preventiva contra la Unión Soviética durante la Guerra Fría).

Hay muchos tipos de juego, muy diferentes unos de otros. Pero todos tienen algo en común: en ellos participan al menos dos jugadores (enfrentados o no), cada uno de los cuales tiene un conjunto de estrategias y recibe unos pagos por cada uno de los posibles resultados del juego. El juego del gallina, monedas coincidentes, o la guerra de sexos son algunos ejemplos. No obstante, existe uno en particular que ha suscitado especial interés entre matemáticos, psicólogos, economistas y, en general, cualquier estudioso de la teoría de juegos: el dilema del prisionero.

Este juego nos presenta a dos prisioneros que han cometido un crimen y se ven abocados a una condena, aunque tienen una oportunidad para librarse de ella: deben delatar al otro prisionero. No hay diálogo previo entre los prisioneros antes de tomar una decisión al respecto y tampoco saben qué ha hecho el otro, si les ha delatado o no. En este contexto, la teoría de juegos puede ayudar a prever el comportamiento de los prisioneros, siempre que estos sean racionales.

Supongamos que si uno de los dos prisioneros decide delatar al otro, mientras que el otro se mantiene en silencio, este último tendrá que ir a la cárcel seis años, y el primero quedará en libertad. En cambio, si ambos se delatan el uno al otro, los dos irán a la cárcel tres años. Por último, en el caso de que los dos cooperen y se mantengan en silencio, irán a la cárcel solo un año.

Podemos plantear este dilema (de ahí el nombre del juego) en esta tabla:


En cada celda, el número de la izquierda representa los años de cárcel para uno de los prisioneros (jugador 1) y el número de la derecha los años para el otro prisionero (jugador 2). Como podemos observar, la mejor situación de todas para cada prisionero consiste en que él confiese el crimen y el otro se mantenga en silencio, de manera que el primero no iría a la cárcel. El segundo mejor resultado se produce cuando ninguno de los dos confiesa y cada uno es condenado a un año de cárcel. Finalmente, lo peor que puede pasarle al prisionero es que él no confiese y su compañero le delate. 

Los prisioneros valoran de manera distinta cada uno de estos resultados. De acuerdo con la ordenación de preferencias que hemos planteado, llegaríamos a esta segunda tabla donde, dentro de cada celda, el número de la izquierda es el pago que obtiene el jugador 1 y el de la derecha el pago del jugador 2:


La lectura de esta tabla revela la existencia de un óptimo de Pareto (situación donde ninguno de los jugadores puede mejorar haciendo otra cosa sin que el otro empeore) en la celda donde ninguno confiesa. Entonces, parece claro, los prisioneros deben mantenerse en silencio, ¿verdad? Pues no, no lo harán, y precisamente en este punto reside el interés del juego. Los dos prisioneros confesarán, porque a la hora de plantearse qué hacer en cada posible situación llegarán a la conclusión de que esa decisión es la mejor. Pongámonos en la piel de uno de los dos jugadores: si el otro no confiesa, recibirá un mayor pago confesando (3 es mayor que 2), y si el otro confiesa, también recibirá un mayor pago confesando (1 es mayor que 0).

Por supuesto, en comparación con este resultado los prisioneros estaría mejor colectivamente si no confesarán, pero no tienen incentivos a cooperar de esta manera. Confesar o no confesar, he aquí el dilema: existe un resultado óptimo para ambos que no ocurre, pues individualmente prefieren delatarse.

Si bien a primera vista este relato puede parecer algo rebuscado, lo cierto es que se reproduce más a menudo de lo que parece en nuestra vida cotidiana. Sin ir más lejos, pensemos en un trabajo en grupos de dos para una asignatura de la universidad. Si ninguno de los dos compañeros hace nada, ambos suspenden. Si uno se esfuerza y el otro no, los dos aprueban, pero el primero se encontrará menos satisfecho que el otro. Por el contrario, si los dos se esfuerzan, también aprueban, pero se habrán repartido la carga de trabajo. 

En general, el dilema del prisionero es aplicable a contextos donde el beneficio individual entra en conflicto con el colectivo, como ocurre en los mercados oligopolísticos, donde las empresas se plantean si acordar entre ellas los precios que fijan a sus productos o las cantidades que ponen a la venta. Como hemos explicado, la teoría de juegos nos dice que en estas situaciones los implicados, siendo racionales, prefieren actuar en beneficio propio a cooperar para alcanzar el mejor resultado para el colectivo. A partir de aquí, en nuestras manos está la posibilidad de descubrir los dilemas del prisionero a los que nos enfrentamos a diario y actuar en consecuencia. Sin embargo, a veces puede ser útil no seguir la dirección indicada por la teoría de juegos, como nos enseñaron los habitantes de Gotham City:


Puedes seguir a Daniel Ghebreial en: