La realidad supera a la prisión (I)


Como decíamos en una entrada anterior, muchas situaciones de la vida cotidiana pueden modelizarse con la ayuda de la teoría de juegos. En concreto, destacábamos la utilidad del dilema del prisionero para entender el comportamiento de agentes que interactúan en situaciones donde el beneficio individual entra en conflicto con el bienestar colectivo. El mantenimiento del Estado del Bienestar podría ser una de ellas. Vamos a desarrollar un modelo sencillo para ver cómo y por qué. 

Supongamos que existe un Estado con solo dos personas (J1 y J2) en su territorio. Un día deciden diseñar un sistema de Estado del Bienestar, basado en impuestos y transferencias, de la misma forma que en muchos países del mundo. Si ambos cooperan pagando impuestos lograrían mejorar, debido a la posibilidad de prosperar si ambos aportan una parte de sus ingresos a la financiación del sistema. Esta posible prosperidad vendría en forma de mejores instalaciones, edificaciones, sanidad, protección, etc.; servicios de los que solo podrían disfrutar bajo el Estado del Bienestar.

Suponiendo que los dos individuos tienen las mismas preferencias, la peor situación de todas para un contribuyente sería que él pagara y su homólogo defraudara impuestos, de modo que el primero tendría que hacer frente a todos los gastos. En caso de que no colaborasen pagando impuestos, cada uno se quedaría con su dinero y sin servicios, quedando en peor posición quien no pagaba en el escenario anterior y en mejor situación el que sí lo hacía. El juego escrito en forma estratégica quedaría así: 

En cada casilla, el número de la izquierda representa la utilidad que obtiene J1, y
 el número de la derecha, la utilidad de J2.
Si atendemos a los pagos, tenemos un equilibrio de Nash en el perfil en el que ninguno de los jugadores paga impuestos. Esto quiere decir que, a pesar de que ambos obtendrían más utilidad pagando impuestos, ese perfil no es estable, ya que tienden a no pagar impuestos para obtener más utilidad.

Ahora supongamos que tenemos un Estado más grande, compuesto por 3 personas (J1, J2 y J3). El anterior planteamiento se podría ampliar para cualquier número de personas, pero de momento tenemos otro participante que debe decidir si paga o no impuestos. Bajo el supuesto de que cada individuo debe tributar lo mismo que para el caso de dos personas, cambian ciertos pagos en las celdas.

Por ejemplo, si solo una persona paga impuestos y las otras dos no (jugador 1 paga, jugadores 2 y 3 no pagan), ésta debe hacerse cargo ahora del triple de impuestos que le corresponderían si todo el mundo pagara, por lo que el contribuyente obtendría menos utilidad que en la ocasión precedente, mientras que el resto obtendrían la misma, dada la circunstancia de que no pagan impuestos. En la situación en que dos jugadores pagan y el tercero no, los dos primeros obtendrían una utilidad algo inferior a 2, que es la que se obtiene cuando todos pagan, pero mayor que 0 ya que no queda un único individuo a cargo de todos los impuestos, sino dos de ellos. También sería mayor que 1, ya que se lograrían crear los servicios (por ejemplo, 3/2). Mientras, el tercero obtendría una utilidad de 3. La utilidad cuando todos pagan y cuando ninguno paga sigue siendo la misma. Escrito de forma estratégica quedaría así:

Jugador 3: paga impuestos
En cada casilla, el número de la izquierda representa la utilidad que recibe J1; el del centro, la que recibe J2; y el de la derecha, la de J3.
Jugador 3: no paga impuestos

De nuevo, el equilibrio de Nash se encuentra en el perfil en el que nadie aporta dinero a las arcas públicas. 

Podríamos extrapolar este juego a n jugadores. Si lo hacemos con cuatro, cambiarían otra vez los pagos correspondientes a las situaciones en las que unos individuos pagan y otros no. Si dos de ellos pagan y otros dos no, el pago debería ser menor que 3/2, ya que pagan más impuestos entre dos que antes (dos personas pagaban los impuestos de tres y ahora son dos los que pagan los de cuatro), y mayor que 0, ya que el cargo de impuestos se reparte entre varias personas. Si uno de ellos paga y los otros tres no, la utilidad para los infractores sigue siendo de 3, pero para el contribuyente es inferior a  -1. Y por último, si uno no paga y los otros tres sí, la utilidad de los contribuyentes debería ser mayor que 3/2 pero menor que 2 (por ejemplo, 7/4). Si escribimos el juego en forma estratégica quedaría así:

Jugador 3: paga impuestos. Jugador 4: paga impuestos

Jugador 3: no paga impuestos. Jugador 4: paga impuestos

Jugador 3: paga impuestos. Jugador 4: no paga impuestos

Jugador 3: no paga impuestos. Jugador 4: no paga impuestos

El único equilibrio de Nash vuelve a encontrarse en el perfil donde nadie paga impuestos. Este equilibrio se halla mediante eliminación iterada de estrategias dominadas débilmente, que nos lleva a descartar la estrategia de pagar impuestos en cualquier circunstancia, dejando como único equilibrio que nadie pague impuestos. Todos los jugadores elegirán su mejor estrategia, que consistirá en no pagar.

Si el número de jugadores tiende a infinito, tenemos diferentes tipos de pagos por el número de personas que defraudan al Estado. Si ese número es pequeño, el pago de los contribuyentes tiende a 2. Cuando el número de defraudadores alcanza un número muy grande y el de contribuyentes es muy pequeño, la utilidad de los últimos tiende a un número lo suficientemente bajo como para que les sea todavía más ventajoso no pagar, lo cual refuerza el equilibrio de Nash. Solo tendríamos otro equilibrio cuando la utilidad por pagar impuestos colectivamente fuera mayor que la utilidad de defraudar, lo cual no es probable que ocurra, puesto que proporciona mayor satisfacción el disfrute de los servicios públicos sin el pago de impuestos por ellos. Así, el rango de utilidades de los contribuyentes puede ir desde menos infinito hasta 2, dependiendo del número de defraudadores.

Una vez formulado el juego, vamos a analizarlo cuando se repite un número infinito de veces. En ese caso, los pagos recibidos cuando se coopera en todos los periodos serían mayores que los de no cooperar (2 frente a 1), mientras que si uno de los jugadores defrauda, él recibiría un pago mayor en un periodo (3), pero sacrificaría el resto de periodos, donde recibiría el pago de no cooperar (1). En este contexto, si los participantes consideran que la duración del Estado del Bienestar es lo suficientemente grande como para no vislumbrar un fin de éste o, dicho de otro modo, si no son demasiado impacientes, la cooperación puede emerger como equilibrio. Vamos a calcular cómo de pacientes deben ser los individuos para que esto suceda.

Lo que buscamos es que los pagos por cooperar (pagar impuestos) sean mayores que los de desertar. Si se coopera en todos los periodos, la utilidad sería la de pagar impuestos (2), dividido por 1 menos un factor de descuento que, por cada periodo que pasa, reduce el valor del pago recibido, ya que los jugadores valoran más el presente que el futuro. Se trata de la suma de una progresión geométrica infinita de razón δ (2, 2δ...) :
En segundo lugar, el pago por defraudar será de 3, pero solo un periodo. Durante los siguientes el defraudador recibirá una utilidad de 1, ya que nadie querrá pagar impuestos cuando en el primer periodo alguien ha defraudado. Por lo tanto, tenemos:
Para que pueda surgir un equilibrio cooperando en todos los periodos se necesita que el valor de la primera suma sea mayor que el de la segunda:
En situaciones como esta, se dice que los individuos están jugando estrategias de gatillo: cada jugador paga impuestos si en el periodo anterior los demás lo hicieron. Si no, él tampoco pagará desde ese periodo en adelante. Para este tipo de estrategia y con estos pagos, el factor de descuento debe ser superior a ½ para que la penalización por defraudar impuestos sea lo suficientemente alta como para querer pagarlos siempre. Es decir, que deberían de ser lo suficientemente pacientes como para poder cooperar en todos los periodos, produciendo así un equilibrio de Nash perfecto en subjuegos en el perfil donde todos pagan impuestos. El factor de descuento podría entenderse como δ = 1/(1+r), de modo que si aumenta el tipo de interés los individuos se muestran más pacientes.

Como segunda hipótesis, podríamos considerar que este juego se repite un número finito de veces, por lo que los jugadores conocerían el fin de éste, o podrían intuirlo. En este caso, su mejor respuesta sería no cooperar, como ya se ha demostrado anteriormente, para cualquier etapa.

Llegados a este punto, lo natural es preguntarnos si las conclusiones del modelo se confirman en la vida real. A la aplicabilidad de la teoría a la práctica dedicaremos la próxima entrada.

Puedes seguir a Daniel Ghebreial en