lección 8 (teoria de los juegos) (2015)

Apunte Español
Universidad Universidad de Girona (UdG)
Grado Criminología - 1º curso
Asignatura Introducción a la sociologia
Año del apunte 2015
Páginas 7
Fecha de subida 09/03/2015
Descargas 12
Subido por

Vista previa del texto

CONCEPTOS ELEMENTALES DE LA TEORÍA DE LOS JUEGOS INTRODUCCIÓN La teoría de los juegos se encarga del estudio de decisiones en contextos estratégicos, es decir, contextos en los que la utilidad esperada depende de la propia decisión que tomen otros.
La teoría parte de dos supuestos:  Los individuos que interactúan tienen conocimiento de las reglas del juego, de las alternativas de acción disponible y de las consecuencias de las mismas.
 Los individuos escogerán racionalmente, es decir, que maximicen su utilidad ELEMENTOS BÁSICOS DE LA TEORÍA  Conjunto de estados del mundo (S) exhaustivos (no hay más estados posibles) y exclusivos (uno implica que no se den los demás)  Un conjunto de acciones (A)  Un conjunto de consecuencias (C), habiendo una para cada par de S y A  Una ordenación de preferencias P sobre las consecuencias.
Con estos elementos, la situación de interacción estratégica se representa de varios modos.
Aquí veremos sólo la forma de representación llamada “normal”. Los juegos en forma “normal” son aquellos en los que la decisión de cada agente se toma sin conocimiento de la decisión que ha tomado otro. No hay una secuencia de decisiones en la que la decisión no una sea conocida por el siguiente. A efectos prácticos, podemos pensar en los juegos en forma normal como en la que la decisión de ambos es simultánea.
LAS MATRICES DE PAGO Los juegos en forma normal se presentan mediante “matrices de Luís pagos”.
Hay dos jugadores (Pedro y Luís). Cada jugados tiene un conjunto de acciones o estrategias posibles. Una estrategia es un plan de acción. En el caso de los juegos de forma normal, que se Pedro A B C 3,3 5,0 D 0,5 1,1 caracterizan por una única decisión del agente, hablamos de estrategia como equivalente a la decisión que toma el agente. Aquí, Pedro puede escoger entre A y B y Luís entre C y D.
En este caso, hay 4 estados del mundo posibles: (A,C), (A,D), (B,C), (B,D). Los agentes tienen un orden de preferencias según el cual, casa uno de estos estados del mundo puede situarse en un ranking del más preferido al menos preferido. Los números representan esa preferencia.
En la matriz, los “pagos” representan esa preferencia. En cada casilla, los pagos de la izquierda siempre corresponden a lo que obtendrá el jugador de filas (Pedro) en ese estado del mundo, y los de la derecha, lo que obtendrá el jugador de la columna (Luís).
ELIMINACIÓN ITERADA DE ESTRATEGIAS DOMINADAS Aunque la situación en la que se encuentran los agentes es una situación estratégica, en algunas ocasiones la estructura de los pagos conduce a un tipo de decisión paramétrica, pues en realidad no se tiene en cuenta qué lo que se espera que haga el otro. Esto se produce cuando el jugador tiene razones suficientes como para preferir una estrategia en lugar de otra independiente de lo que vaya a hacer el otro.
Por ejemplo, Pedro ha de elegir entre la estrategia A y la B. él no Luís sabe si Luís escogerá C o D pero, pero en realidad puede tomar su decisión sin considerarlo.
 Si Luís escoge C, la estrategia que daría mejores pagos a Pedro Pedro sería la B, porque con ella Pedro gana 5, y con la A A B C 3,3 5,0 D 0,5 1,1 sólo ganaría 3.
 Si Luís escoge D, la mejor estrategia que daría mejores pagos a Pedro sería B porque con ella Pedro gana 1, con la A ganaría 0.
Un agente racional y autointeresado nunca escogerá una estrategia dominada. A efectos prácticos, la fila o la columna de una estrategia dominada podría “borrarse” del juego. En la medida en que se asume que los agentes son racionales, pero también que esperan de los demás racionalidad, se supone que cada jugador sabe cuáles son sus estrategias dominantes, pero también cuáles son las estrategias dominantes de su oponente.
Al proceso mediante el cual se van eliminando del juego las estrategias dominadas lo llamamos eliminación iterada de estrategias dominadas (EIED) Una estrategia x domina a una y si:  Los pagos con x nunca son menores que los que se obtienen con y  Por lo menos una ocasión el pago x es mayor que y La solución del juego es cuando en el proceso de “borrado” de estrategias dominadas nos quedamos con una única casilla. La teoría de los juegos considera que ese estado del mundo es el estado al que llegarán agentes racionales que tengan ese orden de preferencias. También establece que ese es el estado del mundo al que deben llegar si quieren ser racionales.
Volviendo al ejemplo, si en el caso de Pedro, B dominaba a A, y en el caso de Luís, D dominaba a C, entonces es obvio que la solución del juego es (1,1), que son los pagos que se obtienen cuando Pedro escoge B y Luís escoge D.
Otro ejemplo: A B C Pedro D 5,4 3,2 4,1 Luís E 5,2 9,5 10 , 7 F 7,3 4,7 4,9 Podemos comenzar el proceso EIED por Luís Luís se preguntará si D domina a E, si E domina a D, si D domina a F, si F domina a D, si D domina a F y si F domina a D.
 Si Pedro escoge A, D da mejores resultados que E Sin embargo, si Pedro escoge B, D da peores resultados que E. Como en este punto ya se ha incumplido la definición de lo que es una estrategia dominante, no hace falta seguir comparando con lo que pasaría si Pedro escoge C, y ya podemos decir que D no domina a E. De hecho, este mismo razonamiento también señala que E no domina a D.
Si Pedro escoge A, D da mejores resultados que F. Sin embargo, si Pedro escoge B, D da peores resultados que F. D, por tanto, no domina a F. Este mismo razonamiento también señala que F no domina a D.
 E no domina a F porque si Pedro escoge A, E da peores resultados que F  F domina a E. Si Pedro escoge A, F da más pagos que E. Si Pedro escoge B, F da más pagos que E. Y si Pedro escoge C, F da más pagos que E. Es decir, escoja lo que escoja Pedro, Luís siempre habrá obtenido más pagos si ha Luís elegido F.
D F Esto significa que podemos “borrar” la estrategia E del A 5,4 7,3 juego. Entonces el juego queda así: Pedro B 3,2 4,7  C 4,1 Pasemos a ver si Pedro tiene estrategias dominantes.
Luís Si Luís escoge D, Pedro obtiene más con A que con B. Si Luís escoge F, Pedro obtiene más con A que con B.
Entonces, A domina B. así que podemos “borrar” la 4,9 Pedro D 5,4 4,1 A C estrategia B: Pedro: S i Luís escoge D, Pedro obtiene más con A que con C.
si Luís escoge F, Pedro obtiene más con A que con B.
F 7,3 4,9 Luís Pedro A D F 5,4 7,3 entonces A domina a C, así que podemos “borrar” la estrategia C.
Si Luís espera que Pedro sea racional, sabe que Pedro nunca escogerá ni B ni C. además, Luís sabe que si él mismo es racional, nunca escogerá E. Por tanto, Luís “sabe” que Pedro escogerá A, y él tan sólo tiene que comparar los pagos que obtendría con D y F. Como se puede ver, Luís obtiene más con D que con F. Así, podría borrarse de esta matriz la estrategia F, y el resultado quedará: Pedro escogerá A y Luís escogerá D (5 , 4).
EL EQUILIBRIO DE NASH Mediante el procedimiento de EIED no siempre ocurre que hallemos una solución al juego. Es decir, no siempre podemos ir borrando hasta quedarnos con una única casilla.
El concepto de equilibrio de Nash se basa en el concepto de “mejor respuesta”: Una mejor respuesta se define como aquella estrategia que proporciona resultados mejores que todas las demás estrategias posibles frente a una estrategia dada del rival.
Así, un equilibrio de Nash es una combinación de estrategias en la que cada estrategia es la mejor respuesta a la otra.
CÓMO IDENTIFICAR UN EQUILIBRIO Como se puede ver, no existen Luís estrategias dominantes, de modo que no podemos hallar una solución mediante la EIED, C 3,3 5,1 A B Pedro En un caso así, la teoría de juegos afirma que los D 1,5 0,0 jugadores acabarían en algún equilibrio.
Un modo fácil de determinar qué es un equilibrio consiste en ir marcando las mejores respuestas de cada estrategia en relación cada una de las estrategias del rival.
Pedro pensará: “Si Luís escoge C, mi mejor respuesta sería B”. B por tanto, es el “best reply” a C. lo marcamos. Y luego pensará: “Si Luís escoge D, mi mejor respuesta es A”. A por tanto, es el “best reply” de D. lo marcamos Por su parte, Luís pensará “Si Pedro escoge A, lo mejor que puedo hacer es escoger D”. D es el mejor “best reply” de A. y luego pensará:”Si Luís Pedro escoge B, lo mejor que puedo hacer es escoger C”. C es el “best reply” a B. Lo marcamos Siempre que en una casilla estén los dos pagos Pedro A B C 3,3 5,1 D 1,5 0,0 marcados, eso es un equilibrio de Nash. Aquí, por tanto, hay dos equilibrios (5 , 1) y (1 , 5).
Si este mismo ejercicio lo hacemos con un dilema del prisionero, podemos comprobar que no siempre que una estrategia es “best reply” de otra, esta obra lo es de la primera: Si marcamos en un dilema del prisionero las estrategias que son “best reply” vemos lo siguiente: Pedro A B Luís C 3,3 5,0 D 0,5 1,1 Un equilibrio es una situación tal que ningún agente tienen ningún motivo por el que desviarse unilateralmente de la estrategia que ha escogido. Es decir, estando en un equilibrio, nadie tiene razones para cambiar de estrategia.
Si, en el último ejemplo, Pedro y Luís están en (1 , 1), Pedro no tendría interés en cambiar de B a A porque supondría pasar a ganar 0 en lugar de 1. Y Luís no tendría ningún interés de pasar de D a C por el mismo motivo.
Un principio que siempre se cumple es el siguiente: Un equilibrio de Nash siempre “sobrevivirá” a la EIED, lo que no significa que todas las combinaciones de estrategia sobrevivías sean un equilibrio de Nash. Dicho de otro modo, borrando filas y columnas de estrategias dominadas nunca borraríamos un equilibrio de Nash. Por tanto, si un juego tiene solución a través de la EIED, podemos estar seguros de que esta combinación de estrategias era el único equilibrio de Nash.
EQUILIBRIOS ÓPTIMOS Y SUBÓPTIMOS DE PARETO Un óptimo de Pareto es un estado del mundo (una combinación de estrategias) tal que no existe la posibilidad de mejorar los pagos de al menos un jugador sin perjudicar los de otro.
un equilibrio es un óptimo de Pareto si no existe ningún otro escenario (ninguna “casilla” de la matriz de pagos) al que pudiera pasarse para mejorar los pagos de algún jugador sin perjudicar los de otro jugador. Y al contrario, un equilibrio es subóptimo si existe otro escenario en el que los pagos de uno o más jugadores son superiores y ninguno es inferior.
Por ejemplo, en el dilema del prisionero: Luís Vemos que el equilibrio (1 , 1) es subóptimo, pues existe otro escenario (3 , 3) al que podría “pasarse” mejorando los pagos de algunos (en este caso, de los dos jugadores) sin perjudicar los pagos de ninguno. Aquí, por tanto, la Pedro A B C 3,3 5,0 D 0,5 1,1 racionalidad individual conduce a un resultado subóptimo.
Luís Sin embargo, en el juego del privilegio: Vemos que el equilibrio (4 , 4) es un óptimo de Pareto porque no pueden mejorarse los pagos de ningún jugador sin perjudicar los de otro (de hecho ningún pago puede ser Pedro A B C 4,4 3,2 D 2,3 1,1 mejorado).
Podemos hablar también de “denominación paretiana” al comparar dos casillas. Así en el dilema del prisionero, aunque el equilibrio es subóptimo, Pareto domina a la casilla B – D (0 , 5), porque si pasáramos del equilibrio a esa casilla Luís saldría ganando pero a costa de que Pedro perdiera. Igualmente, el equilibrio “pareto – domina” a la casilla B – C.
JUEGOS TÍPICOS La estructura de algunos juegos es recurrente: aparece en situaciones muy diversas de la vida social. Estas estructuras has ido ganándose un nombre a lo largo del tiempo, de manera que los investigadores que emplean la Teoría de Juegos suelen referirse a determinadas situaciones sociales por el nombre del modelo que las representa. Así, una situación x “es un Dilema del Prisionero”, o una situación y es un “juego del seguro”.
En estos juegos, las preferencias de los dos agentes son idénticas, y por tanto el juego es simétrico. Se entiende que las estrategias disponibles son “cooperar” (emprender una acción costosa) y “no cooperar” (abstenerse de emprender la acción costosa).
EL DILEMA DEL PRISIONERO Cooperar Cooperar 3,3 No cooperar 1,4 No cooperar 4,1 2,2 Como puedes ver, el orden de preferencias de los jugadores es: U (NC,C) > U(C,C) > U(N,N) > U(C,NC) Siendo: U (NC , C) la utilidad obtenida por el agente cuando él no coopera y el otro sí; U (C , C) la utilidad obtenida cuando ambos cooperan; U (N , N) la utilidad obtenida cuando ninguno coopera; U (C , NC) la utilidad obtenida por el agente cuando él coopera y el otro no.
El Dilema del Prisionera es la típica situación en la que la racionalidad individual conduce a una irracionalidad colectiva, el equilibrio de Nash es un subóptimo de Pareto: ambos preferían estar en el escenario de la cooperación mutua, pero la racionalidad les conduce a un resultado peor.
DILEMA DEL GALLINA Cooperar Cooperar 3,3 No cooperar 2,4 No cooperar 4,2 1,1 El orden de los jugadores es: U (NC , C) > U (C , ) > U (C , NC) > U El Dilema del Gallina no tiene solución obtenida mediante EIED, pero si dos equilibrios de Nash: (NC , C) y (C , NC). Ambos son óptimos de Pareto. Es decir, la teoría predice que alguno de los agentes cooperará, pero es incapaz de prever cuál de los dos será.
JUEGO DEL SEGURO El Juego del Seguro tiene la forma siguiente: Cooperar No cooperar Cooperar 4,4 3,1 No cooperar 1,3 2,2 U (C , C) > U (NC , C) > U (NC , NC) > U (C , NC) No tiene solución mediante el EIED, pero si dos equilibrios de Nash: (C , C) y (N , N). Sin embrago, (C , C) es óptimo de Pareto, de manera que la predicción es que los agentes deberían ser capaces de coordinarse en el equilibrio óptimo.
JUEGO DEL PRIVILEGIO Cooperar No cooperar Cooperar 4,4 3,2 No cooperar 2,3 1,1 U (C , C) > U (NC , C) > U (C , NC) > U (NC , NC) Tiene solución obtenida mediante EIED (y un equilibrio de Nash): (C , C). Además, el equilibrio es un equilibrio óptimo de Pareto.
...