tema 2: jocs dinamics (2014)

Apunte Catalán
Universidad Universidad Rovira y Virgili (URV)
Grado Administración y Dirección de Empresas - 2º curso
Asignatura microeconomia
Año del apunte 2014
Páginas 9
Fecha de subida 15/10/2014
Descargas 2
Subido por

Vista previa del texto

TEMA 2. JOCS DINÀMICS Esquema: 2.1 Jocs dinàmics amb informació perfecta 2.1.1 Representació en forma extensiva d’un joc 2.1.2 Solucions als jocs dinàmics 2.2 Jocs dinàmics amb informació imperfecta 2.3 Jocs repetits Els jocs dinàmics són aquells en els que és fonamental considerar el transcurs del temps.
Això succeeix si, per exemple, un jugador pren una decisió després de conèixer part del desenvolupament del joc. Per representar aquestes situacions utilitzem la forma extensiva. Més endavant, veurem que la forma extensiva es pot reduir a la forma normal utilitzada per jocs estàtics. De totes maneres, l’anàlisi dels jocs dinàmics es realitzarà més fàcilment des de la forma extensiva.
La forma extensiva ha de definir l’ordre en què els jugadors prenen les seves decisions, la informació que tenen en cada moment, les alternatives que tenen a la seva disposició i els guanys rebuts per cada jugador per cada possible camí que hagi pogut transcórrer el joc.
2.1 JOCS DINÀMICS AMB INFORMACIÓ PERFECTA Definició: Els jocs amb informació perfecta són jocs en els que el jugador al que correspon decidir coneix en cada moment tota la història completa de totes les decisions preses fins llavors.
2.1.1 REPRESENTACIÓ EXTENSIVA D’UN JOC La forma extensiva d’un joc amb informació perfecta es defineix amb els següents elements: 1) Un arbre: Un arbre consta d’un vèrtex inicial del que surten vàries branques que arriben a altres vèrtexs, dels que, a la vegada, poden sortir altres branques i així successivament. Els vèrtexs dels que no surten branques s’anomenen vèrtexs finals.
2) Una assignació dels vèrtexs no finals entre els jugadors. En cada vèrtex no final s’ha d’assignar a un (únic) jugador.
3) Una assignació d’accions a cada jugador en cadascun dels vèrtexs que té assignats. En cada vèrtex no final sortiran tantes branques com accions possibles tingui el jugador.
4) Una assignació de pagaments (utilitats) finals. En cada vèrtex final s’assigna un pagament per cada jugador.
1 Exemple 1: Considerem un joc similar a la batalla del sexes explicat en el Tema 1 però suposem que la dona (Jugadora 1) escull primer l’acció i, després d’observar el que ha escollit la dona, l’home (Jugador 2) escull la seva acció. La representació extensiva d’aquest joc seria: 1 F C 2.2 2.1 F 1 2 f C 0 0 0 0 c 2 1 El primer número en cada vèrtex final és el pagament de la Jugadora 1 i, el segon número, del Jugador 2.
De la forma extensiva a la forma normal Recordem que en la forma normal d’un joc s’ha de determinar el conjunt de jugadors, les estratègies i els pagaments de cada jugador per cada combinació possible d’estratègies. Per tant, hem de definir aquests tres elements a partir dels elements del joc en forma extensiva.
 El conjunt de jugadors serà el mateix en ambdós tipus de representacions.
 Per definir el conjunt d’estratègies del Jugador i considerem primer el conjunt de vèrtexs que pertanyen a aquest jugador. Els anomenem i.1, i.2, i.3,...,i.ni. Sigui Ai,k el conjunt d’accions que el Jugador i té a la seva disposició en el vèrtex i.k.
Una estratègia del Jugador i serà un element del producte cartesià Ai ,1   Ai ,ni .Per tant, una estratègia és un pla d’acció que indica una acció en cada una de les possibles situacions en les que es pot trobar el Jugador i.
 Els pagaments del joc en forma normal corresponent a un determinat perfil d’estratègies (un perfil d’estratègies indica una estratègia per cada jugador) es determinen a partir dels pagaments del joc en forma extensiva corresponents a seguir les accions que defineixen les estratègies.
Exemple 2: Considerem el joc de l’exemple 1. Anem a representar-lo en forma normal.
1) Jugadors: Jugadora 1 i Jugador 2.
2) Estratègies: Estratègies Jugadora 1: Hi ha un vèrtex corresponent a aquesta jugadora. En aquest vèrtex té dues accions: F i C. En aquest cas les estratègies de la jugadora 1 són : F i C.
2 Estratègies Jugador 2: Hi han dos vèrtexs corresponents a aquest jugador (2.1 i 2.2). En el primer vèrtex el Jugador 2 té dues accions (F i C) i en el segon vèrtex el Jugador 2 també té dues accions (f i c). Les estratègies del Jugador 2 són quatre: (F,f), (F,c), (C,f) i (C,c).
Nota: L’estratègia (F,c) ha de ser entesa de la següent manera: El Jugador 2 escull F en el node 2.1 (és a dir, si la Jugadora 1 ha escollit F) i c en el node 2.2 (es a dir si la Jugadora 1 ha escollit C) 3) Pagaments: Jugadora 1 F C (F,f) 1,2 0,0 Jugador 2 (F,c) (C,f) 1,2 0,0 2,1 0,0 (C,c) 0,0 2,1 2.1.2 SOLUCIONS ALS JOCS DINÀMICS Anem a solucionar els jocs dinàmics amb informació perfecta de dues maneres: 1) Inducció cap enrera (backward induction): Consisteix en començar per trobar els vèrtexs precedents als finals i, en cadascun d’ells, determinar l’acció que maximitza el pagament del jugador situat en aquest vèrtex. Es substitueix aquest vèrtex pel resultat al que s’arriba si es pren l’acció maximitzadora i es repeteix el procés. Si hi ha dues accions maximitzadores, cada una d’elles dóna lloc a una solució.
2) Equilibri perfecte en subjocs: El concepte d’equilibri de Nash és adequat pels jocs en forma normal. El concepte d’equilibri perfecte en subjocs (a partir d’ara EPS) intenta estendre aquesta definició als jocs dinàmics. Més endavant oferim la definició exacta d’aquest nou concepte d’equilibri.
Anem a argumentar per què la noció d’equilibri de Nash no és l’adequada pels jocs dinàmics.
Exemple 3: Considerem el joc de l’exemple 1 i la seva forma normal, trobada en l’Exemple 2. Anem a i) ii) Resoldre aquest joc per inducció cap enrera.
Calcular els equilibris de Nash i) Recordem 3 1 F C 2.2 2.1 F f C 1 2 0 0 c 2 1 0 0 En el vèrtex 2.1, el Jugador 2 escull F, mentre que en el vèrtex 2.2 escull c. Substituïm aquests vèrtexs pels pagaments corresponents a les accions maximitzadores 1 F C 2 1 1 2 Anticipant el que farà el Jugador 2, la Jugadora 1 escull C. Per tant, la Jugadora 1 escull C i 2 (F,c). La solució per inducció cap enrera és (C,(F,c)).
ii) Recordem la forma normal Jugadora 1 F C (F,f) 1,2 0,0 Jugador 2 (F,c) (C,f) 1,2 0,0 2,1 0,0 (C,c) 0,0 2,1 F C (F,f) 1,2 0,0 Jugador 2 (F,c) (C,f) 1,2 0,0 2,1 0,0 (C,c) 0,0 2,1 Equilibris de Nash Jugadora 1 Equilibris de Nash: (F, (F,f)), (C, (F,c)), (C, (C,c)) Observem que dels 3 equilibris de Nash en estratègies pures, solament un s’obté per inducció cap enrera. Això succeeix perquè el concepte de l’equilibri de Nash no és dinàmic. Observem que si la Jugadora 1 escull C, els pagaments finals no s’alteren per l’acció que l’estratègia del Jugador 2 indica pel primer vèrtex. Així doncs, tant F com C 4 són igual de bones respostes en aquest cas. De totes maneres, en la hipòtesi que el Jugador 2 es trobés en el vèrtex 2.1, escollir C no té cap sentit.
Aquesta inconsistència intertemporal observada en l’exemple anterior és el que intenta evitar el concepte d’Equilibri Perfecte en Subjocs: Definició: Un subjoc d’un joc dinàmic amb informació perfecta consisteix en un vèrtex no final del joc i en tots els vèrtexs següents, units per les mateixes branques i respectant l’assignació de jugadors i els pagaments finals.
Nota: El joc original és un subjoc del mateix.
Definició: Un perfil d’estratègies constitueix un Equilibri Perfecte en Subjocs (EPS) si és un equilibri de Nash en cadascun dels subjocs.
Exemple 4: Considerem l’Exemple 1. Anem a calcular els EPS.
1 F C 2.2 2.1 F 1 2 f C 0 0 0 0 c 2 1 Observem que aquest joc té 3 subjocs, que comencen en els vèrtexs 1, 2.1, 2.2, respectivament.
Podem buscar els EPS de dues maneres: 1) Considerem un per un els equilibris de Nash del joc original i mirem quins satisfan la definició de EPS: (F, (F,f)): En el subjoc que comença en el vèrtex 2.2, aquest equilibri de Nash indica jugar f a l’únic jugador que juga. Però jugar f en aquest subjoc no és un equilibri de Nash d’aquest subjoc, ja que el jugador 2 guanya si es desvia a c.
(C, (F,c)): És un equilibri de Nash en cadascun dels 3 subjocs.
(C, (C,c)): En el subjoc que comença en el vèrtex 2.1, el jugador 2 guanya si es desvia de C a F.
5 Per tant, l’únic EPS és (C, (F,c)).
2) Construïm directament els EPS. En el cas que no coneixem els equilibris de Nash del joc original, aquesta segona manera és més senzilla.
Subjoc que comença en 2.1: L’únic equilibri de Nash d’aquest subjoc d’un sol jugador és F. Qualsevol EPS ha d’incloure únicament estratègies del Jugador 2 que indiquin aquesta acció en el vèrtex 2.1.
Subjoc que comença en 2.2: L’únic equilibri de Nash d’aquest subjoc d’un sol jugador és c. Qualsevol EPS ha d’incloure únicament estratègies del Jugador 2 que indiquin aquesta acció en el vèrtex 2.2.
Subjoc que comença en 1: Donat que en un EPS requereix que 2 jugui (F,c), la millor resposta de la jugadora 1 és C.
Per tant, l’únic EPS és (C, (F,c)).
Els mètodes d’inducció cap enrera i EPS seleccionen els mateixos equilibris en el tipus de jocs estudiats (jocs amb informació perfecta i sense moviments a l’atzar).
2.2 JOCS DINÀMICS AMB INFORMACIÓ IMPERFECTA Definició: Els jocs amb informació imperfecta són jocs en els que algun jugador al que li correspon decidir no coneix l’acció que ha escollit un altre jugador que ha jugat abans que ell.
La manera d’introduir la informació imperfecta és la següent. Quan un jugador no sap en quin dels seus diversos vèrtexs es troba direm que aquests vèrtexs pertanyen al mateix conjunt d’informació.
Gràficament indicarem les situacions amb informació imperfecta unint amb una línia discontínua tots els vèrtexs que pertanyin al mateix conjunt d’informació.
Exemple 5: Considerem el joc de l’Exemple 1, però ara suposem que el jugador 2 escull sense saber el que ha fet la jugadora 1. La representació en forma extensiva del joc és la següent: 6 1 F C 2 F F C 1 2 0 0 C 2 1 0 0 Notem que la Jugadora 1 té un conjunt d’informació format per un únic vèrtex. Els dos vèrtexs en els que juga 2 pertanyen a un únic conjunt d’informació. Gràficament hem unit els dos vèrtexs amb una línia discontínua.
Quan un jugador està en una situació d’informació imperfecta, no pot condicionar la seva acció al vèrtex en què es troba, sinó al conjunt d’informació. Per a que això tingui sentit, les accions que pot prendre en cada vèrtex d’un determinat conjunt d’informació han de ser les mateixes. En cas contrari, el jugador obtindria informació nova a l’observar les alternatives de que disposa.
Una estratègia d’un jugador consisteix en determinar una acció per cadascun dels seus conjunts d’informació. Notem que s’escull la mateixa acció en tots els vèrtexs d’un mateix conjunt d’informació.
En el joc que estem considerant les estratègies per ambdós jugadors són dues: F i C.
La representació en forma normal d’aquest joc: Home Dona F C F 1,2 0,0 C 0,0 2,1 Notem que aquesta representació en forma normal és idèntica al joc original de la batalla de sexes on els dos jugadors escullen simultàniament.
7 2.3 JOCS REPETITS Definició: Un joc repetit un nombre infinit de vegades és un joc dinàmic en el que un joc simultani (joc d'etapa) es juga un nombre infinit de vegades i els resultats de cada etapa són observats abans de la següent.
Resultat: Independentment del nombre de EN del joc d’etapa, poden existir EPS en el joc repetit un nombre infinit de vegades en els que en alguna etapa no es juguin les estratègies que siguin EN del joc simultani, sinó que es juga quelcom que és millor pels jugadors.
A continuació anem a il·lustrar el resultat anterior amb un exemple.
Exemple 7: Considerem el següent joc simultani: Considerem el següent joc simultani: Suposem que es juga un nombre infinit de vegades i que cada jugador descompta els seus pagaments futurs amb una tassa de descompte  , 0    1.
 El pagament d’un jugador és el valor present dels seus pagaments futurs:  t 1  t , on t 1  t denota el pagament en l’etapa t.
Anem a veure sota quines circumstàncies existeix un ENPS en què en cada etapa es jugui ( R1 , R2 ). En d’altres paraules, anem a analitzar en quines circumstàncies la cooperació dels jugadors es pot sostenir.
Considerem que els jugadors utilitzen les estratègies anomenades estratègies de gallet (estrategias de “gatillo”). Una estratègia de gallet pel jugador i consisteix en jugar Ri en la primera etapa, i en la etapa t, si en totes les anteriors etapes, de 1 fins t-1, es va jugar ( R1 , R2 ). Si en alguna etapa anterior no es va jugar ( R1 , R2 ), llavors escull Li .
Anem a mostrar quan aquest tipus d'estratègies per ambdós jugadors constitueix un EPS. Per tant, hem de comprovar: 8 Pas 1: Aquestes estratègies constitueixen un EN del joc total.
Pas 2: Aquestes estratègies constitueixen un EN de cada subjoc.
Pas 1: Comprovació que aquestes estratègies constitueix un EN del joc total.
Suposem que el jugador 1 escull l'estratègia de gallet.
Pregunta: Guanya quelcom el jugador 2 desviant-se en t? Si el jugador 2 no es desvia, tindrà una seqüència de pagaments de t fins a infinit de 4.
Per tant, el valor actual dels pagaments 1 4 .
 4   4   2 4   3 4  ...  4(1     2   3  ...)  4 1 1  Si el jugador 2 es desvia en t (escull L2 ), llavors el jugador 1 escollirà L1 a partir de t+1. Llavors el jugador 2 respondrà jugant L2 a partir de llavors. Llavors la seqüència de pagaments serà 5, 1,1,..... Per tant, el valor actual dels pagaments 1 5  4 5   1   2 1   31  ...  4  1     2   3  ...  4   .
1  1 Per a tenir un EN de manera que el jugador 2 no es desviï, s'ha de satisfer: 4 5  4  1 1   1 4 Un raonament similar es fa pel jugador 1.
Per tant, hi ha un EN en el que ambdós jugadors juguen les estratègies de gallet si 1  .
4 Pas 2: Comprovació que aquestes estratègies constitueix un EN de cada subjoc.
Hi ha dues famílies de subjocs: 1) Els subjocs que comencen després d'una seqüència de ( R1 , R2 ) 2) Els subjocs que comencen després d'una història en la què en alguna etapa no es va jugar ( R1 , R2 ).
Per la primera família de subjocs, les estratègies proposades indueixen un EN (Notem que cada subjoc és idèntic al joc total).
Per la segona família de subjocs, les estratègies proposades indueixen un EN en el què es juga ( L1 , L2 ) per sempre (com és un EN del joc estàtic, la seva repetició constitueix un EN en aquesta família de subjocs).
9 ...