- Jan 14, 2015
- Views: 19
- Page(s): 102
- Size: 4.05 MB
- Report
Share
Transcript
1 M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C COLECCIN CUADERNO DE CTEDRA N 2 ELNER CRESPIN ELAS La Teora de Juegos es una rama de la Economa, sustentada en las matemticas, que estudia las decisiones de un individuo o de una empresa, quienes para tener el xito buscado deben tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en una situacin determinada o en un juego estratgico; de la misma manera, los dems agentes actuarn pensando segn crean que van a ser nuestras actuaciones. Se analizan los mtodos de actuacin y comportamiento de las personas con base en predicciones que las personas hacen de las decisiones de los otros participantes en el juego estratgico. COLECCIN CUADERNOS DE CTEDRA N 2 - TEORA DE JUEGOS Y ESTRATEGIA UFG-Editores ELNER CRESPIN ELAS
2 COLECCIN CUADERNO DE CTEDRA N 2
3 Teora de juegos y estrategia lner Crespn Elas
4 Primera edicin 2014 658.8 C921t Crespn Elas, Elner Osan, 1968- Teora de juego y estratega / Elner Crespn Elas. -- 1 ed. -- sv San Salvador, El Salv. : UFG Editores, 2014 138 p. ; 22 cm. ISBN 978-99923-47-49-2 1.Decisiones empresariales. 2. Administracin de empresas. 3. xito empresarial. I. Ttulo. Oscar Picardo Joao. Director del Instituto de Ciencia, Tecnologa e Innovacin (ICTI). Universidad Francisco Gavidia. Oscar Martnez Peate. UFG-Editores. Alejandra Serrano. Diseo editorial
5 Publicado por UFG-Editores Derechos reservados Copyright Segn la Ley de Propiedad Intelectual UFG-Editores UNIVERSIDAD FRANCISCO GAVIDIA Calle El Progreso N 2748, Col Flor Blanca. San Salvador, El Salvador Centroamrica. Tel.: (503) 2249-2716 Correo electrnico: [email protected] Sitio web: www.ufg.edu.sv
6 Tabla de contenido Introduccin................................................................................................................................................................................ 1 I. Tipos de juegos...................................................................................................................................................................... 3 1.1. Dilema de una empresa nica en un mercado proteccionista....................................................................................... 3 1.2 Juegos estticos con informacin completa............................................................................................................................ 5 1.3 Juegos en forma normal y Equilibrio de Nash...................................................................................................................... 6 1.3.1 Representacin de los juegos en forma normal............................................................................................................ 6 1.4 Eliminacin iterativa de estrategias estrictamente dominadas...................................................................................... 9 1.5 Ejercicios y aplicaciones.................................................................................................................................................................. 11 II El Equilibrio de Nash...................................................................................................................................................................... 15 2.1 Ejercicios y aplicaciones.................................................................................................................................................................. 17 III Estrategias mixtas............................................................................................................................................................................ 21 3.1 Equilibrio de Nash en Estrategias mixtas................................................................................................................................ 25 3.2 Ejercicios y aplicaciones.................................................................................................................................................................. 27 IV Juegos de suma cero (n =2)......................................................................................................................................................... 41 4.1 Estrategias de seguridad mixtas................................................................................................................................................. 43 4.1.1 El principio Minimax y Maximin..................................................................................................................................... 44 4.2 Punto de Silla de Montar................................................................................................................................................................ 48 4.3 Juegos de la forma mx2 y 2xn....................................................................................................................................................... 53 4.4 Ejercicios de Juegos de Suma Cero............................................................................................................................................ 55 V Juegos en forma extensiva............................................................................................................................................................ 65 5.1 Conversin de un juego de forma normal a forma extensiva........................................................................................... 70 5.2 Ejercicios y aplicaciones.................................................................................................................................................................. 72 5.3 Juegos dinmicos con informacin completa.......................................................................................................................... 74 5.4 Induccin hacia atrs........................................................................................................................................................................ 75 5.5 Estrategias puras en juegos en forma extensiva.................................................................................................................... 76 5.6 Equilibrio perfecto en subjuegos................................................................................................................................................. 77 Bibliografa.................................................................................................................................................................................................. 83 Glosario.......................................................................................................................................................................................................... 85
7 Introduccin La Teora de Juegos es una rama de la se comportan bajo el supuesto de que sus Economa, sustentada en las matemticas, que decisiones no tendrn efecto perceptible sobre estudia las decisiones de un individuo o de una las otras empresas. En el caso del monopolio, empresa, quienes para tener el xito buscado la empresa puede ignorar a sus rivales porque deben tener en cuenta las decisiones tomadas simplemente no existen. Estos dos casos son por el resto de los agentes que intervienen extremos; sin embargo, existe una gama en una situacin determinada o en un juego intermedia en los que la interaccin entre las estratgico; de la misma manera, los dems empresas es importante. agentes actuarn pensando segn crean que van a ser nuestras actuaciones. Se analizan los En la dcada de los aos 40, John von Neumann mtodos de actuacin y comportamiento de y Oskar Morgenstern hicieron contribuciones las personas con base en predicciones que las pioneras a la teora de juegos, quienes personas hacen de las decisiones de los otros estaban convencidos de que los problemas participantes en el juego estratgico. caractersticos en el comportamiento econmico eran idnticos a los que llamaban juegos de estrategias. Cincuenta aos despus, La Teora de juegos se aplica todos los das en tres cientficos continuaron esta labor, a el campo empresarial, al tomarse decisiones no quienes les otorgaron el Premio Nobel de solamente basadas en los posibles beneficios Economa 1994: John Nash, John Harsany y inmediatos que podramos obtener, sino Reinhard Selten. Nash introdujo el concepto de en las reacciones y estrategias que nuestra equilibrio ms utilizado en la teora de juegos, competencia podra adoptar ante la decisin el tema de juegos de suma cero (Neumann y que hemos tomado como empresa. Morgenstern) y juegos de suma no cero (si un jugador gana no necesariamente supone que En el anlisis microeconmico convencional el otro pierda). Selten perfeccion las ideas de dos paradigmas de comportamiento empresarial Nash para adaptarlas a los llamados juegos son el de la competencia perfecta y el del dinmicos (donde el juego se desarrolla a lo monopolio. Estos dos casos tienen algo en largo del tiempo), y Harsany lo hizo con los comn: pueden analizarse ignorando el juegos con informacin incompleta (donde comportamiento de los rivales. En el caso del algunos jugadores no conocen con certeza primero hay tantas empresas, y cada una es lo que pueden hacer o las preferencias de los tan pequea en relacin con el mercado, que otros jugadores).
8 La teora de juegos es til para analizar el son frecuentes estos tipos de problemas, por comportamiento econmico y social, donde ejemplo en situaciones de oligopolio, donde existen diferentes personas (agentes), cada uno cada empresa debe tomar en cuenta lo que con sus propios objetivos, en una situacin de harn los dems agentes. interdependencia. En efecto, la Teora de Juegos analiza situaciones en donde las decisiones que toma una persona pueden afectarla de manera La teora de juegos tiene influencia en muy distinta dependiendo de las decisiones de ciencia poltica, sociologa, biologa y otras otras personas; es decir, existen otros tomadores ciencias sociales. Hay otras aplicaciones en de decisiones, actuando conforme a sus propios los campos microeconmico, modelos de intereses, que deben ser considerados. intercambio (negociacin y subasta); en la economa financiera se utiliza en modelos de comportamiento de las empresas en Existe un conjunto de jugadores, y las decisiones los mercados, o para dilucidar problemas de todos ellos, conjuntamente, determinan de decisin multipersonales dentro de las qu resultado obtendr cada uno. Considrese empresas: trabajadores compitiendo por un el lanzamiento de un producto bancario ascenso, departamentos compitiendo por los (una tarjeta de crdito) con tasas de inters mismos recursos; en el campo de economa menores a los de la competencia. En este caso la internacional se utiliza en modelos en los competencia no se quedar de brazos cruzados, que los pases compiten (o coluden) en sus ocasionara una reaccin que podra traducirse decisiones arancelarias, posible aprobacin de en beneficios para los deudores de tarjetas. Los un tratado de libre comercio; en macroeconoma, bancos pueden actuar cooperando entre ellos, y para analizar los resultados de la poltica otras veces compitiendo unos contra otros, este monetaria cuando el Gobierno y los agentes es un comportamiento estratgico. que determinan los salarios o los precios se comportan estratgicamente; en poltica, La Teora de Juegos es el estudio de problemas para analizar las estrategias que utilizan los multipersonales de decisin. En Economa partidos polticos en los procesos electorales.
9 I Tipos de juegos Existen cuatro tipos de juegos: juegos estticos 1.1 Dilema de una empresa nica en un con informacin completa, juegos dinmicos mercado proteccionista1 con informacin completa, juegos estticos con informacin incompleta y juegos dinmicos Supuestos: con informacin incompleta. Un juego tiene 1. La ciudad se extiende a lo largo de informacin incompleta si un jugador no una avenida. conoce las ganancias de otro jugador, como ocurre en una subasta cuando uno de los 2. La empresa desea ganancias altas. licitadores no sabe cunto est dispuesto a 3. Por cada tienda debe pagar $8,000.00. pagar otro licitador por el bien subastado. En 4. El nmero de tiendas y ubicacin influyen correspondencia con los cuatro tipos de juegos, en las ventas. hay cuatro nociones de equilibrio: Equilibrio de Nash, Equilibrio de Nash perfecto en 5. Obtiene ganancias brutas de $20.00 /u.v. subjuegos, Equilibrio bayesiano de Nash y G= $20 * Ventas (u.v.) - ($8000 * Nmero de Equilibrio bayesiano perfecto. Tiendas). 6. Los consumidores potenciales compran ! YLYHQ D XQD GLVWDQFLD G GH Cuadro 1: Clasificacin de los tipos de juegos una tienda). Tipo de juego Informacin Informacin completa incompleta 7. 6HREWLHQHQYHQWDVYHQWDV Esttico Equilibrio de Equilibrio Nash Bayesiano de Decisin: Cuntas tiendas instalar y dnde Nash ubicarlas?. Dinmico Equilibrio de Equilibrio Nash perfecto Bayesiano en subjuegos Perfecto Fuente: Elaboracin propia. Qu otras situaciones implican un comportamiento estratgico? Consideremos Si instala una tienda en a = 0 entonces le situaciones donde la ubicacin y el nmero de compraran entre 0 y 0.6 entonces sus ventas establecimientos influyen sobre las ventas sern del 60% de la demanda (600). 1 Es un caso de proliferacin de variedades, comportamiento estratgico Game Theory, Jorge Hernndez.
10 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Si se ubica en a = 0.75 le comprarn entre Las decisiones de la empresa 1 para disuadir al 0.15 y 1.0 y vender el 85% de la demanda rival podran ser: (850 unidades). a. Ubicar una tienda, podra ser en el centro de la ciudad. b. Ubicar dos tiendas apropiadamente para cubrir mercado. Si quiere instalar 2 tiendas, por ejemplo a) Si la Empresa 1 ubica una tienda en el centro podra ubicarse en a = 0.75 y b = 1 (a = 5), ignorando a la Empresa 2, y si la Empresa 2 ubica la tienda en le compraran a la empresa 2, todos los consumidores a la derecha de b y a la mitad entre a y b, es decir desde el punto al punto b. Los consumidores a la izquierda de 0.15 seguirn sin comprar. A tienda a le comprarn entre 0.15 y 0.875 y Puede observarse que la Empresa 2 aumenta vender el 72.5% (725 u). sus ventas si se acerca a la Empresa 1, al punto a=0.5 , porque tiene ms consumidores a la A tienda b le comprarn entre 0.875 y 1.0 y derecha (logra quitarle a la Empresa 1 ms vender el 12.5% (125 u). consumidores situados entre las dos tiendas). As las ventas de la Empresa 2 alcanzan su As, si la empresa 1 es la nica autorizada para valor mximo cuando est lo ms cerca posible operar, pondr una sola tienda en el centro de la de la Empresa 1. ciudad. As garantizar que todos le compren, y obtiene un beneficio de: Si llamamos a la mnima distancia que B (empresa 1) = 20(1000) - 8000 = $12000 puede existir entre las dos tiendas (0.5 + ) y supongamos que =0 ( puede ser La empresa 1 se despreocupa de los rivales extremadamente pequeo). Entonces la (asume un comportamiento no estratgico). Empresa 2 se llevar todos los clientes a la derecha de a=0.5 (es decir la mitad del mercado) Qu pasa si una empresa 2 es autorizada? Entonces y obtendr un beneficio de: las decisiones de la empresa 1 sern diferentes, B (Empresa 2) = 20(500) - 8000 = $ 2,000 porque deber tomar en cuenta a su rival. As cada empresa obtiene la mitad del mercado. 4
11 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Veamos el comportamiento estratgico de la Por lo tanto, la Empresa 1 pondr 2 tiendas, en Empresa 1. a=0.25 y a=0.75, con lo cual disuadir la entrada de la Empresa 2, se quedar en todo el mercado La Empresa 1 sabe que existe otra empresa, y vender 1000 unidades, con un beneficio de: que sus acciones influirn sobre las acciones B (empresa 1) = 20(1000) - 2 (8000) = $4000 de la Empresa 2, entonces puede anticipar que si ubica una tienda en a=0.5 , entonces la Empresa 2 pondra la tienda contigua a la suya 1.2 Juegos estticos con informacin completa y ambos obtendran beneficios iguales ($2000). Se consideran juegos simples con las b) Ahora, tambin puede examinar caractersticas siguientes: los jugadores forman la alternativa de ubicar 2 tiendas. decisiones simultneamente2; reciben sus Si la Empresa 1 ubica dos tiendas, podra ganancias (que dependen de la combinacin ubicarlas en los puntos Cunto mercado de acciones que eligen); son juegos con captar la Empresa 2? informacin completa, dado que la funcin que determina la ganancia de cada jugador a partir de la combinacin de acciones elegidas por los jugadores es conocida por los jugadores. Se dice que la informacin es completa porque todos los jugadores conocen todos los componentes del juego3. Para definir un i. Si la Empresa 2 se ubica en puede ganar juego de este tipo necesitamos especificar, i) la demanda a la izquierda del punto a=0.25. quines son los jugadores, ii) qu decisiones ii. Si la empresa 2 se ubica en puede ganar puede tomar cada jugador, iii) combinacin de demanda a la derecha de 0.75. decisiones posibles. iii. Si se ubica en , se llevar la demanda ubicada entre ; vender de la demanda. El juego conocido como Piedra, papel o tijera es un ejemplo de un juego esttico; Pares o Entonces la Empresa 2 obtendra un beneficio de: nones es otro ejemplo. Es simultneo porque cada persona no toma ms de una decisin, y B (empresa 2) = 20(250) - 8000 = -$3000 la toma sin saber lo que harn los dems. Entonces la Empresa 2 no entrar. 2 Cada jugador toma su decisin sin conocer las decisiones de los dems jugadores, y el conjunto de estas decisiones determina el resultado del juego. Los jugadores nunca ms interactan 3 Como complemento, se tienen los juegos con informacin incompleta, aquellos en los cuales algn jugador no est seguro de la funcin de ganancias del otro jugador. 5
12 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Cmo sera la matriz de pagos en el juego continuacin veremos la representacin de los Piedra, papel o tijera? Supongamos que juegos en forma normal y podremos responder todo jugador prefiere ganar a empatar, y a las interrogantes anteriores. empatar a perder. En tal caso, unos posibles pagos que representan este juego pueden ser 1.3 Juegos en forma normal y Equilibrio de Nash los siguientes: 1.3.1 Representacin de los juegos en forma normal Cuadro 2 Ejemplo de un juego esttico con informacin completa Cada jugador elige de forma simultnea una estrategia, y la combinacin de estrategias Piedra Papel Tijera elegidas por los jugadores determina la ganancia Piedra 0,0 -1,1 1, -1 de cada jugador. Papel 1, -1 0,0 -1,1 Tijera -1,1 1, -1 0,0 Para ejemplificar la representacin de los juegos Cmo se podra representar el juego de un en forma normal, veamos el ejemplo clsico el delantero y un portero en un partido de ftbol dilema del prisionero. Dos sospechosos son en un tiro de penalti? arrestados y acusados de un delito. La Polica no tiene evidencia suficiente como para condenar a los sospechosos, a menos que uno confiese. Figura 1.1 Representacin de un juego entre un La Polica encierra a los sospechosos en celdas delantero y un portero en un tiro de penalti. separadas y les explica las consecuencias derivadas de las decisiones que formen (cada Portero sospechoso sabe que su sentencia depender de Izquierda Derecha lo que confiesen tanto l como su compaero). Delantero Izquierda -1,1 1, -1 Si ninguno confiesa, ambos sern condenados Derecha 1, -1 -1,1 por un delito menor y sentenciados a un mes de crcel. Si ambos confiesan, sern sentenciados a Cuntos jugadores incluye este juego? Cules seis meses de crcel. Finalmente, si uno confiesa y son las estrategias de cada jugador? Cul es la el otro no, el que confiesa ser puesto en libertad funcin de utilidad de cada jugador? Sea (x,y) la inmediatamente y el otro ser sentenciado a combinacin de estrategias correspondientes, nueve meses en prisin, seis meses por el delito Jugador 1=x; Jugador 2=y. Cul es el y tres meses ms por obstruccin a la justicia. conjunto de combinaciones de estrategias? Supongamos que a cada prisionero no le interesa Cmo se describe un juego? Cmo resolver cunto tiempo encierren a su compaero, sino el problema de Teora de Juegos resultante? A slo cunto tiempo estar l en la crcel. 6
13 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' El problema se puede representar mediante una alguna de las estrategias sin importar que haga matriz binaria (al hecho de que en un juego de el prisionero 2.4 Qu es lo que ms le conviene dos jugadores hay dos nmeros en cada casilla, al prisionero 1? las ganancias de los dos jugadores). Ejercicios. Figura 1.2: El Dilema del Prisionero Para los siguientes casos, establecer la matriz Preso 2 de pagos: No Confesar Confesar Preso 1 No Confesar -1,-1 -9,0 Confesar 0,-9 -6,-6 a. Considerar dos empresas que venden un mismo bien (Airbus y Boeing). Cada una puede elegir entre hacer descuentos en Cules son las estrategias en este juego? Cul el precio a los clientes o no. Supongamos es la funcin de utilidad de cada jugador? lo siguiente: Si nadie hace descuentos, los beneficios de ambas son 4. Si una empresa En este juego cada jugador cuenta con dos hace descuentos y la otra no, la primera le estrategias posibles: confesar y no confesar. Las quita los clientes a la segunda y obtiene 7 ganancias de los dos jugadores cuando eligen de beneficio. La segunda, por lo contrario, un par especfico de estrategias aparecen en la obtiene un beneficio de 0. Finalmente, casilla correspondiente de la matriz binaria. Por suponemos que si los dos hacen convencin, la ganancia del llamado jugador-fila descuentos entonces los ingresos bajan, es la primera ganancia, seguida por la ganancia con lo cual los beneficios de ambas son del jugador-columna. Por ejemplo, si el preso slo de 2. 1 elige no confesar y el preso 2 elige confesar, b. Dos pases comercian entre s. Cada uno el preso 1 recibe una ganancia de -9 (que puede elegir una poltica comercial representa nueve meses de prisin) y el preso proteccionista (no cooperar) o liberal 2 recibe una ganancia de 0 (que representa la (cooperar). Suponemos que si un pas es inmediata puesta en libertad). proteccionista y el otro no, el primero sale ganando con respecto a la situacin Cul ser el resultado de esta situacin? Cada en que ambos eran liberales (y el prisionero puede determinar lo que ms le segundo sale perdiendo).Si los dos pases conviene sin necesidad de saber lo que har el son proteccionistas, ambos estn peor que otro prisionero (cada uno se preocupa slo por si los dos fueran liberales. el tiempo que puede estar en la crcel y actuar 4 Este ejemplo pone de manifiesto la existencia de situaciones en racionalmente para aumentar su propio que la bsqueda del bienestar individual conduce a un resultado perjudicial para ambos jugadores. Por ejemplo, el bienestar de los bienestar); es decir, el prisionero 1 debe elegir dos prisioneros aumentara si los dos negaran las acusaciones. 7
14 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA c. Dos grandes pases que tienen que decidir Definicin 1.0: si firman un protocolo para controlar La representacin en forma normal de un las emisiones de CO2 (Protocolo de Kyoto). juego con n jugadores especifica los espacios Suponer que si los dos pases firman (o no de estrategias de los jugadores S1,.,Sn y sus firman), la competitividad de las empresas funciones de ganancias u1,,un. Se denota el de cada pas es idntica. Sin embargo, si juego con G={S1,.,Sn;u1,,un}. un pas firma y el otro no, las industrias del primero pierden competitividad La eleccin de estrategias en forma simultnea (porque tienen que gastar dinero para implica que cada parte elija la accin a seguir sin reducir las emisiones), mientras que las conocer las decisiones de los dems (como sera del segundo la ganan. el caso si los presos tomasen una decisin en momentos arbitrarios en sus celdas separadas). De manera general, la representacin en forma normal de un juego5 se especifica de la Apliquemos la representacin en forma normal siguiente manera: del juego del dilema del prisionero. 1. Los jugadores en el juego. La forma normal se puede representar de la siguiente forma: 2. Las estrategias de que dispone cada jugador. i. El conjunto de jugadores N est 3. La ganancia (utilidad o bienestar) de formado por Prisionero 1 y Prisionero 2 cada jugador en cada combinacin n = 2 jugadores. posible de estrategias. ii. El conjunto de estrategias es el mismo para los dos jugadores Pueden haber n jugadores, {1,,n}, un jugador arbitrario es denominado jugador i. Si= S2 = {Confesar, No Confesar} Sea Si el conjunto de estrategias con que cuenta el jugador i (llamado espacio de estrategias Denotamos (x,y) a la combinacin de de i), y sea si un elemento arbitrario de este estrategias en el que el Jugador 1 elige la conjunto (si Si). Sea (s1,.,sn) una combinacin estrategia x y el Jugador 2 elige la estrategia de estrategias, una para cada jugador, y sea ui la y. Entonces el conjunto de combinaciones funcin de ganancias del jugador i: ui (s1,.,sn) de estrategias es: es la ganancia del jugador i si los jugadores S = {(Confesar, No Confesar), (Confesar, eligen las estrategias (s1,.,sn). Confesar), (No Confesar, Confesar), (No Confesar, No Confesar)} 5 Juegos en forma estratgica. 8
15 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' iii. La funcin de utilidad es el negativo del problema de teora de juegos. Podemos retomar nmero de aos que pasa en la crcel el ejemplo del dilema del prisionero, ya que es cada jugador. fcil de resolverlo utilizando nicamente la idea de que un jugador racional no utilizar Por ejemplo, si el jugador 1 confiesa y una estrategia estrictamente dominada. el Jugador 2 No Confesar, el Jugador 1 tiene utilidad de 0 (lo liberan), es decir: En el dilema, si un prisionero va a confesar, La utilidad del Jugador 1 sera mejor para el otro confesar y con ello ir a la u1 (Confesar, No Confesar) =0 crcel seis meses, en lugar no confesar y pasar u1 (No Confesar, No Confesar) = - 1 nueve meses en prisin. Del mismo modo, si u1 (Confesar, Confesar) =-6 un prisionero no confiesa, para el otro sera mejor confesar y con ello ser puesto en libertad u1 (No Confesar, Confesar) =-9 inmediatamente en lugar de no confesar y permanecer en prisin durante un mes. As, La utilidad del Jugador 2 para el preso i, la estrategia de no confesar est dominada por la de confesar. u2 (Confesar, No Confesar) =0 u2 (No Confesar, No Confesar) = - 1 Definicin 2.0: u2 (Confesar, Confesar) =-6 En el juego en forma normal G = {S1,.,Sn; u2 (No Confesar, Confesar) =-9 u1,,un}, sean s i y s i posibles estrategias del jugador i (s i y s i son elementos de Si). La estrategia s i est estrictamente dominada 1.4 Eliminacin iterativa de estrategias por la estrategia s i si para cada combinacin estrictamente dominadas posible de las estrategias de los restantes jugadores, la ganancia de i por utilizar s i es Cuando un jugador tiene una estrategia con la estrictamente menor que la ganancia de i por caracterstica de que le proporciona mejores utilizar s i: resultados que sus dems estrategias, no importando qu hagan los dems jugadores, dicha estrategia es identificada como una ui(s1,,si-1, s i,si+1,,sn) < ui(s1,.,si-1,s i,si+1,,sn) estrategia fuertemente dominante, y es esta estrategia la que le conviene utilizar. Para cada (s1,,si-1,si+1,,sn) que puede ser construida a partir de los espacios de estrategias Ahora que ya conocemos la forma de representar de los otros jugadores S1,,Si-1, Si+1,,Sn. un juego, veamos la forma de resolver un 9
16 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Los jugadores racionales no utilizan estrategias comportarse en el juego como si estuviera en el estrictamente dominadas, pues no es ptimo juego siguiente: utilizarlas.6 As en el dilema del prisionero, un jugador racional elegir confesar, por lo que Figura 1.4 (confesar, confesar) ser el resultado al que llegan dos jugadores racionales, incluso cuando Jugador 2 Izquierda Centro (confesar, confesar) supone unas ganancias Jugador 1 Alta 1,0 1,2 peores para ambos jugadores que (no confesar, Baja 0,3 0,1 no confesar). En la figura 1.4, baja est ahora estrictamente Considerar el juego abstracto siguiente: dominada por alta para el jugador 1, as que, si el jugador 1 es racional (y el jugador 1 sabe Figura 1.3 que el jugador 2 es racional, por lo que se aplica Jugador 2 el juego de la figura 1.4) no elegir baja. Por Izquierda Centro Derecha ello, si el jugador 2 sabe que el jugador 1 es Jugador 1 Alta 1,0 1,2 0,1 racional, y el jugador 2 sabe que el jugador 1 Baja 0,3 0,1 2,0 sabe que el jugador 2 es racional (por lo que el jugador 2 sabe que se aplica la figura 1.4), el El Jugador 1 tiene dos estrategias y el Jugador 2 jugador 2 puede eliminar baja del espacio tiene tres: S1={alta, baja} y S2={izquierda, centro, de estrategias del jugador 1, quedando el derecha}. Para el Jugador 1, ni alta ni baja juego como lo indica la figura 1.5. Pero ahora, estn estrictamente dominadas: alta es mejor izquierda est estrictamente dominada por que baja si el Jugador 2 elige izquierda centro para el jugador 2, quedando (alta, (porque 1 es mayor que 0), pero baja es centro) como el resultado del juego. mejor que alta si el Jugador 2 elige derecha (porque 2 es mayor que 0). Figura 1.5 Jugador 2 Sin embargo, para el Jugador 2, derecha est Izquierda Centro Jugador 1 estrictamente dominada por centro (porque Alta 1,0 1,2 2 es mayor que 1, y 1 es mayor que 0), por lo que un Jugador racional 2 no elegir derecha. As, si el Jugador 1 sabe que el Jugador 2 es racional, Este proceso se denomina eliminacin iterativa puede eliminar derecha del espacio de de las estrategias estrictamente dominadas estrategias del Jugador 2. Esto es, si el Jugador (EIEED). Aunque est basado en la atractiva 1 sabe que el Jugador 2 es racional, puede idea de que los jugadores racionales no utilizan 6 Porque dispone de una estrategia alternativa que le proporciona un bienestar mayor, no importando lo que hagan los dems jugadores. 10
17 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' estrategias estrictamente dominadas, el repartiran el mercado a la mitad; por lo proceso presenta dos inconvenientes: que si el precio comn es alto obtendran beneficios de 75, mientras que si es bajo, 1. Cada paso requiere un supuesto adicional obtendran 55. Si una empresa fijara el sobre lo que los jugadores saben acerca de precio ms bajo que su competencia, la racionalidad del otro (informacin de le quitara una porcin importante del dominio pblico). mercado y la dejara con beneficios de 2. El proceso conduce a menudo a una solo 45, mientras que ella aumentara los prediccin imprecisa sobre el desarrollo suyos a 100. Hacer la matriz binaria del del juego (puede darse el caso que no haya juego. Cul ser el comportamiento de estrategias estrictamente dominadas para cada empresa, cuando cada una quiere ser eliminadasejemplo figura 1.6). maximizar sus propios beneficios? Qu le conviene a cada empresario? Figura 1.6 2. Dos empresarios con acceso al lago I C D de Ilopango tiene flotas pesqueras A 0,4 4,0 5,3 respectivamente. Cada empresario debe M 4,0 0,4 5,3 decidir cuntas lanchas pesqueras enva B 3,5 3,5 6,6 al lago. La pesca que obtiene cada lancha depende del nmero total de lanchas en el A continuacin demostraremos un concepto de lago, si los dos empresarios envan pocas solucin ms efectivo que la eliminacin iterativa lanchas, cada lancha obtendr una buena de las estrategias estrictamente dominadas, pesca y cada empresario beneficios de denominado Equilibrio de Nash. Las estrategias 100; si los dos empresarios envan muchas de los jugadores en un Equilibrio de Nash lanchas, el lago se saturar de lanchas, y siempre sobreviven a la eliminacin iterativa de cada lancha pescar poco y cada empresario las estrategias estrictamente dominadas. obtendr beneficios de 50. Si un empresario enva muchas lanchas y el otro empresario enva pocas, el primero se beneficiar 1.5 Ejercicios y aplicaciones de la moderacin del segundo, obtendr beneficios de 120 y dejar al segundo con 1. Dos empresas nicas en cierto mercado beneficios de 40. Hacer la matriz binaria de combustibles, pueden fijar dos niveles del juego: Cul ser el comportamiento de precios que pueden denominarse alto de cada empresa, cuando cada una quiere y bajo. Cada una fija su precio sin conocer maximizar sus propios beneficios? Qu la decisin de su competidor. Si las dos le conviene a cada empresario? Cul es la empresas fijaran el mismo precio se estrategia fuertemente dominante? 11
18 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA 3. Considerar la siguiente forma normal e Inamura minimizarlo. Inamura poda del juego: realizar el traslado por el norte o por el sur de Nueva Bretaa, por lo que Kenney N={1, 2}. tambin deba decidir a cul de esos sitios Ai = {Cine, Teatro}. Cada jugador selecciona una enviar sus aviones. El traslado durara accin que puede ser ir al cine o ir al teatro. tres das por cualquiera de las rutas; pero El Jugador 1 prefiere ver una pelcula con el la ruta norte era ms lluviosa. Adems, si Jugador 2 que ir al teatro. Kenney no acertaba a la ruta que seguira El Jugador 2 prefiere ir al teatro con el Inamura, sus aviones tendran un poco Jugador 2 que ir a ver una pelcula. menos de un da en rectificar el rumbo y alcanzar a las tropas japonesas. Estas Los jugadores obtienen un pago de 0 si consideraciones resultaban en un tiempo ellos terminan en un lugar diferente que el de exposicin de tres das si el bombardeo otro jugador. tena lugar en el sur y Kenney enviaba sus Jugador 1 / Jugador 2 Pelcula Teatro aviones por esa ruta desde el principio, Pelcula a,b 0,0 con una reduccin de 0.9 das si Kenney Teatro 0,0 c,d elega una ruta distinta a Inamura y de un Cul restriccin debera satisfacer a, b, c y d? da si el bombardeo tena lugar en el norte. a) a>c, b>d La matriz de pagos era la siguiente: b) a>d, bc, b
19 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' i. Radio. (baja). En el viaje de regreso de unas vacaciones, se perdieron los equipajes de dos viajeros ii. Por TV. (media). que haban comprado exactamente los iii. Por radio y TV. (alta). mismos objetos. La compaa area pone a La distribucin del mercado entre las dos los viajeros a participar en un juego como empresas se determinar por el tipo de el anteriormente descrito, les dice: Cada campaa que lancen las dos. Esta distribucin, uno de ustedes debe solicitar un pago junto con el costo de la campaa, determina por el valor de los objetos extraviados, las ganancias que obtiene cada empresa, y se que sabemos que estn entre 7 mil y presenta a continuacin: 10 mil. Nosotros les vamos a pagar el mnimo de las dos solicitudes. Pero para asegurarnos de que no nos engaen, si las Empresa 2 Baja Media Alta dos cantidades solicitadas son diferentes, Baja 70, 70 65, 80 50, 90 vamos a quitarle 7 mil a la persona que Empresa 1 Media 80, 60 60, 65 40, 60 hizo la reclamacin ms alta y drselos a Alta 60, 50 40, 40 20, 45 la que hizo la ms baja. A continuacin la Existe una estrategia fuertemente representacin del juego: dominante? Aplicar el proceso de EIEED. Cul es la Jugador 2 estrategia que utilizara la Empresa 1 y la 7 mil 8 mil 9 mil 10 mil empresa 2? 7 mil 7, 7 14, 0 14, 0 14, 0 Jugador 1 8 mil 0, 14 8, 8 15, 1 15, 1 9 mil 0, 14 1, 15 9, 9 16, 2 10 mil 0, 14 1, 15 2, 16 10, 10 6. Ejercicio de Mltiplos de 1000 (El Dilema del Viajero). Qu estrategias sobreviven al proceso de EIEED? Dos jugadores eligen simultneamente nmeros mltiplos de mil, entre 7 mil y 10 mil, ambos incluidos. A cada jugador se le 7. Encontrar cules estrategias sobreviven al pagar el mnimo de los nmeros elegidos. proceso de EIEED del siguiente juego. Adicionalmente, si estos nmeros son Empresa 2 distintos, el jugador que eligi el nmero Izquierda Derecha mayor le pagar una transferencia de 7 Baja 4, 2 1, 4 Empresa 1 mil al que eligi el nmero menor. Media 2, 4 3, 1 Alta 1, 3 4, 4 El Dilema del Viajero (Basu, 1994) est Cul es la mejor combinacin de basado en la siguiente historia: estrategias? 13
20 II El Equilibrio de Nash La Teora de Juegos ofrece una solucin nica Esta definicin hace referencia a que una a un determinado problema? Esta solucin combinacin de estrategias es un NE si ningn debe ser un Equilibrio de Nash. jugador dispone de una estrategia que le permita aumentar su utilidad desvindose unilateralmente. Una combinacin de estrategias Supongamos que la Teora de Juegos hace una ser un EN si cada jugador responde con la nica prediccin sobre las estrategias elegidas estrategia que ms le conviene como respuesta a por los jugadores. Para que esta prediccin las estrategias de los dems jugadores. sea correcta es necesario que cada jugador est dispuesto a elegir la estrategia predicha Consideremos los tres juegos en forma normal por la teora, la mejor respuesta de cada ya descritos (el dilema del prisionero--Figura jugador a las estrategias predichas de los otros 1.2, Figura 1.3 y la Figura 1.6). La forma de jugadores, tal prediccin puede denominarse encontrar los equilibrios (EN) es la siguiente: estratgicamente estable, ya que ningn jugador para cada jugador y para cada estrategia querr desviarse de la estrategia predicha para posible con la que cuenta cada jugador se l. Esta prediccin es denominada Equilibrio determina la mejor respuesta del otro jugador de Nash. a esa estrategia. La Figura 2.1 muestra este procedimiento, subrayando la ganancia de Definicin 3.0: la mejor respuesta del jugador j a cada una En el juego en forma normal de n jugadores, de las posibles estrategias del jugador i. Si el G={S1,..,Sn; u1,..,un}, las estrategias (s*1,,s*n ) jugador columna fuera a jugar la estrategia I, forman un Equilibrio de Nash (EN) si, para cada por ejemplo, la mejor respuesta del jugador jugador i, s*i es la mejor respuesta del jugador i fila sera M, puesto que 4 es mayor que 3 y que (o al menos una de ellas) a las estrategias de los 0; por ello, la ganancia que 4 le proporciona otros n-1 jugadores, (s*1,,s*i-1, s*i+1,,s*n): al jugador fila en la casilla (M,I) de la matriz binaria esta subrayada. ui(s*1,,s*i-1, s*i, s*i+1,,s*n) ui(s*1,.,s*i-1, si ,s*i+1,,s*n) Figura 2.1 Para cada posible estrategia si en Si; esto es, s*i Jugador Columna es una solucin de I C D Jugador A 0, 4 4, 0 5, 3 max ui (s*1,,s*i-1,si,s*i+1,,s*n) Fila M 4, 0 0, 4 5, 3 si Si B 3, 5 3, 5 6, 6
21 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Un par de estrategias satisface la condicin EN si Otro ejemplo clsico en la Teora de Juegos es la la estrategia de cada jugador es la mejor respuesta batalla de los sexos. Este ejemplo muestra que a la del otro, es decir, si ambas ganancias estn un juego puede tener mltiples equilibrios de subrayadas en la casilla correspondiente de la Nash: un hombre y una mujer estn tratando matriz binaria, razn por la cual la casilla (B,D) de decidir qu harn esta noche. Juan y Mara es el nico par de estrategias que satisface EN.7 deben elegir entre ir a la pera o a un combate En el caso del dilema del prisionero (Figura 1.2), de boxeo. Ambos jugadores preferiran pasar lo mismo ocurre para (confesar, confesar), y en la la noche juntos, pero Juan preferira estar junto Figura 1.3 ocurre para (alta, centro). Estos pares en el boxeo, mientras que Maria preferira estar de estrategias son los nicos equilibrios de Nash junta en la pera. de estos juegos. Figura 2.2 la batalla de los sexos Cul es la relacin entre el EN y la eliminacin Juan iterativa de las estrategias estrictamente pera Boxeo dominadas (EIEED)? Recordemos que las Mara pera 2, 1 0, 0 estrategias de Equilibrio de Nash de los tres Boxeo 0, 0 1, 2 ejemplos anteriores, son las nicas estrategias que sobreviven a la EIEED, entonces puede Cules son equilibrios de Nash? generalizarse que si la EIEED elimina todas las estrategias menos las estratgicas (s*1,,s*n), estas estrategias constituyen el nico EN del Se ha argumentado que si la teora de juegos juego. Sin embargo, puesto que la EIEED con ofrece una nica solucin a un juego, esta frecuencia no elimina ms que una combinacin debe ser un EN; sin embargo, este argumento de estrategias, es del mximo inters el hecho que ignora la posibilidad de juegos en los cuales la el EN sea un concepto de solucin ms poderoso teora de juegos no ofrece una solucin nica. que la EIEED, pero pueden existir estrategias que En algunos juegos con mltiples EN sobresale sobrevivan a la EIEED pero que no formen parte un equilibrio como la solucin ms atractiva de ningn EN. del juego (se debe identificar este equilibrio en Podemos estar seguros de que el Equilibrio de diferentes clases de juegos). El ejemplo de la Nash existe? 8 batalla de los sexos indica que pueden existir juegos para los cuales la Teora de Juegos 7 La casilla (B,D) corresponde a una combinacin de estrategias (s*1, s*2) tal que, dado s*2, al jugador fila le conviene elegir s*1 y, no ofrece una solucin nica y en los que recprocamente, dado s*1, al jugador columna le conviene elegir s*2; es decir, tenemos un par de estrategias que son mejor respuesta la no se llegar a ningn acuerdo (hay mucha una de la otra. investigacin al respecto). 8 Nash demostr en 1950 que en cualquier juego finito (por ejemplo, un juego en el cual el nmero n de jugadores y los conjuntos de estrategias S1,,Sn son todos finitos) existe al menos un Equilibrio de Nash. Ademas, Cournot(1838) propuso la misma nocin de equilibrio en el contexto de un modelo particular de duopolio y demostr que existe un equilibrio en este modelo. 16
22 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Cul es el equilibrio de Nash en Piedra, solo les interesa ganar. Las ganancias para los papel, tijera? candidatos se resumen as: Figura 2.3 Juego piedra, papel tijera El que gane tiene una utilidad de 1. Piedra Papel Tijera El que pierde tiene una utilidad de -1. Piedra 0,0 -1,1 1, -1 Papel 1, -1 0,0 -1,1 Si hay empate, los dos candidatos tienen una Tijera -1,1 1, -1 0,0 ganancia de 0. No siempre existe un equilibrio de Nash. Para Cul es el Equilibrio de Nash de este juego? resolver este problema, los tericos inventaron el concepto de estrategias mixtas. Solucin: Por ejemplo, si A propone PA = 0.4 y B propone PB = 0.7 tenemos: 2.1 Ejercicios sobre equilibrios de Nash Todos los votantes cuyos niveles ideales estn entre 0 y 0.4 votan por A, por lo cual Aplicar el concepto de Equilibrio de Nash a el candidato A ya tiene al menos el 40% de una competicin electoral. los votos. Considerar a dos candidatos, A y B, que Todos los votantes cuyos los niveles ideales compiten. El objeto de la campaa es hacer una estn entre 0.7 y 1.0 votan por B, por lo cual el propuesta para una inversin en un edificio candidato B tiene al menos el 30% de los votos. pblico (por ejemplo una biblioteca, un Centro de Investigacin, etc). Para este edificio se Todos los votantes cuyos niveles ideales puede gastar entre 0 y 1. estn entre 0.4 y 0.55 votan por A, estos votantes representan el 15% de los votantes Supongamos que hay un nmero finito de votantes, y cada votante tiene un nivel de inversin definido (preferido). Cada votante vota por el candidato que propone un nivel de inversin ms cerca de su nivel ideal. Por ejemplo, si el candidato A propone invertir PA = 0.3 y el candidato B propone invertir PB = 0.8, el votante cuyo nivel Todos los votantes cuyos niveles ideales ideal es invertir 0.4 votar por el candidato A. estn entre 0.55 y 0.7 votan por B. Estos La distribucin de los votantes segn sus votantes representan el 15% de los votantes. niveles ideales de inversin es uniforme entre Entonces: 0 y 1. Adems se supone que a los candidatos A tiene el 15% + 40% = 55% de los votos, y 17
23 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA B tiene el 15% + 30% = 45% de los votos. Los votantes entre PA y 1.0 votan por el El candidato A gana la eleccin y su ganancia candidato A, es decir el (1 PA) x 100% de los es 1, y B pierde y su ganancia es 1. votantes y tambin todos los votantes cuyos niveles de inversin ideales estn entre PB y PA Ahora supongamos que el candidato A propone y que estn ms cerca de PA que de PB, es decir un nivel de inversin menor a 0.5. el de los votantes. Si el candidato A propone PA < y supone que PB = As, el candidato A tiene (1 PA + (PA PB)) x 100% de los votos. De forma ms simple, el candidato A tiene el (1 (PA + PB)) x 100% de los votos. Dado que PB = , y que PA > tenemos que (1 (PA + PB)) x 100% < 50% Los votantes entre 0 y PA votan por el candidato A, es decir el (PA x 100%) de los votantes, y El candidato A pierde, y tiene una ganancia tambin todos los votantes cuyos niveles de de 1. inversin ideales estn entre PA y PB, y que estn ms cerca de PA que de PB; es decir el de los votantes; as el candidato Por lo tanto, el candidato A no querr A tiene (PA + (PB PA)) x 100% de los votos. establecer un nivel de inversin9 PA > De forma ms simple, el candidato A tiene As, el nico Equilibrio de Nash de este juego el (PA+ (PB PA)) x 100% de los votos. es cuando PA = y PB = . Con este perfil hay Dado que PB = , y que PA < , tenemos que: empate, por lo cual, los dos candidatos tienen (PA + (PB PA)) x 100% y supone que PB = . 8. Qu es un juego en forma normal?, Qu es una estrategia estrictamente dominada en un juego en forma normal?, Qu es 9 Se puede hacer el mismo anlisis para el candidato B. 18
24 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Equilibrio de Nash con Estrategias Puras (EP) en un juego en forma normal? Empresa B H L 9. En el siguiente juego en forma normal, Empresa A H 30, 30 50, 1 Qu estrategia sobrevive a una EIEED?, L 40, 60 20, 20 Cules son los Equilibrio de Nash con Estrategias Puras? Tiene algn jugador una estrategia dominante? Cul es el Equilibrio de Nash? J2 I C D A 2, 0 1, 1 4, 2 J1 12. Sea G el juego siguiente: M 3, 4 1, 2 2, 3 B 1, 3 0, 2 3, 0 X Y Z 10. Sea G = { N, S, u } un juego en forma normal, A 6, 6 8, 20 0, 8 donde N= {i, j} es el conjunto de jugadores. B 10, 0 5, 5 2, 8 S1= {a, b, c} ; S2 = {d, e, f} los conjuntos de C 8, 0 20, 0 4, 4 estrategia de los jugadores, y las funciones Aplicar EIEED Cules es el EN? de ganancia se resumen a continuacin. 13. Considerar el juego siguiente: D E F A 2, 3 4, 5 1, -1 B 1, 4 2, 3 1, 5 Piedra Papel Tijera C 1, 0 0, 1 3, 3 Piedra 0, 0 -1, 1 1, -1 Hallar los equilibrios de Nash en Estrategias Puras (EP). Papel 1, -1 0, 0 -1, 1 11. Dos empresas de computadoras planean Tijera -1, 1 1, -1 0, 0 comercializar sistemas de red para la gestin de la informacin en la oficina. Cuntos equilibrios en Estrategias Puras de Nash hay Cada una puede fabricar un sistema en este juego? rpido y de alta calidad (H), o un lento y de baja calidad (L). El estudio de mercado indica que los beneficios resultantes para cada firma en funcin de la estrategia seleccionada vienen dadas por la siguiente matriz de pago. 19
25 III Estrategias mixtas Recordar que hemos definido a Si al conjunto Una caracterstica de este juego es que a cada de estrategias del jugador i, y a la combinacin jugador le gustara adivinar la jugada del otro de estrategias (s*1,,s*n) como un Equilibrio de y que el otro no adivinase la suya (idntico al Nash (EN) si para cada jugador i, s*i es la mejor pquer, en las batallas,10 el bisbol, etc). respuesta del jugador i a las estrategias de los otros n-1 jugadores: Puede demostrarse que en cualquier juego, en el cual a cada jugador le convenga adivinar ui(s*1,,s*i-1, s*i, s*i+1,,s*n) ui(s*1,.,s*i-1, si ,s*i+1,,s*n) la jugada del otro y que el otro no adivine la suya, no existe ningn EN (tal como lo hemos definido); ya que la solucin de tal juego Para cada estrategia si en Si . incluye un elemento de incertidumbre sobre la Examinemos el siguiente juego conocido como El actuacin de los jugadores. juego de las monedas. Este juego tiene un EN? En estos casos aplica utilizar un nuevo Figura 3.1 concepto denominado Estrategia mixta (EM) Jugador 2 (Harsany, 1973). Cara Cruz Jugador 1 Cara -1, 1 1, -1 Cruz 1, -1 -1, 1 Hasta ahora hemos visto juegos estticos con N = {Jugador 1, Jugador 2 } informacin completa, donde el plan se reduce a elegir una y solo una de las acciones disponibles S1 = S2 = { Cara, Cruz } (estrategias). Por ejemplo, en el juego de las monedas la nica estrategia de cada jugador Imaginar que cada jugador tiene una moneda son jugar cara y jugar cruz. A tales estrategias y debe elegir mostrar una cara de la moneda. las hemos denominado estrategias puras. La Si las dos monedas coinciden (ambas muestran ampliacin del concepto de estrategias consiste la misma cara) el Jugador 2 gana la moneda en permitir que los jugadores no solo puedan del Jugador 1. Si las caras de las monedas elegir entre acciones ciertas y concretas, sino que no coinciden, entonces el Jugador 1 gana la tambin puedan seleccionar acciones aleatorias moneda del Jugador 2. Puede comprobarse que no existe un EN. 10 En una batalla podemos suponer que los atacantes pueden elegir entre dos objetivos o rutas (tierra o por mar) y la defensa puede rechazar cualquiera de los dos ataques s y solo si ste es previsto de forma correcta.
26 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA (acciones mixtas, que asignan distintas Cul es el efecto inmediato de utilizar probabilidades a las distintas acciones), estas estrategias mixtas? La funcin de pagos de son las estrategias mixtas. cualquier jugador deja de ser determinista, pasando a ser aleatoria. Por ejemplo, dado el siguiente juego con estrategias puras S1 y S2. Una estrategia mixta para el jugador i es una distribucin de probabilidad sobre algunas (o Jugador 2 todas) las estrategias en Si (estrategias puras I D del jugador i). A 3, 2 1, 4 Jugador 1 C 1, 3 2, 1 B 2, 2 2, 0 Las estrategias puras de un jugador son las diferentes decisiones que el jugador puede S1 = { A, B, C } Estrategias Puras tomar. As, en el juego de las monedas, Si S2 = { I, D } consiste en las dos estrategias puras Cara y Cruz, entonces una estrategia mixta para Una estrategia mixta para J1 es una distribucin el Jugador i es la distribucin de probabilidad de probabilidad (p, q, 1 p q) donde: (q, 1 q), donde q es la probabilidad de elegir Cara y 1q es la probabilidad de elegir Cruz p probabilidad de elegir A (recordar que, por el concepto de probabilidad, q probabilidad de elegir C 0 q 1). 1 p q probabilidad de elegir B La estrategia mixta (0, 1) es la estrategia pura Cruz Una estrategia mixta para J2 consistir en una La estrategia mixta (1, 0) es la estrategia pura Cara distribucin de probabilidad (r, 1 r) donde: r probabilidad de elegir I En el siguiente juego podramos utilizar diferentes 1 r probabilidad de elegir D estrategias mixtas: Figura 3.2 Por ejemplo para el J1 una estrategia mixta es ( , , ), que asigna a A, una probabilidad J2 Izquierda Centro Derecha de a C, y una probabilidad de a B. J1 Arriba 1, 0 1, 2 0, 1 Abajo 0, 3 0, 1 2, 0 Tambin podemos expresar las estrategias S2 = {izquierda, Centro, Derecha} puras A,C,B (del J1) como las estrategias Estrategias Puras mixtas (1,0,0), (0,1,0) y (0,0,1) respectivamente. 22
27 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Para el J2 una estrategia mixta es distribucin Este juego demuestra que una estrategia pura de probabilidad (q, r, 1 q r) puede estar estrictamente dominada por una estrategia mixta, aun si la estrategia pura no est dominada por ninguna otra estrategia pura. q probabilidad de elegir izquierda; 0 q 1 Cualquier distribucin de probabilidad (q,1q), r probabilidad de elegir centro; que el J1 pudiera adoptar, la mejor respuesta del 0 r 1 J1 es A (si q ) M (si q ), pero nunca B. Ahora B est estrictamente dominada por una 1 q r probabilidad de elegir derecha; estrategia mixta. Por qu?, por que obtiene una 0 q+r 1 mayor ganancia esperada (utilidad esperada) Otras estrategias mixtas validas pueden ser al utilizar A (con una probabilidad de ) y al utilizar M (una probabilidad de ), respecto a ( , , );( , ,0 ). utilizar a B. Definicin 4.0: Para obtener la utilidad esperada se encuentra En el juego en forma normal G = {S1,,Sn; u1,,un} la esperanza matemtica de la ganancia de supongamos que el jugador i cuenta con k los jugadores. estrategias puras Si = {si1,,sik }. En este caso para el jugador i una estrategia mixta es una distribucin de probabilidad Pi = (Pi1,,Pik) Hemos supuesto que J1 utiliza la estrategia donde 0 Pik 1, para k =1,..,k y Pi1+ +Pik = 1 mixta siguiente: Jugar A con una probabilidad de . Observar el siguiente juego: Jugar M con una probabilidad de ; mientras el J2 utiliza I. Entonces J1 gana: Figura 3.3 3 con una probabilidad (con la J2 combinacin S1 = (A,I) ). I D A 3, 0, 0 con una probabilidad (con la J1 M 0, 3, combinacin S2 = (M,I) ). B 1, 1, S1 = { A, M, C } S2 = { I, D } Entonces, la ganancia esperada del J1 es: E (u1) = 3 . Existen estrategias estrictamente dominadas? 23
28 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA As, si el J1 elige A y M (ambas estrategias Jugar la estrategia A con probabilidad de 1. mixtas), la ganancia esperada de J1 es Jugar la estrategia B con probabilidad de 0. independientemente de cul estrategia (Pura o Mixta) utilice J2, de manera que es mayor que el pago de 1 que produce con certeza la eleccin Ejemplo: Dado el siguiente juego, encontrar la de B. utilidad esperada, suponiendo que el jugador 1 utiliza la estrategia mixta siguiente: Supongamos que la ganancia del J1 en la Jugar A con una probabilidad de . estrategia (B, I) se cambia a 2. Jugar B con una probabilidad de . Mientras el J2: Figura 3.4 Jugar C con una probabilidad de . J2 Jugar D con una probabilidad de . I D A 3, 0, J1 M 0, 3, B 2, 2, Figura 3.5 J2 C D Este juego muestra que una estrategia pura J1 A 4, 1 -1, 1 B 2, -4 -2, 1 dada puede ser una mejor respuesta a una estrategia mixta, incluso si la estrategia pura Si el J2 utiliza la estrategia C no es una mejor respuesta a ninguna otra J1 gana: estrategia pura. 4 con una probabilidad de (con el perfil (A, C). 2 con una probabilidad de (con el perfil (B, C). En este juego B no es una mejor respuesta para el y el J2 gana: J1 (ante I o D del J2), pero B es la mejor respuesta 1 con una probabilidad de (con el perfil (A, C). del J1 a la estrategia mixta definida (q, 1 q). -4 con una probabilidad de (con el perfil (B, C). As ambos jugadores jugaran: Una observacin importante es que una estrategia pura es tambin una estrategia La combinacin (A, C) con una probabilidad de mixta. Por ejemplo, si un jugador dispone de dos estrategias A y B, jugar la estrategia A es, por La combinacin (B, C) con una probabilidad de definicin, jugar una estrategia pura; sin embargo, se puede ver como una estrategia mixta: 24
29 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' La combinacin (A, D) con una probabilidad de La forma de encontrar la mejor respuesta del jugador i a una estrategia mixta del jugador j se basa en interpretacin de la estrategia La combinacin (B, D) con una probabilidad de mixta del jugador j como representacin de la incertidumbre del jugador i sobre lo que har el jugador j. Entonces, las ganancias esperadas de los jugadores sern: En el ejemplo del Juego de las monedas (Figura 3.1), supongamos que el J1 cree que el J2 elegir cara con probabilidad q y cruz con probabilidad 1 - q; esto es J1 supone que J2 elegir la estrategia mixta (q, 1 - q). En este supuesto, las ganancias esperadas del Ejercicio: Encontrar las utilidades esperadas J1, eligiendo cara son: del siguiente juego: q x (-1) + (1 - q) x (1) = -q + 1- q = 1- 2q (p, 1 p) = ; (q, 1 q) = Mientras que, eligiendo cruz ser: q x (1) + (1 - q) x (-1) = q - 1 + q = 2q - 1 J2 C D Dado que, 1- 2q > 2q - 1 (si y solo si q < ), la J1 A 4, -5 4, 8 B 1, 4 0, 1 mejor respuesta en estrategias puras del J1 es Cara si q < , y Cruz si q > . 3.1 Equilibrio de Nash en Estrategias Mixtas El J1 ser indiferente entre Cara y Cruz si q = . Recordar que el Equilibrio de Nash visto hasta Consideremos ahora las estrategias mixtas ahora, garantiza que la estrategia pura de cada del J1, sea (r, 1 - r) la estrategia mixta en la jugador constituye una mejor respuesta a las cual el J1 elige Cara con probabilidad r. Para estrategias puras de los dems jugadores. Esta cada valor de q entre 0 y 1, calculamos el(los) definicin se puede ampliar a las estrategias valor(es) de r, denotados por r*(q) tal que (r, mixtas, de manera que, las estrategias mixtas 1 - r) sea una mejor respuesta del J1 a (q, 1 - q) de cada jugador sean una mejor respuesta a las del J2. estrategias mixtas de los otros jugadores. 25
30 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA La ganancia esperada del J1 al elegir (r, 1 - r) Definicin 5: cuando el J2 elija (q, 1 - q) es: En el juego en forma normal de dos jugadores G={S1,S2 ; u1,u2}, las estrategias mixtas (p*1, p*2) J2 forman un Equilibrio de Nash si la estrategia (q) Cara (1-q) Cruz mixta de cada jugador es una mejor respuesta a la J1 (r) Cara -1, 1 1, -1 estrategia mixta del otro jugador, se deber cumplir: (1-r) Cruz 1, -1 -1, 1 V1 (p*1, p*2) V1 (p1, p*2) para cada distribucin rq(-1)+r(1-q)(1)+(1-r)(q)(1)+(1-r)(1-q)(-1) de probabilidad de p1 sobre S1. =(2q-1)+r(2-4q) Donde: p*2 debe cumplir: rq es la probabilidad de (cara, cara) V2 (p*1, p*2) V2 (p*1, p2) para cada distribucin r (1-q) es la probabilidad de (cara, cruz) probabilidad de p2 sobre S2. (1-r)(q) es la probabilidad de (cruz, cara) Ejercicio: considerando el juego La batalla de (1-r)(1-q) es la probabilidad de (cruz, cruz) los sexos encontrar un EN en EM. La ganancia esperada de J1 crece en r si 2-4q > 0 (q< Solucin: ) y es decreciente en r si 2-4q < 0(q> ); as, la mejor respuesta de J1 es r = 1 (cara) si q < yr= La idea consiste en dotar el jugador j de una 0 (cruz) si q> . cierta informacin privada de manera que, dependiendo de cmo el jugador j entienda dicha informacin, se incline por una de las La naturaleza de la mejor respuesta del J1 a (q, 1-q) estrategias puras posibles. Sin embargo, puesto cambia cuando q= (el es indiferente entre las que el jugador i no dispone de la informacin estrategias puras cara y cruz). privada de j, i contina con la incertidumbre de no saber cul ser la decisin de j, y La ganancia esperada de J1 es independiente representamos dicha incertidumbre de i como de r cuando q= , el es tambin indiferente una estrategia mixta de j. entre todas las estrategias mixtas (r, 1-r); es decir, cuando q= la estrategia mixta (r, 1-r) es Considerar la Batalla de sexos para encontrar la mejor respuesta a (q,1-q) para cualquier valor EN con estrategias mixtas. de r entre 0 y 1 (Esto se puede graficar en un Juan plano p-q). (q) pera (1-q) Boxeo Mara (r) pera 2, 1 0, 0 (1-r) Boxeo 0, 0 1, 2 26
31 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Sea (q,1-q) la estrategia mixta en la cual Juan si r < la mejor respuesta de Juan es Boxeo (q = 0) elige pera con probabilidad q, y sea (r,1-r) la y si r = cualquier valor de q es una mejor respuesta. estrategia mixta en la cual Mara elige pera con probabilidad r. As, las estrategias mixtas (q,1-q)=( , ) de Juan y (r, 1-r) = ( , ) de Mara, forman un equilibrio Si Juan elige (q,1-q), las ganancias esperadas de de Nash. Mara son: Estos resultados pueden graficarse as: qx(2) + (1-q)x(0) = 2q al elegir pera y qx(0) + (1-q)x(1) = 1-q al elegir Boxeo Mara utiliza una estrategia mixta (entre opera y boxeo) si est indiferente entre la estrategia pera y boxeo de Juan, es decir, si su ganancia Existen 3 intersecciones de r*(q) y q*(r) ; esperada cuando juega pera es la misma que (q = 0, r = 0), (q = 1, r = 1) y (q = , r = ). su ganancia esperada cuando juega boxeo, as Los primeros representan los Equilibrios Nash se igualan las dos ecuaciones anteriores: en Estrategias Puras (Boxeo, Boxeo) y (pera, 2q = 1 -q q= . pera), y el ultimo es el equilibrio de Nash en As, Estrategias Mixtas. si q > la mejor respuesta de Mara es pera (r = 1) si q < la mejor respuesta de Mara es Boxeo (r = 0), y En cualquier juego, un EN (que incluya estrategias puras o mixtas) aparece como una si q = cualquier valor de r es una mejor respuesta. interseccin de las correspondencias de mejor respuesta de los jugadores. De modo similar, si Mara elige (r,1-r), las ganancias esperadas de Juan son: 3.2 Clculos de los de los EN en EM en los r(1) + (1-r) (0) = r al elegir pera , y juegos 2x2 r(0) + (1-r) (2) = 2 -2r al elegir Boxeo Se complica encontrar EN cuando tenemos Igualando las ecuaciones, r = 2-2r r = . As, juegos con ms de dos jugadores o ms de dos estrategias por jugador. A continuacin se si r > la mejor respuesta de Juan es pera (q = 1) sistematiza el procedimiento para el clculo de EN en EM en juegos 2x2 con 2 estrategias. 27
32 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Una EM ser respuesta ptima a otra estrategia El juego de las monedas dada (pura o mixta) solo si sus estrategia puras soporte son repuesta ptima. Esto significa que J2 tales estrategias puras producen ganancias (q) Cara (1-q) Cruz iguales y mximas, dadas la estrategia del J1 (p) Cara 1, -1 -1, 1 (1-p) Cruz -1, 1 1, -1 otro jugador (Se hace apoyndose en una representacin grfica). 1) Dados (p,1-p) y (q,1-q) EM genricas para J1 y Pasos: J2, respectivamente. 1. Se fijan EM genricas para los jugadores. Sean (p,1-p) y (q,1-q) EM genricas para los 2) Fijada la EM (q,1-q) del J2, para el J1 calcular: jugadores 1 y 2 respectivamente. u1 (cara, (q, 1-q)) = q(1) + (1-q) (-1) = 2q-1 2. Para J1 se calcula la utilidad esperada u1 que u1 (cruz, (q, 1-q)) = q (-1) + (1-q) (1) = 1-2q. se obtiene de cada una de sus estrategias puras cuando la estrategia del J2 es (q,1-q). 3) Encontrar la correspondencia de respuesta 3. A partir del punto 2 se calcula la ptima R1(q) correspondencia de respuesta optima del u1 (cara, (q, 1-q)) > u1 (cruz, (q, 1-q)) J1, R1(q). 2q-1> 1 -2q q> . 4. Para el J2 se calcula u2 que se obtiene de cada una de sus estrategias puras cuando u1 (cara, (q, 1-q)) < u1 (cruz, (q, 1-q)) la estrategia de J1 es (p,1-p). 2 q-1< 1 -2q q< . 5. A partir del punto 4 se calcula la u1 (cara, (q, 1-q)) = u1 (cruz, (q, 1-q)) correspondencia de respuesta optima del 2 q-1= 1 -2q q= . J2, R 2(p). 6. En el plano p-q se representan Por tanto la respuesta optima es: grficamente los correspondientes R1(q) y R 2(p), obtenindose los EN en EM en los Cara, si q > , puntos en donde se cortan. Cruz si q < Cualquiera si q = . A continuacin se aplica el procedimiento al P = 0 (cruz) si q < . juego de las monedas. R1(q) P = 1 (cara) si q > . P [0,1] (cualquier estrategia) si q = . 28
33 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Grficamente la correspondencia de respuesta Se puede visualizar grficamente la correspondencia ptima del J1 a cualquier EM del J2. de respuesta ptima del J2 a cualquier EM del J1 (ver R1(q) y R2(p) en la grfica) 6) Los EN en EM se obtienen en los puntos en los que ambos puntos se cortan. Tomando en cuenta que el J2 es indiferente entre sus estrategias puras y mixtas (le generan las mismas utilidades esperadas) cuando el J1 juega su EM (p, 1 p) = ( , ). 4) Fijada la EM (p,1-p) del J1, para el J2 calcular: u2 ((p, 1-p), (cara)) = p(-1) + (1 -p) (1) = 1-2p El J1 es indiferente entre sus EP y EM cuando el u2 ((p, 1-p), (cruz)) = p (1) + (1-p) (-1)) = 2p-1 J2 juega su EM (q,1-q)= , ). 5) Encontrar la correspondencia de respuesta Podemos decir que el EN en EM es aquel en ptima R 2(p) el que cada jugador juega dicha EM, que u2 ((p, 1-p), cara) > u2 ((p, 1-p), cruz) corresponde al punto en que se cortan las correspondencias de respuesta ptima. 1-2p> 2p-1 p< . u2 ((p, 1-p), cara) < u2 ((p, 1-p), cruz) Por tanto, SNE = {( , ),( , )} 1-2p< 2p-1 p> . Este es el EN en EM del juego, ya u2 ((p, 1-p), cara) = u2 ((p, 1-p), cruz) que ningn jugador tiene incentivo a 1-2p= 2p-1 p= . desviarse unilateralmente. Por tanto la respuesta optima es: Ejercicio. Encontrar los EN del problema de la Cara, si p < , Batalla de los sexos. Cruz si p > Solucin: Cualquiera si p = . J2 (q) Cine (1-q) Ftbol q = 1 (cruz) si p < . J1 (p) Cine 1, 2 0, 0 R 2(p) q = 0 (cara) si p > . (1-p) Ftbol 0, 0 2, 1 q [0,1] (cualquier estrategia) si p = . El juego tiene 2 EN en EP (cine, cine), (ftbol, ftbol). 29
34 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Sea (q, 1-q ) una EM de J2, la utilidad que J1 q = 1 (cine) si p > . obtiene con cada una de sus estrategias puras R 2(p) q = 0 (ftbol) si p < . es: q [0,1] Ei si p = . u1 (cine, (q, 1-q)) = q(1) + (1-q) (0) = q u1 (ftbol, (q, 1-q)) = q(0) + (1-q) (2) = 2-2q El EN es la interseccin de la correspondencia Se produce una igualdad de respuesta ptima. q = 2 -2q si y solo si q = Cuando q = el J1 obtiene la misma ganancia de sus dos EP y por tanto de cualquiera de sus EM. R1(q) la correspondencia de respuesta optima del J1 es: As, el conjunto de perfiles de Ei que forman un EN es: p = 1 (cine) si q > . SNE = {(cine, cine),(ftbol, ftbol), [( , ),( , )]} R1(q) p = 0 (ftbol) si q < . p [0,1] Ei si q = . 3.3 Ejercicios y aplicaciones Sea (p, 1 -p) una EM del J1. 1. Considerar el siguiente juego. La utilidad que J2 obtiene con cada uno de sus EP es: Jugador 2 u2 ((p, 1-p), cine) = p(2) + (1-p) (0) = 2p L M R U 8, 1 0, 2 4, 0 u2 ((p, 1-p), ftbol) = p(0) + (1-p) (1) = 1-p Jugador 1 C 3, 3 1, 2 0, 0 D 5, 0 2, 3 8, 1 Igualando las ecuaciones, se tiene: 2p = 1-p si y solo si P = Supongan que el J2 cree que el J1 seleccionara U con probabilidad , C con probabilidad , y D Cuando P = el J2 obtiene la misma ganancia de con probabilidad tambin suponer que el J2 sus dos EP, y por tanto de cualquiera de sus EM. planea seleccionar aleatoriamente M y R cada una con probabilidad . Cualquier EM o EP es respuesta optima del J2 a (p, 1 p) = ( , ) del J1 Cul es el pago esperado del J2? 30
35 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' 2. Evaluar los siguientes pagos para el 1 2 O M juego dado en forma normal de la siguiente O 2, 1 0, 0 matriz de pagos [recordar que una EM para M 0, 0 1, 2 el J1 es {U, M, D} donde es la probabilidad que el J1 juegue la estrategia U, 4. En el siguiente juego en forma normal, Cul es la probabilidad que el J1 juegue la es el EN en EM? estrategia M y es la probabilidad que el J1 juegue la estrategia D. Por simplicidad, podemos escribir como ( (U), (M), (D)) y en forma Jugador 2 I C D similar para el J2] A 2, 0 1, 1 4, 2 Jugador 1 M 3, 4 1, 2 2, 3 2 B 1, 3 0, 2 3, 0 1 L C R U 10, 0 0, 10 3, 3 D 2, 10 10, 2 6, 4 C 3, 3 4, 6 6, 6 5. Qu es un NE con EM en un juego en forma normal? Qu es un EM en un juego a) u1 (U , C) en forma normal? b) u2 (D , R) c) u2 (D , C) 6. Demostrar que no existe EN con EM en los d) u1 ( ,C) para = ( , , 0) siguientes juegos: e) u1 ( , R) para = ( , , ,) f) u1 ( , L) para = ( 0,1,0 ) Prisionero 2 NC C g) u2 ( ,R) para = ( , , 0) Prisionero NC 1, -1 -9, 0 1 h) u2 ( , ) para = ( , , 0) ; = ( , , ) C 0, -9 -6, -6 Jugador 2 3. Para cada juego encontrar u1( , ) y u2( L M R , ) para =( , ) y =( , ) Jugador 1 U 1, 0 1, 2 0, 1 D 0, 3 0, 1 2, 0 1 2 H T H 1, -1 -1, 1 Jugador 2 T -1, 1 1, -1 L C R 1 2 C D T 0, 4 4, 0 5, 3 Jugador 1 C 2, 2 0, 3 M 4, 0 0, 4 5, 3 D 3, 0 1, 1 B 3, 5 3, 5 6,6 31
36 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA 7. Suponer que tenemos un juego donde 9. En el juego siguiente: S1={H,L} y S2={x,y}. Si el J1 juega H, entonces su pago es z sin tomar en cuenta la seleccin de L R la estrategia del J2; los otros pagos del J1 son T 7, 7 8, 0 u1(L,X) = 0 y u1 = (L,Y) = 10. T puedes escoger B 0, 8 9, 9 cualquier pago que tu gustes para el J2 porque nosotros solamente estaremos preocupados con los pagos del J1. a. Buscar equilibrio en EP. b. Existe otro equilibrio en EM, en el cual los dos jugadores utilizan sus dos estrategias a. Hacer la matriz de pago del juego. puras con una probabilidad estrictamente b. Si el jugador 1 cree =( , ). Cul es el positiva. Encontrar este equilibrio y pago esperado del J1 de jugar H? Cul es explicar que no hay otro equilibrio en el su pago esperado de jugar H?, Cul es su que un jugador utiliza una EM (que no es pago esperado de jugar L? Para cual valor pura) y el otro utiliza una EP. de z es el J1 indiferente entre jugar H y c. Dibujar la funcin de mejor respuesta. L? c. Suponga =( ). Encontrar el pago esperado de jugar L. 10. Sea G={N, S, u} un juego en forma normal, donde N={i, j} es el conjunto de jugadores, S = {Si ={ A, B }, Sj = {C,D}} los conjuntos de estrategia de 8. Evaluar los siguientes pagos para el los jugadores, y las funciones de ganancia estn siguiente juego: resumidos en la siguiente matriz. Encontrar todos los NE en EP y EM. a. u1 ( , I) para =( , , , ) C D b. u2 ( , O) para =( , , , ) A 2, 1 0, 1 c. u1 ( , ) para = ( , , , ), =( , ) B 0, 4 2, 3 d. u1 ( , ) para = ( O, , , ), =( , ) 11. Relaciones comerciales entre EU y Japn. 2 I O Ambos pases estn estudiando normas de 1 OA 2, 2 2, 2 actuacin para abrir o cerrar sus mercados de OB 2, 2 2, 2 importacin. La matriz de pago a continuacin. IA 4, 2 1, 3 IB 3, 4 1, 3 32
37 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Japn En este caso, Japn optara por la estrategia Abierto Cerrado Maximin (la estrategia que maximiza la EU Abierto 10, 10 5, 5 produccin de Japn suponiendo que EU se Cerrado -100, 5 1, 1 comporta irracionalmente). Resulta que esta estrategia consiste en seguir manteniendo Asumir que cada pas conoce la matriz de abierto su sector de importacin. Un mercado pago y cree que el otro pas actuar en su de importacin japons abierto sera peor para propio inters. Tiene cada pas una estrategia EU, y por lo tanto, la situacin terminara por dominante? Cules sern las normas de volver el escenario de ambos mercados abiertos. equilibrio si cada pas acta racionalmente para maximizar su bienestar? 12. Dada la siguiente matriz de juego encontrar las utilidades esperadas, si el Jugador 1 utiliza Solucin: la estrategia mixta (p, 1-p) = ( ) y el Jugador 2 Estratega dominante utilizara la estrategia mixta (q, 1-q) = ( , ). Japn elegir abrir su mercado al margen de lo que EU decida (es siempre la decisin que Jugador 2 C D maximiza su beneficio.) Jugador 1 A 4, -5 4, 8 B 1, 4 0, 1 EU siempre elegir abrir su mercado al margen de lo que decida Japn. 13. Considerar la Batalla de los sexos Equilibrio: El equilibrio dictado por las dos para encontrar un Equilibrio de Nash con estrategias dominantes es que ambos pases estrategias mixtas. abran el mercado de importacin. Se trata de un EN. Por qu? Juan pera Boxeo Ahora pensemos que Japn no est seguro Mara pera 2, 1 0, 0 de que EU se comporte racionalmente. En Boxeo 0, 0 1, 2 particular, a Japn le preocupa que los polticos estadounidenses quieran penalizarles, aunque 14. Sea G ={ N, S, u } un juego en forma normal, con esa conducta no maximicen el bienestar donde N={Jugador 1, Jugador 2} es el conjunto de de EU. Cmo afectara esto a la eleccin de jugadores, S1={A,B}; S2={C,D} son los conjuntos de estrategias de Japn? estrategia de los dos jugadores, y las funciones de ganancias estn resumidas en la siguiente matriz Podra cambiar el equilibrio? de utilidades. 33
38 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Jugador 2 17. Demostrar a travs del concepto de C D dominancia en estrategias mixtas que el Jugador 1 A 2, 3 2, 1 siguiente juego tiene un nico Equilibrio de B 1, -1 4, 3 Nash. Nota: Explorar el concepto de dominancia de estrategias mixtas sobre estrategias puras, a a. Hallar los NE (en estrategias puras y mixtas). travs del proceso EIEED. b. Cules son las ganancias de los jugadores al equilibrio en estrategias mixtas? Jugador 2 I M D c. Dibujar las funciones de mejor respuesta. A -2, -2 -2, 1 0, 0 Jugador 1 B -2, 1 1, -2 0, 0 C 0, 0 0, 0 1, 1 15. Dos empresas competidoras (jugador 1, jugador 2) venden el mismo producto en un mercado compuesto por dos segmentos del L R mismo tamao, A y B. Cada una de estas W 2, 4 2, 5 X 2, 0 7, 1 empresas solo tiene recursos para realizar una Y 6, 5 1, 2 campaa publicitaria enfocada a uno de los Z 5, 6 3, 0 segmentos. En el grupo A solo se entera el 30% de los clientes potenciales, mientras que en el B, lo hace el 70%. Si ambas firmas se anuncian en 18. Dos personas (J1 y J2) pueden beneficiarse el mismo segmento, cada una vender al 40% de realizar una tarea pero solo si los dos la de los que se enteran. Si lo hace en segmentos llevan a cabo. El costo del esfuerzo es 0 < c < 1. diferentes, cada una vender al 60% de los que Si la tarea es llevada a cabo, el pago es 1 para se enteren. cada uno. 16. Dos jugadores negocian sobre cmo Jugador 2 dividirse un billete de $100. Han decidido H T Jugador 1 H 0, 0 0, -c que ambos elegirn simultneamente e T -c, 0 1-c, 1-c independientemente una porcin del dinero S, 6
39 6L66HQWRQFHVFDGDMXJDGRU T= trabajar H= holgazanear recibe la porcin solicitada; en cualquier otro caso donarn ntegro el dinero a una asociacin En qu forma el equilibrio de Nash en EM de beneficencia. Cules son los NE con EP en se relaciona con el equilibrio en EP? Cundo este juego? ocurren cambios en C? Qu implicacin econmica tiene esa variacin? 34
40 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' 19. El juego de la inspeccin. a. Establecer la matriz binaria. En algunos contextos se argumenta que cuando b. Existe alguna estrategia fuertemente a una persona se le paga mal se le induce a dominante? Considerar los casos cuando que no trabaje adecuadamente y a que realice existe un salario bajo (W < 4) y cuando actividades irregulares. existe un salario alto (W > 4) Una persona es contratada para realizar c. Encontrar una EM. ciertas tareas. Este empleado puede trabajar a conciencia o dedicarse a actividades 20. El Tiro de penalti. irregulares que lo benefician, pero que no le Se tienen 2 jugadores, un delantero y un corresponde con las tareas encomendadas. Se portero (eliminar la posibilidad de que establece un salario W por el trabajo, pero el el delantero falle y enve el baln fuera empleado sabe que si lo descubren dedicndose de la portera o al poste) y supongamos a actividades irregulares lo despediran que tiene solo 2 estrategias posibles. sin pagarle, perdera el posible beneficio de El delantero tiene 2 estrategias acertar (hacer) sus actividades irregulares y adems no se el gol al lado derecho o izquierdo de la portera. atrevera a emprender ninguna accin legal. As mismo, el portero tiene como estrategias Las actividades irregulares le reportan un posibles solamente lanzarse a su derecha o a beneficio de 6 al empleado, de manera que si su izquierda. Si los dos eligen el mismo lado de no lo descubren obtendra un beneficio total de la portera, el portero parar el tiro (penalti) y W +6 y si lo descubrieran obtendra 0. obtendr una utilidad de 1 y dejar al delantero Por su parte, el jefe obtiene ingresos promedio con una utilidad de 1. Si eligen distintos lados de $20 si su empleado trabaja, y de solo $10, si de la portera, el delantero anotar el gol y se dedica a actividades irregulares, a los que entonces es l quien obtendr una utilidad de 1 hay que restar el salario W para obtener el y el portero obtendra -1. beneficio neto. Adicionalmente el jefe incurre en un costo en trmino de tiempo, dedicacin y a. Representar la matriz binaria del juego. dinero si decide supervisar al empleado, costo que lo valora en $4. As, si el jefe supervisa y el b. Existe un par de estrategias a las cuales empleado trabaja, el jefe obtiene unos beneficios podran plegarse voluntariamente? promedio de $20 menos el salario W y el costo c. Si el delantero decide tirar un dado y si de supervisin de $4. Si el jefe supervisa y el sale 5 lanzar el tiro a la izquierda y en empleado se dedica a actividades irregulares, a caso contrario al derecho. Cul es el valor los ingresos promedios de $10 hay que restarle de las EM? solamente el costo de supervisin de $4. d. Cules son las utilidades que obtienen los jugadores con la EM anterior, si el portero 35
41 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA decide jugar con una estrategia pura de salario es tan bajo que lo que deja de pagarle lanzarse a la izquierda? no compensa el costo de supervisin. e. Supongamos que los dos jugadores juegan Dado que el jefe no supervisa, el empleado EM arbitrarias; el delantero (p,1-p) y el se dedica a actividades irregulares. As, portero (q,1-q). Cul es la utilidad esperada si W< 4 (salario bajo) el equilibrio EP de cada jugador?, Qu significan los pares consiste en que el jefe no supervise aun de probabilidades pq, p(1-q), (1-p)q y (1-p) cuando sabe que el empleado se dedica a (1-q)? actividades irregulares. f. Encontrar el equilibrio de Nash en EM. b. Si el salario es mayor (W> 4) , por ejemplo w=5, se puede observar que no existe un Equilibrio de Nash en estrategias puras. Solucin ejercicio 19. El Juego de la inspeccin. No podemos tener un equilibrio en La matriz de pagos viene dada de la siguiente que el jefe elija la estrategia (pura) manera: Supervisar, pues si se tuviera, el Jefe empleado decidira trabajar con toda (q) (1-q) No Supervisar supervisar seguridad. Pero esto es contradictorio (S) (NS) porque el jefe decidira ahorrarse el (p) Trabajar Empleado (T) w, 20-w-4 w, 20-w costo de supervisin y no supervisara. (1-p) Otras No podemos tener un equilibrio en que el Actividades 0, 6 w+6, 10-w (OA) jefe elija No supervisar, pues entonces al empleado le convendra dedicarse a otras actividades, pero dada esta situacin del Qu ocurre si el salario es w=2 (relativamente empleado, al jefe s le conviene supervisar, bajo) o cuando w=10(relativamente alto)? Existir con lo que tenemos otra contradiccin. un Equilibrio de Nash en estrategias puras o en estrategias mixtas? As el nico equilibrio es en EM. Si el jefe supervisa con probabilidad q, para Supongamos dos casos: a) cuando w4 (salario alto). sus dos estrategias, se requiere que: a. Cuando w
42 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Por otra parte, si el empleado trabaja con De los valores de equilibrio se deduce que al probabilidad p, para que el jefe no tenga aumentar el salario se reduce tanto la probabilidad preferencia por ninguna de sus dos estrategias, de supervisin (q), como la probabilidad que el se requiere que: empleado se dedique a otras actividades (1-p). El riesgo de perder un salario ms alto acta P(20-W-4)+(1-p)(6) = P(20-W)+(1-p)(10-W) como instrumento de disuasin de realizar otras actividades. 20P-PW-4p+6 -6P = 20P-PW+10-W-10P+PW Por otra parte, aunque la probabilidad de 6 + 10P = 10P + P W + 10-W dedicarse a otras actividades sea ms pequea, 6-10 = W(P-1) (1-P) = el incentivo del jefe para no supervisar persiste porque el salario aumenta. En conclusin: el Pero q = puede reescribirse en la forma salario si influye sobre la decisin de trabajar o siguiente: dedicarse a otras actividades. T:
43 Con salarios muy bajos es de hecho un equilibrio que el trabajador se dedique a T:T otras actividades y que el jefe, aun previendo T:T que eso ocurrir, no tenga incentivos para T:T
44 supervisar. Con salarios ms altos desaparece este equilibrio, y a medida aumenta el salario, qW Es el costo de realizar otras actividades el riesgo de perderlo acta como un fuerte ya que el empleado pierde su salario si el jefe incentivo que disuade al empleado de decide supervisar (con probabilidad q). dedicarse a otras actividades que hace 6(1-q) Es el beneficio de realizar otras menos necesaria la supervisin. actividades, obtiene 6 con probabilidad 1-q de que su jefe no supervise. Solucin ejercicio 20. El Tiro de penalti. a. La matriz de pago viene dada por: Tambin podemos reescribir: P (20-W-4) + (1-p)(6) = P (20-W) + (1-p) (10-W) Portero de forma siguiente: Izquierda Derecho (p-1) W 4 Izquierda -1, 1 1, -1 Delantero (1-p)W Es el ahorro de supervisar. 1, -1 -1, 1 Derecha 4 Es el costo de supervisar. 37
45 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA b. Puede ser un equilibrio (izquierda, izquierda)? con probabilidad P y al lado derecho con No, el delantero tendra incentivos para probabilidad 1-p; y el portero asigna una desviarse, lo que implica que no atenderan probabilidad de q a lado izquierdo y 1-q la recomendacin. Por tanto, no hay un par al lado derecho. de estrategias que podamos recomendarles con la caracterstica que se apegaran Portero voluntariamente. (q) (1-q) Izquierda Derecho c. Si lanza un dado, equivale a utilizar Delantero (p) Izquierda -1, 1 1, -1 una estrategia mixta, que asigna una (1-p) Derecha 1, -1 -1, 1 probabilidad de al lado izquierdo y al lado derecho. uD = pq(-1)+p(1-q)(1) + (1-p)(q)(1) + (1-p)(1-q)(-1) d. Cules son las utilidades? up = p q (1) + p (1-q) (-1) + (1 -p) (q) (-1) + (1 -p) (1 -q) (1) El delantero asigna probabilidad de al lado izquierdo, y una probabilidad de al lado El hecho que un jugador tenga la posibilidad de derecho. usar una EM no significa que le convenga utilizarla. El portero selecciona una estrategia pura, f. Supongamos que el delantero tira a la lanzarse al lado izquierdo (cuando el portero izquierda con probabilidad (y a la juega con Izquierda). derecha con probabilidad ). Con una probabilidad de al delantero le Consideremos al portero. Si elige la estrategia pararan el penalti y obtendr un valor de -1, pura de tirarse a la Izquierda obtendra: y con una probabilidad de meter el gol y up = ( )(1) + ( )(-1) = - obtendr una utilidad de 1. Si elige la estrategia pura de tirarse a la Derecha obtendra: La uD = ( ) (-1) + ( ) (1) = ( ) up = ( )(-1) + ( )(1) = La up = ( ) (1) + ( ) (-1) = - ( ) Si el portero eligiera una EM con una probabilidad de q de tirarse a la izquierda, una probabilidad de (1-q) de tirarse a la derecha, dada la probabilidad e. Supongamos ahora que los dos jugadores ( , ) del delantero, obtendra: juegan EM arbitrarias. Si el delantero juega la EM de tirar al lado izquierdo up = -( )q 38
46 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' As, dada la estrategia del delantero de asignar Anlogamente, para que el delantero use un una probabilidad alta ( ) a tirar al lado derecho, mecanismo aleatorio, debe cumplirse: al portero le conviene simplemente seguir la (q) (-1) + (1-q) (1) = q (1) + (1-q) (-1) estrategia pura de tirarse a la derecha Utilidad esperada del Utilidad esperada del (obtendra en lugar de ). delantero si tira al lado delantero si tira al lado izquierdo. derecho As no le conviene ni tirarse a la izquierda con seguridad (estrategia pura con la que obtiene - ), ni usar un mecanismo aleatorio asignando una Despejando p y q de ambas ecuaciones: probabilidad positiva para tirarse a la izquierda. P(1) + (1-p)(-1) = P (-1) + (1-p)( 1) De manera que el portero slo pondr una P-1+ p = -P +1-p probabilidad positiva a sus dos estrategias, si 4p = 2 no tiene predileccin por ninguna (lo mismo p= ocurrir con el delantero). q (-1) + (1-q)(1) = q(1) + (1-q)(-1) -q + 1-q = q -1+ q Entonces, para que el portero siga un EM, no -4q = -2 debe tener predileccin por ninguna de sus q= dos estrategias. As, el nico equilibrio en estrategias mixtas g. As deber cumplirse: consiste en que el delantero tire con la misma probabilidad a la izquierda que a la derecha, y el portero se lance con la misma probabilidad a (p)(1) + (1-p) (-1) = (p) (-1) + (1-p) (1) su izquierda que a su derecha. Utilidad esperada del Utilidad esperada del portero si se lanza a la portero si se lanza a la izquierda. derecha. Siempre habr un Equilibrio de Nash si permitimos usar estrategias mixtas. 39
47 IV Juegos de suma cero (n =2) Son aquellos en los que no hay ninguna porcentaje de ese mercado. Cada gerente posibilidad de cooperacin; la nica forma en puede mantener la tecnologa con que elabora la cual un jugador puede aumentar su bienestar su producto actualmente o cambiar a una es reduciendo el de su rival. tecnologa alternativa. Si decide cambiar, puede elegir la tecnologa T1 o la tecnologa T2. Cada El nombre se origina en los juegos de mesa, tecnologa implica diferentes caractersticas del en donde la ganancia de un jugador es producto. Con la tecnologa actual, la empresa necesariamente la prdida de su rival. 1 tiene la mitad del mercado, pero tendra solo Un juego de dos jugadores tiene suma cero si: el 40% si la empresa 2 cambiara a la tecnologa T1 y 45% si cambiara a la tecnologa T2. u1(s1 , s2) + u2(s1 , s2) = 0, s1 en S1, s2 en S2 A continuacin la matriz muestra cmo se Ejemplo: [observar que la utilidad de J2 es el reparten el mercado para cada par de decisiones. negativo de la utilidad del J1] Gerente 2 J2 Mantener T1 T2 Izquierda Derecha Mantener 50, 50 40, 60 45, 55 J1 Arriba 70, -70 50, -50 Gerente 1 T1 20, 80 30, 70 50, 50 Abajo 80, -80 40, -40 T2 70, 30 35, 65 20, 90 J2 Observamos que este juego no cumple las Izquierda Derecha J1 condiciones de ser un juego de suma cero, Arriba 70 50 Abajo 80 40 pero s cumple que la suma de utilidades de los dos jugadores es igual a 100, para todas las combinaciones de estrategias u1(s1 , s2) + u2(s1 , El J1 tratara de maximizar la utilidad; mientras s2) = 100, para todo s1 en S1 y para todo s2 en S2. el J2 tratara de minimizarla. Cmo convertimos a este juego a uno de suma Ejemplo: Dos empresas luchan por un mercado cero? Podemos restar 100 a la utilidad que fijo, y al gerente de cada una de ellas se le obtiene el Jugador 2 en todas las combinaciones instruye para que se preocupe solo por el de estrategia posibles (el comportamiento del
48 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA J2 no se altera, ya que equivale a decirle al siguiendo el razonamiento anterior se conoce gerente 2 preocpese solo por el porcentaje como su estrategia maximin (estrategia de de mercado que obtenga menos cien). As seguridad), y la utilidad que se asegura con tal obtenemos la siguiente matriz: estrategia es su es su valor de seguridad o valor maximin. Gerente 2 Mantener T1 T2 Asi, para obtener la estrategia maximin, Mantener 50, -50 40, -40 45, -45 suponemos que el jugador rival elegir la Gerente 1 T1 20, -20 30, -30 50, -50 estrategia que minimice la utilidad del J1. T2 70, -70 35, -35 10, -10 G2 Definicin 6.0: (4) (2) (6) Mantener T1 T2 Un juego de dos jugadores tiene suma constante si: (1)Mantener 50, -50 40, -40 45, -45 40 u1(s1 , s2) + u2(s1 , s2) = c, c , s1 S1, s2 S2 G1 (3) 20, -20 30, -30 50, -50 20 T1 (5) 70, -70 35, -35 10, -10 10 As, los juegos de suma constante se pueden T2 transformar en juegos de suma cero equivalentes. -70 -40 -50 Supongamos que el Gerente 1 asume una visin pesimista y se comporta como si todo lo Para cualquier estrategia s1 en S1, el Jugador 2 que no est bajo su control fuese a ocurrir de la elegir s2 en S2 que solucione: peor forma posible, es prepararse para el peor de los escenarios posibles. Mn u1 (s1,s2) Si decide mantener la tecnloga actual, s2 S2 supone que el G2 tomar la decisin que ms le perjudica (elegir T1), lo cual le dejar con El Jugador 1 elegir s1 en S1 para solucionar 40% del mercado; si elige T1 supone que el G2 Max Mn u1 (s1,s2) As, el G1 elige elegir la estrategia mantener y le dejar con el 20% del mercado; si elige T2 supone que el s1 S1 , s2 S2 mantener G2 elegir T2 y le dejar con solo el 10% del mercado. Cul es la mejor decisin para el G1? El G2 tambin puede encontrar su estrategia de Es mantener la tecnologa actual, con lo que seguridad mediante un razonamiento similar asegura 40%. La estrategia que ha elegido G1, al empleado por el G1. 42
49 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Si G2 decide mantener Las estrategias de seguridad siempre forman un EN? El G1 elegir T2 y obtendr -70 (30%) Suponer una variacin del juego. Si G2 decide T1 El G1 elegir mantener y obtendr -40 (60%) Gerente 2 Si G2 decide T2 Cambiar Mantener El G1 elegir T1 y obtendr -50 (50%) Gerente 1 Cambiar 85, -85 70, -70 Mantener 60, -60 80, -80 A si la decisin T1 del G2 es lo que asegura una utilidad de -40 (60%), y permite que el G1 slo Aqu la estrategia de seguridad del J1 es obtenga 40 (el menor valor). cambiar lo que proporciona un valor de seguridad de 70, y la del J2 es mantener, con La estrategia de seguridad de un J2 es la lo que obtiene un valor de seguridad de -80 estrategia s2 S2 que soluciona: (observar que este par de estrategias no es un EN). En este juego no existe un EN en EP. Max Mn u2 (s1,s2) As el G2 elige En juegos de suma cero, un par de estrategias de s2 S2 , s1 S1 T1(estrategia de seguridad) seguridad necesariamente formar un Equilibrio de Nash cuando el juego tenga equilibrio en En trminos de la utilidad del J1, la estrategia estrategias puras y, recprocamente, un EN en de seguridad del J2 soluciona: EP necesariamente estar constituido por un par de estrategias de seguridad. Mn Max u1 (s1,s2) s2 S2 , s1 S1 4.1 Estrategias mixtas de seguridad Observar que para encontrar la estrategia de Sea Mi el conjunto de EM del Jugador i, i = 1,2. seguridad, un jugador conjetura lo que har Cul es la estrategia de seguridad del J1? El J1 el otro jugador para perjudicarlo, y se prepara supondr que para cualquier estrategia p M 1, para ello. En un juego de suma cero, la nica el J2 elegir un q M 2 que solucione. forma en la cual un jugador puede aumentar su utilidad es reduciendo la del otro. Mn Eu (p,q) q M2 43
50 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA El J1 elegir p M1 que maximice su utilidad Cuando el J1 maximiza su propia utilidad esperada, es decir: esperada, est minimizando la utilidad esperada de su rival. Max Mn Eu1 (p,q) = V1 Una forma alternativa de definir una estrategia p M 1, q M2 de seguridad del J2, es encontrar una solucin de: Una estrategia p que solucione el problema anterior es una estrategia de seguridad (maximin) Min Max Eu1 (p,q) del J1, y la utilidad esperada V1 que obtiene J1 es su q M 2, p M1 valor de seguridad o valor Maximin. Puesto que Eu1 (p,q) = -Eu2 (p,q), el valor de Cuando J1 utiliza p, se asegura al menos una seguridad del J2 es: utilidad esperada de V1, es decir: V2 = -Min Max Eu1 (p,q) Eu1 (p, q) V1 q M2 q M 2, p M1 Se puede hacer lo mismo para el J2, quien Cuando el J2 usa su estrategia de seguridad q tambin se prepara para lo peor y supone se asegura que el J1 no obtendr ms de -V2 , es que J1 elegir p M1 que minimice Eu2(p,q), es decir, se cumple: decir, J2 elige q M 2 que maximice su utilidad esperada, es decir: Eu1 (p, q) -V2, p M1 Max Mn Eu2 (p,q) = V2 4.1.1 El Principio Minimax y Maximin q M 2, p M1 En los juegos de suma cero (los primeros analizados en la historia de los juegos), la Una estrategia q que solucione el problema ganancia de un jugador es siempre la ganancia anterior es una estrategia de seguridad del otro jugador multiplicada por -1. (Minimax) del J2, y la utilidad esperada V2 que obtiene el J2 es su valor de seguridad o valor Minimax. 44
51 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Definicin 7.0: As, si el perfil de estrategia (si,sj) es un EN de un juego de suma cero, la ganancia del Jugador Un juego G={N=i,j; Si, Sj; ui, uj} es un juego con i en el perfil (si,sj) es la mejor ganancia de i suma cero si para cualquier perfil de estrategias cuando j minimiza la ganancia de i. si Si, sj Sj tenemos: ui (Si, Sj) = -uj (Si, Sj) ui (Si, Sj) = Max Min ui (ti, tj) ti Si , tj Sj Ejemplo: Si es la mejor estrategia para el Jugador i entre todas las dems y Jj C D Sj es la mejor estrategia para el Jugador j entre J1 A 0, 0 2, -2 todas las dems. B 6, -6 5, -5 Este tipo de juego es til cuando se analizan De forma anloga se puede escribir que, si (Si,Sj) situaciones conflictivas entre los jugadores. es un EN, la ganancia del Jugador i en el perfil (Si,Sj) es la peor ganancia de i (j minimiza la ganancia de i) cuando i maximiza su ganancia. En este tipo de juego, para el Jugador j, minimizar la ganancia del Jugador i equivale a maximizar su ganancia. ui (Si, Sj) = Min Max ui (ti, tj) si Si , Min ui (Si, Sj) = Max uj (Si, Sj) tj Sj , ti Si sj Sj sj Sj Esto implica, un perfil de estrategias, donde: Definicin 8.0: El Jugador i maximiza su ganancia, y al Sea G un juego con suma cero y con dos mismo tiempo. jugadores i y j, (Si,Sj) es un EN, entonces: El Jugador j minimiza la ganancia de i (ui). ui(Si, Sj) = MaxMin ui(ti, t j) = MinMax ui(ti, t j) Es un perfil donde: ti (si), t j (si) tj (sj), ti (si) El Jugador i minimiza su ganancia, y al En forma anloga puede escribirse la ecuacin mismo tiempo. para el Jugador j. Estas expresiones es el El Jugador j maximiza la ganancia de i (uj). principio del Maximin y el principio Minimax. 45
52 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Este concepto es til para analizar los juegos Con la estrategia D, la estrategia de i que maximiza repetidos. la ganancia de i s B (obtiene una ganancia de 10). Las estrategias Maximin, en un juego con dos jugadores, i , j, se dice que la ganancia Ahora el Jugador j tiene que elegir una del Jugador i es del tipo Minimax cuando el estrategia, pero sin maximizar su ganancia: Jugador j elige la estrategia que minimiza elegir la ganancia que minimiza la ganancia la ganancia del Jugador i, y el Jugador j de i. Si j juega C, la mejor ganancia que i puede maximiza su ganancia. tener es 4, y si juega D, la mejor ganancia de i es 10. As, j elegir la estrategia C. La ganancia del Jugador i con el principio del Minimax es 4. Sea el juego: Ahora busquemos la ganancia de i con el Jugador j C D Min principio Maximin. Jugador i A 2, 4 0, 3 0 B 4, 1 10, 2 4 Maximin Max 4 10 Min Max ui (Si, Sj) Minimax si Si, sj Sj Donde el Jugador i elige entre las estrategias A La diferencia est en el orden de las bsquedas y B, y el Jugador j elige entre C y D. de las estrategias de los jugadores. Seleccionar primero una estrategia de i y buscamos la estrategia de j que minimiza la ganancia de i, La ganancia Minimax del jugador i est dada por: y se hace lo mismo con las otras estrategias de i, al final el jugador i elige la estrategia i que Min Max ui (Si, Sj) maximiza su ganancia. sj Sj, si Si Si i juega A, la estrategia de j que minimiza la Se selecciona primero una estrategia Sj y ganancia de i es D (i tiene una ganancia de 0). buscamos la estrategia Si que maximiza la Si i juega B, la estrategia de j que minimiza la ganancia de i, ui (Si, Sj). Se repite con todas ganancia de i es C (i tiene una ganancia de 4), las estrategias del Jugador j. Por ejemplo, si entonces la estrategia de i que maximiza su seleccionamos la estrategia C, la estrategia que ganancia cuando j quiere minimizar la ganancia maximiza la ganancia del Jugador i es B (i tiene de i es B. As, la ganancia del jugador i con el una ganancia de 4) 46
53 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' principio del Maximin es 4, que es la misma P1 una ganancia de 1. cuando utilizamos el principio del Minimax, El P1 quiere maximizar su ganancia. Si juega esta ganancia se puede denotar por i. NC la peor ganancia que puede obtener es 1, y si juega C la peor ganancia que puede obtener es 0. Siempre se cumple P1 elige NC (mayor valor); as el valor i =1; el perfil de estrategia es (NC,NC). MaxMin ui (Si, Sj) = i = MinMax (Si, Sj) si Si, sj Sj, sj Sj, si Si Criterio Minimax. Nota: Tambin se puede encontrar el valor de . j Si P2 juga C, la estrategia que maximiza la ganancia de P1 es NC, que proporciona una Ejercicio: ganancia de 5. Considerar el juego del Dilema del prisionero Si P2 juega NC, la estrategia que maximiza con las ganancias siguientes. Encontrar el valor la ganancia de P1 es NC, que proporciona de vi con el principio de Minimax y Maximnin. una ganancia de 1. El P2 quiere minimizar la ganancia del P1. Si P2 juega NC la mejor ganancia que Confesar NC Confesar 2, 2 0, 5 puede obtener P1 es 1, y si juega C la mejor NC 5, 0 1, 1 ganancia que obtiene P1 es 5. P2 elige NC (menor valor); as, el valor P2 i = 1; el perfil de estrategia (NC, NC). C NC Min P1 C 2, 2 0, 5 0 NC 5, 0 1, 1 1 Maximin Ahora, encontrar el valor j, obtenido cuando Max 5 1 P1 quiere minimizar la ganancia de P2, y P2 Minimax quiere maximizar su ganancia. P2 Criterio Maximin. Confesar NC Max Si P1 juega C, la estrategia que minimiza la P1 Confesar 2, 2 0, 5 5 NC 5, 0 1, 1 1 Minimax ganancia de P1 es NC que proporciona una Min 0 1 ganancia de 0. Maxmin Si P1 juega NC, la estrategia que minimiza la ganancia de P1 es NC que proporciona a 47
54 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Maximin 4.2 Punto de silla de montar. Si P1 juega C, la estrategia que maximiza la ganancia de P2 es NC que proporciona una En algunos juegos el Maximin y Minimax no son lo ganancia de 5. mismo. Dado el siguiente juego, con los jugadores Mara y Juan, cada uno con sus estrategias: Si P1 juega NC, la estrategia que maximiza la ganancia de P2 es NC, que proporciona una ganancia de 1. Juan A B Min El P1 quiere minimizar la ganancia de P2. A 2 -3 -3 Mara i. Si juega NC la mejor ganancia que puede B 0 2 0 Max Min obtener es 1. C -5 10 -5 Max 2 10 ii. Si juega C la mejor ganancia que puede Min Max obtener es 5. Mara puede asegurar que ganar al menos 0, P1 elige NC (el menor valor); as, el valor y Juan puede asegurar que ganar no ms de 2. j = 1; en el perfil de estrategia (NC,NC). Sabemos que en algunos juegos el valor Maximin y Minimax son diferentes, por ejemplo: Minimax. Si P2 juega C, la estrategia que minimiza la Juan ganancia de P2 es NC, que proporciona una A B Min ganancia de 0. Mara A 2 -3 -3 Si P2 juega NC, la estrategia que minimiza B 0 3 0 Max Min Max 2 3 la ganancia de P2 es NC, que proporciona una ganancia de1. Min Max El P2 quiere maximizar su ganancia. i. Si juega NC la menor ganancia que puede Ningn jugador querr jugar una estrategia obtener es 1. simple con certeza, el nico plan podra ser utilizar la estrategia con cierta probabilidad ii. Si juega C la menor ganancia que puede (EM). Si Juan utiliza una moneda y decide obtener es 0. utilizar la estrategia A con probabilidad y la P2 elige NC (el mayor valor); as, el valor estrategia B con probabilidad . = 1; en el perfil de estrategia (NC,NC) j Si Mara juega A, ella obtendr un pago de 2 con probabilidad , y un pago de -3 con Puede observarse que = . probabilidad de . i j 48
55 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' As, el pago esperado de Mara cuando Juan selecciona la estrategia A es: (q) A (1-q) B Mara A 2 -3 u1 = ( ) (2) + (-3) = - B 0 3 Y si Mara selecciona B u1= ( ) (0) + (3) = Si Mara selecciona A: q (2) + (1 q) ( 3) = 2q 3 + 3q = 5q 3 Si Mara sabe o adivina que Juan jugar dicha EM, Si Mara selecciona B: Mara debera jugar la estrategia B= q (0) + (1 q) (3) = 3 3q (obtiene mayor ganancia), esto es llamado el principio del valor esperado. Mara no ser capaz de tomar ventaja de la EM de Juan si estos dos valores esperados son lo Si t sabes que tu oponente est jugando una mismo, es decir: EM determinada, y que continuar jugando de acuerdo a lo que t hagas, t deberas jugar tu 5q 3 = 3 3q 8q = 6 q= estrategia la cual tiene un mayor valor esperado. 1 q = As, si Juan juega la EM ( , ), Juan puede Ahora consideremos la situacin del punto de asegurar que Mara ganar, en promedio, no vista de Juan. ms que por juego independientemente de cmo juegue Mara. Si Juan usa la EM ( , ) y Mara adivina esto, Mara podra tomar ventaja de su conocimiento Si Mara juega A: para obtener un pago esperado de . Juan podra considerar usando una EM con diferentes ( ) (2)+ ( ) ( 3) = probabilidades, por ejemplo: ( ) = (q, 1 q). Si Mara juega B: ( ) (0)+ ( ) (3) = Podra haber alguna opcin de probabilidades, en la cual Mara no podra tomar ventaja? Es importante pensar acerca de cmo Juan podra en la prctica jugar una EM con esas Supongamos que Juan juega una EM con probabilidades (asignar mediante algn probabilidad T T
56 T Calcular los proceso aleatorio, tirar una moneda, generar valores esperados para Mara. nmeros aleatorios entre 0 y 1, y jugar B si dicho nmero es mayor a 0.75, etc). 49
57 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Ahora consideremos el punto de vista de Mara, Estos valores son denominados La solucin intentando encontrar una EM (p, 1 p) para la del juego. cual Juan no puede tomar ventaja. Ahora, para Juan encontremos los valores esperados. Existe un teorema que establece que cada matriz de juego tiene como tal una solucin, ya Si Juan juega A: sea en EP o en EM. p (2) + (1 p) 0 = 2p Si Juan juega B: Un mtodo abreviado para calcular soluciones de EM para juegos 2x2 (Willams,1986) se ilustra p (3) + (1- p) 3 = 3 6p a continuacin: Igualando las dos ecuaciones, tenemos: 2p = 36p p= 1p = Juan A B Si Mara juega una EM ( , ) ella se asegura de Mara A 2 -3 B 0 3 ganar, en promedio, al menos por juego, de acuerdo de cmo juegue Juan. Diferencia entre filas 2-(-3)=5 +3 Probabilidad Si juega A: de Mara 0-(3)=-3 5 ( )(2) + ( )(0) = = 68 Si juega B: Diferencia entre columnas ( ) (3) + ( )(3) = = 2-0 = 2 6 = Probabilidad de Juan -3-3 = -6 2 = As, Mara tiene una EM que le asegura un 68 pago esperado de al menos . Juan tiene una EM, la cual le asegura que el pago esperado de Mara no ser mayor a . Los valores Maximin y Minimax que hemos encontrado anteriormente son equivalentes al concepto de punto de silla de montar. La Teora de Juegos prescribe lo siguiente: es el valor del juego ( i ). Definicin9.0: ( , ) es la estrategia ptima de Juan. El resultado de un juego es llamado punto de ( , ) es la estrategia ptima de Mara. silla de montar si el ingreso de un resultado 50
58 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' es menor que o igual a cualquier ingreso en su para incrementos de la otra variable (por lo que, fila, y ms grande que o igual que cualquier el punto no es ni un mximo ni un mnimo) es entrada/ingreso en su columna. llamado un punto de silla de la funcin, ya que la grfica tiene un parecido a una silla de montar. Principio de silla de montar: Si una matriz de un juego tiene un punto de silla En el ejemplo siguiente, los nmeros encerrados de montar (PSM), ambos jugadores jugaran en crculos son PSM. Si Max-Min = Min-Max, una estrategia en la cual est contenida. entonces se presentan en las estrategias de PSM. En el ejemplo, los 2 PSM estn en las estrategias (A, B), (A, D), (C, B) y (C, D). Definicin 10.0: Para cualquier matriz de un juego, si hay un nmero tal que el Jugador 1 tiene una Juan i A B C D Min estrategia la cual garantiza que ganar al A 4 2 5 2 2 menos i , y el Jugador 2 tiene una estrategia Mara B 2 1 -1 -20 -20 Maximin la cual le garantiza que el Jugador 1 ganar no C 3 2 4 2 2 ms que i , entonces i es llamado el valor D -16 0 16 1 -16 Max 4 2 16 2 del juego. Minimax Si un jugador tiene un PSM, el ingreso del PSM Observar que habrn casos en los cuales los es el valor del juego. valores Maximin y MiniMax no son lo mismo, Figura 4.1: Punto de Silla de Montar entonces se dice que no tiene un PSM. En el juego siguiente; por ejemplo: Pagos Juan A B Min A 2 -3 -3 Mara B 0 2 0 Maximin Filas C -5 10 -5 Max 2 10 Columnas Minimax En general, un punto de una funcin donde las derivadas tienen un valor de cero, porque Se observa que no existe un PSM. Mara puede la funcin toma un valor mximo para asegurar que ella ganar al menos 0, y Juan incrementos de una variable y un valor mnimo puede asegurar que Mara no ganar ms de 2. 51
59 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA El mtodo abreviado para calcular soluciones Otra forma equivalente es encontrar las EM, en EM para juegos 2x2 se utiliza cuando no igualando los valores esperados para cada existe un PSM; es decir, es importante que se estrategia. verifique un PSM antes de utilizar el mtodo abreviado para encontrar una EM ptima. J2 A B J1 (p)A 1 -2 Ejemplo: Dado el siguiente juego encontrar las (1-p)B -1.5 2 proporciones ptimas. J2 (Oponente) A B Min Supongamos que el J1 selecciona A con una J1 A 1 -2 -2 probabilidad P, y B -1.5 2 -1.5 Maximin Max 1 2 Supongamos que el J1 selecciona B con una probabilidad (1-p). Minimax Si el oponente (J2) selecciona A el pago Valores diferentes No existe un PSM esperado para J1 es: p (1) + (1-p) (-1.5) =2.5p -1.5 Entonces se necesita encontrar una EM. Si el oponente (J2) juega B el pago esperado J2 para J1 es: A B J1 A 1 -2 p (-2) + (1-p) (2) = 2 - 4p B -1.5 2 Ahora, igualando los dos pagos esperados se tiene: Diferencia entre filas 2.5p - 1.5 = 2 - 4p p = = 0.54 1-(-2)=1+2=3 3.5 = 0.54 Probab. J1 1-p = 1-0.54 = 0.46 -1.5 -2 = -3.5 3 = 0.46 As el J1 debe jugar la estrategia A el 54% y la estrategia B el 46% Diferencia entre columnas Luego el J1 tiene un valor del juego de: 1 - (-1.5) 4 = 0.62 p(1) +(1-p) (-1.5) = 1 + 1.5 Probab. = 2.5 J2 1(0.54) + (-1.5) (0.46) -2-2 = -4 2.5 = 0.38 = - 0.15 Para el oponente, se tiene un valor del juego de11: Observar que el J1 jugar las estrategia A ms q(1)+(1-q)(-2) = (-1) (0.62)+(2)(0.38) = 0.15 que B; y que el oponente jugar la estrategia A 11 Se cambian los signos para los pagos especficos del oponente ms que B (0.62 > 0.38). (Juego suma cero). 52
60 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' As se tiene un juego de suma cero. Por qu? Ya hemos verificado que este juego no tiene un PSM. Por lo tanto, el J1 perder en promedio 0.15 por cada juego y el oponente J2 ganar 0.15. La solucin a este tipo de juegos es la siguiente: Para cada estrategia de Mara, marcamos El mtodo para analizar juegos de estrategia el pago si Juan juega la estrategia A en el eje mixta no funciona si uno o ms jugadores izquierdo del siguiente grfico, marcamos tienen ms de dos estrategias. el pago si Juan juega la estrategia B en el eje derecho, y luego conectarlos en una lnea. Ms all de juegos 2x2, los prximos juegos Observar que la coordenada vertical de esta ms complicados son 2xn, donde Mara tiene lnea arriba de cualquier punto de X le da un 2 estrategias puras y Juan tiene n>2, o mx2, pago esperado a Mara, si Juan juega una EM donde Mara tiene m>2 estrategias puras y (1-X) A, XB. Juan tiene 2. Si Mara sabe o adivina la EM de Juan, ella Si tales juegos no tienen un PSM, resulta que podra tomar ventaja para seleccionar la siempre tiene una solucin, la cual es una mejor respuesta, la cual podra significar que solucin de EM a uno de sus subjuegos 2x2 el resultado fuera superior al segmento de la Para un m o n grande, puede haber un gran lnea gruesa del grfico. nmero de sus subjuegos 2x2 para tratar. Pagos de Mara Afortunadamente hay una tcnica grfica elegante para encontrar subjuegos 2x2 que dan la solucin al juego. 4.3 Juegos de la forma mx2 y 2xn Considerar el juego 3x2 (mx2) Juan A B A 2 -3 Mara B 0 2 C -5 10 53
61 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Juan querra elegir x para hacer el pago Expectativas de Juan si Mara juega ( ) A y ( ) B correspondiente a Mara como el menor (ms pequeo) posible para obtener el punto ms Juan (A): ( ) (2) + ( ) (0) + (0)( -3) = bajo del segmento de lnea gruesa. Ya que este (B): ( ) (-3) + ( )(2) + (0)(10) = punto (crculo) est en la interseccin de las lneas de la estrategia de Mara (A) y Mara (B), Lo principal del resultado es que todas las el apropiado subjuego a resolver es: H[SHFWDWLYDV GH 0DUtD VRQ , y todas las H[SHFWDWLYDVGH-XDQVRQ . Probab. Juan de Mara A B As, Juan asegura que Mara no ganar ms A 2 -3 que , y Mara asegura que Juan no ganar Mara menos que ; as el valor del juego es . B 0 2 Observar en la grfica que, el punto ms bajo Probab. de Juan en la lnea gruesa se encuentra arriba de x = ( del recorrido hacia la estrategia A de Juan). Mara jugara A con probabilidad , jugara La coordenada vertical de este punto es , el B con probabilidad , y nunca debe jugar la valor del juego. Arriba de x = la lnea para estrategia C. Mara (Estrategia C) tiene una coordenada vertical de - , un valor ms bajo que el valor del juego, lo cual es por lo que Mara (Estrategia Se puede hacer una verificacin de que esta C) no debera ser usada. solucin del juego es la ptima, haciendo los siguientes clculos: Para juego 2xn se puede aplicar la misma tcnica grfica, con algn importante cambio. Expectativas de Mara si Juan juega ( ) A y ( ) B Mara (A): ( ) (2) + ( ) (-3) = Juan (B): ( ) (0) + ( ) (2) = A B C D E (C): ( ) (-5) + ( ) (10) = - A -2 5 1 0 -4 Mara B 3 -3 -1 3 8 54
62 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Juan (E): ( ) (-4) + ( ) (8) = El valor del juego es . Lo importante es verificar que todas las expectativas de Juan en FRQWUDGHODVH[SHFWDWLYDVGH0DUtDVRQ . Qu ocurre con juegos donde ambos jugadores tienen ms de dos estrategias que seleccionar? John Von Newman demostr que todos ellos tienen soluciones. 4.4 Ejercicios de Juegos de Suma Cero Juan tratara de seleccionar su estrategia para permanecer en la posicin ms baja, y Mara 1. Obtener un valor i con el principio Maxi- querra seleccionar un valor x para obtener el Min y Mini-Max de los siguientes juegos: punto ms alto de la posicin ms baja. Esto implica la estrategia A y la estrategia C de Juan. a) j Las estrategias ms ptimas son: C D i A 0, 1 2, 0 Juan ( , 0, , 0, 0) B 4, 4 3, 5 Mara ( , ) = ( A, B) b) j C D Expectativas de Mara, si Juan juega ( ) A y ( )C i A 2, 5 3, -1 B -2, 0 5, 3 Mara (A): ( ) (-2) + ( ) (1) = c) Mara (B): ( ) (3) + ( ) (-1) = Mara Ftbol Ballet Juan Ftbol 4, 1 0, 0 Expectativas de Juan, si Mara juega ( )A y ( )B: Ballet 0, 0 1, 4 d) Juan (A): ( ) (-2) + ( ) (3) = j Juan (B): ( ) ( 5 ) + ( ) (-3) = A B K 3 1 Juan (C): ( ) ( 1 ) + ( ) (-1) = i L 1 2 M 2 2 Juan (D): ( ) ( 0 ) + ( ) (3) = 55
63 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Para el ejercicio b), demostrar que los valores 4. Encontrar el valor j para el juego del dilema i j . del Prisionero. j C NC 2. Encontrar el valor Maxi-Min y Mini-Max i C 2, 2 0, 5 para el juego Piedra-Papel-Tijera y para el juego NC 5, 0 1, 1 de Las Monedas. a) 5. Encontrar un PSM en cada juego; si no Juan existe, resolver a travs de la tcnica grfica, Pi Pa Ti encontrando subjuegos. Pi 0, 0 -1, 1 1, -1 a) mx2 Mara Pa 1, -1 0, 0 -1, 1 A B A -3 5 Ti -1, 1 1, -1 0, 0 B -1 3 C 2 -2 b) D 3 -6 J2 b) mx2 Cara Cruz A B Cara 1, -1 -1, 1 J1 A -2 5 B 1 2 Cruz -1, 1 1, -1 C 0 -2 D 0 4 Para el caso b), encontrar una EM para J1 y J2. c) 2xn A B C D E 3. Dado el siguiente juego de Suma Constante, A -4 2 0 3 -2 transformarlo en un juego de Suma Cero y B 4 -1 0 -3 1 encontrar el valor i . 6. Dada la matriz de juego 3x3, aplicar el mtodo j de Expectativas de Igualacin. C D A B C A 60, 60 70, 50 A 3 0 1 i B -1 2 2 B 80, 40 75, 45 C 1 0 -1 Cul es la estrategia de seguridad para el Encontrar la solucin del juego y el valor del juego. jugador i? 56
64 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' 7. Considerar el juego 2x2. el cual sostiene que las costumbres, las instituciones o patrones de comportamiento en una sociedad pueden ser interpretados Juan A B como una respuesta funcional a los problemas Mara A a b con los cuales la sociedad enfrenta; as, un B c d mtodo para comprender la organizacin de las sociedades podra ser identificar problemas y tensiones, ver qu tipo de comportamiento El juego tendr un PSM a menos que las dos proporcionara buenas soluciones y comparar entradas ms grandes estn diagonalmente patrones de comportamiento de la sociedad de opuestas cada una de la otra. As, suponer aquellas soluciones. que las dos entradas (ingresos) ms grandes son a y d. suponer que Juan juega A y B con probabilidad x y (1 x). La primera aplicacin cuantitativa de la teora de juegos de dos personas al problema antropolgico fue realizada por Davenport a. Mostrar que el valor de x, el cual igualar (1960), sobre la pesca jamaiquina, que estudi las expectativas de Mara para la estrategia una va de 200 personas en la costa sur de A de Mara, y la estrategia B de Mara es Jamaica, cuyos habitantes vivan de la pesca. La zona de pesca se extiende hacia fuera de la costa (mar adentro), a unos 22 kilmetros. Analiz 26 tripulaciones de pescadores en navegacin, en tres das de pesca cada semana. b. Mostrar que el valor del juego es La zona de pesca era dividida hacia adentro y hacia afuera de la orilla. Hacia adentro de la orilla (inside) se encuentra de 5 a 10 kilmetros; mientras que hacia afuera de la orilla (outside- mar adentro) se encuentra ms all de los 10 8. Considerar el siguiente juego aplicado a la kilmetros. Hacia adentro de la orilla esta Antropologa siempre protegida de las corrientes fuertes. La zona entre inside y outside la llamaremos in-out, que es donde inician corrientes fuertes. LA PESCA JAMAICANA As, los capitanes de las canoas pueden Una importante escuela de Antropologa posiblemente adoptar 3 estrategias diferentes reflexion sobre el conocido Funcionalismo, para pescar: 57
65 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Inside: Colocar todas las canoas al interior Davenport recolect datos para estimar el de la orilla. pago de las tres posibles estrategias, cuando la corriente est en marcha y cuando la corriente Outside: Colocar todas las canoas al otro no est en marcha. Los pagos de la matriz son lado de la orilla. un promedio de los beneficios en libras por In-out: Colocar algunas canoas al interior mes de pesca de una canoa. de la orilla, y algunas al otro lado de la orilla (mar adentro). As, la matriz siguiente puede ser vista como un juego 3x2. Estas estrategias tienen algunas ventajas Corriente y desventajas: No Marcha marcha Pescador Inside 17.3 11.5 1. Ya que el tiempo de recorrido es ms largo, Outside -4.4 20.6 las tripulaciones siguen las estrategias In-Out 5.2 17.0 outside o in-out, que pueden establecer un nmero menor de canoas. 2. Cuando la corriente es alta, es perjudicial i. Encontrar el valor del juego. para las canoas del otro lado de la orilla ii. Las estrategias ptimas. porque pueden sufrir accidentes y el iii. Cmo se compara la solucin del juego pescado puede morir por los cambios de con el comportamiento de los aldeanos? temperatura y otras condiciones inducidas Por qu no utilizan la estrategia outside? por la corriente. iv. Cul es la conclusin del juego?, Podra 3. Al otro lado de la orilla produce una haber una falla para este juego? alta calidad de pescado (en variedades y tamaos). v. Qu significa el valor del juego encontrado, desde la perspectiva del Mini-Max? 4. Las canoas en la zona outside o in-out requieren de canoas ms resistentes. Los vi. Qu pasa si los pescadores utilizan una pescadores de la zona inside a menudo EM del 25% con la estrategia Marcha?. compran sus canoas usadas de los vii. Calcular el valor esperado de sus diversas pescadores, quienes van al otro lado de la estrategias. orilla outside, las cuales son ms nuevas y viii. Suponer que en un ao la corriente corra ms resistentes. (Marcha) en un 35% del tiempo. Cules son los pagos esperados? 58
66 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' 9. Considerar el siguiente juego aplicado a Si ellos dividen 2 0, ellos an tienen que conflictos (fenmeno de la guerra). decidir cul arsenal atacar. Ellos decidirn aleatoriamente, ya que cualquier solucin no aleatoria puede ser anticipada por la Polica. GUERRILLAS v.s. POLICAS Los juegos de suma cero representan La Polica debe decidir si divide 3 0 o 2 1, y situaciones de conflicto y la solucin terica entonces decidir (aleatoriamente) dnde enviar para ellos, describe estrategias racionales la fuerza ms fuerte. La matriz se presenta a para el conflicto. Dado que la mayora de la continuacin, con los pagos de las guerrillas (1 forma extrema del conflicto es la guerra, no para un ganador, 0 para un perdedor). Un pago es sorprendente que algunas de las primeras de si la guerrilla divide 2 0, del tiempo, aplicaciones propuestas en la teora de juegos atacarn al arsenal, el cual tiene la fuerza de fueran tcticas de guerra. defensa ms fuerte y perdern; la otra mitad del tiempo ellos atacarn al arsenal ms dbil Supngase que hay m guerrillas, n policas, y ganaran. y 2 arsenales de Gobierno a los cuales la guerrilla les gustara capturar, y la Polica debe defender. La guerrilla atacar uno o 3 Policas ambos arsenales y ellos capturaran cualquier 3-0 2-1 arsenal atacndolo con ms fuerza respecto a 2 Guerrillas 2-0 los policas (que defienden). 2-1 1 0 La guerrilla gana el juego si ellos capturan Cul es el valor del juego? incluso un arsenal (ellos tiene armas para Cul es la estrategia ptima? continuar atacando), la Polica gana solamente si ellos defienden con xito ambos arsenales. Para otras fortalezas la estrategia ptima La guerrilla puede sin duda ganar si m>n: ellos puede ser una estrategia Mixta; considerar el solo atacarn a cualquiera de los dos arsenales siguiente escenario: con toda su fuerza. La Polica gana si QP: ellos defienden cada arsenal con fuerza de al menos m. Lo interesante del caso es cuando m QP 4 Policas 4-0 3-1 2-2 Para hacerse una idea de esta situacin, suponer m = 2 y n = 3. 4-0 1 1 4 Guerrillas El reto de la guerrilla es como dividir su fuerza 3-1 1 1 entre los dos arsenales 2 0 o 1 1. 2-2 1 1 0 59
67 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA i. Encontrar la solucin para la guerrilla y de red #2 y #3. Red #2 ha sido eliminada, de para los policas. manera que este antimisil eliminar Red #3. Blue gana, obtiene un pago de 1. La Matriz se presenta ii. Encontrar el valor del juego. a continuacin: Red 10. Considerar el siguiente juego aplicado a WWDD WDWD WDDW DWWD DWDW DDWW conflictos (la guerra de las galaxias) 12 1 1 0 1 0 0 13 0 1 1 1 1 0 Blue 14 0 0 1 0 1 0 STAR WARS 23 0 0 0 1 1 1 24 0 0 0 0 1 1 34 0 0 0 0 0 1 Considerar un problema de penetracin de misiles Encontrar la solucin del juego. (Jhonson, 1966) aplicable al programa de defensa de misiles como el programa Star Wars de los Estados Unidos (1980) llamaremos a los pases 11. Considerar el siguiente juego aplicado a la Red y Blue. Suponer que Red desea destruir la Biologa. base militar de Blue. Red tiene 4 misiles los cuales sern disparados en secuencia. Dos de los misiles ESTRATEGIAS ESTABLES EVOLUTIVAMENTE tienen ojivas reales; mientras que otras dos estn (ESS) vacas. Para la defensa, Blue tiene anti-misil. Cada antimisil puede examinar dos misiles de Red y La idea de ESS fue introducida por Maynord destruir el primero que tiene una ojiva real. Smith y G.R Price (1973) es una idea que explica Red debe escoger el orden en el cual enviar la la Biologa evolutiva. Es especialmente aplicable ojiva real y las vacas. Usaremos la notacin en al estudio del comportamiento y tiene su base la cual DWWD significa enviar una ojiva: vaca, en la moderna Sociobiologa. La idea bsica ojiva real, real, vaca; en ese orden la seleccin de radica en que por qu miembros individuales Blue es cuando dispara los antimisiles. de una especie biolgica tienen similares Otra notacin ser que 13 significa disparar en la necesidades, y recursos limitados situaciones primera y tercer misil de Red. Blue gana el juego de conflicto a menudo aparecern. En esta (Pago 1), si Blue destruye ambas ojivas de red; Blue situacin de conflicto hay diferentes patrones perder (Pago 0), si incluso se recibe una ojiva a (estrategias) de comportamiento que pueden travs de Red. Para ilustrar cmo los pagos son seguir en forma individual. En estos casos la calculados, considerar Blue 12 contra Red DWWD. Teora de Juegos puede ayudar a seleccionar El primer antimisil de Blue observa misiles de red dichos patrones de comportamiento (lo que #1 y #2, y elimina #2, el cual tiene una ojiva viva; toma el lugar de la racionalidad es la presin el segundo antimisil Blue puede rastrear misiles evolutiva, la seleccin natural). 60
68 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Miembros de una especie se comprometern APAREAMIENTO ASIMTRICO en repetidos conflictos aleatorios bajo el mismo Considera un simple juego de apareamiento recurso. Cada conflicto es entre dos miembros asimtrico en el cual una hembra (un Pjaro), y solamente uno puede ganar; el recurso es intenta mantener un macho para permanecer valorado con 50 puntos. con l y ayudar a crear una familia en lugar Los puntos son interpretados como un de irse y propagar sus genes en cualquier incremento a la probabilidad de pasar genes otro lado. Una posible tcnica para hacerlo es a la prxima generacin. Supongamos que insistir en un largo y arduo cortejo antes de un individuo tiene solamente dos estrategias aparearse. Suponer que una hembra puede posibles: Halcn y Paloma. ser tmida (insistir en un cortejo) o rpida (estar dispuesta a aparearse con cualquiera de Un Halcn lucha por el recurso; una Paloma su especie), y un macho puede ser cualquiera solo se involucra en un conflicto simblico; de las dos caractersticas: fiel (pasar por un adopta postura, pero en realidad no lucha. cortejo y luego ayudar a criar a los bebes) Si ambos jugadores adoptan la estrategia o infiel (no estar dispuesto a pasar por un Halcn, ellos lucharan hasta que uno es cortejo, y abandonar a cualquier hembra lesionado. El ganador obtendr el recurso con despus del apareamiento). Suponer que los un valor de 50 puntos, mientras el perdedor pagos de cada padre de los bebs es +15 y, obtendr 0 puntos. Si un Halcn encuentra una el total de costos por criar bebs es de -20, Paloma siempre ganar el recurso. La matriz se los cuales pueden ser divididos igualmente presenta a continuacin. entre ambos padres, o caer enteramente en la hembra si el macho la abandona. Suponer J2 que el costo de un largo cortejo es -3 para H P cada jugador (Dawkins, 1976). J1 H -25 50 P 0 15 Macho Fiel Infiel Qu ocurre si se tiene una poblacin mixta, Hembra Tmida (2, 2) (0, 0) por ejemplo de Halcones y de Palomas? Rpida (5, 5) (-5, 15) Qu poblacin se incrementa, los Halcones o las Palomas? i. Demostrar que no hay un equilibrio en EP. 12. Encontrar una EM en la cual la proposicin ii. Encontrar una EM ESS (estrategia estable de Halcones y Palomas tengan un balance en evolutivamente) para el macho (sera una el incremento de la poblacin. Esta solucin es en la cual iguala los pagos esperados de denominada estrategia estable evolutivamente (ESS). Tmida y Rpida). 61
69 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA iii. Similarmente, encontrar una ESS para ganancia es 5 la hembra. Entonces j elige C (el menor valor); as vi = 2 ; iv. Si los machos y las hembras siguen esas (Si, Sj) = (A, C) ESS, Cuales seran los pagos esperados? III. Mini-Max: (Jugador j) Si i Juega A, la Sj que maximiza la ganancia j es Solucin al ejercicio # 2 b. C (ganancia = 5) j C D Min Si i Juega B, la Sj que maximiza la ganancia j es i A 2, 5 3, -1 2 Max Min C (ganancia = 0) B -2, 0 5, 3 -2 i quiere minimizar la ganancia de j. Si juega Max 2 5 A la mejor ganancia es 5; si juega B la mejor ganancia es 0 Min Max Entonces i elige B (el menor valor); as vj = 0 ; (Si, Sj) = (B, C) I. Maxi-Min: (Jugador i) [i quiere maximizar su ganancia; j minimizar j su ganancia de i] C D Max Si i selecciona A, la Sj que minimiza la ganancia i A 2, 5 3, -1 2 Min Max i es C (ganancia = 2) B -2, 0 5, 3 0 Si i selecciona B, la Sj que minimiza la ganancia Min 0 -3 i es C (ganancia = -2) Max Min i quiere maximizar su ganancia. Si juega A la peor ganancia es 2; si juega B la peor ganancia IV. Maxi-Min es -2 Si j Juega C, la Si que minimiza la ganancia j es Entonces i elige A (el mayor valor); as vi = 2 ; B (ganancia = 0) (Si, Sj) = (A,C) Si j Juega D, la Si que minimiza la ganancia j es II. Mini-Max: (Jugador i) B (ganancia = -3) Si j Juega C, la Si que maximiza la ganancia i es j quiere maximizar su ganancia. Si juega C A (ganancia = 2) la menor ganancia es 0; si juega D la menor Si j Juega D, la Si que maximiza la ganancia i es ganancia es -3 B (ganancia = 5) Entonces j elige C (el mayor valor); as vj = 0 ; el j quiere minimizar la ganancia i. Si juega perfil (Si,Sj) = (B,C) C la mejor ganancia es 2; si juega D la mejor As i j . 62
70 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Solucin: al ejercicio #8 (La Pesca Jamacana) ii. As obtenemos una estrategia ptima del 67% para inside; 33% para in-out del pescador; una estrategia ptima para la Corriente No corriente Marcha del 31% y un 69% para la Marcha corriente No marcha; y un valor del juego marcha Pescador Inside 17.3 11.5 de 13.3. Outside -4.4 20.6 iii. Cmo se compara la solucin del juego con In-Out 5.2 17.0 el comportamiento de los aldeanos? Por Puede observarse que no existe un PSM, no qu no utilizan outside? Los pescadores hay dominancia. (capitn) no siguen la estrategia outside; ya Los pagos son un promedio de los beneficios en que se caracteriza como arriesgada. libras por mes de pesca del capitn de la canoa iv. Cul es la conclusin de este juego? Esta del pescador. Este caso se puede tratar como sociedad se ha adaptado a su ambiente un juego de 3x2 (mx2). Al graficar el juego se natural y econmico. observar que el punto ms bajo de la posicin v. En su opinin, cul es la falla de este juego? superior de la grfica implica a las estrategias Segn Kozelka (1969) hay una falla en inside e in-out. Ahora se resuelve el juego 2x2: el anlisis, ya que los oponentes de los pescadores es un fenmeno natural la Corriente corriente, y no es una entidad razonable, M NM y su comportamiento no es afectado. Inside 17.3 11.5 Pescador In-Out 5.2 17.0 vi. Qu pasa si los pescadores utilizan una 31% 69% EM del 25% en la estrategia Marcha? Diferencias en fila: Calcular el valor esperado de sus diversas estrategias. 17.3 11.5 = 5.8 Inside: (0.25)(17.3) + (0.75)(11.5) = 12.95 5.2 17 = 11.8 Outside: (0.25)(-4.4) + (0.75)(20.6) = 14.35 In-out: (0.25)(5.2) + (0.75)(17.0) = 14.05 Las diferencias en columna resultan en 31% y 69% Segn estos datos, los pescadores deberan pescar outside. vii. Suponer que en un ao la corriente corra i. Valor del Juego? Valor esperado para un 35% del tiempo: Cules sern los inside. Pescador Inside: (17.3)(0.31) + pagos esperados? (11.5)(0.69) = 13.3. Inside: (0.35)(17.3) + (0.65)(11.5) = 13.53 63
71 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Outside: (0.35)(17.3) + (0.65)(11.5) = 11.85 Si q = 0.30 In-out: (0.35)(17.3) + (0.65)(11.5) = 12.87 Inside: (0.30) (17.3) + (0.70) (11.5) = 5.19 + 8.05 = 13.24 viii. Qu significa el valor del juego 13.3 Outside: (0.30) (-4.4) + (0.70) (20.6) = -1.36 + 14.42 = 13.1 encontrado inicialmente, desde la perspectiva In-out: (0.30) (5.2) + (0.70) (17.0) = 1.56 + 11.9 = 13.46 del Minimax? La solucin del juego (ventaja) a travs del Minimax es que les garantiza un ingreso promedio de al menos 13.3% libras/ Suponer que in-out en NM fuera de 15 canoa por mes, sin tener en cuenta de lo que en lugar de 17. Cul sera el efecto en la ocurre con la corriente (es una propiedad solucin del juego sobre el valor del juego? de seguridad que da la solucin Minimax, Encontrando el valor del juego para in-out. incluso cuando el oponente no es una entidad razonable). In-Out: (5.2)(0.22) + (15)(0.78) = 1.144 + 11.7 = 12.84 Cul sera el % para el cual la estrategia in-out Se tiene una disminucin del 3.5% respecto al sera la mejor respuesta? valor del juego original. Una reduccin en el ingreso promedio por (q) M (1-q) NM libras/canoa/mes. (p) Inside 17.3 11.5 (1-p) In-Out 5.2 17.0 17.3q + (1 q)(11.5) < 5.2q + (1 q)(17) 5.8q + 11.5 < 17 11.8q 17.6q < 5.5 q < 0.31 64
72 V Juegos en forma extensiva En el otoo de 1998 los espectadores tuvieron Disney eligi liberar a A Bugs Life en la una opcin de pelculas animadas para escoger. temporada del Da de Gracias, cuando Curiosamente dos de las pelculas fueron la pelcula Prince of Egypt, de SKG, fue de insectos: Disney Studios A Bugs Life y originalmente programada para abrirse en DreamWorks SKGS Antz. Alguna audiencia, las salas de cine. En respuesta, SKG decidi maravillada de las pelculas animadas por retrasar la liberacin de Prince of Egypt hasta computadoras, estuvo expectante de la la temporada de Navidad y se apresuraron a rivalidad que conllev a las dos pelculas completar Antz, de manera que pudiera estar gemelas a una alta competencia. lista antes de A Bugs Life y reclamar el ttulo de la Primer pelcula animada de Bichos. Los ejecutivos de Disney ponderaron la idea de una pelcula de bichos, animada en los Esta historia es intrigante por las caractersticas, finales de los aos 80, durante el periodo de ms all de los personajes, los temas legales Jeffrey Katzenberg a cargo de los estudios de la (Katzenberg rob la idea de Bichos de Disney?) Compaa. Sin embargo, A Bugs Life no fue y la complicada estrategia de negocios. concebida hasta despus que Katzenberg dej Katzenberg abandon Disney por la falta de la empresa Disney por desacuerdos con sus pago de bonos. directivos. En agosto de 1994, poco despus, Pixar Animation, una empresa de animacin Usemos un modelo matemtico para contar la de pelculas por computadoras, se inclin por historia de la pelcula de bichos, focalicemos A Bugs Life para Disney, donde Michael en la competencia entre las dos pelculas. Eisner, el sustituto de Katzenberg, acept la Pensar en un juego entre Katzenberg y Eisner, propuesta y la pelcula entr en produccin. quienes son los jugadores de nuestro modelo. Podemos usar un rbol para representar Aproximadamente al mismo tiempo, grficamente la interaccin de estrategias entre Katzenberg se junt con Steven Spielberg y estas dos personas. El rbol es definido por David Geffen para formar DreamWorks SKG, nodos y ramas. Los nodos representan el lugar un nuevo estudio con grandes expectativas; donde algo sucede en el juego (tal como una poco tiempo despus SKG se uni con una decisin de uno de los jugadores) y las ramas firma de animacin por computadora, llamada indican las acciones varias que los jugadores PDI para producir Antz. pueden escoger. Representaremos los nodos
73 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA por slidos crculos y las ramas por flechas conectando los nodos. Un apropiado rbol construido es llamado una representacin en forma extensiva. Para disear el rbol del juego para Katzenberg Eisner es til pensar en la secuencia cronolgica de eventos que describen la historia. Permitir que el juego comience con la decisin de Katzenberg acerca de dejar o no a Disney. El La figura muestra cmo el rbol es expandido nodo a significa el lugar donde esta decisin es para incluir la escogencia de Eisner. Notar que realizada. Esta decisin es el inicio del juego; a Eisner ha hecho esta decisin solamente si es llamado nodo inicial. Cada juego en forma Katzenberg ha dejado a Disney, el movimiento extensiva tiene exactamente un nodo inicial. de Eisner ocurre en el nodo b. Las dos opciones de Eisner producir A Bugs Life o no producirla son representadas por dos ramas, que se dirigen desde el nodo b a dos otros nodos, c y d. Ahora Katzenberg debe escoger si produce Katzenberg tiene dos opciones: - permanecer Antz. La decisin de Katzenberg toma lugar en (stay) o abandonar (leave), corresponde a las dos ambos, nodos c o nodo d, dependiendo de que ramas, las cuales son graficadas como flechas si Eisner ha seleccionado producir o no. desde el nodo a y etiquetadas. Esas ramas dirigen desde el nodo a hacia otros dos nodos. Notar que hay dos ramas desde el nodo c y otras dos en el nodo d. Observar que el inicio de Si Katzenberg decide permanecer en Katzenberg est localizado en c y en d porque Disney se asume que el juego termine. l est en movimiento en esos nodos. De otra manera, si Katzenberg abandona, entonces otra decisin tiene que hacerse. A este punto hemos llegado a un asunto crtico: Primero, Eisner debe decidir si produce A La informacin En el rbol se especifica Bugs Life. 66
74 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' apropiadamente la informacin de los jugadores cuando ellos toman las decisiones? Con la forma extensiva podemos representar la informacin de los jugadores para describir si ellos saben dnde estn en el rbol y los progresos del juego. Por ejemplo, cuando Katzenberg decide si permanecer o dejar, l sabe que est haciendo el primer movimiento en el juego. En otras palabras, en el nodo a Katzenberg sabe que est en el nodo a; adems, porque Eisner observa si Katzenberg Asumir que, si cada uno o ambos jugadores permanece o abandona, cuando Eisner ha escoge no producir su pelcula propuesta, decidido si producir A Bugs Life, l sabe que entonces el juego termina. Si ambos est en el nodo b. jugadores optan por producir, entonces una o ms decisiones tiene que ser realizada por Katzenberg. Si libera Antz tempranamente Sin embargo, como la historia lo indica, cada (para superar el xito de la pelcula A Bugs jugador tiene que seleccionar entre producir y Life en los salas de cine). no producir sin conocer si el otro jugador ha decidido producir. En particular, Katzenberg debe escoger si produce Antz, antes de Agregando esta decisin al rbol con pagos, conocer si Eisner est produciendo A Bugs Katzenberg hace esta escogencia en el nodo e, Life. Los jugadores conocen acerca de cada despus de conocer que Eisner disidi producir una de las opciones de los otros, solamente A Bugs Life. despus que ambos lo hacen. Katzenberg no tiene informacin, l no puede distinguir entre los nodos c y d (existe falta de informacin); l sabe que est en uno de esos nodos, pero l no sabe en cul de ellos est. Para ello se traza una lnea (punteada) para capturar esta falta de informacin, entre los nodos c y d (se etiqueta solamente uno de ellos con la letra inicial de Katzenberg). 67
75 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA El rbol representa las diferentes acciones de los El nodo c y e tambin son sus conjuntos de jugadores y la informacin en el juego. Los nodos informacin separada. Los nodos c y d, sin a, b, c, d, e, son llamados nodos de decisin. embargo, estn en el mismo conjunto de informacin. Los nodos f, g, h, l, m, n, son llamados nodos terminales y representan los pagos o resultados El conjunto de informacin en un juego del juego los lugares donde el juego termina-. precisamente describe las diferentes decisiones Cada nodo terminal tambin corresponde que los jugadores tienen que hacer. Por ejemplo a una nica ruta a travs del rbol, el cual es Katzenberg tiene 3 decisiones que hacer en el un camino de obtener desde el nodo inicial juego: Uno en el conjunto de informacin dado a travs del rbol, siguiendo las ramas en la en el nodo a; otro, en el conjunto de informacin direccin de las flechas. contenido en los nodos c y d; y el tercer conjunto de informacin es dado en el nodo e. Eisner tiene una decisin que hacer (en el nodo b). En una forma extensiva hay una relacin, una- Recordar que solamente una decisin es hecha a-una entre la ruta y los nodos terminales. en cada conjunto de informacin. Es comn utilizar el trmino conjunto de informacin para especificar la informacin Por ejemplo, porque los nodos c y d estn en de los jugadores en los nodos de decisin en el mismo conjunto de informacin, Katzenberg el juego. hace la misma eleccin en c, tanto como en d (producir o no). Asumimos que todos los nodos Un conjunto de informacin describe cul en un conjunto de informacin son nodos de nodo de decisin es conectado a cada otro por decisin para el mismo jugador. lneas punteadas (significando que un jugador no puede distinguir entre ellas). La figura anterior muestra los elementos de un juego. Las preferencias bajo resultados o Cada nodo de decisin es conectado a un ganancias, pagos o utilidades? Katzenberg conjunto de informacin. Algunos conjuntos de preferira finalizar el juego en f que en el nodo l? informacin consisten de solamente un nodo: Por ejemplo, el conjunto de informacin del Recordar que los pagos mayores significan nodo a comprende solo este nodo (Katzenberg los resultados preferidos. Katzenberg y puede distinguir este nodo de sus otros nodos Eisner probablemente quieren maximizar sus de decisiones). ganancias monetarias individuales. Entonces, definamos los pagos como beneficios que 68
76 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' cada uno obtiene en varios resultados. Las La Forma Extensiva completa del juego ganancias en un nodo es un vector de pagos. Katzenberg-Eisner representa todos los Por ejemplo, en el nodo n, (35, 100) significa 35 elementos estratgicos. para Katzenberg y 100 para Eisner. 1. Lista de jugadores. 2. Descripcin completa de lo que los jugadores pueden hacer (sus posibles acciones). 3. Una descripcin de lo que los jugadores saben cundo ellos actan. 4. Una especificacin de cmo las acciones de los jugadores lideran los resultados. 5. Una especificacin de las preferencias de los jugadores bajo sus resultados. Otros ejemplos. Identificar el conjunto de informacin de cada Se utiliza la convencin de que uno de los pagos jugador y el conjunto de estrategias de los de los jugadores son primeramente listados, juegos siguientes, descritos en forma extensiva. porque Katzenberg es el primer jugador a a) mover en el juego. Una representacin ms compacta se presenta a continuacin: Solucin: S1 = {U,D} S2 = {AC, AE, BD, BE} S3 = {RP, RQ, TP, TQ} 69
77 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA b) d) Cul es el conjunto de estrategias? Solucin: S1 = {0A, 0B, IA, IB} S1 = {AW, BW, CW, AZ, BZ, CZ} S2 = {0, I} S2 = {X,Y} A B c) Una empresa puede o no salir de una industria competitiva: A ser agresivo en el mercado (Empresa 1). Espacio de estrategias P ser pasivo S = {(OA,O), (OA, I), (OB, O)...} O dejar el mercado. Entonces la empresa 2 disfruta el monopolio. Cada perfil de estrategias un vector de pagos: Cuando E2 toma su decisin, sabe solamente u1 = (OA,O) = 2 si E1 est en el mercado o fuera de l. La E2 no u2 = (IA,O) = 3 observa a E1. 5.1 Conversin de un juego de forma normal a forma extensiva Existe un procedimiento para convertir un juego en forma normal a una forma extensiva? La conversin no es tan sencilla. Aunque puede haber una sola manera de ir de la forma S1 = {A,P,O} extensiva a la forma normal; lo inverso no es cierto. S2 = {A,P} 70
78 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Se puede observar que el Jugador K tiene J2 3 conjuntos de informacin. En el primer C D conjunto de informacin selecciona entre L J1 A 1, 2 1, 2 y S. En el segundo conjunto de informacin, B 3, 1 2, 4 l escoge entre P y N, y en su tercer conjunto de informacin l selecciona entre R y N. As Observar que las siguientes formas extensivas una estrategia para K es una combinacin tienen diferentes estructuras de informacin. de tres acciones: una para cada conjunto de En la primera, el J2 sabe que el J1 no selecciona informacin. Por ejemplo, una estrategia A cuando el J2 tiene que decidir entre C y D. es LNR, la cual es una estrategia utilizable En el segundo, el J2 no tiene tal informacin. a considerar porque ilustra, incluso, si el Jugador K selecciona N en su segundo conjunto de informacin; su estrategia debe describir lo que l hara en su tercer conjunto de informacin. Dado que el Jugador K tiene dos alternativas en cada uno de los tres conjuntos de informacin, hay 2 x 2 x 2 = 8 diferentes Tienen diferentes combinaciones (8 diferentes estrategias), as estructuras de informacin. Sk = {LPR, LPN, LNR, LNN, SPR, SPN, SNR, SNN} Observar que el Jugador E tiene solamente un conjunto de informacin y su espacio de Ejemplo: Dado el siguiente juego en forma estrategia es: SE = {P, N}. extensiva (el juego Katzenberg Eisner), describir el espacio de estrategias y dibujar la Para dibujar la matriz en forma normal, representacin en forma normal. primero observar que debemos tener 8 filas (para 8 diferentes estrategias para K) y dos columnas (para las dos estrategias del Jugador E). Observar que en cada perfil de estrategia individual se puede trazar a travs de la forma extensiva para encontrar el vector de pagos 71
79 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA asociado. Por ejemplo, considerar el perfil gana nada si no entra. de estrategia (LNN, P). Con este perfil de 2. Janet es una concursante de un juego estrategia se juegan los ingresos desde el nodo popular y su tarea es adivinar detrs de inicial hacia el nodo b, luego el nodo c y finaliza cul puerta esta Liz, otra concursante en el nodo terminal con un vector de pago (0, que est de pie. Con Janet fuera del 140). cuarto, Liz escoge una puerta detrs de A continuacin se completa la matriz. la cual pararse cualquier puerta A o B. El anfitrin, Juan, observa esta seleccin. Janet no ha observado la seleccin de E Liz, entonces entra al cuarto. Juan le dice P N LPR 40, 110 80, 0 a Janet cualquiera de los dos: Rojo o LPN 13, 120 80, 0 Verde. Despus de escuchar la oracin LNR 0, 140 0, 0 de Juan, Janet levanta una puerta (ella K LNN 0, 140 0, 0 dice cualquiera de las dos: A o B). Si SPR 35, 100 35, 100 ella levanta la puerta correcta, entonces SPN 35, 100 35, 100 SNR 35, 100 35, 100 ella gana $100. Si ella levanta la puerta SNN 35, 100 35, 100 equivocada entonces no gana nada. Liz gana $100 si Janet levanta la puerta errnea, y no gana nada si ella levanta la puerta 5.2 Ejercicios y aplicaciones correcta (as Liz le gustara ocultarse de 1. Representar el siguiente juego en forma Janet, y a Janet le gustara encontrar a Liz). extensiva. La firma A decide si entra a la A Juan le gusta la letra A. Si Janet selecciona industria de la firma B. La firma B observa la puerta A, entonces esta seleccin hace esta decisin. Si la firma A entra, entonces feliz a Juan, para acordar 10 unidades de las dos firmas deciden simultneamente utilidad. Si ella selecciona la puerta B, si lo anuncian. De otra forma, la firma B entonces Juan recibe 0 utilidades. decide unilateralmente si lo anuncia. Con dos firmas en el mercado, las firmas ganan un beneficio de $3 millones cada una, si Solucin al ejercicio 1: ambas anuncian; y $5 millones si ambas Sea E y NE la notacin de la firma A para no lo anuncian. Si solamente una firma entrar y no entrar a la industria de la firma lo anuncia, entonces gana $6 millones y B. Sea a (advertise) y n colocar publicidad y la otra gana $1millon. Cuando la firma B no publicidad, respectivamente. Entonces esta solitaria en la industria, su ganancia el siguiente diagrama en forma extensiva es de $4 millones si se anuncia, y de $3.5 representa el conjunto de estrategias. millones si no se anuncia. La firma A no 72
80 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' el comportamiento anticompetitivo. En este caso, el apoderado general no observa cul firma seleccion el precio alto (o si ambas firmas seleccionaron el precio alto). Dibujar la forma extensiva del juego, asignar tus propios pagos (vector de pagos). 4. Dibujar la matriz en forma normal de cada uno de los siguientes juegos en forma extensiva. a) 0, 0 Notar que la decisin de anunciar simultneamente son capturadas suponiendo que en el segundo conjunto de informacin de la firma A, la firma A no sabe si la firma B escoger a o n. Tambin notar 1, 1 que los apstrofos () son usados en las etiquetas 2, 2 de accin en el conjunto de informacin ms bajo de la firma B para diferenciarla de las acciones tomadas en el conjunto de informacin de B (en la parte superior). 3, 4 3. Hay una industria en la cual 2 firmas b) compiten de la forma siguiente: primero, la firma1 decide si fija un precio alto (H) o un precio bajo (L). Despus viendo el precio de la firma1, la firma2 decide si fija un precio alto (H) o un precio bajo (L). Si ambas firmas seleccionan el precio bajo, entonces el juego termina con no ms interaccin. Si cualquiera de las dos o ambas firmas seleccionaron el precio alto, entonces el apoderado general decide si procesar/enjuiciar (P) o no hacerlo (N) por 73
81 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA c) 5.3 Juegos dinmicos con informacin completa Antes hemos estudiado juegos con movimientos simultneos. Los jugadores, una vez finalizan el juego nunca ms interactan. En la vida real la mayora de interacciones no es de este tipo, es posible que cuando un jugador acte ya conozca la decisin de otro, o que uno o ms jugadores actan ms de una vez. Ejemplo: dos empresas en un oligopolio, no solo fijan precios hoy, saben que tambin tendrn 5. Considerar el juego en forma normal que fijar precios en el futuro, y al decidir si siguiente. Dibujar una representacin del bajan el precio hoy para ganarle la cuota del juego en forma extensiva. mercado a su rival, toman en cuenta la posible J2 reaccin del rival en el futuro (un Gobierno que C D impone aranceles a las importaciones,). AY 0, 3 0, 0 J1 En este tipo de juegos veremos que el EN AN 2, 0 -1, 0 BY 0, 1 1, 1 sigue siendo vlido en este tipo de juegos; sin BN 0, 1 1, 1 embargo, hay una idea que no pude recoger y es esencial en este tipo de juegos: la credibilidad (ejemplo: la farmacia en un pueblo, que es 6. Convertir el rbol del juego en forma nica monopolio). extensiva a una forma normal y verificar si existen EN. Ejemplo: UBICACIN DE UN CENTRO DE INVESTIGACIN Dos empresas deben decidir si establecer sus centros de investigacin y desarrollo con el Norte o en el Sur. A las dos empresas les conviene elegir la misma zona porque esto facilitar su comunicacin y reducir costos; pero la Empresa 1 prefiere el Norte 74
82 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' y la Empresa 2 prefiere el Sur, lo cual las 5.4 Induccin hacia atrs lleva a una situacin familiar a la de la Batalla de los Sexos. Si cada empresa toma Se inicia por el final del juego para identificar su decisin sin conocer la decisin de la otra, acciones ptimas. Se analiza la decisin la representacin matricial es la siguiente: ptima de la Empresa 2 si le toca jugar en el nodo b, as, le conviene elegir Norte, pues Emp2 obtiene 3 en lugar de 2. De la misma forma, N S encontramos que en el nodo c, a la Empresa Emp1 N 4, 3 2, 2 2 le conviene elegir Sur (que le proporciona S 1, 1 3, 4 4 en lugar de 1). Marcamos en el rbol las acciones Puede observase que existen dos Equilibrios ptimas para la Empresa 2. de Nash en EP, que las dos empresas se establezcan en el Norte, y que ambas se 4, 3 establezcan en el Sur. Consideremos el caso en el que la 2, 2 interaccin entre las empresas se da en forma secuencial. La Empresa 1 establece su 1, 1 centro primero. Luego la Empresa 2 toma su decisin (despus de haber observado la 3, 4 localizacin elegida por Empresa 1). La Empresa 1 puede anticipar qu accin le 4, 3 convendr tomar a la Empresa 2 en cada caso; sabe que si el elige Norte, la Empresa 2 tambin lo har (N,N), y si elige Sur, la Empresa 2 2, 2 tambin elegir Sur (S,S). Es decir, la Empresa 1 anticipa que si elige Norte se llegar a los pagos 1, 1 (4,3); mientras que elegir Sur conducir a los pagos (3,4). As, la Empresa 1 se enfrenta a una decisin, pues evidentemente le conviene elegir 3, 4 Norte. As, el procedimiento de induccin hacia En este tipo de juegos la Empresa 2 no tendr atrs dicta que el resultado de la interaccin es que hacer conjeturas sobre lo que har la que las dos empresas se ubicarn en el Norte. Empresa 1, lo sabr con seguridad. 75
83 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Observar que a diferencia de la interaccin El grfico con la lnea punteada, representa simultnea (Donde haban 2 EN, y lo nico un juego donde la Empesa 2, sin conocer la que podamos predecir es que se ubicaran decisin de la Empesa 1, elige entre N y S. en el mismo sitio); en la interaccin secuencial resulta que la empresa que elige primero se 5.5 Estrategias puras en juegos sale con la suya, se ubica en su lugar preferido, anticipando que la segunda empresa har lo en forma extensiva mismo porque es lo que le convendr. Definicin 11: En el siguiente diagrama se puede representar Una EP para el jugador i en un juego en forma una situacin en que las empresas 1 y 2 eligen extensiva es un plan que indica que alternativa simultneamente su ubicacin (ver lnea punteada). debe escoger el jugador i en cada uno de los conjuntos de informacin en que le puede tocar jugar. 4, 3 En el juego anterior (los dos centros de 2, 2 investigacin), observar que la Empresa 1 solamente juega en el nodo a, entonces una EP 1, 1 tiene que especificar qu hacer en ese nodo, por lo que la Empresa 1 solo tiene 2 estrategias 3, 4 posibles (N o S). La Empresa 2 puede jugar en dos conjuntos de Esto indicara que cuando la Empresa 2 est en informacin distintos, en el nodo b y en c. Una el nodo b o en c, no sabe en cul de los dos est, estrategia debe indicar qu hacer si juega en b as, se dice que los nodos b y c pertenecen al y qu hacer si juega en c, as, en total tiene 4 mismo conjunto de informacin de la Empesa estrategias posibles: {NN, NS, SN, SS}. 2; significa que el jugador que mueve en ella no sabe en cul de ellos esta. Convertir el juego en forma extensiva a un juego en forma normal (estratgica). El diagrama sin la lnea punteada describe que la Empesa 1 elige entre N y S, luego la Empesa 2, conociendo la decisin de la Empesa 1, elige Emp2 entre N y S; los pagos que obtienen las empresas NN NS SN SS dependen de la combinacin de acciones de las Emp1 N 4, 3 4, 3 2, 2 2, 2 dos empresas. S 1, 1 3, 4 1, 1 3, 4 76
84 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Una vez en el juego normal buscamos los EN Asimismo, los (N,NN) y (N,NS) llevan a los y observamos que tiene 3: (4,3), (4,3), (3,4); (N, mismos pagos, son equivalentes y tambin NN), (N, NS) y (S, SS), respectivamente. carecen de credibilidad; en efecto, en este equilibrio la estrategia de la Empresa 2 indica elegir N aunque la Empresa 1 se ubique en S, Cul es la relacin que guardan estos accin que no le convendr llevar a cabo si la equilibrios con el procedimiento de induccin Empresa 1 se ubica en S. hacia atrs? Hemos visto que el Mtodo de induccin hacia El equilibrio (N, NS) corresponde al que habamos atrs no permite obtener todos los EN, pero obtenido con el procedimiento de induccin s el Equilibrio de Nash, que satisface una hacia atrs (la Empresa 2 elige N si la Empresa 1 condicin adicional: la credibilidad. se ubica en N, la Empresa 2 se ubica en el S si la Empresa 1 se ubica en S, as la Empresa 1 se ubica en el Norte). Definicin 12: Un juego en forma extensiva tiene informacin perfecta si todo conjunto de informacin de La respuesta(S,SS) da un resultado distinto cada jugador contiene un solo nodo. al obtenido por el mtodo de induccin hacia atrs y es til para explicar el concepto de En un juego con informacin perfecta cada credibilidad. Observar que dada la estrategia jugador distingue siempre en cual nodo de la Empresa 1 de ubicarse en S, la estrategia est jugando (Ejemplo: las empresas con sus de la Empresa 2 de ubicarse en S (pase lo que centros de investigacin). pase) es ptima, le proporciona el pago ms alto Los jugadores, al final, pueden elegir la posible, pero lo que planee hacer la Empresa 2 rama que les proporciona el pago ms alto. si la Empresa 1 se ubica en el Norte no influye Teorema de Zermelo: Todo juego finito en sobre sus pagos, porque esta parte del plan forma extensiva con informacin perfecta, nunca se tendr que llevar a cabo. Es creble tiene al menos un EN en EP. la parte del plan de la Empresa 2? Supongamos que la Empresa 1 se ubica en N, la Empresa 2 no 5.6 Equilibrio perfecto en subjuegos se adherir a la estrategia de la Empresa 1, pues obtendra 2 en lugar de 4. El plan de Empresa 2 Supongamos un juego donde: de ubicarse en S si la Empresa 1 se ubica en N es El J1 elige entre las acciones a y b. ptimo solo cuando no se tiene que realizar, no Despus de observar si J1 eligi a o b, el J2 le convendr llevarlo en la prctica si de verdad elige entre c y d. la Empresa 1 se ubica en el N; as el equilibrio Conociendo su propia eleccin anterior (S,SS) se elimina. entre a o b, pero sin conocer la decisin del J2 entre c y d, el J1 elige entre las acciones e y f. 77
85 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Ejemplo: 1. El J1 elige entre a y b. 2. Sin conocer la decisin del J1, el J2 elige entre c y d. Cmo usar el mtodo de Induccin hacia atrs? Cuando analizamos la decisin del J1 En este caso el nico subjuego es el juego entre las acciones e y f al final del juego, vemos completo. No podemos separar el nodo b que no podemos asegurar cul es la decisin porque J2 sabra que J1 jug a y no b, lo cual no ptima, porque depende del nodo concreto en se saba en el juego original; adems, el nodo b el cual el J1 est ubicado, y eso, el J1 no lo sabe. pertenece a un conjunto de informacin. Para generalizar el mtodo de induccin hacia atrs necesitamos definir el concepto de subjuego. Consideremos el siguiente ejemplo: 1. El J1 elige entre acciones a y b. Definicin 13: 2. Si el J1 elige a, el J2 elige entre acciones c y d. Un subjuego de un juego en forma extensiva es una 3. Si el J1 elige b o si el J2 elige d despus de parte del juego que comienza en un nodo t, incluye J1 eligi a. El J3 eligi entre e y f. Cuando los nodos que son sucesores y excluye los que no lo toma su decisin, el J3 no sabe si el J1 eligi son, y cumple las siguientes caractersticas: b o si eligi a y J2 eligi d. 1. El conjunto de informacin del nodo t contiene solo a t. 2. Si dos nodos pertenecen al mismo conjunto de informacin y uno de ellos est incluido en el subjuego, el otro tambin lo estar. Un subjuego es una parte del juego original que podemos analizar aisladamente, respetando la informacin contenida en el juego completo. 78
86 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Nuevamente, el nico subjuego es el juego Monopolio mismo. Si retomamos parte del rbol que R NR comienza en el nodo c , no se puede analizar Entrante e -1, -1 2, 2 aisladamente porque el J3 sabra que le toca f 0, 4 0, 4 jugar porque J1 jug a y despus el J2 jug d, S1 = {Entra, Fuera} ; S2 = {Regala, No Regala} informacin que no se tena en el juego original; adems los dos nodos en que juega el J3 Examinar primero los EN en el juego en forma pertenecen al mismo conjunto de informacin normal, hay 2: (E,NR), (F,R). Para encontrar los (no se puede tener solamente un nodo). equilibrios perfectos en subjuegos, observar que este juego tiene 2 subjuegos: El primero, el Definicin 14: que inicia cuando el entrante potencial decide entrar y el monopolista debe decidir si Regala Un equilibrio perfecto en subjuegos (EPS) de la mercadera venderla a mitad de precio o un juego en forma extensiva es un EN, que, no hacerlo. El segundo subjuego es el juego adems, proporciona un EN en cada subjuego entero mismo. del juego. El primer subjuego Ejemplo: La farmacia nica del pueblo. Monopolista La farmacia del pueblo ve amenazada su R NR situacin monopoltica por una empresa Entrante -1, -1 2, 2 entrante potencial. Para evitar la entrada de la competencia disemina el rumor de que s efectivamente se establece la nueva farmacia en El nico EN es que el monopolista no regalar represalia comenzar a vender la mercadera a la mercadera. Por tanto, de los dos EN que mitad del costo. Sera un error establecer la tiene el juego completo, solo el primero de ellos nueva farmacia en el pueblo? proporciona tambin un EN en el otro subjuego. -1, -1 En cambio, el EN, en el cual el Entrante decide No entrar, y el monopolista decide regalar, no proporciona un EN en el subjuego que 2, 2 comienza cuando el Entrante efectivamente entra. Es as como el concepto de Equilibrio Perfecto en subjuegos descarta este segundo 0, 4 EN por mantener una amenaza No Creble. 79
87 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Otro ejemplo: Retomar el juego siguiente y Consideremos el primer subjuego: encontrar el EPS. a) Cuando J1 elija a S2 = {c, d} ; S1 = {e, f} 4, 2 3, 1 2, 1 1, 2 J2 c d J1 e 4, 2 2, 1 f 3, 1 1, 2 Se tiene un nico NE, Sne = {(e,c)} J1 {a, b }; {e, f }; {e, f } {a, b } {ee, ef, fe, ff } b) Cuando J1 elija b J2 {c, d } {c, d } = {cc, cd, dc, dd } S2 = {c, d} ; S1 = {e, f} Este ejemplo refleja por qu el concepto de equilibrio perfecto en subjuegos (EPS) se puede ver como una generalizacin del proceso de induccin hacia atrs. Este juego tiene 3 subjuegos: el juego entero, el subjuego que inicia despus de que el J1 elige a y el subjuego que inicia despus de que J1 elige b. J2 Para encontrar el EPS podemos actuar de c d manera similar al procedimiento de induccin J1 e 5, 2 3, 4 hacia atrs, iniciando nuestro anlisis en el f 2, 1 2, 4 final del juego, pero buscando los subjuegos. Se tiene un nico NE, Sne = {(e,d)} 80
88 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Cules ramas sern elegidas en cada uno de los dos ltimos subjuegos? J2 CC CD DC DD Si J1 elige a, despus se elegirn c y e. Si J1 AEE 4, 2 4, 2 2, 1 2, 1 elige b, despus se elegirn d y e; esto se puede AEF 4, 2 4, 2 2, 1 2, 1 sealar en el rbol (ver una lnea adicional en AFE 3, 1 3, 1 1, 2 1, 2 algunas ramas del rbol). J1 AFF 3, 1 3, 1 1, 2 1, 2 BEE 5, 2 3, 4 5, 2 3, 4 BEF 2, 1 2, 4 2, 1 2, 4 As, el J1 concluye que si elige a le llevar a los BFE 5, 2 3, 4 5, 2 3, 4 BFF 2, 1 2, 4 2, 1 2, 4 pagos (4, 2) y, si elige b le llevar a los pagos (3, 4); de manera que, la decisin ptima del J1 ser El jugador 1 tiene 3 conjuntos de informacin. elegir a, con lo que obtendra 4 en lugar de 3. Entonces hay 2x2x2 = 8 diferentes combinaciones (estrategias) Cul es el resultado de juego?: El EPS consiste S1 = {AEE, AEF, AFE, AFF, BEE, BEF, BFE, BFF} en que el J1 siga la estrategia que indica elegir a al principio y e en sus otros dos conjuntos de Para el J2 se tienen 2 conjuntos de informacin. informacin, y el J2 siga la estrategia que indica elegir c si el J1 eligi a, y elegir d si el J1 eligi b. S2 = {CC, CD, DC, DD} El resultado del juego en la ruta ace, el cual tiene asociado un pago de 4 para el J1 y un pago de 2 De la matriz se puede observar que se tienen 4 para el J2. EN: (AEE, CD), (AEF, CD), (BEE, DD), (BFE, DD). De estos 4 equilibrios, solamente el primero Ejercicio. Convertir el siguiente rbol en la es, adems, un EPS. Significa que los otros 3 forma normal (estratgica) y verificar si existen carecen de credibilidad (son redundantes, nos otros EN. llevan por el mismo camino en el rbol del juego). Para el caso (2, 4) no es creble que J2 elija d si J1 elige a. El nico EN consiste en que J1 juegue e y J2 juegue c, y ser la nica que sobreviva la EIEED en este juego, pues a J1 le conviene ms la accin e que la accin f, no importando lo que haga el J2. El J2 se debe dar cuenta de que J1 elegir e y que, por tanto, no le conviene elegir d si el J1 elige a. No es creble que lo haga, por tanto, no son EPS. 81
89 Bibliografa Cerd, E., Prez, J., Jimeno, J., (2004). Teora de Grinblatt, T.(2002). Financial Markets and Corporate Juegos, Pearson Educacin, Prentice Hall, Strategy, 2a edicin, The McGraw-Hill Madrid, Espaa. Companies. Drew, F, Tirole, J (1991). Game Theory. The MIT Press, Hernndez, J., (2002), Teora de Juegos: su aplicacin Cambridge Massachusetts, London England. en economa, Mxico, El Colegio de Mxico, Centro de Estudios Econmicos. Gibbons, R.. (1992). A Primer in Game Theory. Prentice Hall-Financial Times. Straffin, P.(1993). Game Theory and Strategy. 1a edicin. EUA. The Mathematical Gibbons, R.. (1992). Game Theory for Applied Association of Amrica. Economists, Princeton University Press, New Jersey. Watson, J. (2007). An Introduction to Game Theory. 2a edicin. EUA. W. W. Norton.
90 Glosario A C Acciones de cada jugador: Son las decisiones Comportamiento estratgico: Es un que puede tomar cada jugador en el momento comportamiento que toma en cuenta las en que le toque jugar. El conjunto de acciones decisiones de los dems, atendiendo a sus de un jugador en cada momento del juego propios deseos; afectan el resultado de las puede ser finito o infinito. decisiones propias. Anlisis del comportamiento estratgico: Cooperacin: Obrar conjuntamente con otros El anlisis formal de una situacin de individuos para alcanzar un fin comn. comportamiento estratgico inicia con la formulacin de un juego. Conflicto: Asunto o problema de difcil solucin. Anlisis de decisiones: Consiste en un Competencia perfecta: Modelo de mercado conjunto de tcnicas y procedimientos caracterizado por gran cantidad de oferentes orientados a reducir el margen de error en y demandantes, de tal manera que ninguno las decisiones adoptadas en el marco de una de ellos puede incidir en las condiciones del situacin especfica. mercado; productos homogneos; perfecta Los elementos que lo conforman son: informacin; libre de intervencin estatal e inexistencia de barreras al ingreso o salida. El Objetivo o problema a solucionar Las alternativas de eleccin. D Los atributos o condiciones y su valoracin. Distribucin de probabilidad: Lista de todos los La probabilidad asociada a cada alternativa. resultados de un experimento y la probabilidad El decisor est interesado en tomar la mejor que se asocia con cada uno de ellos. alternativa posible que maximice sus beneficios. Dominancia iterativa: Es un procedimiento Aversin al riesgo: Implica la exigencia de un mediante el cual un jugador no considera mayor beneficio en la medida en que se deba aquellas estrategias de los otros jugadores que asumir mayor riesgo. estn dominados estrictamente.
91 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Existen dos premisas bsicas a considerar: Los jugadores racionales no utilizan estrategias estrictamente dominadas, pues no es ptimo Si una estrategia pura est estrictamente utilizarlas. dominada, ya sea por una estrategia pura o una mixta, no existen creencias para las cuales convenga usarla. Equilibrio de Nash: Es un perfil de estrategias Si una estrategia pura no est estrictamente en el que las estrategias de todos los jugadores dominada ni por una estrategia pura ni por son las mejores respuestas a las dems una mixta. Necesariamente existen algunas estrategias del perfil. creencias acerca de lo que har el otro En el juego en forma normal de n jugadores, jugador para las cuales le conviene usarla. G = {S1,..,Sn;u1,..,un}, las estrategias (s*1,,s*n) forman un equilibrio de Nash (EN) si, para cada jugador i, s*i es la mejor respuesta del jugador i E (o al menos una de ellas) a las estrategias de los Eliminacin iterativa de las estrategias otros n-1 jugadores, (s*1,,s*i-1,s*i+1,,s*n): estrictamente dominadas: Cuando un jugador tiene una estrategia con las caractersticas de ui(s*1,,s*i-1, s*i, s*i+1,,s*n) >= ui(s*1, que le proporciona mejores resultados que .,s*i-1, si ,s*i+1,,s*n). sus dems estrategias, no importando qu Para cada posible estrategia si en Si; esto es, s*i hagan los dems jugadores, dicha estrategia es es una solucin de identificada como una estrategia fuertemente max ui (s*1,,s*i-1,si,s*i+1,,s*n) si Si. dominante, y es esta estrategia la que le conviene utilizar. Esperanza matemtica E(X): Es la suma En el juego en forma normal G= {S1,.,Sn;u1, de la probabilidad de cada posible suceso ,un}, sean si y si posibles estrategias del multiplicado por la frecuencia de dicho proceso, jugador i (si y si son elementos de Si). La es decir si tenemos una variable cuantitativa estrategia si est estrictamente dominada por la discreta X con n posibles sucesos x1,x2,,xn estrategia si si para cada combinacin posible y probabilidades P(X=xi)=Pi la esperanza de las estrategias de los restantes jugadores, la matemtica es ganancia de i por utilizar si es estrictamente menor que la ganancia de i por utilizar si: ui(s1,,si-1,si,si+1,,sn)
92 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' Estrategias disponibles: Es el conjunto de cumple que: EUi(m1, mi-1,mi,mi+1
93 (8i(m1, estrategias con que cuenta cada jugador, se mi-1,m1,mi+1,,m n) para toda estrategia mixta denota: S= {S1,Sn}. mi en Mi. Estrategia mixta: Es una distribucin de Estrategias de seguridad: En los juegos de suma probabilidades sobre alguna o todas las cero, cuando un jugador intenta maximizar su estrategias puras del juego. Una estrategia pago, a la vez est intentando minimizar el mixta para el jugador i, mi, es una distribucin pago de su oponente. Cada jugador considera de probabilidades sobre su conjunto de el peor resultado que puede conseguir con estrategias puras Si. cada una de sus estrategias y despus escoge la estrategia que le proporciona el mejor de los Si el jugador i tiene ki estrategias puras, Si = (S1, peores resultados. S2, Sk), entonces una estrategia mixta para el jugador i ser una distribucin de probabilidad Para cada estrategia pura Ii E1, el nivel de mi = (mi(S1), mi(Ski)) con mi (Sj
94 SDUDM seguridad del jugador I, es el pago que puede ki y mi (S1) ++ mi (Ski) = 1, siendo mi (Sj) la asegurarse con esa estrategia, prescindiendo probabilidad con que el jugador i jugar su de las acciones del jugador II. estrategia pura Sj. Una estrategia mixta consiste en el uso de un mecanismo aleatorio para prescindir Para cada estrategia pura IIj E2, el nivel de del uso real de una mecanismo concreto o seguridad del jugador II, es el pago que puede determinstio. Lo importante de una estrategia asegurarse con esa estrategia, prescindiendo mixta es que hace impredecible saber qu har de las acciones del jugador I. el jugador que la usa. La estrategia mixta de un jugador se refiere simplemente a lo que ocurre en la mente del otro jugador. Equilibrio de Nash con estrategias mixtas: En I las estrategias mixtas el equilibrio de Nash es Interacciones estratgicas: Son situaciones aquel en el que cada agente elige la frecuencia en las que las consecuencias de las acciones ptima con la que seguir sus estrategias, dadas de los individuos dependen de las acciones la frecuencia que elija el otro (Varian, 1996). de otros; y esta interdependencia mutua es reconocida por los involucrados y afecta las Una combinacin de estrategias mixtas (m1, acciones que realizarn. m n) es un equilibrio de Nash del juego (S1, Sn; U1, Un) si para todo jugador i en N se 87
95 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA J Juegos de suma no cero: Juegos en los que Jugadores: Son los participantes en el juego que cada participante puede obtener un premio de toman decisiones con el fin de maximizar su forma simultnea. utilidad. Puede tratarse de dos o ms (n jugadores). Juegos de suma constante: La suma de los Juegos: Consisten en una identificacin completa beneficios de los dos jugadores es constante de los jugadores, una lista para cada jugador y corresponde a la idea de una cantidad fija con cada curso de accin disponible para ellos que se ha de repartir entre los jugadores (incluyendo acciones que dependen de medidas en cuestin. Este tipo de juegos se puede tomadas por otros, o de eventos al azar). convertir en juegos de suma cero. Un juego de dos jugadores es de suma constante si u1(s1,s2) + u2(s1,s2) = c, c R, s1 S1 , s2 S2 Juego en forma normal o estratgica: Se denota por G = {S1,.....,Sn; u1,.....,un}, y se compone de tres elementos esenciales: M Maximin: El valor Maximin (o valor inferior Los n jugadores que participan en el juego. del juego) del jugador I es. Las estrategias disponibles para cada jugador. El conjunto de funciones de pago (utilidad o bienestar) de cada jugador en cada combinacin posible de estrategias. Una estrategia de seguridad o estrategia Maximin es la que proporciona al jugador su Bajo esta forma los jugadores eligen sus valor Maximin. estrategias de forma simultnea (sin conocer las decisiones del resto de los jugadores). Minimax: El valor minimax (o valor superior del juego) del jugador II es. Juegos de suma cero: Son juegos en los que dos individuos compiten por un nico premio. Son aquellos en los que no hay ninguna posibilidad de cooperacin; la nica forma en la cual un jugador Una estrategia de seguridad o estrategia puede aumentar su bienestar es reduciendo el de minimax es la que proporciona al jugador su su oponente. valor minimax. u1 (s1 , s2) + u2 (s1 , s2) = 0, s1 en S1 , s2 en S2 Monopolio natural: Es aquel en que el tamao mnimo eficiente al que puede operar una 88
96 /E^d/dhdK/E/dEK>K'1/EEKs/ME/d/ hE/sZ^/&ZE/^K's//h&' empresa es tan grande en relacin con el Un resultado de un juego es llamado punto de tamao del mercado, que slo hay lugar para silla de montar si el ingreso de un resultado que opere de manera rentable una empresa. es menor que o igual a cualquier ingreso en su fila, y ms grande qu o igual que cualquier entrada/ingreso en su columna. P Un juego matricial de matriz A= (aij) tiene un Pagos: Cada jugador recibe un pago al terminar punto de silla en estrategias puras cuando se el juego, que depende de cul haya sido el verifica que: vI=vII Este valor comn se llama resultado del juego. El significado de dicho valor del juego y es el menor elemento de su fila pago es la utilidad que cada jugador atribuye a y el mximo de su columna. Se denota por v. dicho resultado, es decir la valoracin que para Si una matriz de un juego tiene un punto de silla el jugador tienen las consecuencias de alcanzar de montar (PSM), ambos jugadores jugaran un determinado resultado en el juego. una estrategia en la cual est contenida. Para cualquier matriz de un juego, si hay un Pensamiento estratgico: Supone la posibilidad nmero i tal que el jugador 1 tiene una estrategia, de plantear de manera anticipada situaciones la cual garantiza que ganar al menos i, y el para establecer criterios de valor sobre las jugador 2 tiene una estrategia la cual le garantiza diferentes alternativas de accin y ponerlos en que el jugador 1 ganar no ms que i, entonces i relacin con los resultados posibles. es llamado el valor del juego. Si un jugador tiene un PSM, el ingreso del PSM Perfil estratgico: Representa una combinacin es el valor del juego. de estrategias posibles para cada jugador. R Prima de riesgo: Es la cantidad que un agente Racionalidad: Capacidad humana que permite averso al riesgo, est dispuesto a pagar para pensar, evaluar y actuar de acuerdo a ciertos librarse del riesgo. principios de optimidad y consistencia, para satisfacer algn objetivo o finalidad. Usando la razn, el ser humano intenta elegir para Probabilidad: Un valor entre cero y uno, conseguir los mayores beneficios. El ejercicio inclusive, que describe la posibilidad relativa de de la racionalidad est sujeto a principios que algo ocurra. La probabilidad es un nmero de optimidad y consistencia. Cualquier UHDOTXHWRPDYDORUHVHQWUH\3i construccin mental llevada a cabo mediante procedimientos racionales tiene por tanto una Punto de silla de montar: Los valores Maximin estructura lgico-mecnica distinguible. y Minimax son equivalentes al concepto de punto de silla de montar. 89
97 ELNER CRESPN ELAS TEORA DE JUEGOS Y ESTRATEGIA Resultado de un juego: Es un conjunto de acciones llevadas a cabo por los jugadores (y las ganancias asociadas a las mismas). Los La utilidad esperada que obtiene el jugador i resultados de juego no se pueden deducir slo con una combinacin de estrategias mixtas de las estructuras del juego, sino que requieren es igual al valor esperado de las utilidades adems de un concepto de solucin plausible, o que obtiene con las distintas combinaciones sea, una especificacin de cmo podran jugar de estrategias puras. Para calcular este valor los implicados. esperado se utilizan las probabilidades que especifican las estrategias mixtas. T Teora de juegos: Es el estudio de problemas de decisin multipersonales. Es el estudio de Lista de smbolos modelos matemticos que describen el conflicto La siguiente lista est compuesta por los y la cooperacin entre entes inteligentes que smbolos que se utilizan frecuentemente en la toman decisiones. Tales decisiones se consideran temtica de Teora de Juegos: estratgicas, es decir que los entes que participan en el juego actan teniendo en cuenta las acciones que puede tomar el resto de jugadores. = Igual a > Mayor a < Menor a Teorema de Nash: Todo juego con un nmero Mayor o igual a finito de jugadores y un nmero finito de Menor o igual a estrategias para cada jugador tiene al menos Por lo tanto un equilibrio de Nash si se permite el uso de Para todo elemento estrategias mixtas. Existe al menos un elemento No existe Sumatoria U Pertenece a Utilidad: Son las ganancias de cada jugador No pertenece a en cada combinacin posible de estrategias. Se Entonces denota U= {u1,..un} o y Incremento Utilidad esperada: Para el jugador i deriva de || Valor absoluto la combinacin de estrategias mixtas (m1, m2, Infinito m n) es S y solo si 90
98 M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C M Y B C COLECCIN CUADERNO DE CTEDRA N 2 ELNER CRESPIN ELAS La Teora de Juegos es una rama de la Economa, sustentada en las matemticas, que estudia las decisiones de un individuo o de una empresa, quienes para tener el xito buscado deben tener en cuenta las decisiones tomadas por el resto de los agentes que intervienen en una situacin determinada o en un juego estratgico; de la misma manera, los dems agentes actuarn pensando segn crean que van a ser nuestras actuaciones. Se analizan los mtodos de actuacin y comportamiento de las personas con base en predicciones que las personas hacen de las decisiones de los otros participantes en el juego estratgico. COLECCIN CUADERNOS DE CTEDRA N 2 - TEORA DE JUEGOS Y ESTRATEGIA UFG-Editores ELNER CRESPIN ELAS
Load More