Autor Tema: Equilibrio bayesiano de Nash

0 Usuarios y 1 Visitante están viendo este tema.

19 Julio, 2020, 12:17 pm
Leído 146 veces

martiniano

  • Moderador Global
  • Mensajes: 1,278
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
Hola.

Ha llegado a mí un curso de teoría de juegos que me gustaría completar. La verdad es que el material es fácil de seguir y parece estar, en general, bien concebido. El último tema se llama Juegos estáticos con información incompleta y en el desarrollo del tema va poniendo ejemplos de juegos para dos jugadores en los que al menos uno ellos desconoce cuál es el estado de la naturaleza. Uno de ellos ilustra el apartado Juegos bayesianos con muchas estrategias, cuyo enunciado es el siguiente:

Consideremos un juego en el que dos empresas deciden simultáneamente qué cantidad de dinero invierten en publicidad. Llamemos \( s_1 \) y \( s_2 \) a las respectivas cantidades de dinero invertidas. La función de beneficios de la que llamaremos empresa 1 es conocida por ambas empresas y es:

\( \pi_1(s_1,s_2)=1000s_1-s_1s_2-s_1^2 \)

Sin embargo, la función de beneficios de la empresa 2 sólo es conocida por esta empresa. La empresa 1 sabe que la función de beneficios de la empresa 2 será:

\( \pi_2(s_1,s_2)=1000s_2-s_1s_2-\alpha s_2^2 \)

con probabilidad \( \theta \) o:

\( \pi_2(s_1,s_2)=1000s_2-s_1s_2-\beta s_2^2 \)

con probabilidad \( 1-\theta \). En el primer caso diremos que la empresa 2 es de tipo I mientras que en el otro diremos que es de tipo II.

Hallar los equilibrios bayesianos de Nash en estrategias puras del juego.

Tener en cuenta que la empresa 2 debe especificar qué hará en caso de tener la primera función y qué hará en caso de tener la segunda. En cambio la empresa 1 deberá elegir una sola inversión, que deberá ser la mejor respuesta al valor esperado de la estrategia seguida por la empresa 2


El último párrafo está prácticamente tal cual en el texto y a mí me parece muy lógico. Resulta que la solución que el mismo texto ofrece no parece, si no se me está escapando nada, ser demasiado coherente con este último párrafo. Dicha solución comienza así, y con este comienzo estoy de acuerdo:

Dada una cantidad \( s_1 \), la empresa 2 jugará a maximizar su función de beneficios, es decir invertirá:

\( s_{2a}=\frac{1000-s_1}{2\alpha} \) si es de tipo I y:

\( s_{2b}=\frac{1000-s_1}{2\alpha} \) si es de tipo II.

Y ahora viene la parte en la que no estoy tan de acuerdo. Dice que para maximizar su función beneficio la empresa 1 debe jugar \( s_1=\frac{1000-s_2}{2} \) y substituye aquí \( s_2=\theta s_{2a}+(1-\theta)s_{2b} \), es decir, \( s_2 \) por su valor esperado, y resuelve el sistema de tres ecuaciones con tres incógintas: \( s_{2a} \), \( s_{2b} \) y \( s_{1} \). El texto aporta la solución para el caso concreto \( \alpha=2 \), \( \beta=1 \) y \( \theta=0.5 \), que es \( s_1=384.6 \), \( s_{2a}=153.8 \) y \( s_{2b}=307.6 \)

No estoy de acuerdo en que la decisión de la empresa 1 así tomada maximice su beneficio esperado. A mí me parece más lógico calcular el beneficio esperado para la empresa 1 teniendo en cuenta las respuestas óptimas de la empresa 2 a cada estado de la naturaleza para obtener una función que sólo dependa de \( s_1 \)

\( E(s_1)=\theta\pi_1\left(s_1,\frac{1000-s_1}{2\alpha}\right)+(1-\theta)\pi_1\left(s_1,\frac{1000-s_1}{2\beta}\right)=s_1^2\cdot{}\frac{\beta\theta -\alpha\theta+\alpha-2\alpha\beta}{2\alpha\beta}+s_1\cdot{}\frac{-1000\theta\beta+2000\alpha\beta-1000\alpha+1000\alpha\beta}{2\alpha\beta} \)

El máximo de esta función se obtiene para \( s_1=500 \) y substituyendo en las primeras ecuaciones se tiene \( s_{2a}=\displaystyle\frac{250}{\alpha} \) y \( s_{2b}=\displaystyle\frac{250}{\beta} \).

Aquí pasa algo raro...

¿Alguien tiene algún comentario iluminador? Agradezco de antemano cualquier aporte.

Saludos.

19 Julio, 2020, 01:45 pm
Respuesta #1

geómetracat

  • Moderador Global
  • Mensajes: 1,889
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
¿No debería ser lo mismo?
Quiero decir, el beneficio esperado que calculas es:
\( E(s_1)=\theta\pi_1(s_1,s_{2\alpha}) + (1-\theta)\pi_1(s_1,s_{2\beta}) = 1000s_1 - s_1(\theta s_{2\alpha} + (1-\theta)s_{2\beta}) -s_1^2 \).
A mí esto me parece equivalente a lo que hace el texto.
De todas formas, hay algo muy extraño en la solución que propones, que me hace pensar que no puede estar bien. Las soluciones que das no dependen de \( \theta \), lo que implicaría que la elección de \( s_1 \) óptima es la misma tanto si \( \theta=1 \) como si \( \theta=0 \) o cualquier valor intermedio, es decir que la empresa 1 debería invertir lo mismo tanto si sabe con seguridad que la empresa 2 es de tipo I como si sabe con seguridad que la empresa 2 es de tipo II. Pero esto parece falso, la solución general para \( s_1 \) debería depender de \( \theta \).

Por otra parte, ¿podrías compartir el curso que dices de teoría de juegos?

Añadido: Espera, creo que ya entiendo lo que pasa. Lo que pasa es que no puedes sustituir \( s_{2\alpha} = \frac{1000-s_1}{2\alpha}, s_{2\beta} = \frac{1000-s_1}{2\beta} \) en la ecuación del beneficio esperado y luego maximizar.
De hecho este es un problema que no tiene nada que ver con los valores esperados.

Supongamos que sabemos con seguridad que la empresa 2 es de tipo I, y resolvamos el problema de maximizar. Si resuelves el sistema:
\( s_1=\frac{1000-s_2}{2} \)
\( s_2=\frac{1000-s_1}{2\alpha} \)
obtendrás una solución con \( s_1=\frac{2\alpha-1}{4\alpha-1}1000 \).
En cambio, si sustituyes \( s_2=\frac{1000-s_1}{2\alpha} \) en la ecuación del beneficio de la empresa 1 y maximizas \( s_1 \) obtendrás una solución con \( s_1=500 \).
Este es exactamente el problema que estás teniendo.

En realidad la manera buena de hacerlo es la primera. Esto es porque para la empresa 1 la cantidad \( s_2 \) es un parámetro, es algo que la empresa no controla. Así que, sea cual sea el valor de \( s_2 \) la empresa 1 debe maximizar su ecuación de beneficios respecto a \( s_1 \), que conduce a la ecuación
\( s_1 = \frac{1000-s_2}{2} \).
El mismo razonamiento hace la empresa 2, que no controla \( s_1 \). El deseo de maximizar sus beneficios independientemente del valor de \[ s_1 \] lleva a la ecuación:
\( s_2=\frac{1000-s_1}{2\alpha} \).
Y por tanto los valores que se obtendrán serán los de resolver este sistema de dos ecuaciones, que provienen del deseo de cada empresa de maximizar sus beneficios independientemente de lo que haga la otra empresa.
La ecuación más bonita de las matemáticas: \( d^2=0 \)

19 Julio, 2020, 04:44 pm
Respuesta #2

martiniano

  • Moderador Global
  • Mensajes: 1,278
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
Hola.

Gracias por responder, geómetracat.

Estoy de acuerdo contigo en lo que dices. Cuando en tu mensaje sin editar has indicado que en mi solución \( s_1 \) no dependía de \( \theta \) has hecho que mis alarmas se disparasen y creo que he llegado a la misma conclusión que tú. El problema que yo resolvía era otro. Estaba asumiendo que la empresa 2 decidía conociendo la decisión de la empresa 1. Sin embargo, el enunciado dice claramente que ambas empresas toman la decisión simultáneamente.

Vale. Creo que esto está solucionado.

Por otra parte, ¿podrías compartir el curso que dices de teoría de juegos?

El curso lo adjunto aquí abajo. Está en catalán porque es el idioma en el que se imparte la asignatura aquí en la UIB. Yo creo que se entiende bastante bien para alguien que hable castellano, pero si en algún punto concreto alguien no entiende algo por culpa del idioma le puedo echar yo una mano.

Por otro lado, no tengo ni la más mínima idea sobre la legalidad de subir este material aquí, por lo del tema de derechos de autor y esas cosas... La verdad es que no tengo ni idea de cómo va todo eso ni de cómo tratáis el asunto aquí en el foro. Pero bueno... Yo lo subo, y si los moderadores tenéis que modificar algo pues lo modificáis...

Un saludo. Y gracias.

19 Julio, 2020, 06:01 pm
Respuesta #3

geómetracat

  • Moderador Global
  • Mensajes: 1,889
  • País: es
  • Karma: +0/-0
  • Sexo: Masculino
Perfecto, todo solucionado pues.

Muchas gracias por el curso, se ve bastante bien. El idioma para mí no es problema, soy catalán. En cualquier caso me sumo a tu oferta de aclarar dudas de traducción si alguien más se lo quiere mirar.

Sobre la legalidad no lo tengo demasiado claro, la verdad. Pero imagino que al no haber ánimo de lucro no debería haber problema, siempre que el autor no diga que no quiere que su material esté disponible en internet.
La ecuación más bonita de las matemáticas: \( d^2=0 \)