Dinámica para encontrar el valor del juego cuando no está estrictamente determinado

Cuando un juego no tiene punto de silla, la teoría de juegos aconseja a cada jugador asignar una distribución de probabilidad sobre su conjunto de estrategias. Vamos a expresar esto de la siguiente forma:

Xi = probabilidad de que el jugador A use la estrategia i ( i = 1,2,…,m)
yi = probabilidad de que el jugador B use la estrategia j ( j = 1,2,…,n) donde  n y m son los números de estrategias disponibles.
Vamos a empezar con el juego (2 x n) en el que el jugador A tiene dos estrategias, siendo la recompensa para este mismo jugador.


Suponemos que el jugador A mezcla las estrategias A1 y A2 con sus probabilidades respectivas x1 y 1 – x1, siendo 0 ≤ x1 ≤ 1. A su vez el jugador B mezcla sus estrategias con sus respectivas probabilidades.
En este caso, la recompensa esperada por A correspondiente a la j-ésima estrategia pura de B se calcula de la siguiente manera:

(a1j – a2j) x1 – a2j, j = 1,2,…,n

El jugador A trata así de determinar el valor de x1 que maximice las recompensas mínimas esperadas:
Max min {(a1j – a2j)x1 – a2j}

Tenemos un juego de 2 x 4 en el que la recompensa es para el jugador A.


B1
B2
B3
B4
Mínimo
A1
-1
2
2
3
-1
A2
6
4
3
2
2
Máximo
6
4
3
3

No hay punto de silla es decir el juego no está estrictamente determinado, no hay solución de estrategia pura, por lo que debemos mezclar estrategias. Las recompensas esperadas por A correspondientes a las estrategias puras de B, son:
RELACION DE ECUACIONES
|Estrategia pura de B           |Recompensa esperada por A                                      |
|1                                                              |-2x1 + 4                                                       |
|2                                                              |-x1 + 3                                                        |
|3                                                              |-x1 + 2                                                        |
|4                                                              |-7x1 + 6                                                       |
Se iguala las ecuaciones número 2 y 4 y nos resulta lo siguiente

-x1+3=-7x1+6
-x1+7x1=6-3
6x1=3
X1=3/6
X1=0.5
La solución óptima del jugador A mezcla A1 y A2 con las probabilidades 0.5 y 0.5, respectivamente. El valor V correspondiente del juego se determina sustituyendo x1 = 0.5 en cualquiera de las funciones de las líneas B3 y B4, con lo que se obtiene:
V = 0.5 + 2 = 2.5
V = -7(0.5) + 6= 2.5





Fuente: Tomado Última actualización: septiembre 2007  
Derechos de autor © Stefan Waner

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best CD Rates