Primeiro Seminário de Teoria dos Jogos Maio de 2007...
Transcript of Primeiro Seminário de Teoria dos Jogos Maio de 2007...
Teorema de Nash
Primeiro Seminário de Teoria dos Jogos
Maio de 2007
Fabrício Murai
2
Sumár io
● Objetivos● Notação e definições● Enunciado do Teorema● Teoremas do Ponto Fixo● Demostração do Teorema● Referências
3
Obje t i vos
● Apresentar a demonstração do Teorema de Nash
4
Notação e de f in i ções
● Jogo estático finito na forma normal:– Existem N jogadores, denotados por
. Vamos denotar o conjunto de índices por .
– Seja o número de estratégias de um jogador e o conjunto de índices por , sendo um elemento típico de representado por .
– Se é o resultado do jogo, a perda de é dada por .
f1; 2; :::;Ngmi
Pi f1; 2; :::;migMi
ni
fn1; n2; :::; nNgain1;n2;:::;nNPi
Mi
N
P1; P2; :::; PN
5
Notação e de f in i ções
● Um equilíbrio de Nash usando estratégias puras é uma N-upla , com , onde N inequações seguintes são satisfeitas para todo :
fn¤1; n¤2; :::; n¤Ng
ni 2Mi; i 2 N
a1¤ , a1n¤1 ;n
¤2;:::;n
¤N· a1n1;n¤
2 ;:::;n¤N
an¤ , ann¤1 ;n
¤2;:::;n
¤N· ann¤
1 ;n¤2;:::;nN
a2¤ , a2n¤1 ;n
¤2;:::;n
¤N· a2n¤
1 ;n2;:::;n¤N
... gn¤i 2Mi; i 2 N
6
Notação e de f in i ções
● Uma estratégia mista adotada por um jogador i é uma distribuição de probabilidade sobre , onde é a probabilidade de escolher a estratégia .– Exemplo:
yi
Mi yinjnj
Espaço de estratégias do jogador 1:
1-simplex 2-simplex
N = 2
mi = 2 mi = 3
7
Notação e de f in i ções
0 1
Outra representação:
1
1 Espaço de estratégiasdo jogador 1 e 2
1
1
1
y11
N = 3;mi = 2; 8i 2 N
N = 2;mi = 2; 8i 2 N
Espaço de estratégiasdo jogador 1
yi2 = 1¡ yi1
Todos esses são subespaçosdo fechados, limitados econvexos.
<n
8
Notação e de f in i ções
● Um equilíbrio de Nash formado por estratégias mistas é uma N-upla , onde as seguintes inequações são satisfeitas para todo
:yj 2 Y j ; j 2 N
fyi¤ 2 Y i; i 2 Ng
9
Notação e de f in i ções
X
M1
:::X
MN
y1n1y2¤n2 :::y
N¤nN a
1n1;:::;nN
X
M1
:::X
MN
y1n1y2¤n2 :::y
N¤nN a
1n1;:::;nN
X
M1
:::X
MN
y1¤n1y2n2 :::y
N¤nN a
2n1;:::;nN
...
)¹J1¤ ,X
M1
:::X
MN
y1¤n1y2¤n2:::yN¤nN a
1n1;:::;nN
·
¹J2¤ ,X
M1
:::X
MN
y1¤n1y2¤n2 :::y
N¤nN a
2n1;:::;nN ·
¹J1¤ ,X
M1
:::X
MN
y1¤n1y2¤n2 :::y
N¤nN a
1n1;:::;nN ·
Volta ao slide 16
10
Enunc iado do Teorema
● Todo jogo estático finito com N jogadores em forma normal possui pelo menos um equilíbrio não-cooperativo (equilíbrio de Nash) usando estratégias mistas.
Observação: Toda estratégia pura é uma estratégia mista.
11
Teoremas do Ponto F ixo
● Teorema do Ponto Fixo de Brouwer– Se é um subconjunto convexo e compacto
do e é uma função contínua mapeando em si mesmo, então existe pelo menos um tal que .
SS<n f
x 2 S f(x) = x
12
Demonst ração do Teorema
● Seja uma N-upla de estratégias mistas para o jogo de N jogadores. Vamos definir:
para cada e . Note que esta função é contínua.
fyi 2 Y i; i 2 Ng
Ãini(y1; :::yN) ,
X
M1
:::X
MN
y1n1y2n2 :::y
NnNa
in1;:::;nN
¡X
M1
:::X
Mi¡1
X
Mi+1
:::X
MN
y1n1 :::yi¡1ni¡1
yi+1ni+1 :::yNnNa
in1;:::;nN
ni 2Mi i 2 N
perda esperada
perda esperada usandoa estrat. pura
Voltar ao Slide 20
ni
13
Demonst ração do Teorema
● Agora, seja relacionado a por:
para cada e . Logo, é também uma função contínua. Então, introduzindo a transformação:
cini , maxfÃini ; 0g
ciniÃini
ni 2Mi i 2 N cini(y1; :::; yN )
Voltar ao Slide 20
¹yini =yini + c
ini
1 +P
j2Micij; ni 2Mi; i 2 N
observe que não estamosusando para não confundircom o índice de
cinini ¹yini
14
Demonst ração do Teorema
● Note que:
X
Mi
¹yini = 1
g¹yini ¸ 0 0 · ¹yini · 1yini · 1; cini ·
PMicinj ) ¹yinI · 1
X
Mi
¹yini =yin1 + y
in2 + ::: + y
inN + c
in1 + c
in2 + :::+ c
inN
1 +Pj2Mi
cijX
Mi
¹yini =
PMiyini +
Pni2Mi
cini1 +
Pj2Mi
cij
15
Demonst ração do Teorema
T
(¹y1; :::; ¹yN) = T (y1; :::; yN )
T
T
● E chamando-a de :
podemos observar que é um mapeamento contínuo de em si mesmo. Como é fechado, limitado e convexo, pelo Teorema do Ponto Fixo de Brouwer, o mapeamento tem pelo menos um ponto fixo.
QN YiQ
N Yi
16
Demonst ração do Teorema
● Agora iremos provar que é um equilíbrio de Nash usando estratégias mistas se e somente se for um ponto fixo desse mapeamento.
● Sentido direto:
Se é um equilíbrio de Nash usando estratégias mistas, então por definição, a função é não-positiva para todo , e , e por fim para todo , .
fyi¤ 2 Y i; i 2 Ng
fyi¤ 2 Y i; i 2 Ng
ni 2Mi i 2 Nni 2Mi i 2 Ncini = 0
Ãini(y1¤; :::; yN¤)
17
Demonst ração do Teorema
● Como
então:
provando que é um ponto fixo de .
¹yini =yini + c
ini
1 +P
j2Micij; cini = 0; ni 2Mi; i 2 N
T (y1¤; :::; yN¤) = (y1¤; :::; yN¤)
T
fyi¤ 2 Y i; i 2 Ng
18
Demonst ração do Teorema
● Sentido inverso:
Suponha que é um ponto fixo de , mas não é um equilíbrio de Nash. Então, para algum (por exemplo, ), existe um tal que:
Agora seja o índice onde a quantidade
fyi¤ 2 Y i; i 2 NgT
i 2 N i = 1
~y1 2 Y 1
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
(1)
~n1
19
Demonst ração do Teorema
alcança seu menor valor sobre .● Como é uma estratégia mista, o lado
direito da equação (1) pode ser limitado por baixo por (2) com :
~y1
(2)X
M2
:::X
MN
y2n2 :::yNnNa
1n1;:::;nN
ni 2Mi
n1 = ~n1X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
>X
M2
:::X
MN
y2n2 :::yNnNa
1~n1;:::;nN
X
M1
:::X
MN
y1n1y2n2:::yNnN a
1n1;:::;nN
>X
M2
:::X
MN
y2n2 :::yNnNa1~n1;:::;nN
Voltar ao Slide 21
20
Demonst ração do Teorema
é equivalente a:
E mais:
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M2
:::X
MN
y2n2 :::yNnNa
1~n1;:::;nN
definição de Psi
c1~n1 > 0
cini ¸ 0) c1n1 ¸ 0definição de c
)PM1c1n1 > 0
Voltar ao Slide 22
Ã1~ni(y1; y2; :::; yN) > 0
21
Demonst ração do Teorema
● Agora seja o índice onde a quantidade (2) alcança o seu valor máximo.
● Então, podemos limitar superiormente o lado esquerdo de (1) pelo valor (2) quando :
n̂1
n1 = n̂1
X
M1
:::X
MN
y1n1y2n2 :::y
NnN a
1n1;:::;nN >
X
M1
:::X
MN
~y1n1y2n2 :::y
NnNa
1n1;:::;nN
X
M2
:::X
MN
y2n2 :::yNnNa
1n̂1;:::;nN >
X
M2
:::X
MN
y2n2 :::yNnNa
1n̂1;:::;nN >
X
M1
:::X
MN
y1n1y2n2 :::y
NnNa
1n1;:::;nN
22
Demonst ração do Teorema
é equivalente a:
E mais: )PM1c1n1 > 0
X
M2
:::X
MN
y2n2 :::yNnNa1n̂1;:::;nN >
X
M1
:::X
MN
y1n1y2n2:::yNnNa
1n1;:::;nN
c1n̂1 = 0
Resultado obtido em 20 CONTRADIÇÃO!
Ã1n̂i(y1; y2; :::; yN) < 0
¹y1n̂1 =y1n̂1 + c
1n̂1
1 +P
j2M1c1j
¹y1n̂1 < y1n̂1
23
Refe rênc ias
● T. Basar and G. J. Olsder● Fixed-Point Theorems
http://cepa.newschool.edu/het/essays/math/fixedpoint.htm
● Nash Equilibrium http://www.scs.carleton.ca/~maheshwa/MAW/MAW/node7.html
● Brouwer fixed point theorem http://en.wikipedia.org/wiki/Brouwer_fixed_point_theorem
● Mahalanobis http://mahalanobis.twoday.net/stories/308405/