Primeiro Seminário de Teoria dos Jogos Maio de 2007...

Teorema de Nash

Primeiro Seminário de Teoria dos Jogos

Maio de 2007

Fabrício Murai

2

Sumár io

● Objetivos● Notação e definições● Enunciado do Teorema● Teoremas do Ponto Fixo● Demostração do Teorema● Referências

3

Obje t i vos

● Apresentar a demonstração do Teorema de Nash

4

Notação e de f in i ções

● Jogo estático finito na forma normal:– Existem N jogadores, denotados por

. Vamos denotar o conjunto de índices por .

– Seja o número de estratégias de um jogador e o conjunto de índices por , sendo um elemento típico de representado por .

– Se é o resultado do jogo, a perda de é dada por .

f1; 2; :::;Ngmi

Pi f1; 2; :::;migMi

ni

fn1; n2; :::; nNgain1;n2;:::;nNPi

Mi

N

P1; P2; :::; PN

5


● Um equilíbrio de Nash usando estratégias puras é uma N-upla , com , onde N inequações seguintes são satisfeitas para todo :

fn¤1; n¤2; :::; n¤Ng

ni 2Mi; i 2 N

a1¤ , a1n¤1 ;n

¤2;:::;n

¤N· a1n1;n¤

2 ;:::;n¤N

an¤ , ann¤1 ;n

¤2;:::;n

¤N· ann¤

1 ;n¤2;:::;nN

a2¤ , a2n¤1 ;n

¤2;:::;n

¤N· a2n¤

1 ;n2;:::;n¤N

... gn¤i 2Mi; i 2 N

6


● Uma estratégia mista adotada por um jogador i é uma distribuição de probabilidade sobre , onde é a probabilidade de escolher a estratégia .– Exemplo:

yi

Mi yinjnj

Espaço de estratégias do jogador 1:

1-simplex 2-simplex

N = 2

mi = 2 mi = 3

7


0 1

Outra representação:

1

1 Espaço de estratégiasdo jogador 1 e 2

1

1

1

y11

N = 3;mi = 2; 8i 2 N

N = 2;mi = 2; 8i 2 N

Espaço de estratégiasdo jogador 1

yi2 = 1¡ yi1

Todos esses são subespaçosdo fechados, limitados econvexos.

<n

8


● Um equilíbrio de Nash formado por estratégias mistas é uma N-upla , onde as seguintes inequações são satisfeitas para todo

:yj 2 Y j ; j 2 N

fyi¤ 2 Y i; i 2 Ng

9


X

M1

:::X

MN

y1n1y2¤n2 :::y

N¤nN a

1n1;:::;nN

X

M1

:::X

MN

y1n1y2¤n2 :::y

N¤nN a

1n1;:::;nN

X

M1

:::X

MN

y1¤n1y2n2 :::y

N¤nN a

2n1;:::;nN

...

)¹J1¤ ,X

M1

:::X

MN

y1¤n1y2¤n2:::yN¤nN a

1n1;:::;nN

·

¹J2¤ ,X

M1

:::X

MN

y1¤n1y2¤n2 :::y

N¤nN a

2n1;:::;nN ·

¹J1¤ ,X

M1

:::X

MN

y1¤n1y2¤n2 :::y

N¤nN a

1n1;:::;nN ·

Volta ao slide 16

10

Enunc iado do Teorema

● Todo jogo estático finito com N jogadores em forma normal possui pelo menos um equilíbrio não-cooperativo (equilíbrio de Nash) usando estratégias mistas.

Observação: Toda estratégia pura é uma estratégia mista.

11

Teoremas do Ponto F ixo

● Teorema do Ponto Fixo de Brouwer– Se é um subconjunto convexo e compacto

do e é uma função contínua mapeando em si mesmo, então existe pelo menos um tal que .

SS<n f

x 2 S f(x) = x

12

Demonst ração do Teorema

● Seja uma N-upla de estratégias mistas para o jogo de N jogadores. Vamos definir:

para cada e . Note que esta função é contínua.

fyi 2 Y i; i 2 Ng

Ãini(y1; :::yN) ,

X

M1

:::X

MN

y1n1y2n2 :::y

NnNa

in1;:::;nN

¡X

M1

:::X

Mi¡1

X

Mi+1

:::X

MN

y1n1 :::yi¡1ni¡1

yi+1ni+1 :::yNnNa

in1;:::;nN

ni 2Mi i 2 N

perda esperada

perda esperada usandoa estrat. pura

Voltar ao Slide 20

ni

13


● Agora, seja relacionado a por:

para cada e . Logo, é também uma função contínua. Então, introduzindo a transformação:

cini , maxfÃini ; 0g

ciniÃini

ni 2Mi i 2 N cini(y1; :::; yN )

Voltar ao Slide 20

¹yini =yini + c

ini

1 +P

j2Micij; ni 2Mi; i 2 N

observe que não estamosusando para não confundircom o índice de

cinini ¹yini

14


● Note que:

X

Mi

¹yini = 1

g¹yini ¸ 0 0 · ¹yini · 1yini · 1; cini ·

PMicinj ) ¹yinI · 1

X

Mi

¹yini =yin1 + y

in2 + ::: + y

inN + c

in1 + c

in2 + :::+ c

inN

1 +Pj2Mi

cijX

Mi

¹yini =

PMiyini +

Pni2Mi

cini1 +

Pj2Mi

cij

15


T

(¹y1; :::; ¹yN) = T (y1; :::; yN )

T

T

● E chamando-a de :

podemos observar que é um mapeamento contínuo de em si mesmo. Como é fechado, limitado e convexo, pelo Teorema do Ponto Fixo de Brouwer, o mapeamento tem pelo menos um ponto fixo.

QN YiQ

N Yi

16


● Agora iremos provar que é um equilíbrio de Nash usando estratégias mistas se e somente se for um ponto fixo desse mapeamento.

● Sentido direto:

Se é um equilíbrio de Nash usando estratégias mistas, então por definição, a função é não-positiva para todo , e , e por fim para todo , .

fyi¤ 2 Y i; i 2 Ng

fyi¤ 2 Y i; i 2 Ng

ni 2Mi i 2 Nni 2Mi i 2 Ncini = 0

Ãini(y1¤; :::; yN¤)

17


● Como

então:

provando que é um ponto fixo de .

¹yini =yini + c

ini

1 +P

j2Micij; cini = 0; ni 2Mi; i 2 N

T (y1¤; :::; yN¤) = (y1¤; :::; yN¤)

T

fyi¤ 2 Y i; i 2 Ng

18


● Sentido inverso:

Suponha que é um ponto fixo de , mas não é um equilíbrio de Nash. Então, para algum (por exemplo, ), existe um tal que:

Agora seja o índice onde a quantidade

fyi¤ 2 Y i; i 2 NgT

i 2 N i = 1

~y1 2 Y 1

X

M1

:::X

MN

y1n1y2n2 :::y

NnN a

1n1;:::;nN >

X

M1

:::X

MN

~y1n1y2n2 :::y

NnNa

1n1;:::;nN

(1)

~n1

19


alcança seu menor valor sobre .● Como é uma estratégia mista, o lado

direito da equação (1) pode ser limitado por baixo por (2) com :

~y1

(2)X

M2

:::X

MN

y2n2 :::yNnNa

1n1;:::;nN

ni 2Mi

n1 = ~n1X

M1

:::X

MN

y1n1y2n2 :::y

NnN a

1n1;:::;nN >

X

M1

:::X

MN

~y1n1y2n2 :::y

NnNa

1n1;:::;nN

>X

M2

:::X

MN

y2n2 :::yNnNa

1~n1;:::;nN

X

M1

:::X

MN

y1n1y2n2:::yNnN a

1n1;:::;nN

>X

M2

:::X

MN

y2n2 :::yNnNa1~n1;:::;nN

Voltar ao Slide 21

20


é equivalente a:

E mais:

X

M1

:::X

MN

y1n1y2n2 :::y

NnN a

1n1;:::;nN >

X

M2

:::X

MN

y2n2 :::yNnNa

1~n1;:::;nN

definição de Psi

c1~n1 > 0

cini ¸ 0) c1n1 ¸ 0definição de c

)PM1c1n1 > 0

Voltar ao Slide 22

Ã1~ni(y1; y2; :::; yN) > 0

21


● Agora seja o índice onde a quantidade (2) alcança o seu valor máximo.

● Então, podemos limitar superiormente o lado esquerdo de (1) pelo valor (2) quando :

n̂1

n1 = n̂1

X

M1

:::X

MN

y1n1y2n2 :::y

NnN a

1n1;:::;nN >

X

M1

:::X

MN

~y1n1y2n2 :::y

NnNa

1n1;:::;nN

X

M2

:::X

MN

y2n2 :::yNnNa

1n̂1;:::;nN >

X

M2

:::X

MN

y2n2 :::yNnNa

1n̂1;:::;nN >

X

M1

:::X

MN

y1n1y2n2 :::y

NnNa

1n1;:::;nN

22


é equivalente a:

E mais: )PM1c1n1 > 0

X

M2

:::X

MN

y2n2 :::yNnNa1n̂1;:::;nN >

X

M1

:::X

MN

y1n1y2n2:::yNnNa

1n1;:::;nN

c1n̂1 = 0

Resultado obtido em 20 CONTRADIÇÃO!

Ã1n̂i(y1; y2; :::; yN) < 0

¹y1n̂1 =y1n̂1 + c

1n̂1

1 +P

j2M1c1j

¹y1n̂1 < y1n̂1

23

Refe rênc ias

● T. Basar and G. J. Olsder● Fixed-Point Theorems

http://cepa.newschool.edu/het/essays/math/fixedpoint.htm

● Nash Equilibrium http://www.scs.carleton.ca/~maheshwa/MAW/MAW/node7.html

● Brouwer fixed point theorem http://en.wikipedia.org/wiki/Brouwer_fixed_point_theorem

● Mahalanobis http://mahalanobis.twoday.net/stories/308405/

Primeiro Seminário de Teoria dos Jogos Maio de 2007...

Documents

Transcript of Primeiro Seminário de Teoria dos Jogos Maio de 2007...