Teoria dos Jogos - Mauricio Bugarin's Blog · Exemplo. (poker) Aula 10 Teoria dos Jogos Maurício...
Transcript of Teoria dos Jogos - Mauricio Bugarin's Blog · Exemplo. (poker) Aula 10 Teoria dos Jogos Maurício...
1
Aula 10 Teoria dos Jogos Maurício Bugarin
Teoria dos Jogos
Prof. Maurício Bugarin Eco/UnB 2014-I
Aula 10 Teoria dos Jogos Maurício Bugarin
Roteiro
• Capítulo 2: Jogos dinâmicos com informação completa 1. Jogos Dinâmicos com Informação Completa e Perfeita 2. Jogos Dinâmicos com Informação Completa mas imperfeita
Informação imperfeita: Não observabilidade e Natureza Utilidade esperada e Equilibrio de Nash Exemplos Estratégias mistas comportamentais e o Teorema de Kuhn A riqueza do conceito de perfeição em subjogos Exemplos
2
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Definição: Equilíbrio de Nash
Um perfil de estratégias s=(s1, s2,..., sn) é um equilíbrio de Nash (EN) do jogo dinâmico se
nenhum jogador i, puder obter uma utilidade esperada maior mudando sua estratégia, se os
outros jogadores mantiverem as suas. Equivalentemente,
∀i=1,..., n, Ui(si, s-i) ≥ Ui(siʹ′, s-i)
em que siʹ′ é qualquer estratégia alternativa disponível para o jogador i e Ui é a utilidade
esperada do agente i.
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo. (poker)
Considere o seguinte jogo entre dois jogadores.
O jogador 1 retira uma carta de um baralho com 50% de chance de ser uma carta alta (A) e
50% de chance de ser uma carta baixa (B).
Depois de olhar a carta ele decide apostar (p) ou não (np).
Se ele escolhe não apostar, ele paga $1 ao jogador 2.
Se ele aposta, então o jogador 2 deve decidir se aceita (a) ou não (na) a aposta, sem
conhecer se a carta retirada é alta ou baixa.
Se 2 não aceitar a aposta, ele paga $1 ao jogador 1.
Caso 2 aceite a aposta, verifica-se o valor da carta retirada por 1.
Se for elevado, 2 paga $2 ao jogador 1.
Por outro lado, se o valor for baixo, então 1 paga $2 ao jogador 2.
3
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo. (poker)
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo. (poker)
Não existe EN em estratégias puras!
4
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Definição. estratégia mista comportamental
Num jogo na forma extensiva, um jogador poderia adotar um mecanismo aleatório de
escolha em um nó ou conjunto de decisão específico.
Quando as possíveis "misturas" ocorrem não sobre uma estratégia completa, como na forma
normal, mas em cada conjunto de decisão de um jogador na forma extensiva do jogo,
dizemos tratar-se de uma estratégia mista comportamental.
Observação. Memória pefeita.
Teorema de Kuhn:
Qualquer jogo na forma extensiva finito com memória perfeita admite um equilíbrio de Nash
em estratégias mistas comportamentais.
Ideia da demonstração:
Todo jogo finito na forma extensiva pode ser transformado em
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Definição. estratégia mista comportamental
Teorema de Kuhn:
Qualquer jogo na forma extensiva finito com memória perfeita admite um equilíbrio de Nash
em estratégias mistas comportamentais.
Ideia da demonstração:
Todo jogo finito na forma extensiva pode ser transformado em um jogo normal, mesmo que,
para tanto, seja necessário o cálculo de utilidades esperadas.
Qualquer estratégia mista na forma normal equivale a uma estratégia mista comportamental
na forma extensiva.
Qualquer equilíbrio de Nash na forma normal corresponde a um equilíbrio de Nash na forma
extensiva.
5
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo. (poker)
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Definição: Subjogo. Sejam E um jogo na forma extensiva e t um nó não terminal qualquer
do jogo E. Considere todos os nós que seguem t, incluindo os nós terminais do jogo. O
conjunto formado por t e seus sucessores é um subjogo do jogo E se:
(i) O nó t constitui um conjunto de decisão unitário, ou seja, se o nó não corresponder à
natureza, então o jogador que joga em t sabe que está nesse nó no momento de jogar.
(ii) Nenhum dos nós incluídos nesse conjunto pode fazer parte de um conjunto de
informação contendo algum nó fora desse conjunto.
Observação: Pela definição acima, um subjogo é uma parte "estrategicamente consistente"
do jogo, no sentido de que ele inicia-se num nó que não pertence nenhum conjunto de
informação maior e, por (ii), cada jogador que venha a tomar uma decisão num nó desse
subjogo sabe que está nesse subjogo. Assim, um subjogo possui as mesmas características
de um jogo. Observe que assim como qualquer jogo com informação imperfeita, o subjogo
pode iniciar-se com um movimento da natureza, N.
6
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M M
xM
( ) MM xx−240
M
xM
E
xʹ′M
xE
( )( )( )( ) MME
EME
xxxFxxx
+−
−+−
2424
xE
( )( )( )( ) MME
EME
xxxFxxx
ʹ′ʹ′+−
−ʹ′+−
2424
pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
Exemplo: Barreira à Entrada:
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4
7
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Definição-Equilíbrio perfeito em subjogos.
Um perfil de estratégias de um jogo na forma extensiva E é um equilíbrio perfeito
em subjogos se esse perfil induz um equilíbrio de Nash em cada subjogo de E. Um equilíbrio
perfeito em subjogos é denotados por EPS.
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo: Barreira à Entrada:
ne e
c g
t0
t1
E
M M
xM
( ) MM xx−240
M
xM
E
xʹ′M
xE
( )( )( )( ) MME
EME
xxxFxxx
+−
−+−
2424
xE
( )( )( )( ) MME
EME
xxxFxxx
ʹ′ʹ′+−
−ʹ′+−
2424
pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
8
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
M
xM
E
xʹ′M
xE
( )( )( )( ) MME
EME
xxxFxxx
+−
−+−
2424
xE
( )( )( )( ) MME
EME
xxxFxxx
ʹ′ʹ′+−
−ʹ′+−
2424
pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
Exemplo: Barreira à Entrada:
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
M
xM
E
xʹ′M
xE
( )( )( )( ) MME
EME
xxxFxxx
+−
−+−
2424
xE
( )( )( )( ) MME
EME
xxxFxxx
ʹ′ʹ′+−
−ʹ′+−
2424
pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
Exemplo: Barreira à Entrada:
9
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
6464 F− pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
Exemplo: Barreira à Entrada:
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
6464 F− pM
E
pʹ′M
pE<pM pE
pE=pM pE>pM
( )( )0
630 Fpp EE −−−
( )( )
( )( )63021
63021
−−
−−−
MM
EE
pp
Fpp
( )( )630 −−
−
MM ppF
Exemplo: Barreira à Entrada:
10
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
6464 F−
0F−
Exemplo: Barreira à Entrada:
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e
c g
t0
t1
E
M
1440
6464 F−
0F−
Exemplo: Barreira à Entrada:
11
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e t0
E
1440
6464 F−
Exemplo: Barreira à Entrada:
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
ne e t0
E
1440
6464 F−
Exemplo: Barreira à Entrada:
12
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4
13
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4
14
Aula 10 Teoria dos Jogos Maurício Bugarin
2. Jogos Dinâmicos com Informação Completa e Imperfeita
Exemplo:
1
D E
e d
L R
2
t0 t1
t6 2 10 20
B A
e d e d
L R
2
3
1
t2 t3
t5 4 2 1
0 2 0
0 0 1
10 4 2
1 1 2
6 5 3
3 4 10
3
t4