Teoria Microeconômica II: Introdução à Teoria dos Jogos
Agosto, 2006
Prof. João Manoel Pinho de [email protected]
Revisão
Principais conceitos e definições
Revisão Jogo estático
“Common knowledge” Eliminação de estratégias estritamente dominadas Equilíbrio de Nash Estratégias mistas
Jogo Dinâmico Estratégia Subjogo Equilíbrio de Nash Perfeito em Subjogos
HOJE: Jogos RepetidosHorizonte finito e infinitoReputação e credibilidade
Punições
Dilema dos Prisioneiros Considere a seguinte versão do dilema dos
prisioneiros.
Pergunta: há meios de implementar cooperação em relações duradouras?
2
1
C NC
C 1,1 5,0
NC 0,5 4,4
Horizonte Finito
Dilema dos prisioneiros em 2 períodos Taxa de desconto: = 1
Expansão da árvore é exponencial: 1o período: 4 resultados possíveis 2o período: 16 resultados possíveis
Estratégia: deve estabelecer o que será feito por cada jogador, em cada história possível do jogo.
Indução retroativa
Menor subjogo: é o próprio jogo constituinte; independente da história pregressa.
EN do menor subjogo: (C,C).
1o período Considerando que no segundo período será jogado
(C,C), o primeiro período é representado por:
2
1
C NC
C 2,2 6,1
NC 1,6 5,5
Equilíbrio de Nash Perfeito em Subjogos Jogador i =1,2: (C; C,C,C,C)
O ENPS é único.
Não há como implementar cooperação.
Caso houvesse N períodos, o resultado seria análogo.
Proposição
Caso o jogo constituinte tenha um único equilíbrio de Nash, o jogo repetido N vezes também terá um único equilíbrio de Nash perfeito em subjogos.
Esse ENPS corresponde à repetição dos equilíbrios do jogo constituinte.
Cooperação em jogos com horizonte finito Suponha que, por alguma razão, haja uma nova
possibilidade no jogo constituinte, representada por X.
2
1
C NC X
C 1,1 5,0 0,0
NC 0,5 4,4 0,0
X 0,0 0,0 3,3
Sustentando cooperação Considere o seguinte par de estratégias (s1, s2) :
Primeiro período: NC Segundo período: X caso tenha ocorrido (NC,NC); C caso
contrário.
Objetivo: ao invés de caracterizar o conjunto de todos os equilíbrios, iremos mostrar que as estratégias acima constituem um ENPS.
Dá para implementar NC no 1º período? Considere a decisão do jogador 2 dado o que
o jogador 1 joga s1:
5
1o estágio
+ 1
2o estágio
Se ele joga C no primeiro período, dado o que o jogador 1 joga s1, seu payoff é:
4
1o estágio
+ 3
2o estágio
Se ele joga NC no primeiro período, dado o que o jogador 1 joga s1, seu payoff é:
Características Só é possível implementar cooperação em jogos repetidos
com horizonte finito se o jogo constituinte apresentar equilíbrios múltiplos.
apenas as ameaças críveis de punições futuras podem afetar o comportamento corrente.
Caso haja um único EN no jogo constituinte, será jogado em cada repetição.
Horizonte Infinito
Estrutura Jogo constituinte é o mesmo que antes
Infinitas repetições – se aplica para relações duradouras que não possuem prazo de validade.
Taxa de desconto: 0 < < 1. Impaciência. Probabilidade do jogo se repetir por mais 1 período.
Dilema dos prisioneiros
Estratégia do gatilho: Joga NC no 1o período; Joga NC se observou (NC,NC) em todos os períodos
anteriores e C caso contrário.
2
1
C NC
C 1,1 5,0
NC 0,5 4,4
Teste A estratégia do gatilho constitui um equilíbrio de
Nash perfeito em subjogos?
2 tipos relevantes de subjogos: subjogos de “cooperação”; subjogos de “não-cooperação”.
Naqueles subjogos de não-cooperação, a estratégia prevê um equilíbrio de Nash do jogo constituinte.
Subjogos de cooperação Nos subjogos de cooperação, as estratégias
constituem equilíbrio se:
4+4+42+... ≥ 5++2...
4/(1-) ≥ 5+/(1-)
≥ 1/4.
Implementando o que é possível O que acontece se <1/4 ?
C não é implementável Considere uma versão modificada do dilema dos
prisioneiros, em que:
2
1
C NC
C 1,1 5,0
NC 0,5 M,M
Continuação Estratégia do gatilho:
Joga NC no 1o período; Joga NC se observou (NC,NC) em todos os períodos anteriores e C
caso contrário. Nos subjogos de cooperação, as estratégias constituem
equilíbrio se:M+M+M2+... ≥ 5++2...
M/(1-) ≥ 5+/(1-)
M ≥ 5-4.
Lição
Como os jogadores descontam muito o futuro, torna-se necessária uma compensação maior para que a cooperação ocorra.
Implementando cooperação com punições mais brandas A estratégia do gatilho envolve punições muito
agressivas que, diante de um desvio, penaliza os jogadores indefinidamente.
Considere o seguinte par de estratégias (“stick and carrot”): Joga NC no 1o período; Joga NC se observou (NC,NC) ou (C,C) no período anterior; Joga C caso contrário.
Estratégia
Diante de um desvio em k+1, a punição tem duração de apenas 1 período.
t ação de 1 ação de 2
k NC NC
k+1 NC C
k+2 C C
k+3 NC NC
Equilíbrio de Nash Perfeito em Subjogos Nos subjogos de punição, a análise é a mesma da estratégia
do gatilho.
Nos subjogos de cooperação, as estratégias constituem equilíbrio se:
4+4+42+... ≥ 5++42...
4+4 ≥ 5+
≥ 1/3.
Lição
Punições mais brandas requerem uma taxa de desconto mínima maior para a implementação da cooperação.
DefiniçõesGanhos factíveis:
(0,5)(4,4)
(1,1) (5,0)
Teorema Folk Friedman, 1971
Seja G um jogo estratégico com informação completa e (e1,...,eN) os ganhos de um equilíbrio de Nash de G. Seja (x1,...,xN) um vetor de ganhos factíveis de G.
Se xi > ei para todo i e for suficientemente próximo de 1, existe um ENPS do jogo repetido com horizonte infinito que atinge (x1,...,xN) como ganho médio.
Teorema Folk
(0,5)
(4,4)
(1,1) (5,0)
Ganhos atingíveis em ENPS
Top Related