Problema: Dada uma matriz m n - IME-USPcris/aulas/13_1_6906/slides/aula3.pdf · Jogos de soma zero...

Jogos de soma zero com dois jogadores

Problema: Dada uma matriz Am×n,encontrar um equilíbrio de Nash (de estratégias mistas).

Jogador 1 quer encontrar p quemaximize vsujeito a

i pi = 1sujeito a (pA)j ≥ v para j = 1, . . . , nsujeito a pi ≥ 0 para i = 1, . . . ,m.

Teoria dos Jogos – p. 1

Jogador 2 quer encontrar q queminimize wsujeito a

i qi = 1sujeito a (Aq)i ≤ w para i = 1, . . . ,msujeito a qj ≥ 0 para j = 1, . . . , n.

Jogador 2 quer encontrar q queminimize wsujeito a

Estes são programas lineares, e um é o dual do outro!

Forma padrão dos LPs

Programa primal:

minimize cx

sujeito a Ax ≥ b

x ≥ 0

Forma padrão dos LPs

Programa primal:

minimize cx

sujeito a Ax ≥ b

x ≥ 0

Programa dual:

maximize by

sujeito a AT y ≤ c

y ≥ 0

Primeiro LP em forma padrão

Jogador 1 quer encontrar p que

maximize vsujeito a

Forma padrão:

minimize −v+ + v−

sujeito a −∑

i pi ≥ −1∑

i pi ≥ 1

−v+ + v− +∑

i aijpi ≥ 0 para j = 1, . . . , n

v+, v−, pi ≥ 0 para i = 1, . . . ,m

Segundo LP em forma padrão

Jogador 2 quer encontrar q que

minimize wsujeito a

Forma padrão:

maximize −w+ + w−

sujeito a −∑

i qi ≤ −1∑

i qi ≤ 1

−w+ + w− +∑

j aijqj ≤ 0 para i = 1, . . . ,m

w+, w−, qj ≥ 0 para j = 1, . . . , n

LPs em forma padrão

sujeito a −∑

i pi ≥ −1∑

i pi ≥ 1

−v+ + v− +∑

i aijpi ≥ 0 para j = 1, . . . , n

v+, v−, pi ≥ 0 para i = 1, . . . ,m

maximize −w+ + w−

sujeito a −∑

i qi ≤ −1∑

i qi ≤ 1

−w+ + w− +∑

j aijqj ≤ 0 para i = 1, . . . ,m

w+, w−, qj ≥ 0 para j = 1, . . . , n

Programa primal

sujeito a −∑

i pi ≥ −1∑

i pi ≥ 1

−v+ + v− +∑

i aijpi ≥ 0 para j = 1, . . . , n

v+, v−, pi ≥ 0 para i = 1, . . . ,m

c = (−1, 1, 0, . . . , 0) e b = (−1, 1, 0, . . . , 0)

0 0 −1 · · · −1

0 0 1 · · · 1

−1 1 a11 · · · am1

......

... · · ·...

−1 1 a1n · · · amn

Relação entre os valores dos LPs

v =∑

≤∑

qj =∑

≤∑

wpi =(

v =∑

≤∑

qj =∑

≤∑

wpi =(

Para soluções ótimas, os valores v∗ e w∗ são iguais e

se q∗j > 0 então∑

i aijp∗i = v∗

se p∗i > 0 então∑

j aijq∗j = w∗

v =∑

≤∑

qj =∑

≤∑

wpi =(

Para soluções ótimas, os valores v∗ e w∗ são iguais e

se q∗j > 0 então∑

i aijp∗i = v∗

se p∗i > 0 então∑

j aijq∗j = w∗

Toda estratégia no suporte de uma estrategia mista ótimatem o mesmo valor esperado (o valor ótimo).

Jogos com dois jogadores

Problema: Dada uma matriz Am×n

representando um jogo de dois jogadores de soma zero,encontrar um equilíbrio de Nash (de estratégias mistas).

Conclusão:

Este problema pode ser resolvido em tempo polinomial(usando programação linear).

Conclusão:

E para jogos que não sejam de soma zero?

Conclusão:

E para jogos que não sejam de soma zero?

Veremos mais adiante.

Estratégias mistas

Uma estratégia mista para o jogador ié uma distribuição de probabilidades no conjunto Si.

Seja σ um vetor de estratégias mistas.

Ou seja, para cada jogador i,σi é uma distribuição de probabilidades em Si.

Estratégias mistas

Qual é a utilidade esperada do jogador i para σ?

Estratégias mistas

Qual é a utilidade esperada do jogador i para σ?

Ui(σ) = E[ui(σ)] =∑

ui(s)Prσ[s],

onde Prσ[s] =∏

j σj(sj).(Considera-se que os jogadores são independentes.)

Equilíbrio de Nash

Jogador i está satisfeito com σ seE[ui(σ)] ≥ E[ui(ρ, σ−i)] para toda estratégia mista ρsobre Si.

Equilíbrio de Nash

Jogador i está satisfeito com σ seUi(σ) ≥ Ui(ρ, σ−i) para toda estratégia mista ρ sobre Si.

Equilíbrio de Nash

σ é um equilíbrio de Nash (de estratégias mistas)se todo jogador está satisfeito com σ.

Ou seja, em σ, nenhum jogador tem incentivo para mudarde estratégia (mista).

Equilíbrio de Nash

σ é um equilíbrio de Nash (de estratégias mistas)se todo jogador está satisfeito com σ.

Ou seja, em σ, nenhum jogador tem incentivo para mudarde estratégia (mista).

Teorema (Nash, 1951): Todo jogo com um número finito dejogadores e conjuntos finitos de estratégias tem umequilíbrio de Nash de estratégias mistas.

Teorema de Ponto Fixo de Brouwer

Teorema de Ponto Fixo de Brouwer (1909):

Toda função contínua f : D → D, onde D é um subconjuntocompacto e convexo do IRm, tem um ponto fixo.

Ponto fixo: x em D tal que f(x) = x.

Conjunto compacto: fechado e limitado.

Conjunto convexo: se x e y ∈ D, então o segmento xy ⊆ D.

Comentários na aula:

Teorema do Ponto Fixo de Brouwer para m = 1 e m = 2.

Comentários na aula:

Teorema do Ponto Fixo de Brouwer para m = 1 e m = 2.

Lema de Sperner e Teorema do Ponto Fixo de Brouwer.Teoria dos Jogos – p. 11

Seja mi = |Si| e m =∑

i mi.Σi: conjunto das estratégias mistas para i(Σi = {p ∈ IRmi : p(s) ≥ 0 ∀s ∈ Si e

s∈Sip(s) = 1} ⊆ IRmi)

Seja mi = |Si| e m =∑

i mi.Σi: conjunto das estratégias mistas para i(Σi = {p ∈ IRmi : p(s) ≥ 0 ∀s ∈ Si e

s∈Sip(s) = 1} ⊆ IRmi)

O conjunto Σ = Σ1 × · · · × Σn ⊆ IRm é compacto e convexo.

Prova do Teorema de Nash

Prova: Considere a função f : Σ → Σ definida por f(σ) = ρ,onde ρi = arg maxρ′

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

A função gi(ρ′i) = Ui(ρ

′i, σ−i) − ||ρ′i − σi||

2 é côncava, logotem um único máximo, e assim f está bem-definida.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

A função gi(ρ′i) = Ui(ρ

′i, σ−i) − ||ρ′i − σi||

2 é côncava, logotem um único máximo, e assim f está bem-definida.

De fato, gi : Σi → IR é uma função quadrática e côncava:

gi(ρ′i) =

ui(s)∏

σj(sj) ρ′i(si) −∑

s∈Si

(ρ′i(s) − σi(s))2.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Note ainda que a função ρi é contínua em σ.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Então, pelo Teorema de Brouwer, f tem um ponto fixo σ̂.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Então, pelo Teorema de Brouwer, f tem um ponto fixo σ̂.

Vamos mostrar que σ̂ é um equilíbrio de Nash!

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Pelo Teorema de Brouwer, f tem um ponto fixo σ̂.

Suponha, por contradição, que σ̂ não é equilíbrio de Nash.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Existe i e ρ′i em Σi tq Ui(ρ′i, σ̂−i) = Ui(σ̂) + δ, para δ > 0.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Vamos escolher α ∈ (0, 1] tq ρ̂i = σ̂i + α(ρ′i − σ̂i)

contraria o fato de f(σ̂) = σ̂.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Vamos escolher α ∈ (0, 1] tq ρ̂i = σ̂i + α(ρ′i − σ̂i)

Note que tal ρ̂i ∈ Σi pois é combinação convexa de σ̂i e ρ′i.

Considere f : Σ → Σ definida por f(σ) = ρ,onde ρi = arg maxρ′

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Vamos escolher α tal que ρ̂i = σ̂i + α(ρ′i − σ̂i)

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Para σ fixo, Ui(ρi, σ−i) é linear em ρi, logoUi(ρi − σ̂i, ˆσ−i) = Ui(ρi, σ̂−i) − Ui(σ̂) = δ e

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Para σ fixo, Ui(ρi, σ−i) é linear em ρi, logoUi(ρi − σ̂i, ˆσ−i) = Ui(ρi, σ̂−i) − Ui(σ̂) = δ e

Ui(ρ̂i, ˆσ−i) = Ui(σ̂i + α(ρ′i − σ̂i), σ̂−i)

= Ui(σ̂) + α Ui(ρ′i − σ̂i, σ̂−i) = Ui(σ̂) + α δ

Prova do Teorema de NashConsidere a função f : Σ → Σ definida por f(σ) = ρ,onde ρi = arg maxρ′

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

Se o ponto fixo σ̂ de f não é equilíbrio de Nash, entãoexiste i e ρ′i em Σi tq Ui(ρ

′i, σ̂−i) = Ui(σ̂) + δ, para δ > 0.

Seja ρ̂i = σ̂i + α(ρ′i − σ̂i) para algum α > 0.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

′i, σ̂−i) = Ui(σ̂) + δ, para δ > 0.

Conforme calculamos, Ui(ρ̂i, σ̂−i) = Ui(σ̂) + α δ.

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

′i, σ̂−i) = Ui(σ̂) + δ, para δ > 0.

Se α < δ/||ρ′i − σ̂i||2, então

Ui(ρ̂i, σ̂−i) − ||ρ̂i − σ̂i||2 = Ui(σ̂) + α δ − ||ρ̂i − σ̂i||

= Ui(σ̂) + α δ − α2||ρ′i − σ̂i||2

> Ui(σ̂),

i∈Σi

{Ui(ρ′i, σ−i) − ||ρ′i − σi||

′i, σ̂−i) = Ui(σ̂) + δ, para δ > 0.

Se α < δ/||ρ′i − σ̂i||2, então

Ui(ρ̂i, σ̂−i) − ||ρ̂i − σ̂i||2 = Ui(σ̂) + α δ − ||ρ̂i − σ̂i||

= Ui(σ̂) + α δ − α2||ρ′i − σ̂i||2

> Ui(σ̂),

contradição pois σ̂i não é arg max{Ui(ρ̂i, σ̂−i) − ||ρ̂i − σ̂i||2}.

Problema: Dada uma matriz m n - IME-USPcris/aulas/13_1_6906/slides/aula3.pdf · Jogos de soma zero...

Documents

Transcript of Problema: Dada uma matriz m n - IME-USPcris/aulas/13_1_6906/slides/aula3.pdf · Jogos de soma zero...

IMPACTOS ECONÔMICOS DE CENÁRIOS DE POLÍTICAS …repositorio.ipea.gov.br/bitstream/11058/4925/1/PPE_v42_n02_Impact... · de combustíveis, dada a importância das primeiras na matriz

IGUALDADE DE MATRIZ...uma matriz basta tornar todos os elementos da matriz A em seus opostos. Dada a Matriz A = −3 2 5 −1. Determine a sua oposta. Exemplo –A = 3 −2 −5 1

Problema da falta de vagas em creches: matriz de loops e a ...

A prática lectiva como actividade de resolução de ...repositorio.ul.pt/bitstream/10451/3980/1/02-Santos-Ponte_Quadrante_11-2.pdfNo segundo caso, uma dada situação será um problema

TEORIA DAS MATRIZES Professor Judson Santos · matriz identidade de ordem n > 1. Determine, em termos de M e I , a matriz M 2003 Problema 7. (UFC)Dadas as matrizes ...

MATRIZ DE REFERÊNCIA/Ensino Fundamental CIÊNCIAS … · - Diferença entre célula animal e vegetal ... MORFOLOGIA E FISIOLOGIA HUMANAS utilizando - Tecidos ... problema. 16. Relacionar

Matriz Avalia-BH - MATavaliabh.caedufjf.net/repositorio/diagnosticabh/pdf/MatrizAvalia-BH_MAT_7ano.pdfD17 Resolver problema utilizando relações entre diferentes unidades de medida:

RAPHAELL MATEMÁTICA 10 QUESTÕES SOBRE 19/05/2020 … · RAPHAELL MATEMÁTICA MARQUES 10 QUESTÕES SOBRE MATRIZES 19/05/2020. 2 QUESTÃO 01 Dada a matriz A e B Solução

7 A Integral Indefinida - files.cercomp.ufg.brtulo_7.pdf · 7 A Integral Indefinida 7.1 Equação Diferencial Até o momento preocupamo-nos com o seguinte problema: Dada uma função

Lógica Proposicional SAT e Custo Computacional. O problema SAT Dada uma fórmula proposicional = (a b) ( a b c) Determinar se é satisfazível.

Sumário - Sigma-Aldrich · processo de consulta aos stakeholders para construir sua Matriz de Materiali-dade – um amplo trabalho que permitiu conhecer a relevância dada pela compa-nhia

Pesquisa Operacional II – Pesquisa Operacional II ... · A matriz Hessiana para essa função é dada por: H(x, y) = − − y x 3 3 1 40 100 1. A matriz Hessiana aplicada no ponto

V Seminário da Pós-graduação em Engenharia Mecânica · V Seminário da Pós-graduação em Engenharia Mecânica A equação diferencial do problema físico é dada por: (2) onde

Ritha C. Capelato Rocha 2 · LEUCONIQUIA Problema na matriz distal – há opacificação da parte ventral da lamina. Causas – trauma principalmente por manicure, dependendo do

Problema 23...1 Problema 2 Suponha que uma matriz X 22x ( não necessariamente Hermitiana, nem unitária ) seja escrita como X =+aa0 σ. GG, (1) onde a0 e a1,2,3 são ...

Contexto Problema Cenário Atual Motivação Arcadea Público alvo e stakeholders Cenário Futuro Matriz de valores Status report Tecnologias.

OFICINA PLANEAMENTO DA AÇÃO DE FORMAÇÃO … · oficina planeamento da aÇÃo de formaÇÃo estratÉgica de ... matriz do plano de aÇÃo estratÉgica 1. fragilidade/ problema

Manual de validação, verificação/confirmação de … · analito-matriz (um dado analito em uma dada matriz) de interesse, recomenda-se por iniciar uma pesquisa quanto à disponibilidade

DEFINIÇÃO DE MATRIZ IGUALDADE DE MATRIZ · Matriz Oposta Dada uma matriz A = (a ij) m x n. A sua matriz oposta será representada por –A. Isso significa que para encontrar o oposto

Algoritmos de Aproximação para o Problema de Empacotamento€¦ · O problema de Empacotamento Unidimensional Dada uma sequ^encia de itens L = (a 1;a 2;:::;a n), onde cada item