PESQUISA OPERACIONAL –MODELOS ESTOCÁSTICOS (PO II)• Professor: João Carlos Soares de Mello• Bibliografia:Taha, H.A., Pesquisa Operacional, Pearson, 2008Tavares, L.T.; Oliveira, R.C.; Themido, I.H.; Correia, F.N.
Investigação Operacional, McGraw-Hill, 1996Bronson, R. Pesquisa Operacional, McGraw-Hill (Coleção
Schaum), 1985Fiani, R. Teoria dos Jogos, Campus-Elsevier, 2006Revistas: Pesquisa Operacional, Investigação Operacional,
Gestão & Produção, Produção (www.scielo.org)Página: www.uff.br/decisao
TÓPICOS
• Otimização em redes (Teoria dos Grafos)• Tipologia das decisões• Decisões sob incerteza (jogos contra a natureza)• Teoria dos jogos• Decisões sob risco e teoria da utilidade• Decisões seqüenciais (árvores de decisão)• Processos multidecisor (Teorema de Arrow e
métodos ordinais)
TÓPICOS
• Processo de Markov• Processos de nascimento e morte – Teoria
das filas• Gestão de estoques
Teoria dos Grafos• Pontes de Königsberg
na Prússia (atual Kalingrado, na Russia): “seria possível percorrer todas as quatro seções e voltar ao local de partida cruzando cada ponte uma única vez?”
• Resolvido por Leonhard Euler XVIII
Teoria dos Grafos
• Um grafo é uma noção simples e abstrata utilizada para representar a idéia de relação entre “elementos". Exemplos: ......???
• Matematicamente: G = (V,A), onde V é o conjunto de vértices e A é o conjunto de ligações entre vértices.
• Grafo não orientado: ligações representadas os pares de vértices não possuem uma ordem (i,j) = (j,i) = [i,j], aresta
• Grafo orientado (dígrafo): ligações (arcos) representadas por partes ordenados (i,j) ≠ (j,i)
Teoria dos Grafos
Grafo não orientado Grafo orientadoV=(1,2,3,4,5,) V=(A,B,C,D,E)
A=([1,2],[1,3],[3,4], A=((A,B),(A,D),(A,C),(B,C),[3,5],[3,4],[4,5]) (C,E),(D,E),(E,D))
Representação de um Grafo
• Listas de Adjacências: armazena o relacionamento entre os vértices em uma estrutura de listas. Representação econômica do ponto de vista computacional.Grafos orientados: duas listas origem - destinos e destino - origensGrafo não orientados: uma lista
Representação de um Grafo
• Matriz de adjacências: dois vértices são adjacentes se estão unidos por uma aresta ou arco. Matriz Mnxn (n total de vértices)
Exemplo:
Representação de um Grafo• Matriz de adjacências valorada - Matriz de
Distâncias (custos): valores associados ás ligações, matriz D
• Exemplo
Percursos em grafos• Percurso ou itinerário ou ainda cadeia é uma
família de ligações sucessivas adjacentes.
• Hamiltonianos: percurso que visita cada vértice uma única vez. Problema do Caixeiro Viajante: “O Caixeiro Viajante deve sair da sua cidade (origem), visitar cada uma das outras (n-1) cidades uma única vez e retornar à cidade de origem, de forma tal a percorrer uma única distância possível”
• Eulerianos: percurso que usa cada ligação exatamente uma vez. Problema do Carteiro Chinês.: “o carteiro deseja percorrer todas as ruas da sua rota um número mínimo de vezes
Problemas estudados em Grafos
• O Problema do Caixeiro Viajante• O Problema do Carteiro Chinês• O Problema de Caminho Mínimo• O Problema de Fluxo Máximo• O Problema de Fluxo Máximo a custo mínimo• Árvore Geradora Mínima (AGM)• Coloração em Grafos• Roteamento de veículos• Etc.
O Problema de Caminho Mínimo
• Objetivo: minimização do custo de percurso de um grafo entre dois vértices, custo este dado pela soma dos custos de cada aresta percorrida.
• Existem muitos algoritmos para resolver este problema, estudaremos dois: Dijkstra e Floyd
• Algoritmo de Dijkstra: determina o custo ou distância mínima entre uma origem e um destino.
• Algoritmo de Floyd: determina os custo ou distâncias mínimas entre todos os pares de vértices
Algoritmo de Dijkstra• Para cada vértices usamos a notação: [c,j] X,
chamada de rótulo• c custo até o momento, j vértice precedente, X pode
ser T (temporário) ou P (permanente)• Início no vértice origem: [0,-]P• Analisar os vértices adjacentes e colocamos rótulos
temporários, calculamos a distância até esse ponto, caso esteja rotulado escolhemos o de menor distância
• Todos os vértices rotulados, pare, caso contrário, escolha o de menor custo rotule como P e repetir o passo anterior
Tipologia das decisões
• Quanto às informações• Quanto ao número de decisores• Quanto aos critérios• Quanto ao objeto
Tipologia das decisões - Quanto ao objeto
• Escolha (Pα )• Classificação (Pβ )• Ordenação (Pγ )• Correta descrição do problema
(Pδ)
DECISÕES COM INCERTEZA
• Sem distribuição de probabilidade• Racionalidade do decisor• Jogo contra a natureza• Não usar valor esperado• Auxiliar o decisor, sem respostas
prontas
MÉTODOS
• Pessimista (Maxmin). Se algo pode dar errado, vai dar errado
• Otimista (Maxmax). Tudo vai dar certo• Savage (intermediário dos anteriores)• Custo de oportunidade perdida. Não me
quero arrepender da decisão tomada.• Laplace. Valor esperado se as alternativas
forem equiproporcionais.
4504504504504
4003003003003
4253752252252
4703502701501
DCBA
Cenários de a a d, de estagnação a forte crescimento.
As alternativas representam opções de investimento
MÉTODO OTIMISTA
4504504504504400300300300342537522522524703502701501DCBA
Escolhe-se o maior valor da tabela. O valor 470 corresponde à alternativa 1.
MÉTODO PESSIMISTA
4504504504504400300300300342537522522524703502701501DCBA
Escolhe-se o menor valor de cada linha. Min1=150, Min2=225, Min3=300, Min4=450. Vê-se então qual é o maior dos mínimos. Max (150, 225, 300, 450)=450. Escolhe-se a opção 4.
MÉTODO DE LAPLACE
4504504504504400300300300342537522522524703502701501DCBA
Esp1=(150+270+350+470)/4=310
Esp2=(225+225+375+425)/4=312,5
Esp3=(300+300+300+400)/4=325
Esp4=450
Consideram-se as alternativas equiprováveis e usa-se o valor esperado. Tem sérias restrições de uso
MÉTODO DE SAVAGE
4504504504504400300300300342537522522524703502701501DCBA
S1=470 αα+150(1+150(1-- αα))
S2=425 αα+225(1+225(1-- αα))
S3=400 S3=400 αα+300(1+300(1-- αα))
S4=450S4=450
Faz uma avaliação de cada Faz uma avaliação de cada alternativa ponderando alternativa ponderando otimismo e pessimismo. otimismo e pessimismo. Adota um coeficiente de Adota um coeficiente de otimismo, otimismo, αα subjetivo e subjetivo e difdifíícil de determinar. cil de determinar. Para Para αα=1 =1 éé o mo méétodo todo otimista. Para otimista. Para αα=0 =0 éé o o mméétodo pessimista.todo pessimista.
MÉTODO DE SAVAGE
4504504504504400300300300342537522522524703502701501DCBA
470 αα+150(1+150(1-- αα)>450, significa que a alternativa 1 ser)>450, significa que a alternativa 1 serááescolhida. Caso contrescolhida. Caso contráário a escolhida serrio a escolhida seráá a alternativa 4.a alternativa 4.
Resolvendo: Resolvendo: 470 α+150-150 α=450
320 320 αα=300 As duas alternativas s=300 As duas alternativas sãão equivalentes para o equivalentes para αα=15/16.` =15/16.` ÉÉ preciso um otimismo superior a 93,75% para escolher a preciso um otimismo superior a 93,75% para escolher a alternativa 1alternativa 1
ÉÉ necessnecessáário comparar rio comparar apenas 1 e 4, japenas 1 e 4, jáá que 4 que 4 domina 2 e 3. Ou seja, na domina 2 e 3. Ou seja, na hiphipóótese do decisor achar tese do decisor achar que deveria escolher 2 ou 3, que deveria escolher 2 ou 3, éé melhor escolher 4.melhor escolher 4.
Dominar significa nunca Dominar significa nunca ser pior e ser melhor pelo ser pior e ser melhor pelo menos um vezmenos um vez
MÉTODO DE SAVAGE
S1=470 αα+150(1+150(1-- αα))
S2=425 αα+225(1+225(1-- αα))
S3=400 S3=400 αα+300(1+300(1-- αα))
S4=450S4=450
Gráfico do método de Savage
0
100
200
300
400
500
Alfa
S
A avaliação otimista é sempre superior à pessimista. Este comentário, que parece óbvio, pode não ser válido em situações em que otimismo e pessimismo tenham um significado diferente, envolvendo valores relativos
MÉTODO DO MENOR ARREPENDIMENTO (OU DO MENOR CUSTO DE OPRTUNIDADE PERDIDA)
4504504504504400300300300342537522522524703502701501DCBA
Verificar qual Verificar qual éé a melhor opa melhor opçãção de cada ceno de cada cenáário. Nos cenrio. Nos cenáários A, B e rios A, B e C a melhor alternativa C a melhor alternativa éé a 4, com valor 450. No cena 4, com valor 450. No cenáário D a melhor rio D a melhor alternativa alternativa éé a 1 com valor 470. Para cada par (alternativa, cena 1 com valor 470. Para cada par (alternativa, cenáário) rio) verificaverifica--se quanto se deixou de ganhar por nse quanto se deixou de ganhar por nãão ter escolhido a o ter escolhido a melhor alternativa para aquele cenmelhor alternativa para aquele cenáário. Assim, para cenrio. Assim, para cenáário A tendo rio A tendo escolhido a alternativa B o arrependimento escolhido a alternativa B o arrependimento éé 450450--150=300. Constr150=300. Constróóii--se uma matriz auxiliarse uma matriz auxiliar
2000047015015015034575225225201001803001DCBA
MÉTODO DO MENOR ARREPENDIMENTO (OU DO MENOR CUSTO DE OPRTUNIDADE PERDIDA)
Os valores da matriz, agora, sOs valores da matriz, agora, sãão perdas. Quem no perdas. Quem nãão quer sofrer o quer sofrer crcrííticas quer, no pior dos caso, ter a menor perda possticas quer, no pior dos caso, ter a menor perda possíível. Para cada vel. Para cada alternativa o pior caso alternativa o pior caso éé a pior perda. A menor das piores perdas a pior perda. A menor das piores perdas éé a a escolhida. Temescolhida. Tem--se assim um problema se assim um problema minmaxminmax..
2000047015015015034575225225201001803001DCBA
MÉTODO DO MENOR ARREPENDIMENTO (OU DO MENOR CUSTO DE OPRTUNIDADE PERDIDA)
Max1=300Max1=300
Max2=225Max2=225
Max3=150Max3=150
Max4=20Max4=20
Min(300,225,150,20)=20. EscolheMin(300,225,150,20)=20. Escolhe--se a alternativa 4.se a alternativa 4.
2000047015015015034575225225201001803001DCBA
DISCUSSÃO
• Diante dos vários métodos, qual alternativa escolher?
• Depende da psicologia do decisor.• Neste caso há uma rara convergência para
a alternativa 4. Só o otimista escolheria a 1.• Savage permite uma análise de
sensibilidade. Pelo gráfico vê-se que quase certamente a 4 seria a escolhida.
EXEMPLO
005000150A3
15403020A2
0-100100050010A1
C5C4C3C2C1
Observar que nenhuma alternativa é dominada
EXEMPLO – MÉTODO DE LAPLACE
005000150A3
15403020A2
0-100100050010A1
C5C4C3C2C1
Esp A1= (10+500+1000-100)/5=282
Esp A2=(20+30+40+5+1)/5=19,2
Esp A3=(150+500)/5=130
EXEMPLO – MÉTODO DE MENOR ARREPENDIMENTO
005000150A3
15403020A2
0-100100050010A1
C5C4C3C2C1
155005000A3
00960470130A2
110500140A1
C5C4C3C2C1
QUAL A ESCOLHIDA?
O que é um jogo
• Situações em que o resultado esperado não depende só das nossas decisões.
• Interação estratégica• Racionalidade• Xadrez, Bridge, Guerra, Cartel, Combate
ao Crime, Localização, Política...• Não são considerados jogos de sorte e
habilidade puras.
Batalha do Mar de Coral
• II Guerra Mundial, derrota de Guadalcanal para os japoneses (1942)
• Transporte de tropas• Risco: poderio aéreo aliado (americano)• Duas rotas possíveis• Dificuldades de reconhecimento aliado• Fevereiro de 1943: transporte de 6900 soldados
em uma frota escoltada a alta velocidade naval.
Batalha do Mar de Coral
• Rota Norte: mau tempo• Rota Sul: bom tempo• Reconhecimento em uma rota de cada vez• Rota Norte: dois dias de bombardeio se forem
descobertos no primeiro dia,1 caso contrário• Rota Sul: 3 dias de bombardeio se forem
descobertos no primeiro dia, 2 caso contrário• O que fazer?
MODELO PARA O MAR DE CORAL
Rota Sul Rota Norte
Busca Sul 3 1
Busca Norte 2 2
Jogo estritamente competitivo, estratégias dominantes
DILEMA DOS PRISIONEIROS
Confessa Não confessa
Confessa (-3,-3) (-1,-5)
Não confessa (-5, -1) (-2,-2)
Cooperação e competição, combate ao crime, Equilíbrio de Nash, Ótimo de Pareto, Decisão pessimista
DILEMA DOS PRISIONEIROS
Confessa Não confessa
Confessa (-6,-6) (-4,-10)
Não confessa (-10, -4) (-2,-2)
Dificuldade no Equilíbrio de Nash
TEORIA DOS JOGOS
• Lógica situacional de Popper: objetividade dos dados, sem subjetividade dos decisores
• Entender situações• Aprimorar raciocínio• Cournot (1838), Zermelo e o jogo de
Xadrez, Borel e o conceito de estratégia, von Neumann e Morgenstern 1994, Nash, 1950
Votação em 2 turnos.
Diretor 1 Diretor 2 Diretor 3
I Ap Am
Ap I I
Am Am Ap
Primeiro turno entre Investir e Ampliar
Ação estratégica do diretor 2
TEORIA DA DECISÁO RACIONAL
• Preferências do decisor• Relações binárias: ordem, ordem lata• Dadas A e B, A P B, B PA ou A I B• Se A P B e B P C então A P C• Se A I B e B I C então A I C• Racionalidade forte e fraca• Simplicidade, aprendizado, recompensas
IRRACIONALIDADE DE GRUPO
• Aumentar programas sociais G• Manter programas sociais M• Diminuir programas sociais D• Conservador: D G M• Moderado: M D G• Radical: G M D• G P M, M P D, D P G
SOLUÇÃO DE JOGOS
• Eliminação sucessiva de estratégias dominadas: a racionalidade é conhecimento comum
• Exemplo: Gato e Rato• Empréstimos bancários: decisões simultâneas
Renova Não renova
Renova 4,4 1,5
Não renova 5,1 3,3
LIMITAÇÃO DO MÉTODO
Não exporta Exporta pouco Exporta muito
Investe 2,1 1,0 0,-1
Não investe 1,0 2,1 -1,2
Não há eliminação de estratégias
EQUILIBRIO DE NASH
• Cada estratégia é a melhor resposta possível às estratégias dos demais jogadores e isso é verdade para todos os jogadores
Não exporta Exporta pouco Exporta muito
Investe L2,1 C 1,0 L0,-1
Não investe 1,0 L2,1 -1,2 C
COMÉRCIO INTERNACIONAL
Tarifa protecionista Tarifa simbólica
Tarifa protecionista 800, 800 2300, -700
Tarifa simbólica -700, 2300 1700, 1700
Compara Nash com Pareto
VÁRIOS EQUILIBRIOS DE NASH
Campanha agressiva
Campanha agressiva -20, -20 10, -10
Campanha normal -10, 10 0,0
Campanha normal
LOCALIZAÇÃO
• Sem custos de transporte: localização concentrada
• Com custos de transporte: Localização nos extremos
Localização de lojas• 3 cidades, ABC• d(A,B)=10, d(A,C)=20, d(B,C)=15• P(A)=45%, P(B)=35%, P(C)=20%• Rede I (Grande), rede II (pequena)• I e II juntas ou equidistantes, I fica com
65%• I mais próxima fica com 90%• I mais distante fica com 40%• I não fica em C• Onde localizar?
Localização de lojas• Jogo estritamente competitivo
(soma=100%)• (I,A), (II,A) g(I)=65% (o mesmo para B)• (I,A), (II,B)
g(I)=0,9x0,45+0,4x0,35+0,4x0,2=0,625• (I,A), (II,C)
g(I)=0,9x0,45+0,9x0,35+0,4x0,2=0,8• ...
Jogos de Soma Zero
• O que um ganha o outro perde• Guerra (será mesmo), medalhas olímpicas,
mercados de demanda fixa.• A soma pode ser constante, não nula.• Jogos estáveis (exemplo anterior). Já tendo
jogado antes, os jogadores repetem as estratégias.
• Jogos instáveis. Um jogador muda a estratégia como resposta à estratégia do outro
Jogos de Soma Zero• Conceito de maxmin e min max: na pior das
hipóteses ganhar o máximo ou perder o mínimo (se perder sempre, para quê jogar?).
• Matriz do segundo jogador é a simétrica da transposta do primeiro jogador.
• Estabilidade: se os dois jogadores concordam com a solução: minmax=maxmin=equilibrio de Nash, ponto de sela (rever as lojas).
Jogo instávelII,A II,B II,C
I,A 2 10 1
I, B 3 -1 -2
II,A II,B
I,A 2 10
I, B 3 -1I,A I,B
II,A - 2 -3
II, B -10 1
Jogo instável
• Não tem equilibrio de Nash se for jogado uma só vez.
• Resolvido em termos de probabilidades• O jogo tem que ser jogado várias vezes
para se obter um equilibrio de Nash em estratégias mistas, isto é, com alternância aleatória de estratégias, segundo uma determinada distribuição de probabilidade
Jogo instável
• Se o jogador II escolhe a sua estratégia A, o ganho esperado do jogador I é:
• E1=2p1+3p2 onde pi é a probabilidade do jogador I escolher a estratégia i (ele controla essa probabilidade, não as escolhas do jogador II).
• Se II escolhe a sua B, temos E2=10p1-p2• A soma das probabilidades é unitária
II,A II,B I,A 2 10 I, B 3 -1
Jogo instável
• O jogador I quer maximizar o seu ganho. Mas, qual deles?
• Deve minimizar o pior caso, que não sabe qual é.• Pior caso: min [(2p1+3p2), (10p1-p2)]• Max E=min [(2p1+3p2), (10p1-p2)]
s.a p1+p2=1p1,p2≥ 0
Isto é um PPNL (problema de programação não linear), não separável, não diferenciável
II,A II,B I,A 2 10 I, B 3 -1
Linearização
• Max (2p1+3p2) se este for o menor (podendo ser igual).
• Ou, Max (10p1-p2) se o menor for este (podendo ser igual)
s.a p1+p2=1p1,p2≥ 0
São, aparentemente, dois Problemas de Programação Linear (PPL). Mas, E sempre será igual a uma das expressões.
II,A II,B I,A 2 10 I, B 3 -1
Linearização
• Max E onde E=(2p1+3p2) e E< (10p1-p2).• Ou, Max E onde E=(10p1-p2) e E< (2p1+3p2)
s.a p1+p2=1p1,p2≥ 0As restrições de menor podem ser agrupadas
com as de igual, dando duas restrições de menor ou igual.
II,A II,B I,A 2 10 I, B 3 -1
Linearização
• Max E s.a E≤ 2p1+3p2E≤ 10p1-p2p1+p2=1p1,p2≥ 0
PPL com 3 variáveis. Pode ser usado o método gráfico?
II,A II,B I,A 2 10 I, B 3 -1
Linearização
• p2=1-p1 e p1 está entre 0 e 1.• Max E s.a E≤ 2p1+3(1-p1)E≤ 10p1-(1-p1)p1≤ 1p1≥ 0
II,A II,B I,A 2 10 I, B 3 -1
Linearização
• p2=1-p1 e p1 está entre 0 e 1.• Max E s.a E≤ -p1+3E≤ 11p1-1p1≤ 1p1≥ 0
II,A II,B I,A 2 10 I, B 3 -1
Gráfico II,A II,B I,A 2 10 I, B 3 -1
Ponto comum às retas:-p1+3=11p1-1, donde p1=1/3 e p2=2/3. E=-1/3 + 3 = 8/3
p1=1/3p1=1/3p1=1/3p1=1/3
JOGOS REPETIDOS
-Jogo possui uma história prévia de conhecimento comum.
-Negócios, política, biologia.-Formação de carteis: o cartel não é estável.
Exemplo: OPEP e a ética entre ladrões.-Ganha-se com coordenação, mas mais ainda
se apenas um trapacear.
COALIZÃO
• Coordenação de quantidades ou preços. O caso extremo é o cartel em que se chega ao preço do monopólio.
• Pode haver conluios explícitos e tácitos.• Os explícitos são, normalmente proibidos
por lei.• Conluios tácitos: empresas dominantes,
pontos focais.
REPETIÇÃO
• E se o jogo for realizado outra vez?• Os jogadores sabem que na segunda vez
não haverá cooperação.• Logo, não há incentivo para cooperação na
primeira.• Pode-se generalizar para qualquer número
de repetições finitas.
JOGOS REPETIDOS
• Loja dominante com número finito de unidades.• Se não valer a pena impedir a concorrência uma
vez, não valerá nunca. Ou seja, não vale a pena ter fama de durona.
• Cartéis existem, obstáculos à concorrência existem. O que falha?
• Hipóteses simplificadoras: custos não conhecidos, modelagem finita não apropriada.
EQUILIBRIOS ADICIONAIS
• Todo o equilíbrio de Nash em jogo simples, também é em jogo repetido.
• Jogos com mais de um equilíbrio de Nash podem gerar repetições em que o equilíbrio não é nenhum dos originais.
• Situação de ameaças
AMEAÇAS Urgente Normal Rápida Especial 4,3 0,0 2,5* Comum 0,1 2,2* 0,1
Primeiro ano: Especial, urgente
Segundo ano: mantém se o compromisso foi honrado, muda para comum normal caso contrário
Qual o novo equilíbrio?
INDUÇÃO À COOPERAÇÃO
• Coerção externa: punições adequadas, custo da estrutura.
• Cooperação espontânea: estratégia severa e de Talião.
• Probabilidade do jogo acabar.• Fatores de desconto e somas infinitas.
DECISÕES SEQUENCIAIS
• Após uma tomada de decisão espera-se um acontecimento para toma a próxima decisão
• O acontecimento pode ser aleatório (árvore de decisão) ou a decisão de outro (jogo sequencial)
• Forma matricial e estendida.
EXEMPLO
• Duas empresas, dominante e desafiante.• Desafiante: entra ou não• Dominante: acomoda ou luta• Não entra, (0,10)• Entra, luta (-1,9)• Entra acomoda (3,7)• Sub jogos e solução reversa
Jogos sequencias contra o acaso
• Segundo jogador não é racional• Podem ser estimadas probabilidades• Valor esperado ou pessimista• Indicar se é decisão ou acaso
Exemplo• Recursos prováveis num terreno• Companhia oferece 60 pelos direitos• Opção para investimentos futuros se os atuais forem
promissores: valor 600• Exploração própria : 100 de custo inicial, 2000 de lucro
se houver exploração positiva• Supor probabilidade de haver o recurso de 60%• E se houver uma opção de terceirizar após a descoberta
do recurso?• E se a empresa tiver outros terrenos para pesquisar?
Métodos Ordinais
• Problema: existem n ordenações (correspondendo a n critério ou n decisores). Como fazer uma ordenação justa?
• O que é uma ordenação justa?
Escolha justa-Axiomas de Arrow
• Independente em relação às alternativas irrelevantes
• Ordem total (sem intransitividades e sem incomparabilidades)
• Unanimidade de Pareto• Universalidade• SÓ MÉTODOS DITATORIAIS
Métodos de ditador
• Ditador puro• Ditadores sucessivos (ou lexicográfico)• De novo as medalhas• Bábá x Azar
Método de Borda
• Chevalier de Borda• Revolução francesa• Soma de postos• Não respeita a independência em relação
às alternativas irrelevantes• Exemplo piorado: Fórmula 1
Borda: retira-se c, d, eD1 D2 D3a b bb a a
a 5b 4
Dependo do conjunto de análise pode-se ter aPb, bPaou aIb.
Método de Condorcet
• Resolver o paradoxo de Borda• Considera apenas as alternativas duas a
duas. • Constrói uma matriz binária• Maria Jean de Caritat, Marquis de
Condorcet
Para o exemplo de Borda: comparações pareadas
a 1 x b 2a 3 x c 0a 3 x d 0a 3 x e 0b 2 x c 1b 2 x d 1b 2 x e 1c 2 x d 1c 1 x e 2d 2 x e 1
Para o exemplo de Borda: matriz de Condorcet
a b c d ea 0 1 1 1b 1 1 1 1c 0 0 1 0d 0 0 0 1e 0 0 1 0
B ganha de todos. É colocado em primeiro e retirado da matriz. Destilação descendente.
Para o exemplo de Borda: matriz de Condorcet
A ganha de todos. É colocado em segundo e retirado da matriz. Destilação descendente.
a c d ea 1 1 1c 0 1 0d 0 0 1e 0 1 0
Para o exemplo de Borda: matriz de Condorcet
c ganha de d que ganha de e que ganha de c. Ciclo de intransitividade. Não fornece ordenação. Paradoxo de Condorcet.
c d ec 1 0d 0 1e 1 0
Método de Copeland:a b c d e
a 0 1 1 1b 1 1 1 1c 0 0 1 0d 0 0 0 1e 0 0 1 0
a=3
b=4
c=1
d=1
e=1Tirou a intransitividade. Empate é bem diferente de intransitividade.
Copeland=Condorcet quando não intrnasitividade.. Quando há. É melhor que Borda para resolver.
Tratamento de empates nas ordenações: Condorcet
: Substituir “ganhar” por “não perder”a b c d
a 1 1 1 1b 1 1 1 1c 0 0 1 1d 0 0 0 1
a,b empatado em primeiro, c em terceiro, d em quarto.
Tratamento de empates nas ordenações: Copeland
:Fazer “linhas menos colunas”
a b c da 1 1 1 1b 1 1 1 1c 0 0 1 1d 0 0 0 1
a,b empatado em primeiro, c em terceiro, d em quarto.
a=2, b=2, c=-1, d=-3
Decisão com risco
• É conhecida uma distribuição de probabilidade
• Valor médio, com seus problemas; moda• Decisão eficiente: conceito de risco• Escolha entre decisões eficientes• Propensão e aversão ao risco.
Utilidade
• Verdadeiro valor do ganho• Definida probabilisticamente. Se definida
deterministicamente chama-se função de valor
• Exemplo: loteria do milhão, área para uma fábrica, nota numa matéria, tamanho de onda, salário, raspadinha...
Utilidade
• Aversão ao risco: utilidade marginal diminui
• Propensão ao risco: utilidade marginal aumenta
• Utilidade assintótica• Teorias psicológicas da utilidade
Utilidade
• Utilidade de von Neumann: Indiferença entre obter um ganho e, com 100% de probabilidade e participar de uma loteria em que o maior valor tem probabilidade p e o menor 1-p. Determinar esse p.
• U(e) =pU(max) + (1-p)U(min)• Se normalizado, U(e) = U(max)• Críticas conduzem a funções de valor
Definições básicas
• Estado de um sistema: situação em que se encontra em determinado tempo
• Vetor de estado: indica a probabilidade de cada estado, em um determinado instante ou etapa do processo
• Processo de Markov: a probabilidade de numa etapa o sistema se encontrar em um determinado estado, depende apenas do estado anterior (sem memória)
• Cadeia de Markov: processo de Markov discreto
Definições básicas
• Probabilidade de transição: a probabilidade de o sistema chegar ao estado j na etapa n+1, dado que na etapa n estava no estado i.
• Matriz de transição: matriz composta das probabilidades de transição
• Propriedades: produto de matrizes de transição é uma matriz de transição, produto de uma matriz de transição por um vetor de estado é um vetor de estado
• Transições sucessivas
Matriz regular
• Pelo menos uma potência da matriz não tem nenhum valor nulo
• Comportamento estático: vP=v• Significa tem um autovalor unitário• O autovetor associado é o vetor de estado no infinito, ou
vetor fixo.• Vetor fixo independe do estado inicial:•
∞→nlim π(n) =
∞→nlim π(0). P n = π
Cada linha da matriz converge para o vetor v
Exemplo: manutenção de uma máquina
• Esperar que a máquina quebre• Trocar no começo do quarto mês• Trocar no começo do terceiro mês• Trocar no começo do segundo mês
1 – a máquina inicia o primeiro mês de operação e a substituiçãofoi planejada.Q – a máquina inicia o primeiro mês de operaçãoe a substituição se deveu a quebra da anterior.2 – a máquina inicia o segundo mês de operação.3 – a máquina inicia o terceiro mês de operação.4 – a máquina inicia o quarto mês de operação.
Exemplo: manutenção de uma máquina
• Custo de troca programada 500• Custo de troca por quebra 1500• Probabilidade de quebrar no mês 1: 0,1• Probabilidade de quebrar até o mês 2: 0,2• Probabilidade de quebrar até o mês 3: 0,5• Probabilidade de quebrar até o mês 4: 1• DETERMINE A POLÍTICA ÓTIMA
Teoria das Filas
• Surge no início do século XX para centrais de telefone.
• Existência de filas: clientes que precisam de um serviço.
• Fonte (população), fila, serviço, sistema
Fonte
• Universo onde se encontram a população que dará origem aos clientes
• População: finita, infinita. Influência na probabilidade de novas chegadas.
• Chegadas simples e em grupo• Chegadas controláveis e incontroláveis• Taxa de chegada (cliente por unidade de tempo).
Pode ser constante ou aleatório. Mede-se o tempo entre duas chegadas.
• Clientes podem ser pacientes ou impacientes
Fila
• Simples e múltiplas• Finita ou infinita• Disciplina: FIFO (PEPS), FILO (PEUS),
aleatória, prioridades.
Serviço
• Simples ou em grupo• Tempo de serviço• Taxa de serviço (numero de clientes por
unidade de tempo)
Parâmetros e critérios
• Congestionamento: tempo do cliente é pouco valorizado
• Ociosidade: tempo do cliente muito valorizado
Parâmetros e critérios
• Comprimento médio da fila Lq
• Número médio de clientes no sistema L• Tempo médio de espera na fila Wq
• Tempo médio de espera no sistema W• Taxa de ocupação• Probabilidade de haver n atendentes
desocupados...
Parâmetros e critérios
• Pn Probabilidade de haver n elementos no sistema
• P (n≥ k) Probabilidade de haver k ou mais elementos no sistema
• P (W>t)• γ taxa de chegada. O seu inverso é o intervalo
médio de chegada.• µ taxa de serviço e seu inverso é o tempo médio
de serviço• ρ Taxa de ocupação
Distribuições usuais
Exponencial negativa f(t) =a.exp (-at)Poisson f(x)= (at)x.exp (-at)/x!Cálculo de valor esperado, variância, CVPropriedade inversaFalta de memória:
P(T>a+b/T>b)=P(T>a+b)/P(T>b)=P(T>a)
Distribuição de chegadas em relação à média
Classificação das filas
• X/Y/Z/W• Entrada, saída, número de servidores,
outras propriedades (finita, paciente...)
• M/M/1
Nascimento e morte M/M/1
• Estado zero para 1 com chegada• Estado 1 para zero com saída, para 2 com
chegada• µP1=λP0• P1 = λP0 /µ• Generalizando: Pn = λnP0 /µn ou • Pn = ρnP0 • Somatório dos P deve ser unitário• Utilizando convergência chega-se à taxa de
desocupação e seu valor
Nascimento e morte M/M/1
• O comprimento do sistema é igual ao valor médio do estado do sistema, somatório de n por Pn.
• L= λ/(µ - λ)• Para a fila, Lq=L-(1-Po)
Exemplo
• Caminhões a serem descarregados• Chegada de 16 por dia
105
124
153
202
501Tempo (minutos)Funcionário
Exemplo
• Caminhão parado: 3000/h• Funcionário 1500/h • Dia de trabalho com 8h• Quantos empregados contratar?
Exemplo
• Verificar o que é melhor para a fila: duplicar a velocidade de atendimento ou duplicar o número de servidores.
Comprimento Limitado e um servidor M/M/1/K
• λn= λ para n de 0 a k-1• λn=0 caso contrário• λmédio= λ(1-Pk)• É preciso distinguir entre taxa de ocupação
e taxa de pressão. A taxa de pressão deste caso equivale à de ocupação no caso M/M/1
Exemplo
• Porto com um guindaste móvel de descarga e dois berços.
• Porto ocupado implica em desviar navios. Custo de 20000 por navio desviado e de 12000 por dia por navio parado.
• Chegadas markovianas de 3 navios por dia e atendimento de 5 navios por dia.
• Expansão para 3 beços custa 1000 por dia. Vale a pena?
Exemplo
• Chegada markoviana de 15 clientes por hora
• Tempo de atendimento médio de 3 minutos• a)Com distribuição constante (variância
nula)• b)Com distribuição uniforme entre 1 e 5
minutos• c)Com distribuição exponencial
Papel dos estoques
• Haver abastecimento quando a procura é superior à oferta• Manter o abastecimento quando não há produção
Modelos de gestão de estoques
• Determinísticos ou Estocásticos• Quanto comprar• Quando comprar• Minimização de custos (incluindo perda de
oportunidade)• Acumulação de estoques – custos de posse• Baixo estoque – mau serviço• Modelos diferentes para vários itens –
classificação ABC
Custos dos estoques
• Aquisição: pagamento ao fornecedor. C1.Q• Encomenda: custos administrativos,
geralmente fixos e sub-avaliados. A• Custo de posse: seguros, aluguel de
espaço, capital imobilizado, obsolescência • Custos de quebra
Modelos determinísticos
• Reposição: instantânea, gradual• Procura: constante, variável• Quebra: permitida, não permitida• Preço: constante, com descontos
Modelos determinísticos
• Reposição instantânea, procura constante, quebra não permitida, sem descontos
• Q: Quantidade encomendada• T: intervalo entre encomendas• r: procura por unidade de tempo
(determinada por modelos de previsão, aqui suposta conhecida)
• Q=Tr
Modelos determinísticos
• Custo de encomenda: A• C2: manter uma unidade de artigo numa
unidade de tempo. Custo de todas as unidade, variáveis no tempo, é a integral ao longo do período T= C2(Q/2)T
• CT=A+C2(Q/2)T• Ciclos de tamanho diferente não são
comparáveis.
Modelos determinísticos
• Custo por unidade de tempo• K=CT/T=A/T + C2Q/2=Ar/Q + C2Q/2• Custo mínimo: deriva e iguala a zero• Q*=(2Ar/C2)1/2
• E os custos de aquisição C1Q?• A derivada é nula, não interferem nos
valores ótimos das variáveis de decisão
Análise de sensibilidade
Modelo robusto, curva quase plana no mínimo.; Melhor comprar mais que menos. E o JIT,como fica?
Outros casos
• Reposição não instantânea: fazer o gráfico e calcular nova integral
• Demanda variável: fazer o gráfico e calcular nova integral
• Quebra permitida: incluir o custo de quebra. Nova variável é quanto de quebra se permite. Problema com derivadas parciais
• Custo de encomenda variável: incluir esse custo no custo total e resolver novo problema de otimização
Exemplo
• Consumo: 10000/ano• Custo unitário: 3100 até 2000 unidades, 3000
entre 2000 e 5000 unidades, 2900 para mais de 5000 unidades
• Custo fixo 5000• Custo de posse 600/unidade/ano (na verdade tem
pequenas variações pelos descontos)• Calcular o lote ótimo
Modelos Estocásticos
• Encomenda fixa no ponto de encomenda, intervalos variáveis
• Intervalos de tempo fixos, quantidade variável
• Ambas trabalham com estoques de segurança
• Simulação
Top Related