INF 1771 – Inteligência Artificial Aula 12 – Planejamento Edirlei Soares de Lima.

INF 1771 – Inteligência ArtificialINF 1771 – Inteligência Artificial

Aula 12 – Planejamento

Edirlei Soares de Lima

LOGO Introdução

Agentes vistos anteriormente:Agentes baseados em busca.

Busca cega;Busca heurística;Busca local;

Agentes baseados em lógica.Lógica proposicional;Lógica de primeira ordem;Prolog;

LOGO Introdução

Planejamento consiste na tarefa de apresentar uma sequência de ações para alcançar um determinado objetivo.

Ir(Mercado), Comprar(Biscoito), Ir(Farmácia), Comprar(Remédio), Ir(Casa)

Dado um objetivo, um agente planejador deve ser capaz de construir um plano de ação para chegar ao seu objetivo.

Após planejar, o agente deve executar as ações do plano uma a uma.

LOGO Funcionamento de um Agente Planejador

Inicialmente um agente planejador gera um objetivo a alcançar.

Constrói um plano para atingir o objetivo a partir do estado atual do ambiente.

Executa o plano do começo ao fim.

Gera um novo objetivo com base no novo estado do ambiente.

LOGO Planejamento

Em planejamento clássico o ambiente do problema possui as seguintes características:

Observável;Determinístico;Finito;Estático;

LOGO Resolução de Problemas X Planejamento

Algoritmos de busca tendem a tomar ações irrelevantes.

Grande fator de ramificação.Pouco conhecimento para guiar a busca.

Planejador não considera ações irrelevantes.

Faz conexões diretas entre estados (sentenças) e ações (pré-condições + efeitos)Objetivo: Ter(Leite).

Ação: Comprar(Leite) => Ter(Leite)

Em problemas do mundo real é difícil definir uma boa heurística para algoritmos de busca heurística.

Um planejador tem acesso a representação explícita do objetivo.

Objetivo: conjunção de sub-objetivos que levam ao objetivo final.Heurística única: número de elementos da conjunção não-satisfeitos.

Algoritmos de busca não tiram proveito da decomposição do problema.

Planejadores aproveitam a estrutura do problema. É possível decompor com facilidade sub-objetivos.

Exemplo: Ter(A) Λ Ter(B) Λ Ter(C) Λ Ter(D)

LOGO Linguagem STRIPS

Linguagem formal para a especificação de problemas de planejamento.

Representação de estados: conjunção de literais positivos sem variáveis.

Inicial: Em(Casa)

Final: Em(Casa) ^ Ter(Leite) ^ Ter(Bananas) ^ Ter(Furadeira)

Hipótese do mundo fechado: qualquer condição não mencionada em um estado é considerada negativa.

Exemplo: ¬Ter(Leite) ^ ¬Ter(Bananas) ^ ¬Ter(Furadeira)

Objetivos: conjunção de literais e possivelmente variáveis:

Em(Casa) ^ Ter(Leite) ^ Ter(Bananas) ^ Ter(Furadeira)Em(x) ^ Vende(x, Leite)

Ações são especificadas em termos de pré-condições e efeitos:

Descritor da ação: predicado lógicoPré-condição: conjunção de literais positivosEfeito: conjunção de literais (positivos ou negativos)

Operador para ir de um lugar para outro:

Ação(Ir(Destino), Pré-condição Em(Partida) ^ Caminho(Partida, Destino), Efeito Em(Destino) ^ ¬ Em(Partida))

LOGO Exemplo – Transporte Aéreo de Carga

Início(Em(C1, SFO) ^ Em(C2,JFK) ^ Em(A1,SFO) ^ Em(A2,JFK) ^ Carga(C1) ^ Carga(C2) ^ Avião(A1) ^ Avião(A2) ^ Aeroporto(JFK) ^ Aeroporto(SFO))

Objetivo(Em(C1,JFK) ^ Em(C2,SFO))

Ação(Carregar(c,a,l)PRÉ-CONDIÇÃO: Em(c,l) ^ Em(a,l) ^ Carga(c) ^ Avião(a) ^ Aeroporto(l)EFEITO: ¬Em(c,l) ^ Dentro(c,a))

Ação(Descarregar(c,a,l)PRÉ-CONDIÇÃO: Dentro(c,a) ^ Em(a,l) ^ Carga(c) ^ Avião(a) ^ Aeroporto(l)EFEITO: Em(c,l) ^ ¬Dentro(c,a))

Ação(Voar(a,de,para)PRÉ-CONDIÇÃO: Em(a,de) ^ Avião(a) ^ Aeroporto(de) ^ Aeroporto(para)EFEITO: ¬ Em(a,de) ^ Em(a,para))

LOGO Tipos de Planejadores

Formas de Buscas de Planos:Progressivo: estado inicial -> objetivo.Regressivo: objetivo -> estado inicial.

mais eficiente (há menos caminhos partindo do objetivo do que do estado inicial)

Espaços de busca:Espaço de situações: Funciona da mesma forma que na resolução de problemas por meio de busca.

Espaço de planos: planos parciais.mais flexível.

LOGO Busca em Espaço de situações

A busca em espaço de situações é ineficiente devido a ela não considerar o problema das ações irrelevantes. Todas as opções de ações são testadas em cada estado.

Isso faz com que a complexidade do problema cresça muito rapidamente.

Solução? Busca no espaço de planos parciais (planejamento de ordem parcial).

LOGO Planejamento de Ordem Parcial

Subdivisão do problema.

Ordem de elaboração do plano flexível.

Compromisso mínimo.Adiar decisões durante a procura.

O planejador de ordem parcial pode inserir duas ações em um plano sem especificar qual delas deve ser executada primeiro.

LOGO Exemplo dos Sapatos

Inicio()

Objetivo(SapatoDireitoCalçado^SapatoEsquerdoCalçado)

Ação(SapatoDireito, PRECOND: MeiaDireitaCalçada, EFFECT: SapatoDireitoCalçado)

Ação(MeiaDireita, EFFECT: MeiaDireitaCalçada)

Ação(SapatoEsquerdo, PRECOND: MeiaEsquerdaCalçada, EFFECT: SapatoEsquerdoCalçado)

Ação(MeiaEsquerda, EFFECT: MeiaEsquerdaCalçada)

Um planejador de ordem parcial deve ser capaz de chegar a duas sequências de ações:

MeiaDireita seguido por SapatoDireito;MeiaEsqueda seguido por SapatoEsquerdo.

As duas sequências podem ser combinadas para produzir o plano final.

Plano de Ordem Parcial

Plano de Ordem Total

O planejamento de ordem parcial pode ser implementado como uma busca no espaço de ordem parcial de planos.

Idéia:Busca-se um plano desejado em vez de uma situação desejada (meta-busca).Parte-se de um plano inicial (parcial) e aplica-se 2 tipos de operadores até chegar a um plano final (completo)

Plano Final:Completo: todas as pré-condições de todas as ações são alcançada por meio de alguma outra ação.Consistente: não há contradições.

Operador de refinamento:adicionar novo passo;instanciar variável;ordenar passos;

Operador de modificação:operadores de revisão (para corrigir planos);operadores de decomposição hierárquica;

Na estratégia de compromisso mínimo a ordem e instanciações totais são decididas quando necessário.

Exemplo:

Para objetivo Ter(Leite), a ação Comprar(Produto, Loja), instancia-se somente item: Comprar(Leite, Loja)

Para o problema de colocar meias e sapatos: colocar cada meia antes do sapato, sem dizer por onde começar (esquerda ou direita)

Planos são definidos por 4 componentes:

Ações/Passos: Ação(x, Precondição y, Efeito z)�

Restrições de Ordenação: S1 < Sk < Sn, o que não significa que entre S1 e Sk não exista outro passo

Vínculos Causais: {Si c Sj} Efeitos da ação Si = pré-condições da ação Sj. Não existe �nenhum passo entre eles que negue a pré-condição c.

Pré-condições Abertas:Não é alcançada por nenhuma ação do plano.

LOGOExemplo dos Sapatos

Objetivo: SapatoDireitoCalçado ^ SapatoEsquerdoCalçado

Operadores:

Ação(SapatoDireito, PRECOND: MeiaDireitaCalçada, EFFECT: SapatoDireitoCalçado)Ação(MeiaDireita, EFFECT: MeiaDireitaCalçada)Ação(SapatoEsquerdo, PRECOND: MeiaEsquerdaCalçada, EFFECT: SapatoEsquerdoCalçado)Ação(MeiaEsquerda, EFFECT: MeiaEsquerdaCalçada)

Plano Inicial:

Plano(Passos:{S1: Operador(Ação: Inicio), S2: Operador(Ação: Fim, Precondição: SapatoDireitoCalçado ^ SapatoEsquerdoCalçado)},

ORDENAÇÃO: { S1 < S2 }, VINCULOS: {}, PRECONDIÇÕES_ABERTAS: {})

Características do planejamento de ordem parcial:

A inserção de um passo só é considerada se ele atender uma precondição não atingida.O planejador é regressivo.É correto e completo, assumindo busca em largura ou em profundidade iterativa

Idéia do algoritmo:Identificar um passo com a pré-condição (sub-goal) não satisfeita.Introduzir um passo cujo efeito satisfaz a pré-condição.Instanciar variáveis e atualizar as ligações causais.Verificar se há conflitos e corrigir o plano se for o caso.

LOGO Exemplo

Plano Inicial:

Ações:Op(ACTION: Go(there), PRECOND: At(here), EFFECT: At(there) ¬ At(here))Op(ACTION: Buy(x), PRECOND: At(store) Sells(store, x), EFFECT: Have(x))

LOGO Exemplo

Go(HWS)

At(Home)

Go(SM)

At(Home)

At(SM),Sells(HWS,Drill)

Buy(Drill) Buy(Bananas)Buy(Milk)

Sells(SM, Milk) At(SM), Sells(SM, Bananas)At(HWS),

Have(Milk),Have(Drill), Have(Bananas), At(Home)

Finish

Conflito At(Home)

LOGO Conflito em Planejamento de Ordem Parcial

Um conflito ocorre quando os efeitos de uma ação põem em risco as pré-condições de outra ação.

No caso anterior, os operadores Go(HWS) e Go(SM) apagam At(Home).

LOGO Solução de Conflitos

Demotion e Promotion

LOGO ExemploStart

Go(HWS)

Buy(Drill)

Go(SM)

Buy(Milk) Buy(Ban.) Go(Home)

Finish

At(Home)

At(HWS), Sells(HWS,Drill)

At(HWS)

At(SM) Sells(SM,Milk) At(SM)

At(Home)

At(SM) Sells(SM,Ban.)

Have(Milk) Have(Ban.)Have(Drill)

Resolve o conflito

LOGO Exemplo

Plano de Ordem Parcial

LOGO Aplicações de Planejamento

Qualquer problema que necessite de passos/ações para chegar a um determinado objetivo.

Exemplos:

Robôs que realizam tarefas.

Personagens de jogos direcionados a objetivos.

Geração de histórias para storytelling interativo.

INF 1771 – Inteligência Artificial Aula 12 – Planejamento Edirlei Soares de Lima.

Documents

Transcript of INF 1771 – Inteligência Artificial Aula 12 – Planejamento Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Aula 22 – Redes Neurais Edirlei Soares de Lima.

INF 1771 INF 1771 ––––Inteligência ArtificialInteligência ...edirlei.3dgb.com.br/aulas/ia/IA_Aula_25_Algoritmos_Geneticos.pdf · mecanismo de seleção natural que atua

INF 1771 – Inteligência Artificial Aula 15 – Incerteza Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Aula 14 – Aprendizado de Máquina Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Aula 22 – Incerteza Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 10 – Planejamento.

INF 1771 – Inteligência Artificial Aula 11 – Planejamento Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 19 – Aprendizado Por Reforço.

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 21 – Waypoints e Pathfinding.

INF 1771 Inteligência Artificial - edirlei.3dgb.com.bredirlei.3dgb.com.br/.../IA_Aula_19_Aprendizado_Por_Reforco.pdf · Aula 24 – Aprendizado Por Reforço Edirlei Soares de Lima

INF 1771 – Inteligência Artificial Aula 09 – Prolog Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 06 – Algoritmos Genéticos.

INF 1771 – Inteligência Artificial Aula 01 - Introdução Edirlei Soares de Lima.

INF 1771 Inteligência Artificial - edirlei.3dgb.com.bredirlei.3dgb.com.br/aulas/ia_2012_1/IA_Aula_15_Arvores_de_Decisao.pdf · INF 1771 – Inteligência Artificial Aula 15 – Árvores

INF 1771 Inteligência Artificialedirlei.3dgamebuilder.com.br/aulas/ia_2012_1/IA_Aula_21_Aprendizado...INF 1771 – Inteligência Artificial Aula 21 – Aprendizado Por Reforço Edirlei

INF 1771 – Inteligência Artificial Aula 12 – Aprendizado de Máquina Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Aula 10 – Prolog Edirlei Soares de Lima.

INF 1771 Inteligência Artificial - Edirlei

INF 1771 – Inteligência Artificial Aula 02 – Agentes Inteligentes Edirlei Soares de Lima.

INF 1771 – Inteligência Artificial Edirlei Soares de Lima Aula 16 – Redes Neurais.