Simulação da Movimentação de Pedestres

download Simulação da Movimentação de Pedestres

of 138

Transcript of Simulação da Movimentação de Pedestres

  • UNIVERSIDADE FEDERAL DO PARAN

    MARINA VARGAS REIS DE PAULA GONALVES

    SIMULAO DA MOVIMENTAO DE PEDESTRES ASSUMINDO

    VARIVEIS PSICOCOMPORTAMENTAIS

    CURITIBA

    2014

  • MARINA VARGAS REIS DE PAULA GONALVES

    SIMULAO DA MOVIMENTAO DE PEDESTRES ASSUMINDO

    VARIVEIS PSICOCOMPORTAMENTAIS

    Tese apresentada ao Programa de Ps-Graduao em

    Mtodos Numricos em Engenharia, rea de Concen-

    trao em Programao Matemtica, do Departamento

    de Matemtica e Departamento de Engenharia de Pro-

    duo, Setor de Cincias Exatas e do Departamento de

    Construo Civil, Setor de Tecnologia, Universidade Fe-

    deral do Paran, como parte das exigncias para a ob-

    teno do ttulo de Doutor em Cincias.

    Orientadora: Profa. Dra. Liliana Madalena Gramani

    Coorientador: Prof. Dr. Marco Andr Argenta

    Coorientador: Prof. Dr. Eloy Kaviski

    CURITIBA

    2014

  • G635s

    Gonalves, Marina Vargas Reis de Paula

    Simulao da movimentao de pedestres assumindo variveis psicocomportamentais / Marina Vargas reis de Paula Gonalves. Curitiba, 2014.

    137f. : il. color. ; 30 cm. Tese (doutorado) - Universidade Federal do Paran, Setor de Cincias

    Exatas, Programa de Ps-graduao em Mtodos Numricos em Engenharia, 2014.

    Orientadora: Liliana Madalena Gramani -- Co-orientador: Marco Andr

    Argenta -- Co-orientador: Eloy Kaviski. Bibliografia: p. 131-137.

    1. Trfego de Pedestres. 2. Variveis Psicocomportamentais. 3. Inteligncia Artificial. 4 Modelagem Computacional I. Universidade Federal do Paran. II. Gramani, Liliana Madalena. III. Argenta, Marco Andr. IV. Kaviski, Eloy. V. Ttulo.

    CDD: 511.8

  • Ao meu marido Marco e as nossa filhas gmeas Manuela e Laura.

  • AGRADECIMENTOS

    Aos meus pais, Jlio e Ana Luiza, por todo o apoio sempre e incondicional aos

    meus estudos e nas minhas decises de vida.

    A minha irm Marcela, por podermos compartilhar experincias e com isso apren-

    der sempre mais.

    Ao meu marido e co-orientador, Prof. Dr. Marco Andr Argenta, pois sem seu

    apoio nada teria sido realizado. Foi a minha inspirao.

    As minhas filhas. Por seus sorrisos e beijinhos nas horas mais difceis.

    Aos meus sogros, Jeime e Elair, por me ajudarem tantas vezes em casa, com as

    meninas, quando eu precisei estudar.

    Aos meus amigos Tati, Vanessinha, Guilherme, Fbio, Maiko, Lu, Vnia, Josu,

    Sandro e, me perdoem os que esqueci, por me fornecerem tantos bons momentos de

    discusso, de relaxamento e muitos sorrisos durante esses quatro anos.

    A Profa. Dra. Liliana M. Gramani, por me orientar desde o incio da minha vida

    como pesquisadora.

    No poderia deixar de fora nossa eterna secretria do PPGMNE, Maristela Bandil.

    Minha querida amiga.

    Agradeo a CAPES pelo apoio financeiro e a todos os funcionrios do CESEC, da

    Biblioteca e at da Cantina pela ajuda, pelo espao sempre limpo, pelos cafezinhos,

    em todas as ocasies.

    Vrias pessoas me auxiliaram neste trabalho. A todos s posso dizer: Muito Obri-

    gada!

  • Se enxerguei mais longe, foi por me erguer sobre os ombros de

    gigantes.

    Sir Isaac Newton

  • RESUMO

    O objetivo deste trabalho o desenvolvimento de um modelo fsico-matemtico com-putacional utilizando inteligncia artificial para simulao e anlise da movimentaode pedestres, em ambientes que podem gerar comportamentos desordenados devidoa altos nveis de estresse. Aliando Inteligncia Artificial, que inclui raciocnio proba-bilstico, aprendizagem de mquina e conceitos de robtica possvel simular o des-locamento de pedestres assumindo variveis psicocomportamentais para que essesagentes possam distinguir situaes virtuais impostas pelo ambiente e tomar deci-ses. Estudos de fluxo de pedestres foram empreendidos, em especial nas ltimastrs dcadas. Entretanto, a existncia de fatores psicocomportamentais transformaesse tipo de sistema em algo extremamente complexo. Se o organismo de um pe-destre submetido a situaes desconfortveis ou de impotncia ocorre um aumentona ansiedade que gera estresse. Esse estresse produz uma cadeia de reaes quepodem variar de irritabilidade, desorientao e at pnico. Essa gama de variveispode alterar o fluxo pedonal de forma significativa e justamente esse o maior pro-blema quando se procura um modelo de movimentao de pedestres. A modelagemcomputacional viabilizada utilizando-se linguagem de programao Python, por seruma linguagem de alto nvel, otimizada para o programador ou seja, de fcil imple-mentao e aprendizado, possui vrios ambientes integrados e portvel a todos ossistemas operacionais, alm de ter mdulos para processamento grfico. O entendi-mento da movimentao de pedestres, tendo como foco principal seu comportamento,permite expandir a anlise para ambientes mais complexos resultando em uma ferra-menta de auxlio em situaes com multides em diferentes ambientes. Neste tra-balho desenvolveu-se um modelo bidimensional com visualizao tridimensional deum ambiente genrico, simulando-se agentes inteligentes desconfortveis, represen-tativas de comportamentos psicolgicos humanos genricos, capazes de identificarsituaes e tomar decises. Comparaes com trabalhos j constantes na literaturasobre fluxo de pedestres ilustram as discusses.

    Palavras-chave: Trfego de Pedestres. Variveis Psicocomportamentais. IntelignciaArtificial. Modelagem Computacional. Agentes BDI.

  • ABSTRACT

    The aim of this work is to develop a physical-mathematical computational model usingartificial intelligence to simulate and analyze the movement of pedestrians in environ-ments that can generate disordered behaviors due to high stress levels. CombiningArtificial Intelligence, which includes probabilistic reasoning, machine learning and ro-botics concepts it is possible to simulate the movement of pedestrians coupled withpsycho-behavioral variables so that these agents can distinguish virtual situations im-posed by the environment and make decisions. Pedestrian flow studies have beenundertaken, especially in the last three decades. However, the existence of psycho-behavioral factors turns such system into something extremely complex. If the or-ganism of the pedestrian is submitted to uncomfortable or powerlessness situations,the anxiety that creates stress increases. This stress produces a chain of reactionsthat can vary from irritability, disorientation and even panic. This variation can changesignificantly the pedestrian flow and this is the biggest problem when the aim is a repre-sentative pedestrian movement model. Computer modeling is done using the Pythonprogramming language, because it is a high-level language, optimized for program-mer, ie, easy implementation and learning, has several built-in environments and isportable to all operating systems, besides having modules for graphics processing.Understanding the movement of pedestrians, focusing mainly on their behavior, al-lows expanding the analysis to more complex environments resulting in an auxiliarytool in situations with crowds in different environments. In this work we developed atwo-dimensional model with three-dimensional visualization of a generic environment,simulating uncomfortable intelligent agents, representatives of a human generic psy-chological behavior, able to identify situations and make decisions. Comparisons withliterature papers on pedestrian flow studies illustrate the discussions.

    Key-words: Pedestrian Traffic; Psycho-behavioral variables, Artificial Intelligence, Com-puter Simulation.

  • LISTA DE FIGURAS

    FIGURA 1 GRAFOS DIRIGIDOS ACCLICOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    FIGURA 2 CONSTRUO DA CURVA BZIER CBICA. . . . . . . . . . . . . . . . . . . . 51

    FIGURA 3 RECURSO DE DE CASTELJAU. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

    FIGURA 4 TEM-SE QUE P0 = B0,0, P1 = B1,0, P2 = B2,0 E P3 = B3,0. FONTE:

    WIKIMEDIA.ORG. AUTOR: PHIL TREGONING, 2007. . . . . . . . . . . . . . . 57

    FIGURA 5 COMPARAO ENTRE AS DIMENSES DE PEDESTRES E CI-

    LINDROS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    FIGURA 6 REPRESENTAO DO CONE DE VISO GIRANDO PELO AMBI-

    ENTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    FIGURA 7 CONE DE REVOLUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    FIGURA 8 PONTO P EM XOY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    FIGURA 9 PLANO CARTESIANO COM PONTOS A, B E C. . . . . . . . . . . . . . . . . . 61

    FIGURA 10 CENTROIDES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    FIGURA 11 COLISO ENTRE CILINDROS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

    FIGURA 12 COLISO ENTRE PARALELEPPEDOS E CILINDROS. . . . . . . . . . . 62

    FIGURA 13 CAMINHADA DE UM ROB DE ACORDO COM A SOLUO

    DE UM PF. FONTE: SEQUENTIAL MONTE CARLO METHODS IN

    PRACTICE, 2001. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    FIGURA 14 CAMINHADA DE UM ROB DE ACORDO COM A SOLUO DE

    UM PF. FONTE: A PARTICLE FILTER TUTORIAL FOR MOBILE RO-

    BOT LOCALIZATION, 2004. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

    FIGURA 15 PORTAS FICTCIAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

    FIGURA 16 ESCOLHA DOS PONTOS DE CONTROLE A PARTIR DO PF. . . . . 69

    FIGURA 17 FLUXOGRAMA REPRESENTATIVO PARA UM AGENTE BDI SE-

    GUNDO UM I-PLAN. ADAPTADO DE RENS, FERREIN E POEL (2009). 70

  • FIGURA 18 REPRESENTAO DE UM CILINDRO PELO VPYTHON. FONTE:

    DOCUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    FIGURA 19 REPRESENTAO DE UMA CAIXA NO VPYTHON. FONTE: DO-

    CUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    FIGURA 20 AGENTES ACOPLADOS A SEUS CONES DE VISO, FAZENDO

    A DETECO DE OBSTCULOS PARA SUAS CAMINHADAS. . . . . . 76

    FIGURA 21 REPRESENTAO DE UM CONE NO VPYTHON. FONTE: DO-

    CUMENTAO DO VPYTHON. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

    FIGURA 22 DETECO DE CONTATO ENTRE O CONE DE VISO E AS PA-

    REDES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    FIGURA 23 RASTRO DE ESFERAS. FONTE: DOCUMENTAO DO VPYTHON. 78

    FIGURA 24 PONTOS DE CONTROLE ALINHADOS NAS PORTAS. . . . . . . . . . . 80

    FIGURA 25 HIPTESE DE DOIS AGENTES DE CADA PERSONALIDADE CON-

    TIDOS NO AMBIENTE DE TESTES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    FIGURA 26 VISUALIZAES DO AMBIENTE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

    FIGURA 27 CHOQUES ENTRE AGENTES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    FIGURA 28 DECISO DO AGENTE RACIONAL (SALA 2) AO ENTRAR NA

    PORTA D. TEMPO: 3S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

    FIGURA 29 DECISO DOS AGENTES RACIONAIS (SALA 1 E 2) E DOS AGEN-

    TES EMOTIVO, EXPERIMENTAL E CUSTDIA (SALA 2). TEMPO:

    9S. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

    FIGURA 30 DECISES DOS AGENTES NO TEMPO: 13S. . . . . . . . . . . . . . . . . . . . 89

    FIGURA 31 DECISO DOS AGENTES NO TEMPO: 15S. . . . . . . . . . . . . . . . . . . . . 90

    FIGURA 32 DECISO DOS AGENTES NO TEMPO: 19S. . . . . . . . . . . . . . . . . . . . . 90

    FIGURA 33 TEMPO DE EVACUAO DAS QUATRO PERSONALIDADES. . . . 91

    FIGURA 34 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-

    DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

    FIGURA 35 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-

    TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 93

  • FIGURA 36 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-

    SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

    FIGURA 37 DISTNCIAS MDIAS PERCORRIDAS E DESVIO PADRO, PARA

    CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

    FIGURA 38 AMBIENTE GERAL E POSIO INICIAL DOS AGENTES. . . . . . . . 96

    FIGURA 39 AMBIENTE COMPOSTO APENAS POR AGENTES RACIONAIS. 96

    FIGURA 40 AMBIENTE COMPOSTO APENAS POR AGENTES EXPERIMEN-

    TAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    FIGURA 41 AMBIENTE COMPOSTO APENAS POR AGENTES CUSTDIAS. 98

    FIGURA 42 AMBIENTE COMPOSTO APENAS POR AGENTES EMOTIVOS. . 99

    FIGURA 43 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-

    TES RACIONAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    FIGURA 44 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-

    DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES

    RACIONAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

    FIGURA 45 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-

    DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

    FIGURA 46 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-

    TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 103

    FIGURA 47 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-

    SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

    FIGURA 48 DISTNCIAS MDIAS PERCORRIDAS E DESVIO PADRO, PARA

    CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .105

    FIGURA 49 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-

    TES EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .106

    FIGURA 50 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-

    DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES

    EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .107

    FIGURA 51 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-

    DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

  • FIGURA 52 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-

    TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 108

    FIGURA 53 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-

    SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

    FIGURA 54 DISTNCIAS MDIAS PERCORRIDAS E DESVIO PADRO, PARA

    CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .110

    FIGURA 55 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-

    TES CUSTDIAS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .111

    FIGURA 56 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-

    DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES

    EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .112

    FIGURA 57 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-

    DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

    FIGURA 58 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-

    TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 113

    FIGURA 59 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-

    SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

    FIGURA 60 DISTNCIAS MDIAS PERCORRIDAS E DESVIO PADRO, PARA

    CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115

    FIGURA 61 AMBIENTE COMPOSTO POR UM NMERO MAIOR DE AGEN-

    TES EMOTIVOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

    FIGURA 62 TEMPOS MDIOS DE EVACUAO DAS QUATRO PERSONALI-

    DADES EM UM AMBIENTE COM MAIOR NMERO DE AGENTES

    EXPERIMENTAIS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .117

    FIGURA 63 PORTAS DE SADA DO AMBIENTE DE TESTES MAIS UTILIZA-

    DAS POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    FIGURA 64 NMERO DE VEZES QUE CADA PORTA DO AMBIENTE DE TES-

    TES UTILIZADA POR CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . 118

    FIGURA 65 VELOCIDADES MDIAS E DESVIO PADRO, PARA CADA PER-

    SONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

    FIGURA 66 DISTNCIAS MDIAS PERCORRIDAS E DESVIO PADRO, PARA

  • CADA PERSONALIDADE. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120

    FIGURA 67 MDIA DE TEMPO DE EVACUAO DE TODAS AS SEES

    ANTERIORES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

    FIGURA 68 PORTAS DE SADA MAIS UTILIZADAS POR CADA PERSONALI-

    DADE LEVANDO EM CONSIDERAO TODAS AS SEES ANTE-

    RIORES. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

    FIGURA 69 QUANTIDADE DO USO DE PORTAS POR PERSONALIDADE. . . 123

    FIGURA 70 VALOR MDIO DAS DISTNCIAS PERCORRIDAS POR CADA

    PERSONALIDADE EM TODAS AS SIMULAES REALIZADAS. . . 123

    FIGURA 71 VALOR MDIO DAS VELOCIDADES DE CADA PERSONALIDADE

    EM TODAS AS SIMULAES REALIZADAS. . . . . . . . . . . . . . . . . . . . . . . 124

    FIGURA 72 SIMULAO COM AGENTES SEM CUSTOS. . . . . . . . . . . . . . . . . . . . 125

  • LISTA DE SIGLAS

    HCM Highway Capacity Manual

    TRB Transportation Research Board

    AI Artificial Intelligence

    MAS Multi-Agent System

    BN Bayes Network

    HMMs Hidden Markov Models

    MDPs Markov Decision Processes

    POMDPs Partially Observable Markov Decision Processes

    PDF Probability Density Function

    MLLS Maximum Likelihood Laplace Smoothing

    MCMC Markov chain Monte Carlo

    SIS Sequential Importance Sampling

    PFs Particle Filters

    BDI Belief, Desire, Intention

    FOV Field of Vision

    UFBA Universidade Federal da Bahia

  • SUMRIO

    1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

    1.1 OBJETIVOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    1.1.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    1.1.2 Objetivo Especfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    1.2 JUSTIFICATIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

    1.3 CONTRIBUIES DA TESE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    1.4 ORGANIZAO DO TEXTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

    2 REVISO BIBLIOGRFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

    3 FUNDAMENTAO TERICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    3.1 INTELIGNCIA ARTIFICIAL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

    3.1.1 Conceitos de Inteligncia Artificial - AI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

    3.2 MODELOS PROBABILSTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

    3.2.1 Mtodos ocultos de Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

    3.2.2 Filtro de Partculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

    3.3 PROCESSO DE MARKOV PARCIALMENTE OBSERVVEL . . . . . . . . . . . . . . . . 36

    3.3.1 Descrio Matemtica do Processo de Deciso de Markov Parcialmente Ob-servvel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    3.4 AGENTE BASEADO EM CRENA, DESEJO E INTENO . . . . . . . . . . . . . . . . . 39

    3.4.1 Agentes BDI a partir de polticas timas de POMDPs . . . . . . . . . . . . . . . . . . . . . . 41

    3.4.2 Passagem de Poltica para I-Plans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    3.5 PLANEJAMENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

    3.6 VARIVEIS PSICOCOMPORTAMENTAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

    3.7 CURVAS DE BZIER . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

  • 3.7.1 Propriedades das Curvas de Bzier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

    3.7.2 Propriedades das funes de Bernstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    3.7.3 Algoritmo de De Casteljau para soluo da curva de Bzier . . . . . . . . . . . . . . . . 55

    3.8 INTERAES GEOMTRICAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

    3.8.1 Deteco de um ponto dentro de um cone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    3.8.2 Ponto de Interseco entre retas finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

    3.8.3 Colises entre formas geomtricas dinmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

    3.9 PYTHON . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    4 MTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    4.1 GERAO DE I-PLANS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

    4.1.1 Memria curta e memria longa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

    4.1.2 Combinando planejamento do POMDP com o Modelo de agente BDI . . . . . . 71

    4.2 INTERAES ENTRE AGENTES E AMBIENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

    4.2.1 Agente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

    4.2.2 Paredes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    4.2.3 Cone de Viso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

    4.2.4 Mdulos Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

    4.3 PASSAGEM DE UMA BZIER PARA OUTRA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

    4.4 CUSTOS DE MOVIMENTAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

    5 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    5.1 QUATRO PERSONALIDADES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

    5.2 AMBIENTE COM NICA PERSONALIDADE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

    5.2.1 Agentes Racionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

    5.2.2 Agentes Experimentais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

    5.2.3 Agentes Custdias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

    5.2.4 Agentes Emotivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

  • 5.3 AMBIENTE DESBALANCEADO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

    5.3.1 Racionais em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    5.3.2 Experimentais em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .105

    5.3.3 Custdia em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

    5.3.4 Emotivos em maior nmero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115

    5.4 PROBABILIDADES GERAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .120

    5.5 VALIDAO DOS RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .124

    6 DISCUSSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

    7 CONCLUSES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .129

    8 SUGESTO PARA TRABALHOS FUTUROS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

    REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .131

  • 17

    1 INTRODUO

    Um modelo uma representao simplificada de um sistema, cuja finalidade, emgeral, fazer com que um sistema complexo e de manipulao arriscada seja apresen-tado em um formato de compreenso mais simples. Os modelos podem ser usadostambm para representar sistemas que, em operao, possam causar alguma espciede dano ou prejuzo, de forma que, usando-se simulaes no causem consequnciasdanosas. Em alguns casos, como situaes de movimentao de multides com altosnveis de estresse por exemplo, os testes nem poderiam ser realizados, j que seriaconsiderado antitico levar pessoas a situaes de pnico e perigo sem necessidade,tendo como soluo a utilizao de simulaes. Quando refere-se a simulao de pe-destres, a maioria dos modelos especificada para analisar e gerar previses sobreo comportamento global de um grupo de pedestres frente a situaes de evacuaoe interao de multides (ASHIDA et al., 2001; TEKNOMO, ; HAMAGAMI; HIRATA,2003; LERNER et al., 2009).

    Um bom modelo de fluxo de pedestres precisa ser capaz de simular o comporta-mento humano diante de diversas situaes, preservando as caractersticas essenci-ais do mundo real, por exemplo as caractersticas comportamentais e psicolgicas dospedestres, de modo que os resultados da simulao gerada por este modelo sejamiguais ou semelhantes queles do sistema original modelado.

    Para a construo do modelo proposto neste trabalho, um levantamento biblio-grfico na rea de dinmica de multides, psicologia social, pnico e comportamentocoletivo ser realizado para que seja possvel utilizar variveis psicocomportamentais.A anlise crtica e processamento destas informaes, verificando-se tendncias so-bre a movimentao de pedestres em situaes de estresse definiro a estrutura domodelo.

    Para o processo de modelagem de agentes autnomos que seguem comporta-mentos similares aos comportamentos humanos, ser necessrio o estabelecimentode premissas, j que os estudos psicolgicos mostram tendncias, mas raramentequantificam os fenmenos. Essas premissas sero traduzidas computacionalmenteem linguagem probabilstica, que aliadas a inteligncia artificial representaro as vari-veis psicocomportamentais que se deseja simular. Essas mesmas variveis psicocom-portamentais sero inspiradas nos estudos da pesquisadora Angela Behrendt (2011),que vem pesquisando h alguns anos o comportamento humano e avalia esse com-portamento em grupos de pessoas em empresas, sendo que, recentemente (2013)

  • 18

    realizou uma avaliao comportamental sobre a necessidade de evacuao de pes-soas em uma usina hidreltrica. Alm da pesquisa de Behrendt, outras bibliografiasconhecidas no meio cientfico sobre comportamento de multides como os estudosde Gustave Le Bon (2012), Quarantelli (1957), Turner e Killian (1972) serviro de basepara a anlise dos resultados.

    A aplicao de mtodos computacionais para atingir a programao utilizada noser o grande alvo desta pesquisa, pois o foco so os processos de modelagem emeios de simular situaes que ocorram num processo de evacuao.

    1.1 OBJETIVOS

    1.1.1 Objetivo Geral

    O objetivo deste trabalho desenvolver uma modelagem computacional com vi-sualizao tridimensional (3D), utilizando inteligncia artificial atravs da gerao dei-plans bidimensionais, que seja capaz de simular, em funo de hipteses simplifica-doras, a movimentao de pessoas em situaes de estresse, em ambientes fechadosquaisquer, de forma a contribuir com as pesquisas recentes na rea de movimentaopedonal, inovando com a implementao de variveis psicocomportamentais.

    1.1.2 Objetivo Especfico

    1. Desenvolver um simulador de movimentao de pedestres, levando em conside-rao a existncia de variveis psicocomportamentais que alimentam o modeloproposto.

    2. Modelar o comportamento de agentes autnomos com nveis de estresse pe-rante situaes de evacuao.

    3. Testar a hiptese da existncia de quatro personalidades que dividem o compor-tamento dos seres humanos.

    4. Comparar os resultados obtidos utilizando-se a hiptese da existncia de qua-tro personalidades, com as tendncia de comportamento observadas por outrosautores em multides que apresentam algum nvel de estresse.

    5. Validar os resultados qualitativamente atravs das tendncias j descritas e quan-titativamente atravs dos nmeros obtidos com relao a tempos de evacuao,distncias percorridas e escolha de portas de sada.

  • 19

    1.2 JUSTIFICATIVA

    Com o crescimento das cidades, o fluxo de pedestres em ambientes como edi-fcios, passarelas, cinemas, teatros, centros de entretenimento, etc. tem aumentadodesproporcionalmente ao espao dos ambientes por onde estes pedestres circulam.Analogias entre trfego de veculos e pedestres so realizadas frequentemente talcomo sugere o Highway Capacity Manual1 (ACADEMIES, 2000), sendo que a grandemaioria dos simuladores de trfego criados para representar o trfego de veculos aca-bam sendo usados para modelar o fluxo de pedestres, deixando muitas brechas comrelao a este ltimo.

    Muitos trabalhos sobre dinmica de pedestres tm sido desenvolvidos nas lti-mas dcadas (HELBING; MOLNR, 1995; DAAMEN; HOOGENDOORN; BOVY, 2005;TOYAMA, 2006; VENUTI; BRUNO, 2007; SCHADSCHNEIDER; SEYFRIED, 2009;PORTZ; SEYFRIED, 2010), mas o comportamento humano ainda no foi caracteri-zado com a devida complexidade que as situaes de multides muito densas e comaltos nveis de estresse necessitam. Alm disso, essas multides muito densas, comopasseatas, peregrinaes, torcidas em jogos esportivos, podem representar compor-tamentos caticos e turbulentos em relao a situaes cotidianas. Por estes moti-vos, a simulao de pedestres tem se tornado ferramenta de grande importncia, quepode explicitar e predizer catstrofes, evitando assim transtornos decorrentes do pla-nejamento e infraestrutura inadequados, possibilitando a garantia da segurana e oconforto dos pedestres em diversos tipos de ambientes.

    O estudo de situaes que envolvem multido, quando associado simulao,pode descrever e at prognosticar acontecimentos envolvendo a segurana pblica,evitando assim transtornos decorrentes do planejamento e infraestrutura inadequados,e possibilitando descrever o comportamento humano diante de algumas situaes.

    Assim, trabalhar com inteligncia artificial, utilizando para isso o Python, que uma ferramenta computacional de livre acesso e fcil manipulao, transforma estetrabalho em ferramenta de utilidade para a avaliao de espaos pblicos e privadose movimentao de pedestres em diferentes condies.

    1O Highway Capacity Manual ( HCM) uma publicao do Transportation Research Board ( TRB),nos Estados Unidos. O HCM tem sido uma referncia mundial para o transporte e tambm para osestudiosos e profissionais da rea de engenharia de trfego.

  • 20

    1.3 CONTRIBUIES DA TESE

    A maior contribuio deste trabalho est na metodologia de modelagem da movi-mentao de pedestres assumindo variveis psicocomportamentais, atravs da cria-o de uma ferramenta que simula a movimentao pedonal em situaes de estresse,com ambientes fechados quaisquer, acoplada com a hiptese de existncia de qua-tro personalidades que representam o comportamento psicossocial humano de umaforma generalizada.

    1.4 ORGANIZAO DO TEXTO

    O texto est organizado da seguinte forma: Captulo 2 so apresentadas as re-ferncias bibliogrficas pertinentes ao tema. No Captulo 3 apresenta-se as teoriasutilizadas para a formulao dos agentes BDI, dos i-plans, das variveis psicocom-portamentais e das curvas de Bzier que definem a movimentao dos agentes. NoCaptulo 4 descreve-se os mtodos utilizados para a formulao da modelagem com-putacional com visualizao tridimensional (3D), utilizando inteligncia artificial atravsda gerao de i-plans bidimensionais. O Captulo 5 traz os resultados obtidos com amodelagem. O Captulo 6 contm discusses sobre os resultados e as inovaesapresentadas. O Captulo 7 traz as concluses e o Captulo 8 refere-se ao trabalhosque podem ser desenvolvidos futuramente baseando-se nesta pesquisa.

  • 21

    2 REVISO BIBLIOGRFICA

    Na dcada de trinta, surgiram na Inglaterra as primeiras tentativas de sinalizaopara pedestres. Desde os anos sessenta muitos estudos tm sido dedicados paraa determinao de um modelo matemtico que vincule a velocidade das caminha-das com a densidade das multides. Nos anos recentes, pesquisas foram dirigidaspara o estudo de padres de fluxo de multides sob situaes de emergncia (KER-NER, 2004), e uma crescente ateno foi dedicada aos efeitos do comportamentodas multides na dinmica de estruturas no campo da engenharia civil (DAAMEN;BOVY; HOOGENDOORN, 2002; DAAMEN; HOOGENDOORN; BOVY, 2005; LEBAC-QUE; KHOSHYARAN, 2005). Um grande nmero de fatores podem afetar o compor-tamento dos pedestres (idade, cultura, gnero, propsito da viagem, tipo de infra es-trutura, direo da caminhada). Desta forma, as propriedades dos pedestres diferemde caso para caso, consequentemente suas caractersticas especficas no podemser consideradas constantes no sistema.

    Analisando as questes referentes ao espao fsico, pode-se perceber que, tratando-se de meios susceptveis a um alto fluxo de pessoas, comum ocorrerem aglomera-es, principalmente em locais pblicos. Os casos de aglomerao, ou multido",so pontuados por envolverem um alto nmero de indivduos com caractersticas dis-tintas num mesmo ambiente. Nesses casos, alm da interao entre pedestre e meio,tem-se tambm a interao entre pedestres. Diversas situaes so marcadas peloestudo do comportamento de multides, tais como a simulao de multides aplicadasem produes cinematogrficas, jogos digitais, planejamento de construes, evacu-ao de ambientes complexos, arquitetura, dentre outras (BICHO, 2009; DAPPER,2007).

    Em um espao fsico, o deslocamento de um pedestre descreve uma trajetria,que pode ser interferida por questes comportamentais ou fsicas. De acordo comBicho (2009) a modelagem e simulao de multides caracterizadas por um alto fluxopopulacional so temas de estudo em diferentes reas da cincia, pois garantem umvasto campo aplicativo no que tange ao fluxo de pedestres. Nas ltimas dcadas,destacam-se os estudos relacionados simulao de multides, buscando responderquestes associadas desde a escolha de um caminho, at a simulao de situaesmarcadas pelo pnico (ZAMPIERI, 2006). Esse estudo encontra-se diretamente re-lacionado ao aumento do fluxo populacional em certas regies, despertando estudosespecficos para esse novo comportamento.

  • 22

    Schadschneider (2002), Burstedde (2002) e colaboradores desenvolveram em 2002,um modelo de autmato celular estocstico para simulao de dinmica de pedestres.Este baseia-se em um autmato celular1 estocstico bi-dimensional. O modelo per-mite uma simulao rpida de grandes multides, reproduzindo caractersticas cole-tivas e de auto-organizao de dinmica de pedestres, tais como formao de filas,fluxos em corredores e oscilaes de fluxos encontrados em portas. Entretanto, paramanter o modelo simples, os pedestres so providos apenas de uma inteligncia m-nima para a formao de estruturas complexas e efeitos de auto-organizao obser-vados em dinmica de pedestres, o que muitas vezes, impede que este representebem sistemas reais.

    Toyama (2006), em sua dissertao de mestrado Uma abordagem Multiagentespara a Dinmica de pedestres", props a anlise de um modelo que caracteriza ocomportamento macroscpico de uma multido, por meio da anlise de certas vari-veis, tais como, genro, velocidade, conhecimento do ambiente e comportamento dogrupo. Ainda nesse trabalho, Toyama apresenta um modelo baseado em sistemasmultiagentes, propondo uma melhoria Walker para o modelo estocstico j existentecriado por Schadschneider.

    Ainda no campo de simulao pedonal, o trabalho de Helbing (2000), apresentaum modelo contnuo de pedestres baseado em foras generalizadas, caracterizadopor simplicidade e robustez em relao a variaes dos parmetros, apropriado parasituaes que envolvam pnico. Nesse trabalho h algumas observaes do fen-meno de pnico so realizadas, tais como:

    Variao e aumento da velocidade normal;

    Interaes fsicas;

    Ausncia de coordenao dos movimentos;

    Entupimentos e aglomeraes nas sadas;

    Danos estrutura fsica do ambiente;

    Pisoteamentos. A caminhada (fuga) retardada por pessoas cadas ou feridasse transformando em obstculos";

    1Um autmato celular um modelo discreto estudado na teoria da computabilidade, matemtica,e biologia terica. Consiste de uma grelha finita e regular de clulas, cada uma podendo estar emum nmero finito de estados, que variam de acordo com regras determinsticas. A grelha pode serem qualquer nmero finito de dimenses. O tempo tambm discreto, e o estado de uma clulano tempo t uma funo do estado no tempo t1 de um nmero finito de clulas na sua vizinhana.Essa vizinhana corresponde a uma determinada seleo de clulas prximas (podendo eventualmenteincluir a prpria clula). Todas as clulas evoluem segundo a mesma regra para atualizao, baseadanos valores das suas clulas vizinhas. Cada vez que as regras so aplicadas grelha completa, umanova gerao produzida.

  • 23

    Tendncia de comportamento de massa", ou seja, repetir o comportamento deoutras pessoas;

    Ineficincia ou ignorncia de sadas alternativas presentes em situaes de fuga.

    Essas observaes podem ser representadas na simulao. O modelo contnuo deHelbing considerado promissor, entretanto ainda apresenta falhas, por no ser pos-svel representar muitas variveis comportamentais, devido dificuldade de obtenode resultados ao se resolver as equaes diferenciais parciais que o compem. Assimos parmetros utilizados por Helbing ainda geram resultados contra-intuitivos e muitodiferentes do que ocorre na realidade.

    Zampieri (2006) expe um modelo estimativo de movimento de pedestres baseadoem sintaxe espacial, medidas de desempenho e redes neurais artificiais. Nesse traba-lho destaca-se a importncia do estudo do comportamento de pedestres. Pensandono comportamento, o autor prope um modelo baseado em redes neurais artificiais,que estabelece a relao entre o fluxo de pedestres e as propriedade do espao ur-bano.

    O trabalho de Dapper (2007) apresenta um planejamento de movimento para pe-destres utilizando campos potenciais. Afirmando que o comportamento de cada pe-destre, ou agente, definido por uma alterao de seu campo potencial individual. Asalteraes dinmicas do padro podem ser alteradas em cada passo da simulao.Assim, podem ser evitadas colises com obstculos mveis ou combinar a complexi-dade dos movimentos. Em ambos os trabalhos, no existe o estabelecimento de umnvel de estresse, sendo trabalhado apenas com situaes mais simples referentes aocomportamento humano.

    De acordo com Hughes (2002), o movimento dos pedestres regido por equaesde fluxo contnuo derivadas do fluxo de um nico pedestre ou de mltiplos pedestres.O autor divide o fluxo de pedestres em dois tipos de regime: um regime de alta densi-dade, tambm chamado de regime subcrtico2 e um regime de baixa densidade, quese denomina de supercrtico3. As teorias de Hughes derivam da ideia de se relaci-onar o fluxo e a densidade de pedestres atravs de um diagrama, conhecido comodiagrama fundamental. Muitos outros autores tambm consideram tal diagrama comopea importante para a anlise do fluxo de pedestres, como Fruin (1971), Tanabori-boon (1986), Weidmann (2006), Virkler (1994), Older (1968), Sarkar (1997) e Schads-chneider (2009). Algumas teorias tambm baseadas em equaes de fluxo contnuose baseiam na existncia dos diagramas fundamentais (HELBING; KELTSCH; MOL-

    2Um fluxo de alta densidade sempre preenche o espao (ambiente de caminhada) disponvel3Um regime de baixa densidade pode preencher o espao disponvel, ou se auto limitar para cada

    tipo de pedestre, dependendo da localizao das fronteiras.

  • 24

    NR, 1997; HOOGENDOORN; BOVY, 1999; HOOGENDOORN, 2003).

    Na dcada de 90, o governo dos EUA financiou um dos mais intensivos estudossobre evacuao de pessoas em edifcios. O atentado ao edifcio World Trade Cen-ter em 26 de fevereiro de 1993, anterior ao atentado que culminou na derrubada doedficio, foi estudado exaustivamente por Fahy e Proulx (1995) utilizando como ferra-mentas de pesquisa entrevistas e questionrios relacionados com o comportamentode ocupantes selecionados (VALENTIN; ONO, 2006).

    Levando em considerao as aes e comportamentos humanos, com ou semnveis de estresse, visto que h possibilidade de associ-los a modelos matemticos,ou simulaes computacionais onde a obteno de resultados satisfatrios para aanlise de multides uma realidade.

    A proposta desta pesquisa a de criar uma metodologia de modelagem da mo-vimentao de pedestres, acoplando inteligencia artificial variveis psicocomporta-mentais com hipteses simplificadoras, de forma que os resultados obtidos contribuampara a evoluo da pesquisa em movimentao pedonal, suprindo a ainda faltante uti-lizao da parte psicossocial humana nesse tipo de simulao.

  • 25

    3 FUNDAMENTAO TERICA

    Muitas ferramentas matemticas e computacionais, alm da fundamentao pro-posta para as variveis psicossociais, precisaro ser utilizadas. Desta forma, o emba-samento terico necessrio para estas abordagens sero desenvolvidos neste cap-tulo.

    3.1 INTELIGNCIA ARTIFICIAL

    Embora a rea de Inteligncia Artificial ( AI) seja estudada academicamente desdeos anos 50, s recentemente tem gerado maior interesse pelo surgimento de aplica-es comerciais, industriais e educacionais e no puramente acadmicas. Um fatordecisivo para o sucesso desta transio (da academia para a indstria) so os enor-mes avanos tecnolgicos e computacionais ocorridos nas ltimas duas dcadas.

    O primeiro programa computacional baseado em conhecimento, ou seja, baseadoem uma lgica de programao mais elaborada, levando em considerao o com-portamento humano, foi escrito em 1967 por Ed Feigenbaum, em Stanford. O pro-grama intitulado DENDRAL (Dendritic Algorithm) (BUCHANAN; FEIGENBAUM, 1978)podia predizer as estruturas de compostos qumicos desconhecidos baseando-se emanlises de rotinas. O programa MYCIN (SHORTLIFFE, 1976) foi desenvolvido logoaps o DENDRAL, tambm por Feigenbaum, acompanhado de Buchanan e EdwardShortliffe. Esse sistema especialista foi desenvolvido para identificar as bactrias cau-sadoras de infeces graves, tais como bacteremia e meningite, e para recomendarantibiticos, com a dose ajustada para o peso corporal do paciente. Seu nome derivoudos mesmos antibiticos, uma vez que muitos antibiticos contm o sufixo -mycin.O sistema Mycin tambm foi utilizado para o diagnstico de doenas da coagulaosangunea, ou seja, o MYCIN era capaz de deduzir regras (RHEINGOLD, 2012).

    Desde ento, muito se tem estudado sobre AI e muitas controvrsias ocorrem emtorno deste tema, principalmente no que diz respeito a definio do termo intelign-cia. Por essa razo, a Inteligncia Artificial foi, e continua sendo, uma rea que dispede mltiplas interpretaes. Esse carter mltiplo levou a pesquisa e desenvolvimentoem AI a fixar-se em torno de trs tipos principais de atividades (BITTENCOURT, 2006).

    1. Desenvolvimento de modelos formais para a inteligncia humana, tema da cin-cia cognitiva, tambm chamada psicologia computacional;

  • 26

    2. Desenvolvimento de aplicaes educacionais, comerciais ou industriais utilizandotcnicas de AI;

    3. Explorao e experimentao de tcnicas computacionais que apresentem po-tencial para a simulao do comportamento inteligente, a chamada AI bsica.

    Dentre essas trs atividades, este trabalho percorrer caminhos entre o segundo eterceiro itens, tendo como respaldo conhecimentos psicolgicos referentes ao primeiroitem.

    Os conceitos bsicos da AI podem ser divididos em diversos ramos que incluem:aprendizagem de mquina, raciocnio probabilstico, robtica, processamento de lin-guagem natural.

    De acordo com Sebastian Thrun, professor de Cincia da computao na univer-sidade de Stanford, AI a disciplina que aborda a incerteza e a gerncia no processode tomada de deciso em ferramentas de software (THRUN; NORVIG, 2011). Essadefinio de Thrun se encaixa na proposta desta tese.

    3.1.1 Conceitos de Inteligncia Artificial - AI

    Muitas aplicaes e tcnicas podem ser citadas quando se fala de AI, por exem-plo: planejamento automatizado, jogos, diagnsticos, planejamento logstico, robtica,redes neurais, sistemas com viso computacional, aplicaes utilizando vida artificial,sistemas baseados na ideia de agentes artificiais (denominados Sistemas Multiagen-tes).

    Este trabalho coloca seu foco sobre Sistemas Multiagentes ( MAS - Multi-AgentSystem). Estes tm se tornado comuns para a resoluo de problemas complexos(WOOLDRIDGE, 2002) como, telecomunicaes (SOUZA; NETTO, 2012), monitora-o de usinas nucleares (GUIMARES, 2006), controle de trfego areo (DIB; CAR-DOSO; WEIGANG, 2005), simulao de pedestres (TOYAMA, 2006), etc.

    Os MAS formam uma subrea da AI e concentram-se no estudo de agentes aut-nomos em um universo multiagente. Para os MAS, o termo autnomo designa o fatode que os agentes tm uma existncia prpria, independente da existncia de outrosagentes (REIS, 2003). Usualmente, cada agente possui um conjunto de capacidadescomportamentais que definem sua competncia, um conjunto de objetivos e a auto-nomia necessria para utilizar suas capacidades comportamentais a fim de alcanarseus objetivos. Um agente uma entidade computacional com um comportamentoautnomo que lhe permite decidir suas prprias aes (ALVARES; SICHMAN, 1997).A deciso de qual ao deve ser executada determinada pelo agente, tendo em con-

  • 27

    siderao as mudanas que ocorrem no ambiente no qual atua e o desejo de alcanarseus objetivos. A ideia principal em um sistema multiagente que um comporta-mento global inteligente pode ser alcanado a partir do comportamento individual dosagentes, ou seja, o comportamento macroscpico emerge do comportamento micros-cpico. Dessa forma, pode-se definir um agente autnomo (ativo ou inteligente) comoum ser capaz de perceber seu ambiente por meio de sensores e agir sobre esse am-biente atravs de atuadores. Pode-se traar um paralelo desse processo atravs deum agente humano, onde este usa seus rgo sensitivos como sensores, e mos, per-nas e outras partes do corpo como atuadores. Na robtica, os atuadores podem seras cmeras, detectores infravermelhos, etc. Em um agente de software os atuadoresso teclado, arquivos, pacotes da rede, vdeos, impressora, dentre outros.

    A arquitetura de um agente ento formada dessa maneira: com sensores e atu-adores. Os sensores detectam o ambiente avaliando as situaes e os atuadoresreagem de acordo com a tarefa que lhe foi ensinada ao encontrar determinada situ-ao. Por exemplo: um agente humano analisa o ambiente atravs de seus olhos(sensores) e detecta um buraco. As pernas (atuadores), precisam estar programadaspara desviar desse buraco, ou pul-lo, etc.

    Uma ao de um agente inteligente composta por uma sequncia de percepese no apenas uma percepo por vez. A escolha da ao a ser tomada dependerda anlise dessa sequncia armazenada. Alm disso, um agente s poder ser con-siderado inteligente se obtiver sucesso em suas aes, ou seja, o seu desempenhonecessita ser o desempenho mximo procurado ao ser programado. Exemplo: o de-sempenho de um agente aspirador de p pode ser a quantidade de sujeira limpa,tempo total gasto, quantidade de eletricidade consumida, quantidade de barulho ge-rado, etc (NORVIG; RUSSELL, 2004).

    Assim pode-se definir que um agente inteligente possuir armazenada uma sequn-cia de percepes. A partir destas, ele dever selecionar uma ao que maximize seudesempenho de acordo com as evidncias fornecidas pela sequncia e por qualquerconhecimento interno do agente. Essa maximizao de desempenho tambm cha-mada de desempenho timo ou otimizado.

    A coleta de informaes, ou seja, explorar um ambiente desconhecido, um passofundamental da inteligncia. Por exemplo, analisar se o caf est quente antes debeb-lo maximizar a resposta de saborear sem se queimar, ou ainda olhar antes deatravessar a rua maximizar o desempenho de atravessar sem ser atropelado. Umagente inteligente deve ser capaz de operar com sucesso em uma grande quantidadede ambientes, dado um tempo suficiente para se adaptar, pois tem a capacidade dereconhecer e se adaptar a novas condies (FERREIRA, 2012).

  • 28

    necessrio saber que tipo de ambiente se est especificando no programa paraque esse agente possa se movimentar. Por exemplo:

    O ambiente totalmente observvel, parcialmente observvel ou totalmente des-conhecido? Analisa-se o ambiente quanto ao acesso completo do estado desse,fornecido pelos sensores.

    O ambiente discreto ou contnuo? Verifica-se se as percepes e aes socontveis e distintas.

    O ambiente determinstico ou estocstico? Analisa-se se o estado do ambiente totalmente determinado pelas aes selecionadas pelo agente ou possui aesaleatrias.

    O ambiente esttico ou dinmico? O ambiente se altera com as aes doagente?

    O ambiente episdico ou sequencial? A experincia do agente dividida emepisdios, ou considera-se um nico episdio.

    Trabalha-se com um nico agente ou mltiplos agentes? Ambientes com mlti-plos agentes necessitam de formas de comunicao.

    A partir dessas definies possvel determinar uma heurstica1 de movimenta-o para os agentes. Referente a essa movimentao, frequentemente precisa-selidar com conhecimentos probabilsticos em que a base de informaes incompleta,inexata, imparcial ou at mesmo ambgua para que o agente consiga tomar suas deci-ses. Desta forma, ser usada neste trabalho uma juno de conhecimento simblico(via agentes com crenas, desejos e intenes, que ser melhor explicado nas se-es a seguir) e probabilstico, em especial, probabilidades estruturadas usando redesbayesianas2. Alm disso, os agentes no tm conhecimento de todo o ambiente, ape-nas dos espaos que podem ser detectados por seu cone de viso (ver Sec. (4.2.3)),assim define-se que este ser parcialmente observvel. Tambm ser um ambientecontnuo, pois o agente tem liberdade de movimento em qualquer direo; esttico,pois no se altera com as aes do agente; estocstico3 pois contar com algumas

    1Define-se procedimento heurstico como um mtodo de aproximao das solues ideais dos pro-blemas. A heurstica assume uma soluo prxima da ideal baseada em uma funo de avaliao doresultado.

    2Define distribuio de probabilidade sobre grafos ou variveis aleatrias3Padres estocsticos so aqueles que tm origem em processos no determinsticos, com ori-

    gem em eventos aleatrios. Dentro da inteligncia artificial, programas estocsticos trabalham usandomtodos probabilsticos para solucionar problemas, como em redes neurais estocsticas, otimizaoestocstica e algoritmos genticos. Um problema pode ser estocstico em si mesmo, como no plane-jamento sob incerteza.

  • 29

    decises aleatrias e probabilsticas (o que justifica o uso de redes bayesianas); epi-sdico, pois as vrias percepes do ambiente, ao longo do tempo, vo alimentarnovos planos e de mltiplos agentes para que seja possvel representar conceitos demovimentao em grupo.

    3.2 MODELOS PROBABILSTICOS

    As redes bayesianas ( BN - Bayes Network) so modelos de representao do co-nhecimento que trabalham com o conhecimento incerto e incompleto por meio da Te-oria da Probabilidade Bayesiana, publicada pelo matemtico Thomas Bayes em 1763.As BN foram aperfeioadas no incio dos anos 80 para facilitar a tarefa de predioem sistemas de inteligncia artificial (PEARL, 1988). BN, tambm conhecidas comoredes de opinio, redes causais, grficos de dependncia probabilstica, so modelosgrficos para raciocnio (concluses) baseado na incerteza, onde os ns representamas variveis (discreta ou contnua), e os arcos representam a conexo direta entreeles (KORB; NICHOLSON, 2004). Desta forma, uma BN constituda por: um con-junto de variveis e um conjunto de arcos ligando as variveis; cada varivel possuium conjunto limitado de estados mutuamente exclusivos; as variveis e arcos formamum grafo dirigido, sem ciclos4, como apresentado na Fig. (1).

    7 53

    11 8

    29

    10

    FIGURA 1: Grafos Dirigidos Acclicos.

    Pode-se tambm definir uma BN matematicamente usando uma representaocompacta de uma tabela de conjuno de probabilidades do universo do problema.Assim, seja R uma varivel aleatria com n estados e P(R) a distribuio de probabili-dade para estes estados.

    P(R) = (a1, ,an)4Grafos dirigidos acclicos so aqueles onde, para qualquer vrtice v, no h nenhuma ligao diri-

    gida comeando e acabando em v.

  • 30

    onde ai a probabilidade de R estar no estado ai. Se a varivel T possui m estados,(b1, ,bm), ento P(R/T ) representa uma tabela nXm contendo valores P(ai/bi), comopode ser observado no exemplo da Tab. (1).

    b1 b2 bma1 0,07 0,05 0,08a2 0,04 0.04 0,05...

    ...... . . .

    ...an 0,06 0,03 0,09

    TABELA 1: Tabela de Conjuno de Probabilidades

    Os conceitos da Teoria das Probabilidades para o embasamento da AI podem serobtidos nos mais diversos livros de estatstica. Recomenda-se ver (JAMES, 1996),(FERNANDEZ, 2011), (MAGALHES, 2011), onde possvel relembrar teorias como:Teorema de Bayes, Teorema da Probabilidade Total, Variveis Aleatrias, Funes deDistribuio.

    As BN so parte da construo da Inteligncia Artificial, pois englobam conceitoscomo: Algoritmos de Filtragem (filtros de partculas e filtros de Kalman), Modelosocultos de Markov ( HMMs - Hidden Markov Models), Processos de deciso de Markov( MDPs - Markov Decision Processes), Processos de Deciso de Markov ParcialmenteObservvel ( POMDPs - Partially Observable Markov Decision Processes); que soferramentas probabilsticas (NORVIG; RUSSELL, 2004).

    O conceito de Cadeias de Markov, tambm presente nas bibliografias sugeridasacima, uma vez que ser apresentado a seguir, ser muitas vezes citado e discutidodentro da teoria sobre AI. Para isso, inicialmente ser definido o que so ProcessosEstocsticos. Assim,

    Definio 3.2.1. (NOGUEIRA, 2012) Um processo estocstico definido como umacoleo de variveis aleatrias X(t) indexadas por um parmetro t pertencente a umconjunto T , que pode ser tomado pelos conjunto dos inteiros no-negativos.

    Um Processo Estocstico dito Processo de Markov se o estado futuro deste sdepende do estado presente, e no dos estados passados. Matematicamente pode-seescrever

    P(X(tk+1) xk+1/X(tk) = xk,X(tk1) = xk1, ,X(t1) = x1,X(t0) = x0) == P(X (tk+1) xk+1/X(tk) = xk) ,para t0 t1 tk tk+1 = 0,1 e toda sequncia k0,k1, ,kt1,kt ,kt+1

    (1)

  • 31

    As probabilidades condicionais so denominadas probabilidades de transio. As-sim, pode-se denotar a probabilidade de transio como a probabilidade de Xn+15 estarno estado j dado que Xn est no estado i ou seja

    Pn,n+1i j = P(Xn+1 = j/Xn = i). (2)

    A anlise de uma Cadeia de Markov caracteriza-se principalmente pelo clculo dasprobabilidades de transies em n passos, portanto Pni j denotado por (NOGUEIRA,2012)

    Pni j = P(Xm+n = j/Xm = i) . (3)

    Podem-se representar as quantidades Pni j de forma matricial. Tal notao impor-tante, pois torna o processo mais simples de ser representado computacionalmente.Dessa forma denota-se a matriz de Markov ou matriz de Probabilidades de Transioda seguinte forma:

    ||Pni j|| desde que

    k=0

    PikPn1k j

    P0i j =

    {1 se i= j0 se i 6= j

    (4)

    Proposio 3.2.1. Um Processo de Markov est completamente definido quando suamatriz de probabilidades de transio e seu estado inicial X0 (ou, mais genericamente,a distribuio de probabilidade de X0) esto especificados. (UFPE, 2012)

    Pela iterao da Eq. (4), obtm-se:

    P(n) = PxPxP xPn n vezes

    (5)

    Demonstrao. O evento de ir do estado i para o estado j em n transies pode serrealizado por caminhos mutuamente exclusivos, indo para um estado intermediriok (k = 0,1, ), na primeira transio, e ento ir do estado k ao estado j nas (n1) transies restantes. Pela propriedade de Markov, a probabilidade da segundatransio P(n1)k j (da primeira transio , obviamente, Pik) (UFPE, 2012). Usando a

    5Xn est no estado i se Xn = i

  • 32

    Lei da Probabilidade Total:

    P(n)i j = P{Xn = j|X0 = 1}=

    k=0

    P{Xn = j,X1 = k|X0 = i}

    =

    k=0

    P{X1 = k|X0 = i} P{Xn = j|X0 = i,X1 = k}

    =

    k=0

    PikP(n1)k j

    3.2.1 Mtodos ocultos de Markov

    Os Mtodos ocultos de Markov (HMM) foram descritos pela primeira vez ao finaldos anos 60 (BAUM; PETRIE, 1966). So usados para analisar ou prever sries tem-porais6. O HMM um processo estocstico no visvel (por isso o nome oculto), masque pode ser observado atravs de outro processo estocstico que produz a sequn-cia de observaes. Por este motivo pode ser considerado um processo duplamenteestocstico (RABINER, 1989).

    Os processos ocultos consistem de um conjunto de estados conectados por tran-sies com probabilidades (autmato finito), enquanto os processos observveis (noescondidos) consistem de um conjunto de sadas ou observaes, cada qual podemser emitidos por cada estado de acordo com alguma sada da Funo Densidade deProbabilidade, PDF (MORITA, 1998).

    Seja uma sequncia de estados que evoluem no decorrer do tempo e cada estadodepende apenas do estado anterior na rede bayesiana, ento cada estado consti-tudo do que se chama de medida. Essa rede bayesiana o ncleo dos HMMs, e devrios filtros probabilsticos, como filtros de Kalman e filtros de partculas.

    Pode-se dizer que os estados evoluem por uma cadeia de Markov. Isso quer dizerque cada estado depende apenas do seu antecessor, mas o que transforma isso emum modelo oculto de Markov o fato de existirem variveis de medida que caracte-rizam estes estados. Logo, em vez de se observar os estados, precisa-se analisaressas medidas. Ferramentas como mxima verossimilhana e suavizao laplacianapodem ser usadas neste contexto.

    Os HMMs so usados em duas situaes principais:

    1. Predio: Espera-se prever o prximo estado, ou prever a prxima medida. As

    6Em estatstica, econometria, matemtica aplicada e processamento de sinais, uma srie temporal uma coleo de observaes feitas sequencialmente ao longo do tempo

  • 33

    equaes para predio so baseadas em probabilidade total.

    2. Estimativa de Estados: Deseja-se calcular a probabilidade de um estado internoou oculto, dadas as medidas. As equaes para estimar estados so baseadasno Teorema de Bayes.

    No contexto de HMMs, filtragem refere-se determinao da distribuio de umavarivel latente em um momento especfico, tendo em conta todas as observaesat aquele momento, ou seja, faz-se uma filtragem das informaes da varivel paraanalisar o que pode continuar no processo e o que deve ser retirado ou modificado.

    Dentre os conceitos probabilsticos citados at o momento, a inferncia proba-bilstica ou bayesiana ferramenta fundamental, pois descreve as incertezas sobrequantidades invisveis de forma probabilstica, ou seja, computa a distribuio de pro-babilidade posterior, P(A/B), para um conjunto de variveis de consulta, A, dado umaevidencia, B.

    Castilho e Gutierrez (1997) classificam os algoritmos de inferncia em trs nveis:Exatos, Aproximados e Simblicos. Nesse trabalho os algoritmos usados so classi-ficados como Aproximados, pois esses utilizam tcnicas distintas de simulao parachegar a valores aproximados das probabilidades. Como exemplo, podem-se citar osalgoritmos de amostragem de Gibbs (Gibbs Sampling)7 e Mxima Verossimilhana8

    com Suavizao Laplaciana ( MLLS - Maximum Likelihood Laplace Smoothing). Oprimeiro gera cada amostra baseado na configurao gerada pela amostra anterior eatualiza a configurao atual para amostras futuras. O algoritmo de Gibbs dependede uma configurao inicial. A estimativa do algoritmo baseada na probabilidadeda varivel fazer a transio de um estado para outro, chamada de probabilidade detransio (FIORI; THIELE; RAMOS, 2012).

    Quando estima-se a verossimilhana, utiliza-se como probabilidade o quocientedo nmero de eventos especficos sobre o nmero total de eventos do conjunto (es-pao amostral). Porm, ao se fazer isso, pode-se chegar a falsos resultados nulos.Para amenizar esse problema utiliza-se a suavizao laplaciana. Assim, no algoritmoMLLS, o nmero de eventos especficos acrescido de um valor k e normalizadoadicionando-se k a toda classe (MANNING; RAGHAVAN; SCHTZE, 2008). Desta

    7O amostrador de Gibbs um algoritmo para gerar uma sequncia de amostras da distribuio con-junta de probabilidades de duas ou mais variveis aleatrias. O propsito de tal sequncia aproximara distribuio conjunta, ou computar uma integral (tal como um valor esperado). A amostragem deGibbs um exemplo de um algoritmo Monte Carlo via cadeias de Markov.

    8A verossimilhana (likelihood) a interpretao da funo de um parmetro dado um resultadofixo, ou seja, indica qual a probabilidade de um valor de parmetro em funo do resultado observado.Segundo Bussab e Morettin (2004) o princpio da verossimilhana afirma que deve-se escolher o valordo parmetro desconhecido que maximiza a probabilidade de obter a amostra observada, ou seja, ovalor que torna a mostra o mais provvel.

  • 34

    forma, a probabilidade que podia ser calculada da forma

    P(X) =n(eventos especficos)n(Espao Amostral)

    , (6)

    passa a ser calculada por

    P(X) =n(eventos especficos)+ kn(Espao Amostral)+ k(x)

    , (7)

    onde n(X) representa o nmero de elementos de um conjunto. Desta forma estesdois algoritmos (Amostragem de Gibbs e MLLS) sero utilizados quando o processode deciso dos agentes chegarem a situaes crticas onde seja necessrio o uso deferramentas probabilsticas para a tomada de deciso.

    Existem vrios tipos de filtros bayesianos dentro dessa categoria, sendo que osprincipais so o Filtro de Kalman e o Filtro de Partculas.

    Assim, o filtro de Kalman um algoritmo para realizar, de forma eficiente, infe-rncias exatas sobre um sistema dinmico linear, que um modelo Bayesiano seme-lhante a um HMM (HO; LEE, 1964), entretanto, nesta pesquisa necessita-se que asinferncias sejam aproximadas e que seja possvel trabalhar com distribuies almdas gaussianas.

    Thrun e Norvig (2011) aconselham o uso de filtros de partculas, tambm conhe-cidos como Mtodos Monte Carlo via Cadeias de Markov ( MCMC), quando o assunto AI e mais especificamente agentes inteligentes em ambientes parcialmente obser-vveis.

    3.2.2 Filtro de Partculas

    A ideia do mtodo Monte Carlo escrever a integral que se deseja calcular comoum valor esperado. Seja o problema de calcular a integral de uma funo g() nointervalo (a;b), isto :

    J = bag()d . (8)

    A Eq. (8) pode ser reescrita como:

    J = ba(ba)g() 1

    bad = (ba)E(g()), (9)

    identificando como uma varivel aleatria com distribuio uniforme U(a,b)9. Desta9 uma distribuio de probabilidades contnuas onde a probabilidade de se gerar qualquer ponto em

    um intervalo contido no espao amostral proporcional ao tamanho do intervalo. Alm disso, qualqueroutra distribuio contnua, na qual a funo distribuio acumulada seja invertvel, pode ser simulada

  • 35

    forma, transforma-se o problema de avaliar a integral em um problema estatstico emque se deseja estimar uma mdia, E[g()]. Dispondo de uma amostra aleatria detamanho n, 1, ,n da distribuio uniforme no intervalo (a;b) tem-se tambm umaamostra de valores g(1), ,g(n) da funo g() e a integral acima (9) pode serestimada pela mdia amostral, ou seja,

    J = (ba)1n

    n

    i=1

    g(i) (10)

    e verifica-se que

    E(J) =(ba)

    n

    n

    i=1

    E(g(i)) = (ba)E(g()) = bag()d . (11)

    A generalizao bem simples para o caso em que a integral a esperanamatemtica de uma funo g() onde uma funo de densidade p(), ou seja

    J = bag()p()d = E(g()). (12)

    Tendo no lugar de uma distribuio uniforme uma distribuio de valores 1, ,npara p(), pode-se calcular:

    J = g=1n

    n

    i=1

    g(i). (13)

    Essa simplicidade do Mtodo Monte Carlo fez com que seu desenvolvimento sedesse com a necessidade de se resolverem problemas cada vez mais complexos,onde muitas vezes encontrar uma densidade que seja simultaneamente uma boa apro-ximao e fcil de ser amostrada seria quase impossvel. Os conceitos de Cadeiasde Markov foram acoplados ao mtodo j existente. Essa juno deu origem ao M-todo Monte Carlo via cadeias de Markov (MCMC) ou tambm chamada de algoritmossequenciais de Monte Carlo. A ideia continua a ser a de encontrar uma amostra dadistribuio e calcular estimativas amostrais de caractersticas desta distribuio. Adiferena que para o MCMC usam-se tcnicas de simulao iterativa, baseadas emcadeias de Markov, e assim os valores gerados no so mais independentes (JUSTI-NIANO, 2012).

    O problema de filtragem um caso particular dos mtodos sequenciais de MonteCarlo. Ele consiste na estimao de um sinal desconhecido (oculto) a partir dos dadosprovenientes das observaes que, por sua vez, so uma funo aleatria dos sinais.O estimador chamado de filtro. A amostragem por importncia sequencial ( SIS)(BATISTA, 2011) um mtodo Monte Carlo que forma as bases para a maior parte

    a partir da distribuio uniforme.

  • 36

    dos filtros sequenciais de Monte Carlo desenvolvidos nas ltimas dcadas (DOUCET;FREITAS; GORDON, 2001). Esta aproximao sequencial conhecida por vriosnomes como filtragem bootstrap, algoritmo de condensao, filtro de partculas ou oprprio MCMC j citado (CUPERTINO, 2007).

    Os Filtros de Partculas ( PFs - Particle Filters) so filtros que realizam estima-o sequencial de Monte Carlo e guardam a densidade de probabilidade do estadodo sistema na forma de partculas, podendo representar um nmero muito maior dedistribuies, dispensando as condies de Gaussianidade e linearidade do modelo eainda possuindo adequadas condies de convergncia.

    O filtro de partculas baseia-se na distribuio por importncia a qual definidacomo sendo a distribuio a priori. Infelizmente o processo degenera-se quando otempo cresce, e no se consegue a distribuio a posteriori. Uma etapa adicional acrescida para viabilizar o procedimento. Trata-se da amostragem com reposiorepetidas vezes. As partculas amostradas que so pouco representativas dentro dadistribuio so retiradas do processo e as partculas sobreviventes representam adistribuio. Esta mesma distribuio usada como base para o prosseguimento domtodo em cada instante de tempo (AIUBE, 2005).

    Thrun defende a ideia de que PF talvez seja o algoritmo que mais faz sucessoquando o assunto AI.

    Fazendo uma analogia entre a movimentao de agentes (pedestres) e a rob-tica, escolheu-se usar filtros de partculas neste trabalho, devido aos bons resultadosobtidos por diversos autores quando refere-se a movimentao de robs (FOX et al.,2000; REKLEITIS, 2004; RENS; FERREIN; POEL, 2009).

    3.3 PROCESSO DE MARKOV PARCIALMENTE OBSERVVEL

    Nas sees anteriores deixou-se claro que o espao de movimentao dos agen-tes um ambiente parcialmente observvel. A ferramenta escolhida para solucionareste tipo de problema, dentro da necessidade de uso de ferramentas probabilsticas,foi o Processo de deciso de Markov parcialmente observvel (POMDP). Um ambi-ente totalmente observvel aquele onde possvel ver todo o ambiente e tomardecises baseando-se na resposta imediata dos sensores. A necessidade de usarmemria sensorial e de analis-la antes de tomar as decises mostra que o ambiente parcialmente observvel.

    No POMDP o agente precisa se lembrar das aes que executou e das observa-es que percebeu ao longo do tempo e tentar usar essas informaes para tomar a

  • 37

    prxima deciso. Ao invs do agente estudar o estado atual do sistema, estuda-seuma distribuio de probabilidade sobre os estados antes de tomar as decises.

    Os POMDPs podem ser usados para modelar diversos tipos de problemas comomodelagem de comportamento em ecossistemas, diagnstico mdico (CASSANDRA;LITTMAN; ZHANG, 1997).

    3.3.1 Descrio Matemtica do Processo de Deciso de Markov Parcialmente Ob-servvel

    Um POMDP uma tupla (S,A,T, R,,O,P), onde:

    a) S um conjunto de estados em que o processo pode estar;

    b) A um conjunto de aes que podem ser executadas em diferentes pocas dedeciso;

    c) T : S X A X S 7 [0,1] uma funo que d a probabilidade de o sistema passarpara um estado s S, dado que estava no estado s S e a ao executada foia A;

    d) R : S X A 7 IR uma funo que d o custo (ou recompensa) por tomar umadeciso a A quando o processo est em um estado s S;

    e) o conjunto de observaes que so obtidas em cada perodo de deciso;

    f) O : S X A 7() a funo de observao que d, para cada ao e estado resul-tante, uma distribuio de probabilidade sobre possveis observaes (escreve-se O(s;a;o) para a probabilidade de se fazer a observao o, dado que o agentetomou a ao a e acabou no estado s);

    g) P uma distribuio inicial de probabilidades sobre o conjunto de estados.

    Os conjuntos S,A e sero considerados finitos. Ainda:

    h) z denominado Horizonte de um POMPD, ou seja z o nmero de decisespossveis para a tomada de decises. O horizonte pode ser finito (quando hum nmero fixo de decises a tomar), infinito (quando a tomada de deciso feita repetidamente) ou indefinido (semelhante ao horizonte infinito, mas coma possibilidade do processo parar se chegar a algum estado que tenha sidomarcado como final).

  • 38

    i) pi so as polticas de deciso, ou regras de deciso. Uma regra de deciso paraum POMDP em uma poca de deciso k uma funo dk : S A, que determinaa ao a ser executada, dado o estado do sistema.

    Uma poltica para um POMDP uma sequncia de regras de deciso pi = {d0,d1, ,dz}.Normalmente se quer encontrar uma poltica que otimize um dado critrio de desem-penho das decises (PELLEGRINI, 2006).

    Alm dessas representaes, ainda necessrio definir o estado de informaes,Ck. Este definido como a representao do conhecimento que se tem sobre o sis-tema no momento de se tomar uma deciso k. O estado de informaes compostopor uma distribuio de probabilidade sobre os estados nos primeiros momentos dedeciso, b0, e por um histrico completo de aes e observaes, desde os primeirosmomentos de observao e pode ser representado por Ck=(b0,a0,o0,a1,o1, ,ak1,ok1).Dessa forma C(P) o espao de todos os estados de informao para um POMDP.Pode-se dizer que um estado de informaes dividido em dois estados, o primeiro representado por uma distribuio de probabilidade que representa o conhecimentodo agente sobre os estados, o segundo chamado de estado de crenas (belief). Este representado por uma distribuio de probabilidades sobre os possveis estados dosistema, ou seja, as crenas do agente sobre tal sistema. Para modificar um estado deinformao representado desta forma necessrio adicionar o par (a;o) com a ltimaao e a observao resultante.

    Ainda necessrio que seja criado um estimador de estados de informao, ,para uma boa representao dos estados de informao C(P) em um POMDP. A cadapoca de deciso, o tomador de decises verifica o estado de informao atual (C(P)),a ltima ao executada e a ltima observao obtida do ambiente. A partir dessesdados, determina um novo estado de informao, que usado como entrada parauma poltica pi, que determina a prxima ao a ser tomada (PELLEGRINI; WAINER,2007).

    Desta forma, o conjunto de aes planejadas (polticas) dever maximizar a funode recompensa (ou o retorno) acumulada ao longo do tempo ou minimizar a funo decusto em todo o espao possvel. Uma poltica com tais caractersticas, ou seja, umapoltica tima ser representada por pi. Em episdios finitos, caso deste trabalho,a funo de recompensa pode ser simplesmente a soma das recompensas de cadainstante de tempo, desde o instante inicial.

    A representao para as funes timas podem ser dadas de diversas formas.Desde Redes Neurais (LIN; MITCHELL, 1992), Discretizao (LOVEJOY, 1991; ROY,2003) e Hiperplanos at Controladores (HANSEN; ZHOU, 2003) e Planos Condicio-nais (KAELBLING; LITTMAN; CASSANDRA, 1998).

  • 39

    A escolha para a representao se d de acordo com as necessidades do trabalho.No caso deste, mais coerente trabalhar com Controladores Estocsticos (POUPART;BOUTILIER, 2003), devido necessidade da utilizao de distribuies de probabili-dade para a gerao de cada ao de forma que estas possam minimizar os custosda caminhada, fazendo com que as polticas sejam quase timas.

    Com esses conceitos definidos, fez-se a escolha por uma estrutura hbrida entreagentes BDI (Beliefs-Desires-Intentions - Crena-Desejo-Inteno) e POMDP (NAIR;TAMBE, 2005), para caracterizar os agentes at ento citados com as necessidadesimpostas por este projeto (necessidades comportamentais especficas de seres hu-manos).

    3.4 AGENTE BASEADO EM CRENA, DESEJO E INTENO

    Agente BDI um modelo filosfico proposto por Michael Bratman (1984). O prprioBratman desenvolveu mais trabalhos nesta rea como Intention, Plans, and PracticalReason (1987), mais recentemente Intention, Belief, and Instrumental Rationality(BRATMAN, 2009) e um artigo intitulado Intention, Belief, Practical, Theoretical pre-sente no livro Spheres of Reason: New Essays in the Philosophy of Normativity(BRATMAN, 2010) dentre muitos outros. Todos na rea de inteligncia computacional.

    Os agentes BDI so capazes de aes independentes e autnomas para atingirobjetivos para os quais foram projetados (PEREIRA, 2008). De maneira geral, pode-sedizer que so agentes que decidem por si o que fazer; dada uma situao. Observa-se, entretanto, que esta uma abordagem heurstica, onde um agente BDI constrium plano para realizar uma determinada inteno, tenta execut-lo e, se falha, precisareconsiderar sua inteno ou formular outro plano e assim sucessivamente. Destaforma, seu comportamento dado por tentativa e erro, geralmente impossibilitandoum comportamento timo se comparado aos modelos de teoria da deciso10. Ou-tro fator importante que influencia seu desempenho a dinmica do ambiente, quepode fazer com que o agente passe mais tempo reconsiderando suas intenes doque fazendo aes. Este balano entre o tempo que o agente passa deliberando eo tempo que passa executando planos fundamental para um bom agente BDI. Poroutro lado, os POMDPs podem ser a abordagem ideal para problemas que se con-centram na coordenao de sociedades de agentes e na existncia de incerteza de

    10A teoria da deciso uma cincia que trabalha com a tomada de decises racionais e consistentesem situaes de incerteza, fornecendo um conjunto de conceitos e tcnicas para apoio do decisor.O objetivo da Teoria da Deciso apoiar a escolha de uma ao (ou de uma estratgia) que sejaconsistente com as alternativas, a informao, os valores e a lgica do decisor no momento da tomadade deciso. O decisor o responsvel pela tomada de decises. Pode ser um nico individuo umgrupo, uma empresa ou mesmo uma nao.

  • 40

    aes e observaes em domnios do mundo real. A complexidade de se encontraruma poltica tima em modelos onde o espao de estados seja muito grande algumasvezes intratvel, mas ainda parece ser uma das melhores solues para este tipo deproblema. Assim, a ideia de utilizar um algoritmo para construo de planos BDI ba-seados em polticas timas obtidas atravs de POMDPs encaixa-se proposta destetrabalho.

    O formalismo de um agente BDI baseia-se em um modelo de ramificao de tempo(EMERSON; HALPERN, 1986), no qual as variveis opinio, desejo e inteno, soelas prprias estruturas de ramificao de tempo.

    As crenas representam as informaes que o agente tem sobre o mundo e sobresi prprio. Os desejos esto relacionados com os estados do ambiente que o agenteeventualmente deseje atingir, no entanto, os desejos no precisam obrigatoriamentelevar o agente a agir. O seja, os desejos so um conjunto de estados possveis deonde o agente escolhe o que fazer. As intenes so caracterizadas por uma escolhade um estado a ser atingido e por um certo grau de comprometimento a esta escolha.

    Um agente BDI usa uma descrio BDI. Essa descrio definida como umatupla (S,A,T,B,D, I,Del,M), onde S, A e T so, respectivamente, o espao de estados,o conjunto de aes e a funo de transio e:

    a) B o conjunto de crenas, D o de desejos e I o de intenes;

    b) Del o componente de deliberao;

    c) M o componente de raciocnio meio-fim.

    Portanto considera-se que S, A e T so os mesmos para ambas as descries(BDI e POMDP). Alm disso, considera-se que B e P representam a mesma ideia, ouseja, identificam em que estado o agente se encontra.

    Com estas equivalncias definidas, tem-se de um lado recompensas e polticas, ede outro tem-se desejos, deliberao, raciocnio meio-fim, e intenes. Na verdade,como recompensas so meios de se determinar polticas, e desejos so um passopara se determinar intenes, estes componentes podem ser ignorados. Finalmentea relao que se considera com detalhes a entre polticas e intenes.

    Modelos hbridos tm sido propostos para combinar as vantagens e superar asdesvantagens dos dois modelos, existindo diversas abordagens diferentes que mos-tram a relao entre BDI e POMDP e como eles podem ser combinados para tra-tar problemas de naturezas diversas (SIMARI; PARSONS, 2006; PARUCHURI et al.,2006; NAIR; TAMBE, 2005). Por exemplo, um agente BDI com planos baseados em

  • 41

    POMDPs, ou um POMDP cuja poltica construda a partir de planos BDI, tm sidoapontados como solues para melhorar o desempenho de agentes BDIs ou a trata-bilidade de modelos POMDPs, respectivamente (SIMARI; PARSONS, 2006)

    3.4.1 Agentes BDI a partir de polticas timas de POMDPs

    Como j foi escrito, inteno o estado que o agente se comprometeu a alcan-ar. O termo i-plan denota uma sequncia de aes construdas para alcanar umdeterminado estado, ou seja, para alcanar uma determinada inteno. Para resolveressa questo, i-plans so relacionados com polticas, tendo como objetivo obter i-plansatravs da soluo de um POMDP. Alguns exemplos podem ser vistos em (SIMARI;PARSONS, 2006).

    Nesta seo adota-se a notao utilizada por (SIMARI; PARSONS, 2006) pois estasimplifica a descrio BDI e POMDP para que seja possvel estabelecer relao entreseus elementos.

    Um i-plan, denotado como , possui indexao i,s, onde i a inteno do agentee s seu estado atual. I-plans so sequncias de aes e i denota a i-sima ao em, enquanto si denota o i-simo estado que o agente planeja visitar enquanto executa. Portanto, para um i-plan de tamanho p, o agente comea no estado s0 e planejavisitar os estados s1 ,s

    2 , ,sp . Se o agente precisar fazer uma reconsiderao, e uma

    nova inteno for adotada o agente tambm ir precisar de um novo i-plan.

    A utilidade esperada de um i-plan pode ser obtida da mesma forma que uma pol-tica em um POMDP, estabelecendo-se um valor para cada ao em cada estado emque executada. A diferena que em um i-plan considera-se apenas uma sequn-cia no espao de estados e, na avaliao de uma poltica, considera-se as aes emtodos os estados. A princpio, o agente BDI ter a mesma abordagem para atravessaro espao de estados. Selecionar uma inteno, identificar um i-plan para alcan-ar sua inteno e executar seu i-plan at perceber que seu i-plan no ir alcanarsua inteno ou que sua inteno no pode ser alcanada ou no a melhor inten-o possvel. Nesse momento, o agente ir gerar um novo i-plan ou escolher umanova inteno e gerar um i-plan para alcan-lo e o processo ir se repetir (PEREIRA,2008).

    O resultado obtido nos trabalhos de (SIMARI; PARSONS, 2006) e (PEREIRA,2008) o de que, dada uma poltica, que tem uma ao para cada estado, pos-svel derivar um ou mais i-plans, determinando uma trajetria atravs do espao deestados. Portanto, pode-se dizer que uma poltica incorpora um conjunto de i-plans.

  • 42

    3.4.2 Passagem de Poltica para I-Plans

    Assume-se que uma poltica pi a soluo para um POMDP especificado, e que pi tima (esta condio importante para os resultados que se querem obter). Entre-tanto, de qualquer poltica possvel extrair valores de utilidade para os estados queiro induzir pi, e estes podero ser usados para estabelecer i-plans.

    De uma forma geral, para se atribuir valor para um i-plan necessrio que estetenha, para cada ao adicionada ao plano, valores de custo no negativos, e queestes valores dependam das recompensas dos estados que o agente planeja visitar.

    A definio formal para um i-plan , segundo (SIMARI; PARSONS, 2006), dadada forma a seguir:

    Definio 3.4.1. Uma sequncia de aes 0,1, ,p, chamada i-plan se asaes i, com 0 i p, forem selecionadas para serem executadas uma de cadavez, na ordem da sequncia para alcanar uma dada inteno.

    Definio 3.4.2. Dado um i-plan = 0,1, ,p, diz-se que p o tamanho de .

    Definio 3.4.3. (Definio de Obedincia) Um i-plan de tamanho p obedece a umapoltica pi se, e somente se, i,1 i p : i = pi

    (si1

    ), onde si o estado para qual o

    agente est planejando chegar aps executar a ao i, e s0 seu estado inicial.

    Assim, um i-plan obedece a uma poltica se, e somente se, as aes prescritaspelo i-plan so as mesmas prescritas pela poltica atravs dos estados intermediriosdo i-plan.

    Definio 3.4.4. (Definio de Conformidade) Uma poltica pi est de acordo com umi-plan de tamanho p se, e somente se, i,1 i p : i = pi

    (si1

    )onde si o estado

    que resulta da execuo da ao i no estado si1, e s

    0 o estado no qual a primeira

    ao executada.

    Ou seja, uma poltica est de acordo com um plano, se para cada ao descritano plano a poltica recomenda a mesma ao.

    Proposio 3.4.1. Seja< S,A,T,R,,O,P> um agente POMDP e pi uma poltica que tima sob um critrio de mxima utilidade esperada. Seja < S,A,T,B,D, I,Del,M > umagente BDI, onde M e Del so timos sob um critrio de mxima utilidade esperada.Se o ambiente for parcialmente observvel, com S sendo a contraparte parcialmenteobservvel de S, e tambm no determinstico, isto , |T (s;a)| 1, ento i I,s S, vlido que i,s obedece a pi.

  • 43

    Esta uma formalizao da relao entre polticas e i-plans. Esta correspondncia vlida sob restritivas suposies, em particular se os requisitos (poltica, M e Del)forem timos, mas garante que os i-plans gerados refletem uma poltica tima. Senecessrio, pode-se relaxar a necessidade de um i-plan corresponder a uma polticatima, desta forma o i-plan criado com menos restries.

    Fica realizada, desta forma, uma fundamentao terica abrangente e detalhadadas ferramentas utilizadas para a modelagem e simulao dos agentes inteligentesdeste trabalho. Todas essas ferramentas s podero ser utilizadas se for possvelmontar um planejamento adequado para a realizao das tarefas que os agentes pre-cisaro desempenhar. Tal estratgia11 precisar ser reformulada a cada deteco dossensores dos agentes. Assim, no captulo seguinte sero definidas algumas teoriasde planejamento e destas ser destacada a estratgia que abranger o hbrido deagentes BDI e POMDPs, ou seja, os i-plans.

    3.5 PLANEJAMENTO

    Alguns autores como Peter Norvig12 e Sebastian Thrun colocam o planejamentocomo o ncleo da Inteligncia Artificial.

    Planejamento consiste em apresentar uma sequncia de aes que alcanaroum objetivo. Para o caso de ambientes determinsticos e totalmente observveis, tc-nicas de planejamento clssico, como algoritmos de busca, so suficientes. Entre-tanto, em ambientes estocsticos, no determinsticos ou em ambos preciso pensarem uma forma de relaxamento para tais algoritmos. Esse relaxamento, ou seja, essetipo de planejamento chamado de planejamento no-clssico.

    Como j foi citado, o ambiente deste trabalho estocstico e mais especifica-mente, pode-se dizer que o ambiente possui um indeterminismo ilimitado.

    Em ambientes com essa caracterstica um agente deve usar suas percepespara descobrir o que est acontecendo enquanto o plano est sendo executado e,possivelmente, modificar ou substituir o plano caso ocorra algo inesperado (NORVIG;RUSSELL, 2004). Ambientes no-determinsticos obrigam os agentes a lidar cominformaes incompletas e incorretas. Incompletas pela prpria caracterstica do am-biente e incorretas pois o ambiente no corresponde necessariamente ao modelo deambiente. Por exemplo: posso acreditar que ser servido ch s 15 horas, mas hoje

    11Planejamento ou Planning.12Peter Norvig diretor de pesquisa da Google Inc. Ele tambm membro da Associao Americana

    de Inteligncia Artificial e da Association for Computing Machinery. Norvig co-autor do livro IntelignciaArtificial: uma abordagem moderna. Antes de entrar no Google, ele era o chefe da Diviso de Cinciasda Computao na NASA Ames Research Center.

  • 44

    tomei suco de laranja nesse mesmo horrio.

    O conhecimento correto e completo dependente da quantidade de indetermi-naes existentes no ambiente. Se o indeterminismo limitado, as aes poderoter efeitos imprevisveis, mas os efeitos possveis podem ser listados na classifica-o das descries de aes, ou seja, o espao amostral conhecido e enumervel.Quando o ambiente possui indeterminismo ilimitado, o conjunto de precondies ouefeitos possveis desconhecido ou grande demais para ser enumerado completa-mente (NORVIG; RUSSELL, 2004). Neste caso, alguns mtodos de planejamentopodem ser adotados para suprir esta complexidade.

    Alguns dos mtodos de planejamento para lidar com o indeterminismo so (NOR-VIG; RUSSELL, 2004):

    Planejamento sem sensores (sensorless planning): Tambm chamado plane-jamento com conformao. Esse mtodo constri planos sequenciais que de-vem ser executados sem percepo. O algoritmo de planejamento sem senso-res deve assegurar que o plano atingir o objetivo em todas as circunstnciaspossveis, independente do verdadeiro estado inicial e dos reais resultados dasaes. O planejamento sem sensores se baseia na coero ideia de que omundo pode ser forado a entrar em um determinado estado, mesmo quando oplanejador s tem informaes parciais a respeito do estado atual. A coeronem sempre possvel, portanto o planejamento sem sensores frequentemente inaplicvel.

    Planejamento condicional: Essa abordagem lida com o indeterminismo limitadoconstruindo um plano condicional com diferentes ramificaes para as diferentescontingncias que poderiam surgir. Da mesma maneira que no planejamentoclssico, o agente planeja primeiro e depois executa o plano que foi produzido. Oagente descobre qual parte do plano deve executar incluindo aes de detecono plano para testar a presena das condies apropriadas. Por exemplo, nodomnio de transporte areo, poderia ter planos como verificar se o aeroportode So