Modela˘c~ao de dados espa˘co-temporais em seguran˘ca ...

146
UNIVERSIDADE DE LISBOA FACULDADE DE CI ˆ ENCIAS DEPARTAMENTO DE ESTAT ´ ISTICA E INVESTIGAC ¸ ˜ AO OPERACIONAL Modela¸ ao de dados espa¸ co-temporais em seguran¸ ca rodovi´ aria Maria da Concei¸c˜ao Rodrigues Ribeiro Doutoramento em Estat´ ıstica e Investiga¸c˜ ao Operacional (Especialidade de Probabilidades e Estat´ ıstica) 2012

Transcript of Modela˘c~ao de dados espa˘co-temporais em seguran˘ca ...

UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS

DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL

Modelacao de dadosespaco-temporais em seguranca

rodoviaria

Maria da Conceicao Rodrigues Ribeiro

Doutoramento em Estatıstica e Investigacao Operacional(Especialidade de Probabilidades e Estatıstica)

2012

2

UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS

DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL

Modelacao de dadosespaco-temporais em seguranca

rodoviaria

Maria da Conceicao Rodrigues Ribeiro

Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente

elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)

2012

Resumo

Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-

sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos

ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-

tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca

fundamental para no sentido de compreender melhor a complexidade de fatores relacio-

nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca

rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses

Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de

modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas

correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-

porte com o objectivo de encontrar modelos que possam servir como referencia na imple-

mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios

A estimacao do numero esperado de acidentes continua a ser um problema em aberto

nao existindo um metodo que possa ser considerado otimo No entanto e generalizada

a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de

modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria

No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente

proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA

(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos

metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves

do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos

hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao

WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia

exponencial

Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-

vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de

dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se

assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas

pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a

permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel

nacional ou regional mas tambem ao nıvel internacional

Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo

INLA

Abstract

Road accidents are a serious public health problem worldwide with devastating socio-

economic consequences Despite the enormous efforts made in recent years the road

fatalities values are still unacceptable Statistics recorded caught the interest of resear-

chers and politicians as a key to better understand the complexity of factors related to

road accidents and to determine which aspects of the problem of road safety are local

(national or regional) and which are shared by several countries Thus there has been

considerable research directed towards the development of statistical modeling of road

accident data in geographic areas corresponding to organs of public administration or

management of transport infrasctruture with the aim of finding models that can serve

as reference to the implementation of corrective actions aimed to reduce the number of

road accidents

The estimation of the expected number of accidents remains an open problem and there

is no method that can be considered optimal However there is a general reference to

the superiority of Bayesian methods This thesis focuses on the application of Bayesian

hierarchical models with spatio-temporal data in road safety

Regarding to inference methodology a recent approach proposed in Rue et al (2009)

which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-

ximations) was used which is a deterministic alternative to the simulation methods

MCMC commonly used Thus we explored in R through R-INLA the implementation of

this methodology which makes the use of Bayesian hierarchical models more accessible

being a very competitive alternative for the WinBUGS for situations where the depedent

variable distribution belongs to the exponential family

With the implementation of these models it was possible to reduce the estimates va-

riability of the risks of accidents in small areas and simultaneously to reveal patterns

of spatial dependence trends and spatio-temporal interactions In this way a spatial

smoothing of the data was obtained despite of the regions under study having small

areas Furthermore it was possible to identify the counties of Portugal at higher risk

relatively to the country and to analyze association of the district council with potential

risk factors or exposure It is hoped that this methodology will allow comparisons with

regard to road safety not only at national or regional level but also at international level

Keywords road safety hierarchical Bayesian models relative risk INLA

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

2

UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS

DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL

Modelacao de dadosespaco-temporais em seguranca

rodoviaria

Maria da Conceicao Rodrigues Ribeiro

Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente

elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)

2012

Resumo

Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-

sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos

ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-

tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca

fundamental para no sentido de compreender melhor a complexidade de fatores relacio-

nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca

rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses

Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de

modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas

correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-

porte com o objectivo de encontrar modelos que possam servir como referencia na imple-

mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios

A estimacao do numero esperado de acidentes continua a ser um problema em aberto

nao existindo um metodo que possa ser considerado otimo No entanto e generalizada

a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de

modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria

No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente

proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA

(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos

metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves

do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos

hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao

WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia

exponencial

Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-

vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de

dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se

assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas

pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a

permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel

nacional ou regional mas tambem ao nıvel internacional

Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo

INLA

Abstract

Road accidents are a serious public health problem worldwide with devastating socio-

economic consequences Despite the enormous efforts made in recent years the road

fatalities values are still unacceptable Statistics recorded caught the interest of resear-

chers and politicians as a key to better understand the complexity of factors related to

road accidents and to determine which aspects of the problem of road safety are local

(national or regional) and which are shared by several countries Thus there has been

considerable research directed towards the development of statistical modeling of road

accident data in geographic areas corresponding to organs of public administration or

management of transport infrasctruture with the aim of finding models that can serve

as reference to the implementation of corrective actions aimed to reduce the number of

road accidents

The estimation of the expected number of accidents remains an open problem and there

is no method that can be considered optimal However there is a general reference to

the superiority of Bayesian methods This thesis focuses on the application of Bayesian

hierarchical models with spatio-temporal data in road safety

Regarding to inference methodology a recent approach proposed in Rue et al (2009)

which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-

ximations) was used which is a deterministic alternative to the simulation methods

MCMC commonly used Thus we explored in R through R-INLA the implementation of

this methodology which makes the use of Bayesian hierarchical models more accessible

being a very competitive alternative for the WinBUGS for situations where the depedent

variable distribution belongs to the exponential family

With the implementation of these models it was possible to reduce the estimates va-

riability of the risks of accidents in small areas and simultaneously to reveal patterns

of spatial dependence trends and spatio-temporal interactions In this way a spatial

smoothing of the data was obtained despite of the regions under study having small

areas Furthermore it was possible to identify the counties of Portugal at higher risk

relatively to the country and to analyze association of the district council with potential

risk factors or exposure It is hoped that this methodology will allow comparisons with

regard to road safety not only at national or regional level but also at international level

Keywords road safety hierarchical Bayesian models relative risk INLA

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS

DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL

Modelacao de dadosespaco-temporais em seguranca

rodoviaria

Maria da Conceicao Rodrigues Ribeiro

Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente

elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)

2012

Resumo

Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-

sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos

ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-

tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca

fundamental para no sentido de compreender melhor a complexidade de fatores relacio-

nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca

rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses

Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de

modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas

correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-

porte com o objectivo de encontrar modelos que possam servir como referencia na imple-

mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios

A estimacao do numero esperado de acidentes continua a ser um problema em aberto

nao existindo um metodo que possa ser considerado otimo No entanto e generalizada

a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de

modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria

No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente

proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA

(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos

metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves

do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos

hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao

WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia

exponencial

Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-

vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de

dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se

assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas

pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a

permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel

nacional ou regional mas tambem ao nıvel internacional

Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo

INLA

Abstract

Road accidents are a serious public health problem worldwide with devastating socio-

economic consequences Despite the enormous efforts made in recent years the road

fatalities values are still unacceptable Statistics recorded caught the interest of resear-

chers and politicians as a key to better understand the complexity of factors related to

road accidents and to determine which aspects of the problem of road safety are local

(national or regional) and which are shared by several countries Thus there has been

considerable research directed towards the development of statistical modeling of road

accident data in geographic areas corresponding to organs of public administration or

management of transport infrasctruture with the aim of finding models that can serve

as reference to the implementation of corrective actions aimed to reduce the number of

road accidents

The estimation of the expected number of accidents remains an open problem and there

is no method that can be considered optimal However there is a general reference to

the superiority of Bayesian methods This thesis focuses on the application of Bayesian

hierarchical models with spatio-temporal data in road safety

Regarding to inference methodology a recent approach proposed in Rue et al (2009)

which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-

ximations) was used which is a deterministic alternative to the simulation methods

MCMC commonly used Thus we explored in R through R-INLA the implementation of

this methodology which makes the use of Bayesian hierarchical models more accessible

being a very competitive alternative for the WinBUGS for situations where the depedent

variable distribution belongs to the exponential family

With the implementation of these models it was possible to reduce the estimates va-

riability of the risks of accidents in small areas and simultaneously to reveal patterns

of spatial dependence trends and spatio-temporal interactions In this way a spatial

smoothing of the data was obtained despite of the regions under study having small

areas Furthermore it was possible to identify the counties of Portugal at higher risk

relatively to the country and to analyze association of the district council with potential

risk factors or exposure It is hoped that this methodology will allow comparisons with

regard to road safety not only at national or regional level but also at international level

Keywords road safety hierarchical Bayesian models relative risk INLA

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

Resumo

Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-

sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos

ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-

tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca

fundamental para no sentido de compreender melhor a complexidade de fatores relacio-

nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca

rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses

Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de

modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas

correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-

porte com o objectivo de encontrar modelos que possam servir como referencia na imple-

mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios

A estimacao do numero esperado de acidentes continua a ser um problema em aberto

nao existindo um metodo que possa ser considerado otimo No entanto e generalizada

a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de

modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria

No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente

proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA

(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos

metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves

do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos

hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao

WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia

exponencial

Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-

vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de

dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se

assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas

pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a

permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel

nacional ou regional mas tambem ao nıvel internacional

Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo

INLA

Abstract

Road accidents are a serious public health problem worldwide with devastating socio-

economic consequences Despite the enormous efforts made in recent years the road

fatalities values are still unacceptable Statistics recorded caught the interest of resear-

chers and politicians as a key to better understand the complexity of factors related to

road accidents and to determine which aspects of the problem of road safety are local

(national or regional) and which are shared by several countries Thus there has been

considerable research directed towards the development of statistical modeling of road

accident data in geographic areas corresponding to organs of public administration or

management of transport infrasctruture with the aim of finding models that can serve

as reference to the implementation of corrective actions aimed to reduce the number of

road accidents

The estimation of the expected number of accidents remains an open problem and there

is no method that can be considered optimal However there is a general reference to

the superiority of Bayesian methods This thesis focuses on the application of Bayesian

hierarchical models with spatio-temporal data in road safety

Regarding to inference methodology a recent approach proposed in Rue et al (2009)

which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-

ximations) was used which is a deterministic alternative to the simulation methods

MCMC commonly used Thus we explored in R through R-INLA the implementation of

this methodology which makes the use of Bayesian hierarchical models more accessible

being a very competitive alternative for the WinBUGS for situations where the depedent

variable distribution belongs to the exponential family

With the implementation of these models it was possible to reduce the estimates va-

riability of the risks of accidents in small areas and simultaneously to reveal patterns

of spatial dependence trends and spatio-temporal interactions In this way a spatial

smoothing of the data was obtained despite of the regions under study having small

areas Furthermore it was possible to identify the counties of Portugal at higher risk

relatively to the country and to analyze association of the district council with potential

risk factors or exposure It is hoped that this methodology will allow comparisons with

regard to road safety not only at national or regional level but also at international level

Keywords road safety hierarchical Bayesian models relative risk INLA

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

Abstract

Road accidents are a serious public health problem worldwide with devastating socio-

economic consequences Despite the enormous efforts made in recent years the road

fatalities values are still unacceptable Statistics recorded caught the interest of resear-

chers and politicians as a key to better understand the complexity of factors related to

road accidents and to determine which aspects of the problem of road safety are local

(national or regional) and which are shared by several countries Thus there has been

considerable research directed towards the development of statistical modeling of road

accident data in geographic areas corresponding to organs of public administration or

management of transport infrasctruture with the aim of finding models that can serve

as reference to the implementation of corrective actions aimed to reduce the number of

road accidents

The estimation of the expected number of accidents remains an open problem and there

is no method that can be considered optimal However there is a general reference to

the superiority of Bayesian methods This thesis focuses on the application of Bayesian

hierarchical models with spatio-temporal data in road safety

Regarding to inference methodology a recent approach proposed in Rue et al (2009)

which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-

ximations) was used which is a deterministic alternative to the simulation methods

MCMC commonly used Thus we explored in R through R-INLA the implementation of

this methodology which makes the use of Bayesian hierarchical models more accessible

being a very competitive alternative for the WinBUGS for situations where the depedent

variable distribution belongs to the exponential family

With the implementation of these models it was possible to reduce the estimates va-

riability of the risks of accidents in small areas and simultaneously to reveal patterns

of spatial dependence trends and spatio-temporal interactions In this way a spatial

smoothing of the data was obtained despite of the regions under study having small

areas Furthermore it was possible to identify the counties of Portugal at higher risk

relatively to the country and to analyze association of the district council with potential

risk factors or exposure It is hoped that this methodology will allow comparisons with

regard to road safety not only at national or regional level but also at international level

Keywords road safety hierarchical Bayesian models relative risk INLA

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

Agradecimentos

Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-

pressar o meu profundo agradecimento

A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-

mente pela sua compreensao

A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao

devido acima de tudo pela grande admiracao que tenho por ela

Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima

de tudo pelo seu entusiasmo por esta tese

Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo

Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA

e pelo incentivo

Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a

minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha

de conhecimentos importantes para a realizacao do meu doutoramento

Ao Professor Rune Elvik pelo interesse demostrado

Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-

ciado pela bolsa de doutoramento SFRHPROTEC492262008

A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de

Portugal Continental

Ao Dr Rui Pereira pela prontidao e pelo interesse

A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do

Instituto Superior de Engenharia

Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram

em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao

Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-

balho

Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha

espera

Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho

a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa

os quais me ajudaram cada um a sua maneira

A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude

partilhar muitos momentos de alegria e descontracao

Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira

A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre

em mim a Mariana e a Rita por me seguirem como exemplo

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

A minha mae

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas

Siglas e Acronimos

A Area geografica

AE Autoestrada

ANSR Autoridade Nacional de Seguranca Rodoviaria

BN Binomial Negativo

BT Brigada de Transito

BOA An R Package for MCMC Output Convergence

Assessment and Posterior Inference

BUGS Bayesian Using Gibbs Sampling

C Comprimento de estrada

CARE Community database on accidents on the roads in Europe

CE Codigo de Estrada

CODA Convergence Diagnosis and Output Analysis for MCMC

CPO Conditional Predictive Ordinates

DIC Deviance Information Criterion

DP Densidade populacional

EN Estrada Nacional

ENSR Estrategia Nacional de Seguranca Rodoviaria

GNR Guarda Nacional Republicana

HPD Highest Probability Density

IC Itinerario Complementar

INLA Integrated Nested Laplace Approximations

IP Itinerario Principal

MCMC Markov Chains Monte Carlo

mls Mean logarithmic score

OMS Organizacao Mundial de Saude

ONU Organizacao das Nacoes Unidas

OSEPU Ocupacao do solo com equipamentos e parques urbanos

OSI Ocupacao industrial do solo

OST Ocupacao do solo com equipamento turıstico

OSU Ocupacao urbana do solo

pD Numero efetivo de parametros

PIT Probability Integral Transformation

PMOT Plano Municipal de Ordenamento do Territorio

PMSR Planos Municipais de Seguranca Rodoviaria

PSP Polıcia de Seguranca Publica

R A Language and Environment for Statistical Computing

SafetyNET Projeto europeu European Traffic Information System -

Data Colletion and Analysis Tools for Policy Making

SMR Standard Morbility Ratio

UE Uniao Europeia

WinBUGS versao em ambiente Windows do programa BUGS

VC Quantidade de combustıvel vendido

Conteudo

Lista de Tabelas xiv

Lista de Figuras xv

Introducao 1

1 Nocoes sobre seguranca rodoviaria 9

11 Risco em seguranca rodoviaria 9

12 Caracterizacao dos dados de acidentes 10

13 Caracterizacao da medida de exposicao 14

2 Modelacao estatıstica de acidentes rodoviarios 19

21 Modelos bayesianos hierarquicos 21

22 Modelos nao espaciais 24

23 Modelos espaciais 27

24 Modelos espaco-temporais 28

25 Modelos multivariados 30

26 Metodos de inferencia 32

261 INLA 32

27 Ajustamento e medidas preditivas 36

3 Aplicacoes 39

31 Associacao espacial 40

32 Modelos 43

33 Modelos espaco-temporais 45

331 Associacao regional 46

332 Selecao dos modelos 47

333 Modelos para acidentes do tipo 1 48

334 Validacao dos modelos para acidentes do tipo 1 49

335 Resultados obtidos com modelos para acidentes do tipo 1 49

xii Conteudos

336 Modelos para acidentes do tipo 2 61

337 Validacao dos modelos para acidentes do tipo 2 62

338 Resultados obtidos com modelos para acidentes do tipo 2 62

339 Modelos para acidentes do tipo 3 73

3310 Validacao dos modelos para acidentes do tipo 3 73

3311 Resultados obtidos com modelos para acidentes do tipo 3 74

34 Modelos multivariados 83

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

351 Modelo para acidentes do tipo 1 89

352 Validacao do modelo para acidentes do tipo 1 89

353 Resultados obtidos com o modelo para acidentes do tipo 1 90

354 Modelo para acidentes do tipo 2 92

355 Validacao do modelo para acidentes do tipo 2 92

356 Resultados obtidos com o modelo para acidentes do tipo 2 93

357 Modelos para acidentes do tipo 3 95

358 Validacao do modelo para acidentes do tipo 3 95

359 Resultados obtidos com o modelo para acidentes do tipo 3 96

4 Discussao e conclusoes 99

A Caracterizacao da regiao de estudo 103

A1 Portugal Continental 103

A2 Numero de acidentes 108

A3 Covariaveis 110

A4 15 concelhos 115

Referencias Bibliograficas 119

Lista de Tabelas

11 Numero total de cada tipo de acidentes rodoviarios por ano 11

12 Estatısticas resumo do numero de veıculos com seguro em milhares 14

21 Modelos univariados 30

31 Valores do ındice EBI para cada tipo de acidente por ano 43

32 Valores DIC e mls dos modelos Poisson sem covariaveis 44

33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44

34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45

35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem

covariaveis 46

36 DIC pD e mls para cada tipo de acidente 47

37 DIC pD e mls para acidentes tipo 1 48

38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50

39 Estatısticas resumo dos parametros do modelo P 1 8 1 53

310 Estatısticas resumo dos parametros do modelo P 1 8 16 54

311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55

312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55

313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57

314 DIC pD e mls para acidentes tipo 2 61

315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63

316 Estatısticas resumo para os parametros do modelo P 2 9 1 66

317 Estatısticas resumo para os parametros do modelo P 2 9 16 67

318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67

319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68

320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69

321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71

322 DIC pD e mls para acidentes tipo 3 73

323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74

xiv Lista de Tabelas

324 Estatısticas resumo dos parametros do modelo P 3 6 1 78

325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78

326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78

327 Modelos univariados 82

328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-

tivariado e dos modelos univariados 83

329 Correlacoes dos modelos multivariados com interacao e sem interacao

espaco-temporal 84

330 Vıtimas a 24 horas e vıtimas a 30 dias 84

331 Numero total de cada tipo de acidentes rodoviarios por ano 87

332 DIC pD e mls para cada tipo de acidente 89

333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90

334 DIC pD e mls 92

335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93

336 Estatısticas resumo dos parametros do modelo P 3 6 30 96

337 Comparacao entre a abordagem local e a global 98

A1 Estatısticas resumo de acidentes tipo 1 108

A2 Estatısticas resumo de acidentes tipo 2 108

A3 Estatısticas resumo de acidentes tipo 3 108

A4 Estatısticas resumo de acidentes tipo 1 109

A5 Estatısticas resumo de acidentes tipo 2 109

A6 Estatısticas resumo de acidentes tipo 3 109

A7 Estatısticas resumo da covariavel populacao 110

A8 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 1 115

A9 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 2 116

A10 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 para acidentes tipo 3 117

A11 15 concelhos com estimativas de risco relativo significativamente maiores

que 1 118

Lista de Figuras

1 Dez principais causas de morte no mundo 2

2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4

11 Numero de acidentes tipo 1 por concelho 12

12 Numero de acidentes tipo 2 por concelho 12

13 Numero de acidentes tipo 3 por concelho 13

14 Numero de veıculos com seguro em milhares por concelho e por ano 14

15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15

16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16

17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16

31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de

acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano

2000 41

32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de

veıculos com seguro no ano 2000 41

33 Valores estimados dos SMR1 e respetivos intervalos de confianca para

cada concelho no ano 2000 42

34 Histograma dos valores de EBI simulados e valor de EBI observado para

acidentes tipo 1 e para ano 2000 43

35 Histograma das diferencas entre as medias dos logscores 48

36 Histograma dos valores PIT ajustados para acidentes tipo 1 49

37 Box plot dos valores estimados para acidentes tipo 1 50

38 Amplitude dos intervalos para acidentes tipo 1 51

39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 1 51

310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o

ano 2000 52

xvi Lista de Figuras

311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52

312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o

modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53

313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo P 1 8 16 56

314 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo

P 1 8 16 56

315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo P 1 8 16 57

316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 6 172 58

317 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58

318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-

dos com o modelo BN 1 6 172 59

319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com

o modelo BN 1 6 172 60

320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 6 172 60

321 Histograma das diferencas entre as medias dos logscores 61

322 Histograma dos valores PIT ajustados para acidentes tipo 2 62

323 Box plot dos valores estimados para acidentes tipo 2 63

324 Amplitude dos intervalos para acidentes tipo 2 64

325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori dos acidentes tipo 2 64

326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o

ano 2000 65

327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65

328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o

modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66

329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo P 2 9 16 68

330 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

P 2 9 16 69

Lista de Figuras xvii

331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2

de 2000 a 2007 obtidos com o modelo P 2 9 16 70

332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 4 71

333 Valores esperados a posteriori da componente espacial e da componente

de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo

BN 2 9 4 71

334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 4 72

335 Histograma dos valores PIT ajustados para acidentes tipo 3 74

336 Box plot dos valores estimados para acidentes tipo 3 75

337 Amplitude dos intervalos para acidentes tipo 3 75

338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a

posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76

339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o

ano 2000 76

340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77

341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o

modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77

342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 1 79

343 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79

344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3

de 2000 a 2007 obtidos com o modelo P 3 6 1 80

345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo BN 3 6 6 81

346 Valores esperados a posteriori da componente espacial e da componente

temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81

347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo BN 3 6 6 82

348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos univariados e com os modelos multivariados 85

349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos

com os modelos multivariados 86

350 Numero de acidentes tipo 1 por concelho 87

351 Numero de acidentes tipo 2 por concelho 88

xviii Lista de Figuras

352 Numero de acidentes tipo 3 por concelho 88

353 Histograma dos valores PIT ajustados para acidentes tipo 1 89

354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003

e 2007 obtidos com o modelo BN 1 9 42 90

355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de

2000 a 2007 obtidos com o modelo BN 1 9 42 91

356 Histograma dos valores PIT justados para acidentes tipo 2 92

357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003

e 2007 obtidos com o modelo BN 2 9 86 94

358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de

2000 a 2007 obtidos com o modelo BN 2 9 86 94

359 Histograma dos valores PIT ajustados para acidentes tipo 3 95

360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003

e 2007 obtidos com o modelo P 3 6 30 96

361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de

2000 a 2007 obtidos com o modelo P 3 6 30 97

A1 ID dos concelhos do Norte de Portugal Continental 104

A2 ID dos concelhos do Sul de Portugal Continental 105

A3 Numero de habitantes por concelho e por ano 110

A4 Area por concelho 111

A5 Densidade populacional por concelho 111

A6 Quilometros de estrada por concelho 112

A7 Quantidade de combustıvel vendido por concelho 112

A8 Superfıcie de ocupacao urbana do solo por concelho 113

A9 Superfıcie de ocupacao industrial do solo por concelho 113

A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por

concelho 114

A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114

ldquoThe road to wisdom - Well itacutes plain and simple to express

Err and err and err again but less and less and lessrdquo

Piet Hein (1996)

Introducao

A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora

de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo

automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se

tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao

ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o

Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009

OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes

rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso

entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as

tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa

na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas

etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do

PIB mundial

A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas

necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004

para a quinta causa de morte em 2030

2 Introducao

2004

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Infecoes respiratorias

4 Doencas pulmonares

5 Diarreias

6 HIVAIDS

7 Tuberculose

8Cancro do pulmao

dos bronquios e da traqueia

9 Acidentes rodoviarios

10Recem-nascidos prematuros

e de peso baixo

HH

2030

Ordem Doenca ou ferimento

1 Doencas cardiovasculares

2 Doencas vasculares cerebrais

3 Doencas pulmonares

4 Infecoes respiratorias

5 Acidentes rodoviarios

6Cancro do pulmao

dos bronquios e da traqueia

7 Diabetes mellitus

8 Doencas do coracao hipertensas

9 Cancro do estomago

10 HIVAIDS

Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)

No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a

decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-

ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem

disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao

forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes

rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida

No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de

Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-

dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos

socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a

sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario

e Santos 2012)

O sistema de trafego rodoviario um subsistema do sistema de transportes e formado

por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-

fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes

rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos

correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada

e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a

deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos

Introducao 3

(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de

pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se

por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma

qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena

de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do

sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-

guranca deste sistema complexo tem consequencias devastadoras em termos humanos

sociais e economicos (Cardoso 2007)

Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta

consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos

consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-

vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma

descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-

tadas a nıvel mundial

minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-

doviaria

minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios

como um problema de saude publica

minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da

seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial

minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria

minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das

Nacoes Unidas

minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca

Rodoviaria

minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de

Acao para a Seguranca Rodoviaria

Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria

Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-

dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade

responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para

uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos

veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica

sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste

flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area

da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e

tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha

uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes

4 Introducao

projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do

trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para

veıculos tambem designada por sistemas inteligentes de transportes

A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-

volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos

30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-

tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi

progressivamente modernizado tendo sido acompanhado por um aumento do numero

de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal

terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de

toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu

aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver

na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada

a implementacao de algumas medidas especıficas

Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)

As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para

compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios

e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou

regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma

consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica

de dados de acidentes rodoviarios

Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo

pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e

Introducao 5

do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda

lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util

domınio para desenvolvimento de atividades de investigacao O ambito desta tese e

portanto a modelacao estatıstica de dados de acidentes rodoviarios

Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-

retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar

progressivamente a execucao dessas acoes foram identificados varios fatores capazes de

melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em

particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas

com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados

As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma

melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de

intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-

vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada

em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-

dos na UE (CARE - Community database on accidents on the roads in Europe) No

projeto integrado SafetyNET (European Traffic Information System - Data Colletion

and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de

informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas

principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco

e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como

ponto de partida para a modelacao estatıstica usada nesta tese

A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-

nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-

ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos

desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-

cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes

o que facilita a identificacao dos fatores causais e de intervencoes corretivas

As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-

tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial

como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy

A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-

tatıstica Em geral foram detetados varios problemas na estimacao dos parametros

de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou

desconhecidas dependencia espacial e depedencia temporal que continuam a constituir

objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-

blemas como por exemplo

1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm

6 Introducao

minus modelos lineares generalizados baseados na distribuicao de Poisson

minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia

de sobredispersao

minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado

para analisar dados de acidentes com sobredispersao e excesso de zeros

minus modelos de nıveis multiplos estruturados

minus modelos bayesianos hierarquicos

minus incorporacao de correlacao espacial e dependencia temporal nos modelos

A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao

existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada

a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre

os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos

hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem

podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li

et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar

a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais

e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais

atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004)

O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da

estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a

problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior

barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua

formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains

Monte Carlo) na computacao bayesiana

A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se

nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que

envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas

O seu crescimento ao nıvel das aplicacoes tem sido extraordinario

O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using

Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o

GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao

Introducao 7

CODA Plummer et al (2006) e ao BOA Smith (2007)

Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de

pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)

o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em

particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-

tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas

Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana

aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa

determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas

limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes

de concordancia

Todas as analises envolvidas no metodo INLA estao implementadas num programa que

pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser

descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos

hierarquicos complexos tornou-se muito mais acessıvel

Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA

Objetivos

Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-

los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca

rodoviaria em areas geograficas diferentes

Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse

tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-

pacial e depedencia temporal

Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal

Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com

potenciais fatores de risco ou de exposicao

Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes

nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional

Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-

place Approximations atraves da exploracao do pacote R-INLA

8 Introducao

Estrutura da tese

No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a

caracterizacao dos dados usados nesta tese

No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos

No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais

de sinistralidade rodoviaria registados em Portugal Continental

No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido

de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros

No Anexo A faz-se a caracterizacao da regiao de estudo

No CD em anexo encontram-se todos os codigos usados nesta tese

1Nocoes sobre seguranca rodoviaria

11 Risco em seguranca rodoviaria

O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores

de seguranca informativos muito importantes No entanto quando se pretende fazer

comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de

acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca

rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de

acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja

risco=numero esperado de acidentesmedida de exposicao

A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-

responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel

ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-

teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a

melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-

cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos

proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens

e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego

10 Capıtulo 1 Nocoes sobre seguranca rodoviaria

atraves do comprimento de estrada do numero de veıculos ou preferencialmente da

distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode

estar associada a populacao de risco atraves do numero de habitantes do numero de

condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas

times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco

de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia

de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-

cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o

numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para

a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande

disponibilidade de informacao desagregada o que permite analisar as especificidades de

varios grupos populacionais As restantes medidas indicadas apresentam atualmente

muitas limitacoes1

Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se

deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido

e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a

relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata

de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes

e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-

se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de

veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se

a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho

12 Caracterizacao dos dados de acidentes

Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito

e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas

sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela

gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de

exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-

tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao

usada e sobre as covariaveis usadas

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-

ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez

1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2

205-v3_finalpdf

12 Caracterizacao dos dados de acidentes 11

agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho

A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos

se encontram no litoral norte sendo consequentemente mais proximos uns dos outros

Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz

respeito a caracterizacao dos concelhos2

Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311

Total 279644 28844 8890 317378

Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR

minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo

menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT

e PSP) e da qual resultem vıtimas ou danos materiais

minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais

minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do

acidente ou no seu percurso ate a unidade de saude No perıodo em analise para

obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)

aplica-se um coeficiente multiplicativo de 114 ao numero de mortos

minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo

de hospitalizacao superior a 24 horas

minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave

minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima

minus Acidente mortal Acidente do qual resulte pelo menos um morto

minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido

grave nao tendo ocorrido qualquer morte

minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido

leve e em que nao se tenham registado mortos nem feridos graves

2ver Anexo A

12 Capıtulo 1 Nocoes sobre seguranca rodoviaria

Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes

com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes

do tipo 3 os acidentes mortais

Figura 11 Numero de acidentes tipo 1 por concelho

Figura 12 Numero de acidentes tipo 2 por concelho

12 Caracterizacao dos dados de acidentes 13

Figura 13 Numero de acidentes tipo 3 por concelho

Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero

de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de

acidentes

Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor

risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao

entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria

muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos

mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278

concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado

o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de

cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes

decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para

permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no

espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes

Isto e especialmente importante porque apesar do numero de acidentes ser relacionado

com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria

que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de

3ver Anexo A

14 Capıtulo 1 Nocoes sobre seguranca rodoviaria

trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a

variabilidade da medida de exposicao em funcao do espaco ou do tempo

13 Caracterizacao da medida de exposicao - numero

de veıculos com seguro

Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares

Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730

Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)

13 Caracterizacao da medida de exposicao 15

O numero de veıculos com seguro varia bastante de concelho para concelho como se pode

verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo

por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que

cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media

inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo

Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho

i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o

numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =

100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de

acidente rodoviario para acidentes do tipo 1ndash3

Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por

concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes

e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos

sugerindo a existencia de correlacao espacial

Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na

faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas

mais baixas

Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007

Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-

se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se

mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas

muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a

16 Capıtulo 1 Nocoes sobre seguranca rodoviaria

nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos

com taxas mais baixas

Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007

Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007

No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas

usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer

mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-

petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao

13 Caracterizacao da medida de exposicao 17

ocorre com muita frequencia com dados de contagem com muitos valores escassos e

ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou

unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas

pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes

associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso

nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando

as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante

afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e

Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas

dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem

como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-

tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de

forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e

Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos

desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo

com Banerjee et al (2004) descritos no Capıtulo 2

2Modelacao estatıstica de acidentes rodoviarios

Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram

baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados

normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido

que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-

doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia

de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma

probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre

os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-

dos de contagens sao modelos mais apropriados para este tipo de estudos

Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo

constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo

et al 2007 Cardoso 1996)

Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo

caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala

espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais

desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais

como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel

explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-

20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como

uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade

espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias

ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao

apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo

muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao

verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos

com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao

de riscos relativos em areas pequenas

No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-

dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade

de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto

deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-

mas na alocacao de fundos governamentais e no planeamento regional Determinados

atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-

cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para

areas pequenas e esta tendencia ira provavelmente continuar

Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-

vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco

relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario

num determinado concelho relativamente ao risco no paıs (Portugal Continental)

As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e

consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem

acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999

Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)

Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os

metodos tradicionais para investigar questoes importantes relacionadas com estimacao de

riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia

temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis

nao observaveis tais como clima determinadas caracterısticas da populacao entre outras

Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser

pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a

construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios

ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al

2009)

Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com

efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-

tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes

21 Modelos bayesianos hierarquicos 21

espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e

temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh

et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a

suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos

pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos

dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-

doviarios

A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma

serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia

em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-

dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes

rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem

ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade

existente no dados Noland e Quddus (2004) Elvik (2011)

A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-

melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio

que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-

blema atribuıdo a comportamentos inadequados dos condutores associados a falencias

da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de

acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA

constitui a covariavel com maior poder explicativo da variacao observada No entanto

nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas

do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por

exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de

servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel

vendido e um indicador do volume de trafego e a densidade populacional um indicador de

urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais

o numero de habitantes a area geografica a densidade populacional o comprimento de

estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao

industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao

do solo com equipamento turıstico como sera abordado no Capıtulo 4

21 Modelos bayesianos hierarquicos

O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que

o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro

θ e o segundo traduz a distribuicao a priori para o parametro θ

22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica

na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-

delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-

nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo

que p(θ) =

intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =

1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa

estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-

formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros

Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade

associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-

tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia

a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori

nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-

tribuicao a priori padrao p(θ) (Paulino et al 2003)

Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte

estrutura

1o nıvel f(y|θ) funcao de verosimilhanca

2o nıvel p(θ|φ) distribuicao a priori dos parametros

3o nıvel p(φ) distribuicao a priori dos hiperparametros

Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e

evoluindo para modelos cada vez mais complexos

O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-

creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-

vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de

acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar

esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-

dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se

Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou

sejaYit|θit sim Poisson(Eitθit)

f(yit|θit) =(Eitθit)

yiteminusEitθit

yit

Eit = nitr = nit

sumij

Yitsumij

nit

21 Modelos bayesianos hierarquicos 23

onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit

representa o numero de veıculos com seguro e θit representa o risco relativo de acidente

rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja

se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia

de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de

acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)

A funcao de versimilhanca e dada por

L(θ|y) =prodit

f(yit|θit) =prodit

(Eitθit)yiteminusEitθit

yitpropprod

θyitit e

minussumit

Eitθit

e l(θ|y) = lnL(θ|y) propsumit

yit ln θitminussumit

Eitθit O estimador de maxima verosimilhanca

do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-

dardized Mortality Ratio1 - SMR) e dado por

θit = SMRit =YitEit

(211)

Note-se que V ar(SMRit) =V ar(Yit)

E2it

=θitEit

podendo-se fazer V ar(SMRit) =θitEit

=YitE2it

Um procedimento classico usual para identificar regioes de maior risco consiste na cons-

trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR

Apesar de util este procedimento tem algumas desvantagens Note-se que em areas

com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero

de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR

podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com

muita frequencia com dados desta natureza quando as unidades espaciais de analise sao

concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao

das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit

associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser

grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram

ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de

tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida

em que a respetiva variabilidade pode ser muito grande A variancia destes valores e

1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso

24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao

grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro

estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-

minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992

Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR

tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores

estimados com menos precisao As maiores variacoes do risco relativo nao estarao em

geral associadas com variacoes do risco subjacente a medida de exposicao mas serao

apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)

Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se

que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-

dade teorica subjacente ao modelo Poisson

A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados

(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do

modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado

que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al

2008 2005)

Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-

mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos

tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao

de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das

flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto

dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se

usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico

medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial

entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao

mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)

22 Modelos nao espaciais

Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh

e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis

atraves da funcao de ligacao usada para modelar a media

ln(θit) = α+

nβsump=1

βpxitp (221)

22 Modelos nao espaciais 25

onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel

e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um

nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual

considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a

priori p = 1 2 nβ i = 1 2 N e t = 1 2 T

No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-

adequadamente capturada pelas variaveis explicativas na funcao da media condicional

Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser

distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-

tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como

ln θit = α+

nβsump=1

βpxitp + vit (222)

onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p

Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que

foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-

los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares

generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)

Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-

dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao

a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo

Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples

de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma

fechada dado que esta mistura resulta de um modelo conjugado

Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao

Poisson e na distribuicao Binomial Negativa

O modelo Poisson Lognormal surge quando se admite que

vit sim Normal(0 σ2v) (223)

A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por

f(yit θNit σ

2v) =

1

σ2v

radic2π

EitθNit

y

int infin0

eminusEitθNit e

v

(ev)yminus1eminus v2

2σ2v dev

nao havendo forma explicıta com

26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

ln θNit = α+

nβsump=1

βpxitp (224)

E[Yit] = microNit eσ2v2 = Eitθ

Nit e

σ2v2 e V ar[Yit] = microNit e

σ2v2(

1 + (eσ2v minus 1)microNit e

minusσ2v2)

O modelo Poisson-Gama ou Binomial Negativo surge quando

exp(vit) sim Gama(φ φ) (225)

A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por

f(yit θBNit φ) =

Γ(yit + φ)

Γ(φ)yit

microBNit + φ

)φ(microBNit

microBNit + φ

)yitou seja

Yit|θBNit sim BN(EitθBNit φ)

com

ln θBNit = α+

nβsump=1

βpxitp (226)

E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit

(1 +

microBNitφ

) Note-se que quando φrarrinfin o

modelo Binomial Negativo reduz-se ao modelo Poisson

Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo

podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais

um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com

av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O

parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de

dispersao

O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-

plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre

unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-

quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito

afectadas (Miranda-Moreno et al 2007 Lord et al 2008)

Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)

A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-

pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os

23 Modelos espaciais 27

riscos relativos conjuntamente como um processo espacial atraves de uma especificacao

a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-

lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco

relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados

observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada

area e a soma de duas componentes que representam fatores espaciais e nao espaciais

No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica

de interesse em cada area tem distribuicao Poisson com media especıfica de cada area

As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre

a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento

das variaveis nao-observadas como em Bernardinelli et al (1995ab)

23 Modelos espaciais

Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia

espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos

mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao

associados uma distribuicao a priori conveniente

log(θit) = α+

nβsump=1

βpxitp + si (231)

Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de

notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario

quer para os modelos baseados na distribuicao de Poisson abreviadamente designados

de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa

abreviadamente designados de modelos BN com os devidos significados

Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que

representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos

atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori

associada

log(θit) = α+

nβsump=1

βpxitp + si + vi (232)

onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-

turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e

si sao mutuamente independentes viiidsim Normal(0 σ2

v) e si|sminusi sim Normal(si σ2smi)

28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

onde o sminusi indica o vetor s com o elemento si removido si =1

mi

sumi 6=j

wijsj e a media

dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e

wij = 0 caso contrario Deste modo mi =sumi 6=j

wij e o respetivo numero de vizinhos e

σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma

s tem distribuicao conjunta

f(s) prop (σ2s)minusn2 exp

minus 1

2σ2s

sumi6=j

(si minus sj)2wij

e (σ2v)minus1 sim Gama(av bv) (σ2

s)minus1 sim Gama(as bs) com av bv as e bs conhecidos

Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial

local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo

gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991

Banerjee et al 2004)

24 Modelos espaco-temporais

Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-

tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a

aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios

e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos

com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se

definiu na seccao anterior

Modelos espaco-temporais sem interacao

Nestes modelos tem-se log(θit) = α+

nβsump=1

βpxitp + si + vi + ψt

onde se considera

ψt sim Normal(0 σ2ψ) (241)

ou

ψt sim RW (1 σ2ψ) (242)

e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ

2s σ

2v σ

2ψ mutuamente

independentes

24 Modelos espaco-temporais 29

Alternativamente log(θit) = α+

nβsump=1

βpxitp + si + vi + γt

onde se considera

γ sim Normal(0 cγ) (243)

sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ

2v mutuamente

independentes (Knorr-Held 2000)

Modelos espaco-temporais com interacao

Neste caso log(θit) = α+

nβsump=1

βpxitp + si + vi + (γ + δi)t

onde se considera alternativamente

δi sim Normal(0 σ2δ ) (244)

ou

δi sim CAR(σ2δ ) (245)

e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com

aδ bδ conhecidos e α βp σ2s σ2

v σ2δ mutuamente independentes (Bernardinelli et al

1995b)

A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando

um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de

acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de

risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia

e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de

cada area e a media global α e δi representa a diferenca entre a tendencia temporal

local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0

a tendencia temporal local da area i e menos acentuada do que a tendencia temporal

global enquanto que quando δi gt 0 e mais acentuada

Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados

neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo

nao se encontra definida uma distribuicao a priori para um parametro considera-se a

distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior

30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

Tabela 21 Modelos univariados

M log(θit) Distribuicao a priori Distribuicao a priori

dos parametros dos hiperparametros

1 α+

nβsump=1

βpxitp α sim Normal(0 cα)

βp sim Normal(0 cβ)

2 α+

nβsump=1

βpxitp + vi vi sim Normal(0 σ2v) σminus2

v sim Gama(av bv)

3 α+

nβsump=1

βpxitp + si si sim CAR(σ2s) σminus2

s sim Gama(as bs)

4 α+

nβsump=1

βpxitp + vi + si

5 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2

ψ sim Gama(aψ bψ)

6 α+

nβsump=1

βpxitp + vi + si + ψt ψt sim RW (σ2ψ)

7 α+

nβsump=1

βpxitp + vi + si + γt γ sim Normal(0 cγ)

8 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2

δ sim Gama(aδ bδ)

9 α+

nβsump=1

βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )

25 Modelos multivariados

Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-

mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes

modelos nao consideram a interdependencia que pode existir entre os riscos relativos

dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na

variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia

para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico

tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-

son capazes de considerar a relacao entre diferentes processos de contagem tais como

contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-

25 Modelos multivariados 31

son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta

abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de

diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o

numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo

k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit

condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou

seja

Ykit|θkit sim Poisson(Ekitθkit)

Modelos espaciais multivariados

1)log θkit = αk +

nβsump=1

βpxitp + ski

com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs

conhecidos

Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)

e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios

ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K

tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-

bilidade assume que a estrutura de associacao se separa numa componente nao espacial

e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta

de s e

s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)

Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)

D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de

vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK

definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre

os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao

espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se

o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo

improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou

modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin

et al (2005) Lawson (2009) Waller e Carlin (2010)

Para alem do modelo 1 foram implementados os modelos multivariados seguintes no

WinBUGS

32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)

3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)

4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e

dδ Rδ conhecidos

mas apenas se obteve convergencia para os modelos 1 e 4

Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =

bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =

001 0 0

0 001 0

0 0 001

26 Metodos de inferencia

A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-

mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e

computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas

abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)

consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-

ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino

e Rue (2010a)

261 INLA

O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-

siana aproximada numa subclasse de modelos de regressao estruturados aditivamente

nomeadamente em modelos latentes gaussianos

Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z

que representa todas as componentes nao observaveis com distribuicao a priori Normal

Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-

mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-

buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia

exponencial A media microi de cada componente e relacionada com um preditor aditivo

estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor

incorpora aditivamente os efeitos de varias componentes

26 Metodos de inferencia 33

ηi = α+

nfsumj=1

f (j)(uij) +

nβsump=1

βpxip + εi (261)

onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-

cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u

podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis

contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-

torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos

podem ser representados atraves das funcoes f (j)()

Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-

mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por

suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a

priori dos hiperparametros nao tem de ser gaussianas

Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-

dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto

de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF

Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel

aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e

Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6

embora possa haver excecoes

Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro

nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos

parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-

sume que os dados observados sao condicionalmente independentes dado o campo latente

z tem-se que

f(y|xφ) =prodi

f(yi|ziφ)

Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca

do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos

φ

A distribuicao a posteriori e dada por

p(zφ|y) prop p(φ)p(z|φ)prodi

f(yi|ziφ) (262)

Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e

analiticamente tratavel

Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao

34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao

analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e

possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa

pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como

tempo computacional longo possibilidade de as amostras simuladas dos parametros se-

rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte

Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser

particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori

entre as componentes espacial ou espaco-temporal do campo latente

Em contraste o metodo de aproximacao INLA e apresentado como um metodo que

fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-

vamente pouco tempo

No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes

marginais a posteriori dos parametros de interesse

As distribuicoes marginais a posteriori pretendidas sao

p(zi|y) =

intφ

p(zi|φy)p(φ|y) dφ (263)

e

p(φj |y) =

intφj

p(φ|y) dφminusj (264)

A aproximacao de p(zi|y) e determinada usando a soma finita

p(zi|y) =sumk

p(zi|φky)p(φk|y)∆k (265)

onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-

vamente Esta soma e calculada por integracao numerica em pontos suporte φk com

pesos apropriados ∆k

A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e

obtida atraves da aproximacao de Laplace

p(φ|y) prop p(zφy)

pG(z|φy)

∣∣z=zlowast(φ) (266)

onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-

cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao

corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)

De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade

a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes

26 Metodos de inferencia 35

pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste

basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior

quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste

em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a

estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)

Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a

estrategia CCD a estrategia por omissao no R-INLA

Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a

aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace

simplificada

A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter

a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))

onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia

marginal Os autores referem que apesar de muito conveniente ao nıvel computacional

pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de

simetria das distribuicoes a posteriori marginais quer a ambos nıveis

Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais

demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-

place semelhante a 266 a p(zi|φy)

pLA(zi|φy) prop p(zφy)

pGG(zminusi|ziφy)

∣∣∣zminusi=zlowastminusi(ziφ) (267)

No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-

nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes

numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de

Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo

menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada

uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-

trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e

simetria Para mais detalhes ver Rue et al (2009)

Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre

os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao

de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos

O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-

parametros entre outras No entanto o seu potencial e reconhecidamente enorme e

encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-

tensoes com muita frequencia

36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios

27 Ajustamento e medidas preditivas

Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o

criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio

combina uma medida de adequabilidade a media a posteriori da desvianca D com

uma medida de complexidade o numero efetivo de parametros pD sendo dado por

DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-

promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no

WinBUGS quer no R-INLA

No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos

aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-

vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive

Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-

tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle

e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-

delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para

detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)

As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)

p(yminusi)=

intf(yi|θyminusi)p(θ|yminusi) dθ

e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores

CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para

efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de

calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou

grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito

diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de

dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem

uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este

problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim

pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =

yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma

forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem

ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)

Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a

0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa

por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira

a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da

concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de

27 Ajustamento e medidas preditivas 37

referencia

Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls

(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))

ntimes T Esta medida e muito

utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os

valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo

3Aplicacoes

Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios

ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os

resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo

de aproximacao INLA atraves do R-INLA

Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-

sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel

usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos

no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao

apresentados os resultados obtidos no WinBUGS

Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a

analise individual de cada ano comparando-se os varios modelos e os resultados obtidos

no WinBUGS e no R-INLA tendo havido concordancia

Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial

40 Capıtulo 3 Aplicacoes

31 Associacao espacial

A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-

doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco

como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter

uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas

determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes

entre areas de maior risco e potenciais fatores

Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-

racterısticas que revelam alguns dos seus problemas Para alem da concentracao de

concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito

diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de

veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a

uma pequena mudanca no numero de acidentes

Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-

rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa

global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com

feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0

e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes

valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no

de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida

ao acaso pois os concelhos possuem condicoes identicas

Tendo em conta que o numero de veıculos com seguro varia muito por concelho este

comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-

ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem

medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito

instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis

ja que possuem variancias muito diferentes

A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura

31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero

de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro

para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas

versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em

2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho

da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com

tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que

assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se

31 Associacao espacial 41

ter uma percecao dessa variabilidade em cada concelho

Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000

Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000

42 Capıtulo 3 Aplicacoes

Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000

A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem

a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir

uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de

contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz

de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma

fronteira e wij = 0 caso contrario

As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e

o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em

areas pequenas em que o tamanho da medida de exposicao e diferente de area para

area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta

questao foram desenvolvidas diversas propostas alternativas para dados com populacoes

heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em

conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se

o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por

EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma

estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa

os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes

empırica da media marginal padronizado pela estimativa do desvio padrao da taxa

Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros

sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI

tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao

32 Modelos 43

do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao

aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de

EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado

no R atraves do pacote spdep e da funcao EBImoranmc()

Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano

Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859

Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000

Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente

por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos

testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo

p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na

Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para

acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao

espacial

32 Modelos

Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais

espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos

modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo

uma vez que forneceram melhores resultados como se pode verificar comparando os

valores das Tabelas 32mdash35

Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA

44 Capıtulo 3 Aplicacoes

No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo

da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo

A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos

de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente

pela analise dos resultados com o programa CODA do R (Plummer et al 2006)

No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-

tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada

computacionalmente menos intensa

Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266

P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205

P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204

P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204

Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 1 2063493 188 464 1351516 170 304 988082 169 222

BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201

BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201

BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201

As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos

espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos

com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo

Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial

Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3

1referente a Tabela 21

33 Modelos espaco-temporais 45

Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior

a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a

diferenca entre o numero de parametros e muito grande

No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos

os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero

correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se

pode ver mais adiante quando se usam os modelos espaco-temporais este problema e

ultrapassado

Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao

menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos

os tipos de acidentes

33 Modelos espaco-temporais

De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para

estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-

mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se

reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre

muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21

Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191

P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191

P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192

P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192

P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192

Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor

modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para

2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso

46 Capıtulo 3 Aplicacoes

o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela

35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo

1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash

e para o tipo 3 o modelo 6 mdash BN 3 6

Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis

Tipo 1 Tipo 2 Tipo 3

DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3

BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191

BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191

BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192

BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193

BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193

Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e

do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores

sao os modelos Poisson

331 Associacao regional

Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao

geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar

informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-

plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos

nos riscos de acidentes

Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes

em milhares de habitantes P a area em centenas de km2 A a densidade populacional em

centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade

de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU

a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques

urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do

solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se

valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST

os valores sao por concelho e iguais em todos os anos

33 Modelos espaco-temporais 47

332 Selecao dos modelos

Foram implementados todos os modelos com todas as combinacoes entre as covariaveis

mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de

acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram

escolhidos os seguintes modelos

Tabela 36 DIC pD e mls para cada tipo de acidente

Tipo P DIC pD mls BN DIC pD mls

1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418

2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260

3 3 6 4 846237 20562 191 3 6 6 852362 19267 191

Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais

P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e

Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU

e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash

modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP

mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI

e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash

modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6

com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos

Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para

cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e

nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao

relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os

valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921

e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo

sao relativamente pequenas 961 594 e 076 respetivamente

Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao

contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis

covariaveis significativas e respetiva contribuicao para os resultados Assim fica para

trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais

significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em

48 Capıtulo 3 Aplicacoes

particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)

e uma covariavel considerada muito importante na modelacao estatıstica de acidentes

rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao

nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica

designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos

hoteleiros

333 Modelos para acidentes do tipo 1

Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172

log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t

e

log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t

No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente

para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos

de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem

o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o

zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor

HPD que contem o zero considera-se que a covariavel nao contribui significativamente

para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso

contrario considera-se que a covariavel contribui significativamente para a explicacao

da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado

que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124

obtendo-se o modelo Poisson 1 8 16 ou seja

log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t

Tabela 37 DIC pD e mls para acidentes tipo 1

Modelo DIC pD mls

P 1 8 1 1940548 47786 458

P 1 8 16 1939877 47789 458

BN 1 6 1 1861278 25154 419

BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

33 Modelos espaco-temporais 49

No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as

covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se

manter as covariaveis no modelo

334 Validacao dos modelos para acidentes do tipo 1

Validacao do modelo P 1 8 16 e do modelo BN 1 6 172

Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172

Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do

que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela

37 O valor da media do logscore tambem e significativamente menor de acordo com

o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores

PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O

valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo

BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes

sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do

tipo 1

335 Resultados obtidos com modelos para acidentes do tipo 1

Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172

A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um

efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma

50 Capıtulo 3 Aplicacoes

diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo

1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16

e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo

BN 1 6 172

Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172

Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max

SMR1 00000 07512 09656 10020 12360 32610

RR1 8 1 02290 07728 09663 09989 11870 28890

RR1 8 16 02274 07722 09628 09979 11860 28770

RR1 6 1 02886 07807 09599 10010 11890 24480

RR1 6 172 02852 07798 09589 09999 11870 24400

Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de

33 Modelos espaco-temporais 51

confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-

bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com

os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-

nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172

Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172

Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados

52 Capıtulo 3 Aplicacoes

os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo

P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000

Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para

o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312

se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de

33 Modelos espaco-temporais 53

suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos

erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais

Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000

Relativamente a introducao das covariaveis comprimento de estrada e quantidade de

combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia

dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis

explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao

explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados

espacialmente

Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1

Efeitos fixosmedia dp 0025q 0975q

α1 00580 00074 00435 00723

γ1 -00263 00030 -00321 -00204

Variancia dos efeitos aleatorios

σ2s1 05816 00591 04706 07001

σ2δ1

00019 00002 00015 00023

Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1

54 Capıtulo 3 Aplicacoes

mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-

plicacao da variacao associada aos efeitos temporais

Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel

vendido influenciam significativamente a variacao geografica dos riscos relativos sao

consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem

de forma positiva para a variacao os riscos o que significa que em regioes com maior

comprimento de estrada e em regioes com maior quantidade de combustıvel vendido

esta associado um aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16

Efeitos fixosmedia dp 0025q 0975q

α1 -00898 00354 -01595 -00207

b1C 00016 00004 00008 00024

b1V C 00003 00001 00002 00005

γ1 -00257 00030 -00315 -00198

Variancia dos efeitos aleatorios

σ2s1 05492 00560 04440 06615

σ2δ1

00019 00002 00015 00023

No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada

do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da

ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos

espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-

buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou

efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves

dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos

temporais σ2ψ1

se mantem o que implica que as covariaveis nao contribuem para a ex-

plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o

modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao

e significativa

Mais uma vez as covariaveis que influenciam significativamente a variacao geografica

dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-

variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que

33 Modelos espaco-temporais 55

regioes com maior comprimento de estrada regioes com maior ocupacao de solo com

equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento

turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos

os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-

mente para a estimacao dos riscos o que significa que em regioes com maior numero de

habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo

fixos todos os restantes efeitos

Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1

Efeitos fixosmedia dp 0025q 0975q

α1 -00429 00052 -00595 -00389

Parametro de dispersao φminus11 00298 00017 00267 00332

Variancia dos efeitos aleatorios

σ2s1 02603 00266 02108 03142

σ2ψ1

00090 00057 00029 00237

Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172

Efeitos fixosmedia dp 0025q 0975q

α1 -01348 00243 -01826 -00872

b1C 00013 00003 00007 00019

b1P -00135 00044 -00221 -00049

b1OSEUP 00001 000008 -000005 00003

b1OST 00001 000006 -0000003 00002

Parametro de dispersao φminus11 00300 00017 00269 00334

Variancia dos efeitos aleatorios

σ2s1 02438 00254 01966 02951

σ2ψ1

00090 00056 00029 00235

Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente

56 Capıtulo 3 Aplicacoes

espacial contribui fortemente para a variacao geografica do risco relativo O padrao e

muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes

com maior risco relativo estimado correspondem as regioes em que as estimativas dos

efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-

dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo

proximo de um correspondem as regioes em que as estimativas de si sao proximas de

zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade

HPD nao contem o zero e 633 para o modelo P 1 4 16

Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16

Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16

33 Modelos espaco-temporais 57

A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0

eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao

longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio

anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta

tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores

correspondente a diminuicao das estimativas dos riscos ao longo dos anos

Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16

Min 1oQ Mediana Media 3oQ Max

δ1 -00919 -00254 -00476 00768 00197 00133

eδ1 09125 09751 09954 10010 10200 11420

Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16

Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de

credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1

a tendencia temporal local e maior que a tendencia global sendo o decrescimento do

numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia

58 Capıtulo 3 Aplicacoes

temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia

temporal local e menor do que a global sendo o decrescimento mais acentuado No

mapa da Figura 315 pode ver-se a distribuicao destes concelhos

Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um

sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada

na Tabela A8 do Anexo A

Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172

Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172

Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos

mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial

33 Modelos espaco-temporais 59

contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado

e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com

menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si

sao proximas de zero Para este modelo a percentagem de estimativas dos valores de

s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente

a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos

seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais

acentuado nos cinco anos seguintes

Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172

Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo

BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um

aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os

restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-

gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos

estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel

contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i

no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54

Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel

ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a

percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento

turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como

os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de

60 Capıtulo 3 Aplicacoes

(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo

da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel

OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com

equipamentos turısticos vai de 0 a 038

Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172

Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172

Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior

33 Modelos espaco-temporais 61

que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos

com risco relativo significativamente maior que um

336 Modelos para acidentes do tipo 2

Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192

log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +

b2DPDP2it + s2i + (γ2 + δ2i)t

e

log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t

No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente

das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519

pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo

Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o

modelo P 2 9 16 ou seja

log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t

No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-

variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e

pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-

delo BN 2 9 4 ou seja

log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t

Tabela 314 DIC pD e mls para acidentes tipo 2

modelo DIC pD mls

P 2 9 1 1170386 35334 270

P 2 9 16 1169631 35476 270

BN 2 9 1 1156921 29101 261

BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada

62 Capıtulo 3 Aplicacoes

337 Validacao dos modelos para acidentes do tipo 2

Validacao do modelo P 2 9 16 e do modelo BN 2 9 4

Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4

Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-

ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual

a 13956 O valor da media do logscore tambem e significativamente menor de acordo

com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos

valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura

322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para

o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes

sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do

tipo 2

338 Resultados obtidos com modelos para acidentes do tipo 2

Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4

A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as

estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre

um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das

estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados

a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores

esperados a posteriori obtidos com o modelo BN 2 9 4

33 Modelos espaco-temporais 63

Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4

Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os

modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max

SMR2 00000 05062 09180 11830 15740 87830

RR2 9 1 02237 06553 09651 11910 14980 77550

RR2 9 16 02218 06547 09624 11860 14970 77060

RR2 9 1 nb 02391 06636 09751 11870 14960 59240

RR2 9 4 nb 02363 06630 09720 11810 14850 59030

64 Capıtulo 3 Aplicacoes

Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo

P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4

Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes

33 Modelos espaco-temporais 65

do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000

Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000

66 Capıtulo 3 Aplicacoes

Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000

Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das

covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo

Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja

as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos

sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito

espacial

Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03511 00191 03135 03883

γ2 -00844 00037 -00918 -00771

Variancia dos efeitos aleatorios

σ2s2 09474 01054 07554 11648

σ2δ2

00099 00016 00070 00133

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-

plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao

33 Modelos espaco-temporais 67

para a variacao geografica das estimativas dos riscos e positiva em regioes com maior

comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao

para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos

Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16

Efeitos fixosmedia dp 0025q 0975q

α2 01790 00530 00741 02822

b2C 00020 00005 00009 00031

b2V C -00004 00003 -00010 00003

γ2 -00833 00038 -00906 -00759

Variancia dos efeitos aleatorios

σ2s2 09162 01019 07325 11282

σ2δ2

00099 00016 00015 00135

Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com

a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos

efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma

efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam

incluıdos no modelo P 2 9 1 atraves do efeito espacial

Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1

Efeitos fixosmedia dp 0025q 0975q

α2 03529 00223 03090 03965

γ2 -00819 00044 -00906 -00733

Parametro de dispersao φminus11 00577 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07824 00925 06156 09748

σ2δ2

00051 00012 00031 00079

Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-

68 Capıtulo 3 Aplicacoes

ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2

mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao

associada aos efeitos temporais Para alem disso como a contribuicao para a variacao

geografica das estimativas dos riscos e positiva em regioes com maior comprimento de

estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos

os restantes efeitos

Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4

Efeitos fixosmedia dp 0025q 0975q

α2 01961 00530 00741 02822

b2C 00017 00005 00008 00027

γ2 -00814 00044 -00900 -00727

Parametro de dispersao φminus11 00576 00052 00480 00682

Variancia dos efeitos aleatorios

σ2s2 07516 00894 05914 09385

σ2δ2

00052 00013 00031 00080

Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16

33 Modelos espaco-temporais 69

Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode

verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o

padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado

correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as

regioes com menor risco relativo estimado correspondem as regioes em que as estimativas

de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes

em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem

de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero

e 608

Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era

esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou

seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem

de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295

Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16

Min 1oQ Mediana Media 3oQ Max

δ2 -01805 -00411 00082 00003 00485 01532

eδ2 08358 09604 10090 10030 10500 11660

No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se

que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia

70 Capıtulo 3 Aplicacoes

temporal local maior do que a global e um decrescimento no numero de acidentes do tipo

2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local

menor que a global e um decrescimento mais acentuado

Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16

E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um

obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um que permite complementar esta informacao

Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-

temente para a variacao geografica do risco relativo como se pode observar no mapa da

Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito

semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-

mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes

com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e

entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao

proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i

cujo intervalo de credibilidade HPD nao contem o zero e 5665

33 Modelos espaco-temporais 71

Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4

Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4

Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4

Min 1oQ Mediana Media 3oQ Max

δ1 -01530 -00368 00052 00001 00402 01140

eδ1 08592 09646 10060 10020 10420 11210

72 Capıtulo 3 Aplicacoes

Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =

minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero

de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca

no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de

78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de

valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa

da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a

global sendo o seu decrescimento menos acentuado que o decrescimento global havendo

uma minoria onde se passa o contrario

Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4

Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior

que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao

com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista

ordenada dos primeiros quinze concelhos

33 Modelos espaco-temporais 73

339 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6

log(θ3ij) = α3 + b3CCi + s3i + ψ3t

e

log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t

No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a

covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo

P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1

log(θ3ij) = α3 + s3i + ψ3t

No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade

populacional nao contem o zero por isso o modelo mantem-se

Tabela 322 DIC pD e mls para acidentes tipo 3

modelo DIC pD mls

P 3 6 1 846290 20551 191

P 3 6 4 846237 20562 191

BN 3 6 1 852438 19770 191

BN 3 6 6 852362 19267 191

3310 Validacao dos modelos para acidentes do tipo 3

Validacao do modelo P 3 6 1 e do modelo BN 3 6 6

Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e

menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072

Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos

valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia

preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo

74 Capıtulo 3 Aplicacoes

ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se

que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3

Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6

3311 Resultados obtidos com modelos para acidentes do tipo 3

Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6

Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max

SMR3 00000 04639 11050 15100 20490 156700

RR3 6 1 01363 08869 13050 14900 18430 95400

RR3 6 6 bn 01247 09020 13170 14850 18370 87310

Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo

obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-

vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores

esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos

valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e

Tabela 323

33 Modelos espaco-temporais 75

Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6

Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6

Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de

confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-

76 Capıtulo 3 Aplicacoes

lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os

modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao

da amplitude dos intervalos entre as diferentes estimativas do risco relativo

Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6

Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000

Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos

de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados

os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo

P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho

33 Modelos espaco-temporais 77

Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000

Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000

Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes

do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o

ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se

verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes

fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e

a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-

temporais

Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem

comentarios acerca de associacao regional para este modelo

78 Capıtulo 3 Aplicacoes

No modelo BN observa-se que com a introducao da covariavel densidade populacional o

valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da

variancia dos efeitos temporais σ2ψ1t

se mantem Tabelas 325 e 326

Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02114 00152 01815 02410

Variancia dos efeitos aleatorios

σ2s3 06817 00802 05383 08499

σ2ψ3

00255 00157 00082 00660

Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1

Efeitos fixosmedia dp 0025q 0975q

α3 02155 00158 01842 02464

Parametro de dispersao ψminus11 00455 00061 00348 00584

Variancia dos efeitos aleatorios

σ2s3 06497 00800 05070 08174

σ2ψ3

00255 00161 00081 00672

Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6

Efeitos fixosmedia dp 0025q 0975q

α3 02791 00217 02362 03215

bDP -00199 00048 -00294 -00105

Parametro de dispersao φminus11 00459 00061 00350 00588

Variancia dos efeitos aleatorios

σ2s3 05855 00749 04532 07440

σ2ψ3

00255 00161 00081 00672

Tal significa que a covariavel densidade populacional contribui para a explicacao da

33 Modelos espaco-temporais 79

variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao

da variacao temporal A contribuicao da covariavel densidade populacional e negativa

o que indica que em regioes com maior densidade populacional ocorre a contribuicao

para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos

No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a

sobredispersao nao e significativa

Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1

Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1

80 Capıtulo 3 Aplicacoes

O padrao espacial das estimativas do risco relativo e das estimativas da componente

espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras

342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao

positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos

efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem

o zero e 439 para o modelo P 3 6 1

No que respeita a componente temporal observa-se um decrescimento nos dois primeiros

anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento

nos ultimos cinco anos

Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1

Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco

relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a

lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-

tivamente maior que um na Tabela A9 do Anexo A

33 Modelos espaco-temporais 81

Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6

Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6

Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os

padroes revelados pelos mapas As regioes com maior contribuicao da componente es-

pacial para o aumento do risco relativo correspondem em geral a regioes com maiores

estimativas de risco relativo Tal significa que a componente espacial explica grande parte

da variacao das estimativas do risco relativo A percentagem de estimativas dos valores

de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1

82 Capıtulo 3 Aplicacoes

Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6

A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo

modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode

ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se

pode encontrar uma lista ordenada dos primeiros quinze concelhos

Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se

apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista

o tipo de interacao espaco-temporal

Tabela 327 Modelos univariados

Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal

1 BN 1 6 172 C+P+OSEPU+OST RW mdash

2 BN 2 9 4 C fixo CAR

3 P 3 6 1 mdash RW mdash

34 Modelos multivariados 83

34 Modelos multivariados

Os modelos multivariados usados foram

log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)

log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)

Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-

tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito

complexos nao parece haver um ganho substancial em usa-los

Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados

Modelos multivariados Modelos univariados

Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q

α1 00565 00181 00214 00914 00580 00074 00435 00723

α2 03423 00344 02735 04083 03511 00191 03135 03883

α3 05993 00331 05340 06644 06633 00247 06147 07115

γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204

γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771

γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907

Σu =

05551 03843 05519

03843 1042 05864

05519 05864 09113

Σδ =

00074 00035 00061

00035 00111 00059

00061 00059 00081

No entanto e interessante verificar que em termos de correlacao entre as estimativas

dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo

2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao

que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios

nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e

tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no

numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330

84 Capıtulo 3 Aplicacoes

Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal

Modelos com interacao Modelos sem interacao

media dp 0025q 0975q media dp 0025q 0975q

ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669

ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879

ρ23(θ) 06793 00242 06304 07252 06831 002647 07326

ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196

ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941

ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976

ρ12(δ) 03823 00894 01960 05465

ρ13(δ) 07979 00634 06487 08998

ρ23(δ) 06203 00938 04153 07829

Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias

AnoVıtimas mortais Feridos graves Feridos leves

24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif

2010 741 937 196 2637 2475 -162 43924 43890 -34

2011 689 891 202 2436 2265 -171 39726 39695 -31

34 Modelos multivariados 85

Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados

86 Capıtulo 3 Aplicacoes

Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87

35 Aplicacao para acidentes rodoviarios nas estradas

secundarias

Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-

cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram

retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-

damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior

risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do

poder local

Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)

Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840

Total 175741 16909 3471 196121

Figura 350 Numero de acidentes tipo 1 por concelho

88 Capıtulo 3 Aplicacoes

Figura 351 Numero de acidentes tipo 2 por concelho

Figura 352 Numero de acidentes tipo 3 por concelho

No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados

Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89

de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos

Tabela 332 DIC pD e mls para cada tipo de acidente

Modelo DIC pD mls

BN 1 9 42 1614530 32359 363

BN 2 9 246 924765 27530 208

P 3 6 30 581058 11747 131

351 Modelo para acidentes do tipo 1

Modelo Binomial Negativo 1 9 42

log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t

Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a

variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do

modelo

352 Validacao do modelo para acidentes do tipo 1

Validacao do modelo BN 1 9 42

Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42

O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-

pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O

90 Capıtulo 3 Aplicacoes

valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem

um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-

ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42

e o melhor modelo para acidentes do tipo 1

353 Resultados obtidos com o modelo para acidentes do tipo 1

Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42

Efeitos fixosmedia dp 0025q 0975q

α1 -03518 00346 -04202 -02843

b1C 00012 00004 00005 00019

b1OST 00001 000007 -000005 00002

γ1 -00128 00026 -00179 -00077

Parametro de dispersao φminus11 00287 00021 00248 00328

Variancia dos efeitos aleatorios

σ2s1 03982 00445 03180 04909

σ2δ1

00026 00007 00015 00040

Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91

As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico

influenciam significativamente a variacao geografica dos riscos relativos e portanto sao

consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de

forma positiva para a variacao dos riscos o que significa que em regioes com maior

comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma

contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes

efeitos

Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-

derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura

temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao

envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial

se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de

risco relativo Figuras 354 e 316

Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42

Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco

relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A

encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente

maior que um

92 Capıtulo 3 Aplicacoes

354 Modelo para acidentes do tipo 2

Modelo Binomial Negativo 2 9 246

log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +

s2i + (γ2 + δ2i)t2

Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de

todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938

pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e

manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja

log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2

Tabela 334 DIC pD e mls

Modelo DIC pD mls

BN 2 9 86 924868 24786 208

355 Validacao do modelo para acidentes do tipo 2

Validacao do modelo BN 2 9 86

Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86

O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo

Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93

do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto

proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e

95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor

modelo para acidentes do tipo 2

356 Resultados obtidos com o modelo para acidentes do tipo 2

Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86

Efeitos fixosmedia dp 0025q 0975q

α2 -01198 00480 -02147 -00266

b1OSI 00002 000008 000007 00004

b1OSEPU 00003 00002 000001 00006

b1DP 00084 00066 -00046 00215

γ1 -01198 00480 -02147 -00266

Parametro de dispersao

φminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 10557 01336 08161 13345

σ2δ1

00094 00023 00057 00147

A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-

nos e a densidade populacional influenciam significativamente a variacao geografica dos

riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-

variaveis contribuem de forma positiva para a variacao dos riscos o que significa que

em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo

com equipamentos e parques urbanos e a regioes com maior densidade populacional ha

contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os

restantes efeitos

Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes

do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a

mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao

Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que

os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos

94 Capıtulo 3 Aplicacoes

concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns

conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas

do risco relativo sao os mesmos

Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86

Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95

A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com

o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que

consta na Tabela A11

357 Modelos para acidentes do tipo 3

Modelo Poisson 3 6 30

log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt

Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU

contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo

358 Validacao do modelo para acidentes do tipo 3

Validacao do modelo P 3 6 30

Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30

Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da

distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-

mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores

igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva

e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para

acidentes do tipo 3

96 Capıtulo 3 Aplicacoes

359 Resultados obtidos com o modelo para acidentes do tipo 3

Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30

Efeitos fixosmedia dp 0025q 0975q

α2 00104 00520 -00923 01117

b3A 00258 00116 00031 00049

b3OSEPU -00001 00001 -00004 000006

Parametro de dispersao

ψminus11 00687 00075 00550 00842

Variancia dos efeitos aleatorios

σ2s1 03598 00687 02422 05084

σ2ψ1

00246 00163 0007 00666

Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30

A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam

significativamente a variacao geografica dos riscos relativos sendo consideradas na es-

timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para

35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97

a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial

em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes

com maior area geografica ha uma contribuicao para o aumento das estimativas do risco

relativo mantendo fixos todos os restantes efeitos

O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de

trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-

trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico

mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No

entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos

Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30

E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo

modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que

consta na Tabela A11

Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-

mente a abordagem global e a abordagem local

98 Capıtulo 3 Aplicacoes

Tabela 337 Comparacao entre a abordagem local e a global

Abordagem Tipo Melhor Covariaveis Efeito Interacao

Modelo temporal espaco-temporal

Local 1 BN 1 9 42 C+OST fixo CAR

Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash

Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR

Gloal 2 BN 2 9 4 C fixo CAR

Local 3 P 3 6 30 A+OSEUP aleatorio mdash

Global 3 P 3 6 1 mdash aleatorio mdash

4Discussao e conclusoes

Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia

de dependencia espacial de tendencia temporal e de associacao regional em dados de

acidentes rodoviarios

Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-

delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por

areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar

diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao

espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel

recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados

com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de

trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de sobredispersao de associacao posi-

tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-

mentos e parques urbanos e uma associacao regional negativa com a populacao

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

100 Capıtulo 4 Discussao e conclusoes

bredispersao e de associacao regional positiva com o comprimento de estrada

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente

Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que

minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com o comprimento de estrada e com

a area de ocupacao do solo para turismo

minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia

espacial de tendencia temporal decrescente de interacao espaco-temporal de so-

bredispersao de associacao regional positiva com a area de ocupacao de solo para

a industria com a area de ocupacao do solo com equipamentos e parques urbanos

e com a densidade populacional

minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-

pendencia espacial e de tendencia temporal decrescente de associacao regional

positiva com a area e de associacao regional negativa com a area de ocupacao de

solo com equipamentos e parques urbanos

Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-

se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas

Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com

interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao

do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido

o modelo Poisson com efeito temporal aleatorio

Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos

modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-

tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se

capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes

espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-

formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que

as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto

e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas

as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de

valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais

elevados diminuiram ou seja os valores extremos foram suavizados

101

Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos

dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-

gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi

possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia

temporal global Este e um tipo de resultado muito importante na fase de aplicacao

pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter

exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas

Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-

minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as

covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam

incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-

fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal

Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores

usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal

considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para

todos os anos em estudo

Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos

mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-

pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a

ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-

cativamente maior que um bem como as dos concelhos com valores consideravelmente

menores do que a unidade

Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-

timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises

por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-

pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de

estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-

nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o

TDMA de modo a introduzi-las no modelo

Os modelos multivariados constituiram um esforco computacional elevado nao tendo

havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises

comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi

possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes

tipos de acidentes

Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves

do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo

uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-

ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA

102 Capıtulo 4 Discussao e conclusoes

pela extrema concordancia de resultados pela facilidade de implementacao dos modelos

pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez

de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem

duvida muito mais acessıvel

Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-

dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de

um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-

patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de

recolha e definicao das variaveis de interesse A implementacao estes modelos tambem

pode ser efetuada atraves do R-INLA

Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir

como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-

dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite

efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-

gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade

dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas

geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios

constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel

mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-

sabilidade de todosrdquo

ACaracterizacao da regiao de estudo

A1 Portugal Continental

Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes

administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados

em 18 distritos

O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a

partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na

pagina do Instituto Geografico Portugues - httpwwwigeopt

A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o

map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-

hancas no WinBUGS

104 Apendice A Caracterizacao da regiao de estudo

Figura A1 ID dos concelhos do Norte de Portugal Continental

A1 Portugal Continental 105

Figura A2 ID dos concelhos do Sul de Portugal Continental

106 Apendice A Caracterizacao da regiao de estudo

A1 Portugal Continental 107

108 Apendice A Caracterizacao da regiao de estudo

A2 Numero de acidentes

Tabela A1 Estatısticas resumo de acidentes tipo 1

Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200

Tabela A2 Estatısticas resumo de acidentes tipo 2

Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800

Tabela A3 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100

A2 Numero de acidentes 109

Numero de acidentes que ocorreram nas estradas secundarias

Tabela A4 Estatısticas resumo de acidentes tipo 1

Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900

Tabela A5 Estatısticas resumo de acidentes tipo 2

Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800

Tabela A6 Estatısticas resumo de acidentes tipo 3

Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700

110 Apendice A Caracterizacao da regiao de estudo

A3 Covariaveis

bull Populacao - P

Tabela A7 Estatısticas resumo da covariavel populacao

Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700

Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)

A3 Covariaveis 111

bull Area - A

Figura A4 Area em centenas de km2 por concelho (Fonte INE)

bull Densidade Populacional - DP

Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)

112 Apendice A Caracterizacao da regiao de estudo

bull Comprimento de Estrada - C

Figura A6 Quilometros de estrada por concelho (Fonte EP)

bull Quantidade de combustıvel vendido - VC

Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)

A3 Covariaveis 113

bull Ocupacao urbana do solo - OSU

Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

bull Ocupacao industrial do solo - OSI

Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)

114 Apendice A Caracterizacao da regiao de estudo

bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU

Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)

bull Ocupacao do solo com equipamento turıstico - OST

Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)

A4 15 concelhos 115A

415

con

celh

os

Tab

ela

A8

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o1

Mold

elo

P1

816

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alb

ergaria

-a-V

elh

a3

Castro

Marim

Alc

acer

do

Sal

Grandola

Castro

Marim

Castro

Marim

Castro

Marim

Alb

ergaria

-a-V

elh

aV

ouzela

4A

lcacer

do

Sal

Castro

Marim

Castro

Marim

Grandola

Grandola

Alb

ergaria

-a-V

elh

aC

astro

Marim

Alc

acer

do

Sal

5V

izela

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

Vila

Velh

ade

Rodao

Pedrogao

Grande

6C

ondeix

a-a

-Nova

Azam

buja

Azam

buja

Azam

buja

Obid

os

Penela

Penela

Vila

Velh

ade

Rodao

7A

zam

buja

Viz

ela

Alj

ezur

Obid

os

Penela

Obid

os

Alj

ezur

Penela

8Silves

Alj

ezur

Obid

os

Condeix

a-a

-Nova

Azam

buja

Grandola

Obid

os

Alj

ezur

9A

lbufe

ira

Silves

Pom

bal

Pom

bal

Pom

bal

Vila

Velh

ade

Rodao

Pedrogao

Grande

Obid

os

10

Alj

ezur

Obid

os

Palm

ela

Penela

Alb

ergaria

-a-V

elh

aP

om

bal

Vouzela

Castro

Marim

11

Palm

ela

Pom

bal

Benavente

Palm

ela

Condeix

a-a

-Nova

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oE

sposende

12

Benavente

Benavente

Silves

Benavente

Vila

Velh

ade

Rodao

Azam

buja

Pom

bal

Montem

or-o

-Velh

o13

Pom

bal

Palm

ela

Penela

Vagos

Benavente

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

Tabua

14

Obid

os

Alb

ufe

ira

Olh

ao

Silves

Palm

ela

Condeix

a-a

-Nova

Esposende

Oliveir

ado

Bair

ro

15

Marin

ha

Grande

Olh

ao

Vagos

Olh

ao

Montem

or-o

-Velh

oP

edrogao

Grande

Tabua

Cham

usca

Mold

elo

BN

16

172

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

3C

astro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

4G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

5O

bid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

Obid

os

6C

ondeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Alj

ezur

Alj

ezur

Alj

ezur

7A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Condeix

a-a

-Nova

Condeix

a-a

-Nova

Condeix

a-a

-Nova

8P

om

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

Pom

bal

9B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

10

Penela

Penela

Penela

Penela

Penela

Penela

Penela

Penela

11

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

12

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

Vagos

13

Palm

ela

Alb

ergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

aA

lbergaria

-a-V

elh

a14

Alb

ergaria

-a-V

elh

aP

alm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

Palm

ela

15

Montem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

oM

ontem

or-o

-Velh

o

116 Apendice A Caracterizacao da regiao de estudo

Tab

ela

A9

15

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o2

Modelo

P2

916

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ouriq

ue

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Alj

ustrel

4A

lcacer

do

Sal

Alc

acer

do

Sal

Avis

Nis

aO

urem

Nis

aA

ljustrel

Avis

5A

vis

Avis

Alc

acer

do

Sal

Rio

Maio

rN

isa

Alj

ustrel

Nis

aM

ourao

6C

ham

usca

Nis

aN

isa

Alj

ezur

Alc

acer

do

Sal

Mourao

Mourao

Nis

a7

Santarem

Cham

usca

Alj

ezur

Alc

acer

do

Sal

Alj

ustrel

Pedrogao

Grande

Pedrogao

Grande

Pedrogao

Grande

8V

ila

Nova

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rA

lcacer

do

Sal

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

da

Barquin

ha

da

Barquin

ha

9N

isa

Santarem

Vila

Nova

Pedrogao

Grande

Mourao

Ourem

Alc

acer

do

Sal

Proenca-a

-Nova

da

Barquin

ha

10

Alm

eir

imV

endas

Novas

Pedrogao

Grande

Mourao

Pedrogao

Grande

Ferreir

ado

Ale

ntejo

Proenca-a

-Nova

Alc

acer

do

Sal

11

Gole

ga

Montem

or-o

-Novo

Alj

ustrel

Vila

Nova

Ferreir

ado

Ale

ntejo

Rio

Maio

rG

randola

Idanha-a

-Nova

da

Barquin

ha

12

Vendas

Novas

Alj

ezur

Santarem

Cham

usca

Montem

or-o

-Novo

Montem

or-o

-Novo

Rio

Maio

rG

randola

13

Gavia

oG

avia

oM

ontem

or-o

-Novo

Montem

or-o

-Novo

Vila

Nova

Grandola

Ourem

Alm

odovar

da

Barquin

ha

14

Palm

ela

Gole

ga

Mourao

Ferreir

ado

Ale

ntejo

Grandola

Proenca-a

-Nova

Montem

or-o

-Novo

Montem

or-o

-Novo

15

Montem

or-o

-Novo

Alm

eir

imV

endas

Novas

Grandola

Cham

usca

Vila

Nova

Vila

Velh

ade

Rodao

Celo

ric

oda

Beir

ada

Barquin

ha

Modelo

BN

29

4

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2O

uriq

ue

Ourem

Ourem

Ourem

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

3R

ioM

aio

rR

ioM

aio

rA

vis

Avis

Avis

Avis

Avis

Alj

ustrel

4A

vis

Avis

Rio

Maio

rA

ljezur

Ourem

Nis

aA

ljustrel

Avis

5A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Nis

aN

isa

Alj

ustrel

Nis

aN

isa

6C

ham

usca

Nis

aN

isa

Alc

acer

do

Sal

Alc

acer

do

Sal

Ourem

Mourao

Mourao

7V

ila

Nova

Cham

usca

Alj

ezur

Rio

Maio

rA

ljustrel

Alc

acer

do

Sal

Alc

acer

do

Sal

Pedrogao

Grande

da

Barquin

ha

8Santarem

Vila

Nova

Cham

usca

Alj

ustrel

Rio

Maio

rM

ourao

Pedrogao

Grande

Alc

acer

do

Sal

9N

isa

Santarem

Vila

Nova

Mourao

Mourao

Pedrogao

Grande

Ferreir

aFerreir

ada

Barquin

ha

do

Ale

ntejo

do

Ale

ntejo

10

Montem

or-o

-Novo

Alj

ezur

Alj

ustrel

Vila

Nova

Pedrogao

Grande

Rio

Maio

rO

urem

Proenca-a

-Nova

da

Barquin

ha

11

Vendas

Novas

Montem

or-o

-Novo

Santarem

Cham

usca

Ferreir

ado

Ale

ntejo

Ferreir

ado

Ale

ntejo

Rio

Maio

rC

elo

ric

oda

Beir

a12

Gole

ga

Alj

ustrel

Montem

or-o

-Novo

Pedrogao

Grande

Montem

or-o

-Novo

Montem

or-o

-Novo

Proenca-a

-Nova

Ourem

13

Salv

aterra

de

Magos

Vendas

Novas

Mourao

Montem

or-o

-Novo

Vila

Nova

Grandola

Montem

or-o

-Novo

Grandola

da

Barquin

ha

14

Alm

eir

imM

ourao

Pedrogao

Grande

Ferreir

aC

ham

usca

Vila

Nova

Grandola

Idanha-a

-Nova

do

Ale

ntejo

da

Barquin

ha

15

Alj

ezur

Salv

aterra

de

Magos

Ferreir

ado

Ale

ntejo

Grandola

Grandola

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aM

ontem

or-o

-Novo

A4 15 concelhos 117

Tab

ela

A1

015

con

celh

osco

mes

tim

ati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

para

aci

den

tes

tip

o3

Modelo

P3

61

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

Ferreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9C

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a10

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

11

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

12

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

13

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Modelo

BN

36

6

2000

2001

2002

2003

2004

2005

2006

2007

1O

uriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

Ouriq

ue

2G

randola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

3A

lcacer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

Alc

acer

do

Sal

4Ferreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

aFerreir

ado

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

do

Ale

ntejo

5V

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

aV

ila

Velh

ade

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

de

Rodao

6B

enavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

Benavente

7M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

8A

ljezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

Alj

ezur

9A

zam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

Azam

buja

10

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

11

Celo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

aC

elo

ric

oda

Beir

a12

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

13

Silves

Silves

Silves

Silves

Silves

Silves

Silves

Silves

14

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

Idanha-a

-Nova

15

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

Nis

aN

isa

118 Apendice A Caracterizacao da regiao de estudoT

abel

aA

11

15co

nce

lhos

com

esti

mati

vas

de

risc

ore

lati

vosi

gnifi

cati

vam

ente

maio

res

qu

e1

Acid

entes

tip

o1

-M

odelo

BN

19

42

2000

2001

2002

2003

2004

2005

2006

2007

1M

arin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Marin

ha

Grande

Ilhavo

Ilhavo

Ilhavo

Ilhavo

2Il

havo

Ilhavo

Ilhavo

Ilhavo

Marin

ha

Grande

Marin

ha

Grande

Vagos

Vagos

3A

lbufe

ira

Alb

ufe

ira

Vagos

Vagos

Vagos

Vagos

Marin

ha

Grande

Ferreir

ado

Zezere

4P

ortim

ao

Portim

ao

Alb

ufe

ira

Portim

ao

Portim

ao

Ferreir

ado

Zezere

Ferreir

ado

Zezere

Marin

ha

Grande

5V

agos

Vagos

Portim

ao

Porto

Porto

Portim

ao

Oliveir

ado

Bair

ro

Oliveir

ado

Bair

ro

6P

orto

Porto

Porto

Alb

ufe

ira

Ferreir

ado

Zezere

Porto

Porto

Montem

or-o

-Velh

o7

Faro

Penic

he

Penic

he

Penic

he

Penic

he

Penic

he

Portim

ao

Alp

iarca

8L

oule

Faro

Faro

Faro

Alb

ufe

ira

Oliveir

ado

Bair

ro

Montem

or-o

-Velh

oP

orto

9P

enic

he

Loule

Viz

ela

Ferreir

ado

Zezere

Coim

bra

Montem

or-o

-Velh

oP

enic

he

Penic

he

10

Odiv

ela

sO

div

ela

sC

oim

bra

Coim

bra

Faro

Coim

bra

Coim

bra

Coim

bra

11

Viz

ela

Viz

ela

Odiv

ela

sV

izela

Montem

or-o

-Velh

oA

lbufe

ira

Alp

iarca

Portim

ao

12

Olh

ao

Coim

bra

Loule

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Faro

Pom

bal

Pom

bal

13

Nazare

Olh

ao

Ferreir

ado

Zezere

Odiv

ela

sV

izela

Aveir

oA

veir

oA

veir

o14

Coim

bra

Setubal

Montem

or-o

-Velh

oO

liveir

ado

Bair

ro

Aveir

oP

om

bal

Faro

Vis

eu

15

Setubal

Cantanhede

Setubal

Aveir

oP

om

bal

Viz

ela

Murtosa

Lis

boa

Acid

entes

tip

o2

-M

odelo

BN

29

86

2000

2001

2002

2003

2004

2005

2006

2007

1O

urem

Ourem

Ourem

Ourem

Ourem

Ourem

Ourem

S

J

Madeir

a2

Rio

Maio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rR

ioM

aio

rFerreir

aZ

O

dem

ira

Odem

ira

3A

lmeir

imFerreir

aZ

Ferreir

aZ

Ferreir

aZ

Ferreir

aZ

R

ioM

aio

rFerreir

aZ

Ferreir

aZ

4

Ferreir

ado

Zezere

Alm

eir

imB

raganca

Braganca

Braganca

Odem

ira

S

J

Madeir

aV

izela

5Santarem

Braganca

Avis

Odem

ira

Odem

ira

Mourao

Braganca

Braganca

6L

isboa

Lis

boa

Odem

ira

Mourao

Mourao

Braganca

Rio

Maio

rO

urem

7C

ham

usca

Santarem

Lis

boa

Avis

Avis

S

J

Madeir

aA

lmodovar

Alm

odovar

8B

raganca

Cham

usca

Mourao

Lis

boa

Vim

ioso

Avis

Viz

ela

Tondela

9P

alm

ela

Avis

Santarem

Cham

usca

Ala

ndroal

Vim

ioso

Tondela

Chaves

10

Salv

aterra

de

Magos

Palm

ela

Cham

usca

Palm

ela

S

J

Madeir

aA

lmodovar

Chaves

Rio

Maio

r11

Avis

Salv

aterra

de

Magos

Alm

eir

imSantarem

Alm

odovar

Chaves

Elv

as

Guim

araes

12

Ilhavo

Odem

ira

Palm

ela

Ala

ndroal

Elv

as

Ala

ndroal

Serta

13

Vila

Nova

da

Barquin

ha

Mourao

Salv

aterra

de

Magos

Elv

as

Palm

ela

Tondela

Palm

ela

14

Nazare

Vila

Nova

da

Barquin

ha

Ala

ndroal

Alm

eir

imC

ham

usca

Elv

as

Portim

ao

15

Abrantes

Ala

ndroal

Lagos

Salv

aterra

de

Magos

Lis

boa

Palm

ela

Loule

Acid

entes

tip

o3

-M

odelo

P3

630

2000

2001

2002

2003

2004

2005

2006

2007

1O

dem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

Odem

ira

2M

ertola

Mertola

Mertola

Mertola

Mertola

Mertola

Mertola

3V

imio

so

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Vim

ioso

Cantanhede

4F

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

oF

C

astelo

Rodrig

o5

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

Castro

Marim

6M

iranda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

Mir

anda

do

Douro

7A

lmodovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

Alm

odovar

8Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

Sabugal

9A

lcoutim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

Alc

outim

10

Grandola

Grandola

Grandola

Grandola

Grandola

Grandola

11

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

Santia

go

do

Cacem

12

Alc

ochete

Alc

ochete

Alc

ochete

Macedo

de

Cavale

iros

Alc

ochete

Alc

ochete

13

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

Vagos

Macedo

de

Cavale

iros

Macedo

de

Cavale

iros

14

Vagos

Vagos

Vagos

Cantanhede

Vagos

Vagos

15

Cantanhede

Cantanhede

Cantanhede

Alc

ochete

Cantanhede

Cantanhede

Referencias Bibliograficas

Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes

in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625

ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt

Defaultaspxtabid=220amplanguage=pt-PT

ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx

fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT

Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population

density Statistics in Medicine 18(16) 2147ndash2162

Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety

performance indicators by using a multivariate generalized linear mixed model Journal

of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517

Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis

for Spatial Data Chapman amp Hall

Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease

maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431

Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini

M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med

14(21-22) 2433ndash2443

Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis

of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007

Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems

Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236

Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-

tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20

101007BF00116466

120 Referencias bibliograficas

Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis

with R Springer

Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed

Models Journal of the American Statistical Association 88(421) 9ndash25

Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane

roads Accident Analysis amp Prevention 39(4) 657 ndash 670

Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a

velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos

PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico

Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em

Seguranca Rodoviaria Technical report IST and LNEC

Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-

Temporally Correlated Survival Data In Bayesian Statistics 7

Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data

Analysis Chapman amp Hall

Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative

Risks for Use in Disease Mapping Biometrics 43 671ndash681

Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data

Biometrics 65 1254ndash1261

Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao

em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo

20economico20e20social20dos20acidentes_versao20para20internet

pdf

Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in

Europe Applied Spatial Analysis 1 133ndash150

Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level

Example of Belgium Journal of Safety Research 39(4) 417 ndash 427

El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate

Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828

Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety

Accident Analysis amp Prevention 40(6) 1964 ndash 1969

Referencias bibliograficas 121

Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis

and Prevention 43 253ndash264

Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall

Gelfand A E (1996) Model determination using sampling-based methods In W

Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice

chapter 9 (pp 145ndash161) Chapman amp

Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive

models for spatial data analysis Biostatistics 4(1) 11ndash15

Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis

Chapman amp Hall

Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for

the analysis of spatial data An application to disease mapping Journal of Statistical

Planning and Inference 75(2) 305 ndash 318

Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and

Estimation Journal of the American Statistical Association 102(477) 359ndash378

Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical

Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808

Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps

with Application to German Mortality Data httpepububuni-muenchende

Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive

Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical

Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD

Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR

Models for Areal Data Biometrics 61(4) 950ndash961

Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease

risk Statistics In Medicine 19(17-18) 2555ndash2567

Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space

Statistics in Medicine 17(18) 2045ndash2060

Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-

demiology CRC Press Taylor amp Francis

122 Referencias bibliograficas

Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-

mann P e Divino F (2000) Disease mapping models an empirical evaluation

Statistics in Medicine 19(17-18) 2217ndash2241

Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-

temporal patterns of intra-city motor vehicle craches Journal of Transport Geography

15 274ndash285

Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical

models in road safety countermeasure effectiveness studies in Iowa Accident Analysis

amp Prevention 40(4) 1531 ndash 1542

Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-

Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis

amp Prevention 40(3) 1123 ndash 1134

Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small

sample size on the estimation of the fixed dispersion parameter of Poisson-gamma

models for modeling motor vehicle crashes A Bayesian perspective Safety Science

46(5) 751 ndash 770

Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-

persion parameters of Poisson-gamma models on empirical Bayes estimates Accident

Analysis amp Prevention 40(4) 1441 ndash 1457

Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-

inflated regression models of motor vehicle crashes balancing statistical fit and theory

Accident Analysis amp Prevention 37(1) 35 ndash 46

Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal

regression model for prediction of crash counts by severity using Bayesian methods

Accident Analysis amp Prevention 40(3) 964 ndash 975

MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident

and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028

Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P

Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive

Statistical Methods (pp 99ndash114) Springer

Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-

tent Gaussian models using integrated nested Laplace approximations A manual for

Referencias bibliograficas 123

the inla program Technical report Norwegian University of Science and Technology

Trondheim

McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall

Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-

provements Decision parameter treatability concept statistical criterion and spatial

dependence Accident Analysis amp Prevention 37(4) 699 ndash 720

Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A

Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57

Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures

for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201

Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle

crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468

Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties

in england Accident Analysis amp Prevention 36(6) 973 ndash 984

OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications

world_health_statistics2008en

OMS (2009) Global status report on road safety httpwhqlibdocwhoint

publications20099789241563840_engpdf

Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao

Calouste Gubenkian

Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes

factors Biometrika 77(3) 455ndash466

Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-

tistics 9(3) 523ndash539

Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis

and output analysis for MCMC R News 6(1) 7ndash11

Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and

heterogeneity An analysis of London crash data Accident Analysis amp Prevention

40(4) 1486 ndash 1497

124 Referencias bibliograficas

R Development Core Team (2008) R A Language and Environment for Statistical

Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-

07-0

Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology

Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications

Chapman amp HallCRC

Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent

gaussian models by using integrated nested laplace approximations Journal of the

Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392

Schrodle B e Held L (2011) A primer on disease mapping and ecological regression

using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2

Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment

and Posterior Inference Journal of Statistical Software 21(11) 1ndash37

Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial

models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)

246 ndash 273

Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian

measures of model complexity and fit J R Statist Soc B 64 583ndash639

Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and

Marginal Densities Journal of the American Statistical Association 81 82ndash86

Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian

Journal of Statistics 31 221ndash229

Wakefield J (2007) Disease mapping and spatial regression with count data Biostat

8(2) 158ndash183

Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press

Taylor amp Francis

  • Lista de Tabelas
  • Lista de Figuras
  • Introduccedilatildeo
  • Noccedilotildees sobre seguranccedila rodoviaacuteria
    • Risco em seguranccedila rodoviaacuteria
    • Caracterizaccedilatildeo dos dados de acidentes
    • Caracterizaccedilatildeo da medida de exposiccedilatildeo
      • Modelaccedilatildeo estatiacutestica de acidentes rodoviaacuterios
        • Modelos bayesianos hieraacuterquicos
        • Modelos natildeo espaciais
        • Modelos espaciais
        • Modelos espaccedilo-temporais
        • Modelos multivariados
        • Meacutetodos de inferecircncia
          • INLA
            • Ajustamento e medidas preditivas
              • Aplicaccedilotildees
                • Associaccedilatildeo espacial
                • Modelos
                • Modelos espaccedilo-temporais
                  • Associaccedilatildeo regional
                  • Seleccedilatildeo dos modelos
                  • Modelos para acidentes do tipo 1
                  • Validaccedilatildeo dos modelos para acidentes do tipo 1
                  • Resultados obtidos com modelos para acidentes do tipo 1
                  • Modelos para acidentes do tipo 2
                  • Validaccedilatildeo dos modelos para acidentes do tipo 2
                  • Resultados obtidos com modelos para acidentes do tipo 2
                  • Modelos para acidentes do tipo 3
                  • Validaccedilatildeo dos modelos para acidentes do tipo 3
                  • Resultados obtidos com modelos para acidentes do tipo 3
                    • Modelos multivariados
                    • Aplicaccedilatildeo para acidentes rodoviaacuterios nas estradas secundaacuterias
                      • Modelo para acidentes do tipo 1
                      • Validaccedilatildeo do modelo para acidentes do tipo 1
                      • Resultados obtidos com o modelo para acidentes do tipo 1
                      • Modelo para acidentes do tipo 2
                      • Validaccedilatildeo do modelo para acidentes do tipo 2
                      • Resultados obtidos com o modelo para acidentes do tipo 2
                      • Modelos para acidentes do tipo 3
                      • Validaccedilatildeo do modelo para acidentes do tipo 3
                      • Resultados obtidos com o modelo para acidentes do tipo 3
                          • Discussatildeo e conclusotildees
                          • Caracterizaccedilatildeo da regiatildeo de estudo
                            • Portugal Continental
                            • Nuacutemero de acidentes
                            • Covariaacuteveis
                            • 15 concelhos
                              • Referecircncias Bibliograacuteficas