SOUZA_FT_04_t_D_int

115
 PREDIÇÃO DE ESCORREGAMENTOS DAS ENCOSTAS DO MUNICÍPIO DO RIO DE JANEIRO ATRAVÉS DE TÉCNICAS DE MINERAÇÃO DE DADOS Fábio Teodoro de Souza TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS  NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS EM ENGENHARIA CIVIL. Aprovada por:  __________ Prof. Nelson Francisco Favilla Ebecken, D.Sc.  __________ Prof. Alexandre Gonçalves Evsukoff, Dr.  __________ Prof. Luiz Landau, D.Sc  __________ Prof.a Beatriz de Souza Leite Pires de Lima, D.Sc.  __________ Prof. Alceu Gomes de Andrade Filho, D.Sc RIO DE JANEIRO, RJ – BRASIL JUNHO DE 2004

Transcript of SOUZA_FT_04_t_D_int

Page 1: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 1/115

 

PREDIÇÃO DE ESCORREGAMENTOS DAS ENCOSTAS DO MUNICÍPIO DORIO DE JANEIRO ATRAVÉS DE TÉCNICAS DE MINERAÇÃO DE DADOS

Fábio Teodoro de Souza

TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS

PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE

FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS

  NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS

EM ENGENHARIA CIVIL.

Aprovada por:

 _______________________________________________________ Prof. Nelson Francisco Favilla Ebecken, D.Sc.

 _______________________________________________________ Prof. Alexandre Gonçalves Evsukoff, Dr.

 _______________________________________________________ Prof. Luiz Landau, D.Sc

 _______________________________________________________ 

Prof.a Beatriz de Souza Leite Pires de Lima, D.Sc.

 _______________________________________________________ Prof. Alceu Gomes de Andrade Filho, D.Sc

RIO DE JANEIRO, RJ – BRASIL

JUNHO DE 2004

Page 2: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 2/115

 

 

ii

SOUZA, FÁBIO TEODORO DE

Predição de Escorregamentos das

Encostas do Município do Rio de Janeiro

através de Técnicas de Mineração de Dados

[Rio de Janeiro] 2004.

VII, 108 p. 29,7 cm (COPPE/UFRJ,

D. Sc., Engenharia Civil, 2004)

Tese - Universidade Federal do Rio de

Janeiro, COPPE

1. Mineração de Dados

2. Sistemas de Informações Geográficas

3. Escorregamentos

I. COPPE/UFRJ II. Título (série)

Page 3: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 3/115

 

 

iii

AGRADECIMENTOS 

À Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio deJaneiro - FAPERJ que foi responsável pelo financiamento deste projeto de pesquisa.

Às instituições que forneceram os dados necessários para a realização desta

tese:

•  Fundação Instituto de Geotécnica do Município do Rio de Janeiro - GEORIO;

•  Secretaria Municipal de Meio Ambiente – SMAC ;

•  Diretoria de Hidrografia e Navegação –  DHN (Marinha do Brasil);

•  Fundação Superintendência Estadual de Rios e Lagoas – SERLA;

•  Instituto Nacional de Meteorologia –  INMET ;

•  Universidade do Estado do Rio de Janeiro – UERJ ;

•  Universidade Federal do Rio de Janeiro - UFRJ ;

•  Wyoming University - Department of Atmospheric Science;

•  Departamento de Controle do Espaço Aéreo - DECEA;

•  Serviço Geológico do Brasil - CPRM .

Ao Professor Nelson pela orientação e incentivo às atividades necessárias para

o desenvolvimento desta tese.

Aos membros da banca examinadora pela participação e pela contribuição de

conhecimento para o enriquecimento deste trabalho.

À equipe técnico-administrativa do Núcleo de Transferência de Tecnologia,

UFRJ , amigos e colegas que contribuíram direta ou indiretamente.

Aos meus pais e à minha família que sempre incentivaram meus estudos.

Ao Laboratório de Energia dos Ventos da Uff pela parcela de colaboração.

Page 4: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 4/115

 

 

iv

Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários

 para a obtenção do grau de Doutor em Ciências (D. Sc.)

PREDIÇÃO DE ESCORREGAMENTOS DAS ENCOSTAS DO MUNICÍPIO DO

RIO DE JANEIRO ATRAVÉS DE TÉCNICAS DE MINERAÇÃO DE DADOS

Fábio Teodoro de Souza

Junho/2004

Orientador: Nelson Francisco Favilla Ebecken

Programa: Engenharia Civil

Os efeitos causados pelas chuvas intensas são de grande proporção nas áreas

sujeitas à ocorrência de escorregamentos, e estes desastres acontecem principalmente

devido às agressões ambientais. O estudo deste problema na cidade do Rio de Janeiro

tem sido estudado por técnicas de   Mineração de Dados e Sistemas de Informações

Geográficas. A base deste trabalho é o banco de dados relacionado aos registros de

escorregamentos entre 1998 e 2001, incluindo parâmetros do solo e meteorológicos.

Os padrões de chuvas acumuladas relacionadas aos escorregamentos dependem

da substituição dos dados ausentes, que foram analisados por várias técnicas, incluindo

análises estatísticas e de agrupamento de dados. A análise espacial da chuva selecionouos pluviômetros e  Redes Neurais foram usadas para substituir os valores ausentes de

chuva, mostrando boa performance. A variável volume do escorregamento também

apresentava valores ausentes e a substituição foi realizada pelo método KNN  

considerando as características dos escorregamentos. Devido às incertezas na

metodologia de medição do volume escorregado (inspeção visual) o erro calculado foi

considerado excelente. Depois da preparação dos dados, foram construídos alguns

modelos para predizer estes acidentes, e auxiliar o sistema de alerta existente. Algunsresultados ilustram a precisão dos modelos.

Page 5: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 5/115

 

 

v

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the

requirements for the degree of Doctor of Science (D. Sc.)

RIO DE JANEIRO’S LANDSLIDES PREDICTION BY

A DATA MINING APPROACH

Fábio Teodoro de Souza

June/2004

Advisor: Nelson Francisco Favilla Ebecken

Department: Civil Engineering

The effects caused by rainfall are wide in the locations subject to landslides

occurrences and these disasters happen mainly due to environmental aggressions. Thestudy of Rio de Janeiro’s city landslides problem has been performed by a  Data Mining 

approach and Geographical Information Systems. The basis of this work is the dataset

related to the landslides registers between 1998 and 2001, including meteorological and

soil parameters.

The cumulative rain patterns related to the landslides depend on the missing

data replacement, which was analyzed by several methods, including Clustering and

Statistical Analysis. The rain spatial analysis selected the rain gauges to be input on  Neural Networks, which were used to replace the rain missing values, with a good

  performance. The landslides volume variable also presents missing values and the

completing has been performed by KNN method considering the characteristics of the

landslides. Due to uncertainties in the measurement methodology of the volume slipped

(visual inspection) the calculated error was considered excellent.

After data preparation, some models were built to predict these accidents, and

  possibly aiding the existing alert system. Some results illustrate the resulting model precision.

Page 6: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 6/115

 

 

vi

ÍNDICE

Resumo ............................................................................................................................iv

Abstract .............................................................................................................................v

CAPÍTULO 1 INTRODUÇÃO........................................................................................ 1

1.1 Objetivo. ................................................................................................................. 11.2 Relevância. ............................................................................................................. 2

1.3 Contribuição. .......................................................................................................... 31.4 Organização da Dissertação da Tese. ..................................................................... 3

CAPÍTULO 2 REVISÃO BIBLIOGRÁFICA ................................................................. 4

2.1 Estudos de Escorregamentos Realizados................................................................ 42.2 Abordagens de Classificação de Acidentes Geotécnicos. ...................................... 72.3 Sistemas de Informações Geográficas (SIG). ......................................................... 92.4 Mineração de Dados. ............................................................................................ 10

2.4.1 Auto-correlação. ............................................................................................ 102.4.2 Análise de Componente Principal (ACP)...................................................... 10

2.4.3 Agrupamento de Dados. ................................................................................ 112.4.4 Redes Neurais Artificiais............................................................................... 122.4.5 Método dos Vizinhos Mais Próximos (KNN )................................................ 142.4.6 Regras de Associação de Dados.................................................................... 152.4.7 Análise de regras interessantes. ..................................................................... 162.4.8 Regras de Classificação de Dados. ................................................................ 20

CAPÍTULO 3 VIABILIDADE ...................................................................................... 23

3.1 Descrição do Problema......................................................................................... 23

3.2 Banco de Dados.................................................................................................... 233.2.1 Dados de Escorregamentos............................................................................ 243.2.2 Dados Meteorológicos................................................................................... 243.2.3 Dados de Parâmetros do Solo........................................................................ 293.2.4 Topografia. .................................................................................................... 31

CAPÍTULO 4 METODOLOGIA................................................................................... 33

4.1 Estudo de Aproveitamento dos Dados. ................................................................ 334.1.1 Análise dos Dados de Pluviometria............................................................... 334.1.2 Análise dos Dados de Parâmetros Meteorológicos. ...................................... 34

4.1.3 Análise dos Dados de Parâmetros do Solo. ................................................... 354.2 Preparação dos Dados........................................................................................... 35

Page 7: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 7/115

 

 

vii

4.2.1 Preparação das Variáveis de Escorregamento............................................... 374.2.2 Regionalização dos Dados de Chuva, Substituição dos Valores Ausentes eCálculo dos Índices Acumulados de Chuva. .......................................................... 394.2.3 Cálculo das Taxas dos Parâmetros do Solo................................................... 404.2.4 Substituição dos Valores Ausentes de Volume de Escorregamento. ............ 41

4.2.5 Discretização das Variáveis para Extração de Regras................................... 434.3 Modelagem........................................................................................................... 444.3.1 Montagem da Matriz dos Dados de Escorregamentos. ................................. 454.3.2 Classificação com Redes Neurais.................................................................. 464.3.3 Geração de Regras de Associação e Análise das Regras Interessantes. ........ 474.3.4 Regras de Classificação................................................................................. 484.3.5 Predição de Chuvas Intensas. ........................................................................ 48

CAPÍTULO 5 RESULTADOS E DISCUSSÃO............................................................ 49

5.1 Estudo da Distribuição da Velocidade e Direção do Vento. ................................ 505.2 Regionalização das Chuvas. ................................................................................. 545.3 Predição do Valor Ausente de Chuva................................................................... 585.4 Predição do Valor Ausente de Volume ................................................................ 615.5 Classificação com RNA’s..................................................................................... 635.6 Extração de Regras de Associação Interessantes. ................................................ 715.7 Classificação com Regras de Associação............................................................. 745.8 Predição de Chuvas Intensas. ............................................................................... 785.9 Desempenho de Classificadores. .......................................................................... 80

5.9.1 Custos de Classificação. ................................................................................ 805.9.2 Melhorando a Acurácia de um Classificador. ............................................... 81

5.9.3 Sensibilidade, Singularidade e Precisão – Medindo a Acurácia. .................. 825.9.4 Melhorando a Acurácia do Classificador de Escorregamentos..................... 83

CAPÍTULO 6 CONCLUSÕES E RECOMENDAÇÕES .............................................. 85

REFERÊNCIAS BIBLIOGRÁFICAS........................................................................... 88

ANEXO I – Glossário das classes de Uso das Terras e Cobertura Vegetal....................95

ANEXO II – Glossário das classes de Aptidão para Reflorestamentoe Olericultura..................................................................................................................97

ANEXO III – Glossário das classes de Qualidade Ambiental das Terras.....................100

ANEXO IV – Glossário das classes de Vulnerabilidade Ambiental das Terras...........102

ANEXO V – Glossário das classes de Pedologia..........................................................104

Page 8: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 8/115

 

 

1

CAPÍTULO 1INTRODUÇÃO

Durante o processo de crescimento das grandes cidades, muitas áreas próximas

às encostas são ocupadas pela população, devido à urbanização. A ocupação

desordenada dos morros altera as características físicas do ambiente natural, provocando

a diminuição das áreas de vegetação, o acúmulo de lixo em locais impróprios, a

obstrução das obras de drenagem, além de outras modificações agressivas ao meio.

A alteração do ambiente natural promove novas configurações dos terrenos

íngremes, que se tornam suscetíveis a ocorrências de acidentes geotécnicos

(deslizamentos ou escorregamentos) durante as chuvas intensas. Estudos têm sido

mostrados, MENEZES et al. [1], que a cidade do Rio de Janeiro possui características

físicas (posição geográfica e topografia) e padrões atmosféricos favoráveis ao

desenvolvimento de fenômenos meteorológicos causadores de chuvas intensas.

O conhecimento dos padrões existentes entre os diversos fenômenos

relacionados aos escorregamentos, permite o estabelecimento de critérios determinantes

  para a emissão dos alertas e a conseqüente mobilização das instituições responsáveis

 para o auxílio à população habitante das regiões das encostas.

1.1 Objetivo.

Recentemente diversos algoritmos baseados em métodos estatísticos e

  paradigmas da inteligência artificial tem sido aplicados a sistemas complexos com

muitas variáveis e inter-relações fortemente não-lineares. Pretende-se com este trabalho

aplicar as ferramentas de data mining ou de mineração de dados sobre o banco de dados

de parâmetros geotécnicos e meteorológicos, coletados na cidade do Rio de Janeiro, e

devidamente operado por Sistemas de Informações Geográficas (SIG).

Os resultados destas análises podem servir para o entendimento dos padrões

existentes entre as diversas taxonomias inter-relacionadas (escorregamentos, chuva, uso

do solo, etc.) e para a implementação de um modelo de gerenciamento ambiental,contribuindo com informação auxiliar para o sistema de alerta existente.

Page 9: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 9/115

 

 

2

1.2 Relevância.

Em meados dos anos 60, chuvas intensas castigaram toda a cidade do Rio de

Janeiro, causando diversos escorregamentos danosos a população. A Figura 1 ilustra umescorregamento ocorrido no mês de Fevereiro de 1967, próximo à Rua das Laranjeiras,

no bairro de Laranjeiras.

Figura 1 – Escorregamento ocorrido no mês de Fevereiro de 1967, próximo à Rua das

Laranjeiras (bairro de Laranjeiras no Município do Rio de Janeiro).

 Nessa época então foi criada a Fundação Geo-Rio, com o principal objetivo de

elaborar e organizar o plano de proteção das encostas. Mais recentemente, em 1996, a

Geo-Rio criou o Sistema de Alerta de Chuvas Intensas e de Deslizamentos em Encostas

da Cidade do Rio de Janeiro, ou simplesmente ALERTA-RIO [2], com o objetivo de

emitir boletins de alerta à população (via estações de rádio e TV) sempre que houver 

 previsão de chuvas intensas e que possam gerar escorregamentos nas encostas.

O sistema de alerta utiliza informações, em tempo real, de várias estações

  pluviométricas automáticas instaladas no município, imagens de radar meteorológico,

Page 10: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 10/115

 

 

3

detector de raios, dados de estações meteorológicas, imagens de satélite, etc. Os dados

são analisados por geotécnicos e meteorologistas, em esquema de plantão 24 horas por 

dia, numa estação computadorizada situada na sede da Geo-Rio.

Dentro desta perspectiva, o presente trabalho pretende construir um modelo

computacional que seja capaz de predizer a ocorrência desses acidentes, alimentado

 pelas informações disponíveis e podendo auxiliar o sistema de alerta existente.

1.3 Contribuição.

A previsão destas catástrofes é de grande importância para a mobilização das

instituições responsáveis em prestar auxílio à população habitante das regiões das

encostas. A implementação dos modelos propostos, construídos com técnicas de

mineração de dados, deveria manipular os dados relacionados aos acidentes geotécnicos

de forma automática, gerando relatórios de análise em tempo real e contribuindo com

informações úteis para o processo de tomada de decisão.

1.4 Organização da Dissertação da Tese.

O Capítulo 1 introduz o problema de escorregamentos nas encostas das grandes

cidades, descrevendo o objetivo, a relevância e a contribuição deste trabalho. O

Capítulo 2 levanta o estado da arte na área de escorregamentos, considera algumas

abordagens de classificação de acidentes geotécnicos, e discorre sobre os SIG’s e

mineração de dados. O Capítulo 3 descreve o problema de escorregamentos no Rio de

Janeiro e detalha o banco de dados obtido para a realização desta tese. No Capítulo 4 é

apresentada a metodologia adotada, relata as atividades envolvidas para a escolha das

escalas temporal e espacial, de preparação dos dados e de modelagem. O Capítulo 5

apresenta os resultados obtidos deste estudo, assim como discute tais resultados. No

Capítulo 6 são apresentadas algumas conclusões sobre o trabalho, e também são

apontadas algumas recomendações para trabalhos futuros.

Page 11: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 11/115

 

 

4

CAPÍTULO 2REVISÃO BIBLIOGRÁFICA

O presente Capítulo levanta o estado da arte na área de escorregamentos em

encostas, considera algumas abordagens de classificação de acidentes geotécnicos e

relata sobre os SIG’s e mineração de dados.

2.1 Estudos de Escorregamentos Realizados.

Os escorregamentos são fenômenos que envolvem diversos parâmetros inter-

relacionados, sejam de origem naturais (chuva, topografia, litologia, características do

solo, etc.) ou relacionados às atividades humanas (ocupação e uso do solo).

O trabalho de KAIBORI et al. [3] mostrou que a ocorrência dos

escorregamentos não depende somente das chuvas intensas, mas também das condições

geológicas e/ou geográficas e hidrológicas do local.

Os escorregamentos induzidos pelas chuvas intensas são os mais perigosos

 para as vidas humanas ENOKI [4], porque eles acontecem com movimentos rápidos e o

material deslizado pode atacar severamente as residências e habitantes das encostas.

Vários tipos de materiais podem ser deslizados, tais como solos, rocha, lixo, entulho,

etc.

O mecanismo dos escorregamentos de alguns materiais induzidos pela chuva

tem sido explicado por alguns pesquisadores. A infiltração vertical das águas da chuva

satura a camada superficial do solo, e consequentemente a poro-pressão positiva da

água induzida na camada do solo promove a instabilidade da encosta (ABOSHI et al.

[5], HARUYAMA [6], KITAMURA [7], e YAGHI et al. [8]). A infiltração causa a

redução da sucção dentro da superfície do solo, e promove a conseqüente redução da

coesão, além do aumento do peso próprio, tornando a encosta instável (SASAKI et al.

[9]).

O lixo presente nas encostas tem predominância de sacos plásticos, que

absorvem água com mais facilidade e rapidez do que o solo durante as chuvas intensas

Page 12: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 12/115

 

 

5

REIS e ARRAIS [10]. O plástico do lixo forma uma camada deslizante em alguns

 pontos tornando-se suscetível ao escorregamento.

A energia do escoamento da chuva é capaz de causar a ruptura de aterros e ou

de estruturas de contenção (normalmente associadas às obras de contenção realizadas

 por leigos e sem critérios técnicos), FEIJÓ et al. [11].

O processo de escorregamentos de rochas induzido pela chuva é de difícil

cálculo e previsão ZÁRUBA e MENEL [12]. Os blocos de rocha acham-se geralmente

envolvidos por matriz terrosa, proveniente do mesmo processo de acumulação ou

gerada pelo processo de alteração dos próprios blocos, e qualquer tentativa de modelar o

comportamento de tais massas envolve uma enorme complexidade [12].

KITAMURA et al. [13] desenvolveram medições da sucção no solo e de

  pluviometria durante as chuvas intensas em Kagoshima (Japão). A região estudada

apresenta material solo arenoso denominado Shirasu. Este material é de pequena

densidade, e tem perda acelerada da sucção em função da temperatura ambiente.

KITAMURA & SAKO [14] desenvolveram um modelo para previsão de falhas deste

material, altamente suscetível aos escorregamentos. O modelo foi validado

comparando-se os resultados obtidos com os dados experimentais.

IKEYA & KONDO [15] estudaram os acidentes causados por chuvas intensas

nas cidades de Hiroshima e Kure no Japão. Nestas regiões, foi observado que ações

mecânicas das intempéries formavam juntas nos granitos e a água da chuva infiltrara

essas juntas promovendo reações químicas. Os escorregamentos ocorriam nas regiões

 bastante expostas à ação dessas reações químicas. Um programa de prevenção desses

desastres foi proposto.

Durante a construção de obras hidráulicas na China, ocorreram deslizamentos

 provocados por chuvas intensas, causando mortes. O material escorregado é composto

  por uma massa rochosa de ardósia e arenito. CHEN [16] avaliou as características

desses acidentes e propôs medidas preventivas considerando informações relacionadas

aos fatores geológicos, topográficos e aos mecanismos de escorregamentos causados

 pelas chuvas intensas.

Em 1996, um furacão devastou Taiwan, trazendo chuvas intensas

  principalmente na parte central da ilha. As chuvas intensas provocaram mais de 1300

escorregamentos. LIN & JENG [17] apresentaram análises detalhadas dos fatores de

risco associados à engenharia, geologia e geomorfologia. Nestes estudos também foramidentificadas as áreas mais suscetíveis à ocorrência dos desastres.

Page 13: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 13/115

 

 

6

Enquanto existe um forte esforço para implementar várias medidas preventivas

e para estabilizar as encostas suscetíveis a ocorrência desses fenômenos, também é

necessário se ter um sistema para avisar a população sobre o risco de escorregamentos

durante as chuvas intensas, CHEUNG and LAI [18]. SASAKI et al. [19] propuseram

ações de prevenção e de notificação aos moradores das encostas no município de

Hirohima (Japão). Essas ações contemplam basicamente três medidas: (1) restrição de

áreas suscetíveis aos escorregamentos – mapeamento dos riscos; (2) instalação de

 barragens para contenção e proteção de algumas áreas nas encostas e (3) um sistema de

alerta para a população habitante das encostas.

O Observatório de Hong Kong na China dispõe de um sistema de alerta ao

 público se chuvas intensas caem ou são esperadas sobre a cidade, emitindo três níveis

de advertência: âmbar, vermelho e preto, correspondendo às precipitações horárias de

30, 50 e 70 milímetros, respectivamente. Para os riscos de escorregamentos em

  particular, os critérios de advertência são baseados essencialmente nos índices

acumulados de chuva nas últimas 24 horas [18]. Foram determinadas [18] algumas

  práticas operacionais para a predição de eventos de chuvas intensas, principalmente

 baseadas em sistemas numéricos de predição do tempo e em recomendações derivadas

de observações de radar. O sistema de alerta da cidade do Rio de Janeiro [2] também é

composto por duas configurações diferentes de advertência, para as condições das

chuvas e para a probabilidade de escorregamentos, conforme ilustram as Tabelas 1 e 2.

Tabela 1 – Condições de Chuvas no Município do Rio de Janeiro.

Nível  Descrição Vigilância  Ausência de chuva ou chuva leve nas próximas 6 horasAtenção  Possibilidade de chuva moderada, ocasionalmente forte, nas próximas

horas

Alerta  Chuva forte nas próximas horas podendo causar escorregamentosisoladosAlertaMáximo 

Chuva muito forte nas próximas horas podendo causar escorregamentosgeneralizados

Tabela 2 – Probabilidade de Escorregamentos no Município do Rio de Janeiro.

Nível  Descrição Baixo Possibilidade de ocorrências de escorregamentos circunstanciaisMédio Possibilidade de ocorrências de escorregamentos ocasionaisAlto Ocorrências de escorregamentos esparsosMuito Alto Ocorrências de escorregamentos generalizados

Page 14: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 14/115

 

 

7

O detalhamento das descrições de escorregamentos é mostrado na Tabela 3.

Tabela 3 – Detalhamento das descrições de escorregamentos no Rio de Janeiro.

Escorregamentos Detalhamento Circunstanciais movimentos de massa não deflagrados diretamente pela ação

das chuvas, tendo como agente de maior importância umacircunstância localizada relacionada a efeitos naturais ouantrópicos, como por exemplo, rompimento de tubulações,dilatações térmicas, vibrações, etc.

Ocasionais movimentos de massa deflagrados pelas chuvas,  predominantemente em taludes artificiais (corte e/ou aterro),com distribuição pouco expressiva.

Esparsos movimentos de massa deflagrados pelas chuvas em taludesnaturais e artificiais, com moderada a grande distribuição.

Generalizados movimentos de massa deflagrados pelas chuvas em taludesnaturais e artificiais, com distribuição muito grande,especialmente nas vias que cortam os maciços montanhosos.

Pode-se notar uma grande variedade de fatores envolvidos no estudo de

escorregamentos, sejam os fatores de origem natural ou relacionados às atividades

humanas, e a classificação desses fenômenos tem sido proposta por vários autores.

2.2 Abordagens de Classificação de Acidentes Geotécnicos.

Os fenômenos de acidentes geotécnicos envolvem uma variedade de processos

e fatores que dispõem possibilidades ilimitadas de classificação, [12]. O termo

escorregamento é utilizado no sentido de abranger todo e qualquer movimento coletivo

de materiais terrosos e /ou rochosos, GUIDICINI & NIEBLE [20], independentementeda diversidade de processos, causas, velocidades, formas e demais características.

Freire [21] classifica os movimentos coletivos em três principais grupos:

escorregamentos, escoamentos e subsidências.

Os escorregamentos são movimentos rápidos nos quais uma porção do maciço

desliza em relação ao restante, ao longo de uma superfície de deslizamento bem

definida. Esses fenômenos podem mobilizar solo, solo e rocha ou somente rocha.

Os escoamentos são deformações sem superfície definida de movimentação e

de movimento contínuo. As corridas são escoamentos que, devido à elevada densidade

Page 15: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 15/115

 

 

8

do material e a rapidez do movimento, possuem alto poder destrutivo. As subsidências

são movimentos descendentes verticais, de componente horizontal nula ou

insignificante. As subsidências não interessam ao presente estudo.

  No Rio de Janeiro, o lixo tem uma relação tão direta com o risco de

escorregamento, que passou a ser registrado nos laudos de acidentes da FUNDAÇÃO

GEORIO [22], [23], [24] e [25]. Nestes laudos também são classificadas as ocorrências

de rupturas de estruturas de contenção (normalmente associadas às obras de contenção

sem critérios técnicos).

A Tabela 4 ilustra três diferentes metodologias de classificação de acidentes

geotécnicos em encostas: FREIRE [21], OHUMA et al. [26] e FUNDAÇÃO GEORIO

[22], [23], [24] e [25].

Tabela 4 – Sistemática de classificação através de três metodologias diferentes.

Magalhães Freire Ohuma et al. Fundação GEORIOEsc. de Solo taludes (ES/tc)

soloEsc. de Solo encosta (ES/en)Esc. de Rocha talude (ER/tc)

rocha Esc. de Rocha encosta(ER/en)

Solo/Rocha talude (ES/R/tc)

Translacionais

solo e rocha

Escorregamentos(Translacionais)

Solo/Rocha encosta(ES/R/en)

RotacionaisEscorregamentos

(Rotacionais)Esc. de Tálus (ET)

Esc. de Lixo/Entulho (EL/E)

Escorregamentos

Queda de Blocos / Dendritos Quedas eRolamentos 

Queda/Rolamento de Blocosou Lascas Rochosos (Q/R)

Rastejos RastejosTerra

Areia ou

silteLamaEscoamentos Corridas

Avalanchede dendritos

Corridas deMassa  Corrida (C)

Movimentos complexos de massaErosão laminar,sulcos, ravinas e

voçorocas

Processos Erosivos/Assoreamento (PE/A)

Ruptura de Aterro (RA)Ruptura de Estrutura de

Contenção (REC)

A caracterização da distribuição espacial das variáveis ambientais associadas

aos escorregamentos pode ser feita por Sistemas de Informações Geográficas (SIG’s).

Page 16: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 16/115

 

 

9

2.3 Sistemas de Informações Geográficas (SIG ).

Os Sistema de Informações Geográficas (SIG’s) consistem de sistemas

computacionais usados para capturar, armazenar, integrar, manipular, analisar e mostrar informações geograficamente referenciadas, identificando os dados de acordo com a

  posição geográfica na Terra, HEIMILLER and HAYMES [27]. Estes sistemas são

usados para manusear mapas, representados em várias camadas, onde cada camada

 possui dados sobre uma particular taxonomia, e cada taxonomia está relacionada a uma

 posição da imagem gráfica de um mapa. As taxonomias podem ser organizadas através

de análises estatísticas.

Os SIG’s possibilitam relacionar informações diferentes num contexto espacial

e alcançar uma conclusão sobre estas relações. Muitas das informações que existem no

mundo contêm uma referência de local, estabelecendo que a informação está em algum

 ponto do globo: latitude, longitude e elevação.

Os SIG’s são sistemas que facilitam a realização de análises complexas, através

da integração dos dados georreferenciados FELGUEIRAS [28]. As ferramentas de

geoprocessamento são bastante úteis para a identificação das áreas mais atingidas pelos

acidentes geotécnicos, e conseqüentemente, das áreas com fatores geológicos e

morfológicos associados à instabilidade do talude.

As forças resistivas dos taludes diminuem com o processo de urbanização, que

altera as condições hidrológicas naturais das encostas. A vegetação influencia

diretamente na estabilidade do talude, podendo aumentar em até 20 % o valor da coesão

do solo BABU & MUKESH [29]. A presença das árvores também ajuda a diminuir o

impacto da gota da chuva sobre o solo. Além disso, as raízes auxiliam na retenção da

água das chuvas, diminuindo a probabilidade de erosão.

Além do conhecimento da distribuição espacial das variáveis ambientais,

também é necessário conhecer de forma qualitativa e quantitativa, as relações e padrões

associados aos fenômenos de escorregamentos. É preciso extrair conhecimento do

mecanismo físico como um todo, sua interconectividade entre os atributos, as relações

das variações temporal e espacial. As ferramentas baseadas em mineração dos dados

 permitem a extração desse conhecimento.

Page 17: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 17/115

 

 

10

2.4 Mineração de Dados.

A Mineração de Dados ou  Data Mining é uma atividade multidisciplinar que

envolve diversas áreas, EBECKEN e EVSUKOFF [30]. A Mineração de Dados é umcampo de pesquisa multidisciplinar que envolve estatística, aprendizado de máquina,

 banco de dados, sistemas especialistas, técnicas de visualização de dados e computação

de alto desempenho. A interação destas disciplinas é componente fundamental para o

 processo de descoberta de conhecimento em banco de dados.

A seguir são descritas algumas técnicas usadas em Mineração de Dados e que

foram usadas neste trabalho.

2.4.1 Auto-correlação.

As medidas de correlação extraídas da  Matriz de Auto-Correlação expressam

uma medida da relação entre duas ou mais variável, PEARSON [31]. Os coeficientes de

correlação podem variar de -1 a +1. Os valores -1, +1 e 0 representam uma correlação

negativa perfeita, positiva perfeita, e ausência de correlação, respectivamente.

Essas medidas de correlação foram usadas neste trabalho principalmente naregionalização dos dados de chuva. A análise espacial da chuva permite a identificação

dos padrões regionais da chuva, e a seleção espacial de pluviômetros pelos valores de

correlação associados.

2.4.2 Análise de Componente Principal (ACP).

A Análise de Componente Principal ( ACP) pode ser vista como um método de

redução de dados, a partir da associação de duas ou mais variáveis correlacionadas

dentro de um fator. Por exemplo, pode-se considerar um gráfico em que cada variável é

representada por um ponto. Neste gráfico podem-se girar os eixos em qualquer direção

sem mudar as posições relativas dos pontos uns aos outros, porém, com mudança das

coordenadas atuais dos pontos; ou seja, a simples rotação dos eixos mudaria

naturalmente a carga dos fatores.

Page 18: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 18/115

 

 

11

O objetivo da estratégia de rotação, elaborada e popularizada em discussões

detalhadas por WHERRY [32], é o de obter um padrão de interpretação mais fácil e

claro, através da associação de fatores com altas cargas para algumas variáveis e com

 baixas cargas para outras.

As  ACP`s foram usadas neste trabalho principalmente na análise espacial da

chuva. A seleção espacial dos pluviômetros foi realizada de acordo as cargas associadas

aos fatores regionais.

2.4.3 Agrupamento de Dados.

Os agrupamentos de dados ou clustering são atividades em mineração de

dados, que consistem em agrupar os dados dentro de classes ou ‘clusters’ tal que os

objetos dentro de uma classe tenham alta similaridade em comparação com um outro

objeto dessa classe, HAN [33], mas têm baixa similaridade a objetos de outras classes.

A árvore de agrupamento (ou árvore hierárquica) usa as dissimilaridades ou

distâncias entre os objetos para formar as classes. O cálculo das distâncias Euclidianas éo método mais direto de calcular as distâncias entre os objetos num espaço

multidimensional, [33].

Se os dados contêm uma clara “estrutura” em termos de classes de objetos

(similares uns aos outros), então esta estrutura muitas vezes é refletida na árvore

hierárquica como “galhos” distintos.

Outro método de agrupamento descrito [33] é o algoritmo K-means, que divide

um conjunto de n objetos dentro de k classes, e, baseado na atualização do valor médiodos objetos de cada classe, o algoritmo re-classifica cada objeto para a classe da qual o

objeto é mais similar, num processo iterativo.

As análises de agrupamento de dados foram usadas neste trabalho

  principalmente na análise espacial da chuva. A seleção espacial dos pluviômetros foi

realizada de acordo a distribuição espacial das classes.

Page 19: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 19/115

 

 

12

2.4.4 Redes Neurais Artificiais.

As   Redes Neurais Artificiais ( RNA’s) são modelos conexionistas capazes de

tratar problemas complexos. As RNA’s podem aprender através de exemplos; possuem

tolerância a erros, pois elas são habilitadas para manusear ruídos e dados incompletos;

são capazes de proceder com problemas não lineares; e, uma vez treinadas, podem

realizar predições e generalizações com alta precisão. As  RNA’s têm sido usadas em

diversas aplicações em controle, robótica, reconhecimento de padrões, previsões,

medicina, sistemas de energia, manufatura, otimização, processamento de sinais e

ciências sociais/psicológicas. As  RNA’s são particularmente úteis em sistemas de

modelagem tais como na implementação de mapeamentos complexos e na identificação

de sistemas.

Os Perceptrons de Múltiplas Camadas (PMC’s) são as arquiteturas de  RNA`s 

mais populares em uso, RUMELHART and McCLELLAND [34], BISHOP [35]. Os

PMC’s usam uma função linear (que realizam a soma ponderada das suas entradas) e,

usualmente, uma função de ativação não-linear. São arquiteturas que podem possuir 

diversas camadas, entretanto, o uso de três ou quatro camadas é adequado para as

aplicações. A função de ativação muito utilizada para os PMC’s é a função logística, ou

a função sigmóide.Os PMC’s basicamente consistem de um conjunto de unidades sensoriais, ou

nós de input que constituem a camada de entrada, uma ou mais camadas oculta (de nós

computacionais) e uma camada de saída (de nós computacionais), HAIKIN [36]. O sinal

de entrada se propaga para frente através da rede, camada por camada. Os PMC’s 

representam uma generalização do perceptron de camada única, ROSENBLATT, [37].

O treinamento dos PMC’s pode ser realizado de forma supervisionada com o

algoritmo de retro-propagação do erro (algoritmo de treinamento mais conhecido emredes neurais). Este algoritmo é baseado na regra de aprendizagem por correção do erro

e desenvolve-se em dois passos através das diferentes camadas da rede: um passo para

frente, a propagação, e um passo para trás, a retro-propagação. Durante a propagação,

um padrão de atividade (vetor de entrada) é aplicado aos nós sensoriais da rede e seu

efeito se propaga através da rede, camada por camada. Finalmente, um conjunto de

saídas é produzido como a resposta real da rede [36].

 No passo de propagação, os pesos sinápticos são todos fixos. Durante a retro-  propagação, os pesos sinápticos são todos ajustados de acordo com uma regra de

Page 20: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 20/115

 

 

13

correção de erro. Especificamente, a resposta real da rede é subtraída de uma resposta

desejada (alvo) para produzir um sinal de erro, que é então propagado para trás através

da rede, contra a direção das conexões sinápticas. Os pesos sinápticos são ajustados para

fazer com que a resposta real da rede se mova para mais perto da resposta desejada, em

um sentido estatístico.

As RNA’s são capazes de conduzir uma análise de sensibilidade às entradas da

rede, podendo indicar quais variáveis são consideradas mais importantes para uma rede

 particular. A análise de sensibilidade pode contribuir com um ganho de conhecimento

na identificação de quais variáveis podem ser seguramente ignoradas em análises

subseqüentes, e quais variáveis devem ser mantidas. A análise de sensibilidade é uma

técnica usada para avaliar a contribuição relativa das variáveis de entrada à performance

de uma rede neural, pelo teste sucessivo das redes neurais com cada variável de entrada

“indisponível” (usando a técnica de substituição do valor ausente naquela variável) [36].

  Nesta análise de sensibilidade, as variáveis são avaliadas de acordo com a

deteriorização da performance na modelagem. Fazendo isso, adota-se um simples valor 

de avaliação para cada variável. Considerando, por exemplo, o caso em que duas

variáveis de entrada codificam a mesma informação (elas podem ser cópias da mesma

variável, como por exemplo, data de nascimento e idade). Um modelo particular 

  poderia depender totalmente de uma, totalmente de outra, ou de alguma combinação

arbitrária de ambas. A análise de sensibilidade produz uma sensibilidade arbitrária

relativa para ambas. Além disso, se alguma variável for eliminada, o modelo pode

compensar adequadamente porque a outra ainda alimenta a informação chave [36]. O

modelo pode então avaliar as variáveis como de baixa sensibilidade, sempre que elas

  podem codificar a informação chave. Similarmente, uma variável que codifica

informações relativamente não importantes, pode ter altas sensibilidades.

É através da habilidade de aprender através do treinamento, que as  RNA’s têm

sido aplicado com sucesso para resolver diversos problemas difíceis, e também podem

ser usados em problemas ambientais. Neste trabalho, as  RNA`s foram usadas para o

  preenchimento dos dados ausentes de chuva durante a preparação dos dados, e na

modelagem para previsão de escorregamentos.

Page 21: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 21/115

 

 

14

2.4.5 Método dos Vizinhos Mais Próximos ( KNN ).

O método KNN considera que os valores ausentes podem ser substituídos pelo

valor do atributo correspondente do objeto completo mais similar no conjunto de dados,

MITCHELL [38]. A Figura 2 ilustra os passos do algoritmo descritos por KENNEDY et

al. [39]:

Figura 2 – Fluxograma do Algoritmo KNN .

Este método foi aplicado neste estudo usando duas diferentes definições de

distâncias métricas (Euclidiana e Manhattan). Considerando dois objetos i e  j, ambos

descritos por um conjunto de atributos contínuos { x1,  x2, …,  x N }. A distância entre o

objeto i e o objeto j pode ser chamada d (i, j), HRUSCHKA et al. [40]. Supondo que o

k-ésimo valor do atributo (1 ≤ k  ≤ N) do objeto m está ausente. Deste modo, o método

KNN calcula as distâncias d (m, i). para todo i ≠  m, de acordo com a distância Euclidiana

ou Manhattan, respectivamente:

Armazena todos os pares entrada saída no conjuntode treinamento

Treinamento

Para cada padrão do conjunto de testeTeste

Busca pelos padrões do K  mais próximo relativo ao padrão de entrada usando uma medida de distância

Para Classificação, calcula a confiança para cada

classe sendo C i / k , onde C i é o número de padrõesentre os padrões de K  mais próximos pertencentes aclasse i. A classificação para o padrão de entrada é aclasse com a confiança mais alta.Para  Imputação, o valor de saída ou resposta é

 baseado numa combinação ponderada dos valores dosadrões de K mais róximos

Page 22: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 22/115

 

 

15

d (m,i)E =22

112

112

11 )(...)()(...)( i N 

m N 

ik 

mk 

ik 

mk 

im  x x x x x x x x −++−+−++− ++−−  (1)

d (m,i)M =i

 N m

 N ik 

mk 

ik 

mk 

im  x x x x x x x x −++−+−++− ++−− ...... 111111  (2)

  Nestas expressões, como atributo xk  está vazio, então ele não é considerado no

cálculo. Depois de calcular todas as distâncias, a menor delas é escolhida, a qual se

refere ao objeto mais similar relativo a m. Este objeto é chamado s, que é o vizinho mais

 próximo. Nesta maneira, pode-se ter que d (m, s) para todo i ≠ m, e xk m é substituído por 

 xk s.

 Neste trabalho, o método de KNN foi usado para o preenchimento dos dados

ausentes de volume de escorregamento durante a preparação dos dados,

2.4.6 Regras de Associação de Dados.

As regras de associação buscam por relações interessantes entre os itens num

dado conjunto de dados. A descoberta dessas relações de associações entre enormes

quantidades de registros pode ajudar em muitos processos de decisões.

Uma variável Booleana representa a presença ou ausência de um item. Cada

registro pode ser representado por um vetor Booleano de valores atribuídos para essas

variáveis, LIU et al. [41]. Os vetores booleanos podem ser usados para identificar 

 padrões que refletem os itens que são freqüentemente associados. Esses padrões podem

ser representados na forma de regras de associação. Uma regra é basicamente composta

  por partes, antecedente ( A) e conseqüente (C ). Por exemplo, a informação que um

determinado índice pluviométrico acumulado ( X ) seja atingido, também tende a

deflagrar escorregamentos (Y ) durante as chuvas intensas, é representado na Regra de

Associação abaixo:

 Rule n:"  X ) "-> " Y  

(S% C% s s’) (3)

Explicando os índices da regra acima:

s% - é o valor suporte da regra [P (X U Y))].

Page 23: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 23/115

 

 

16

c% - é a confiança da regra [P (Y|X)].

s - é o valor suporte da regra expresso em número de vezes que ocorre X ou Y .

s´ – é o número de vezes em que os dois itens X e Y ocorrem simultaneamente.

Suporte e confiança das regras são duas medidas de regras interessantes que

refletem respectivamente a utilidade e certeza das regras descobertas. Um suporte de

25,5 % para a Regra de Associação (3) significa que 25,5 % de todos registros que um

determinado índice pluviométrico acumulado ( A) tenha sido atingido, também tendem a

deflagrar escorregamentos (C ). Uma confiança de 92% significa que 92% dos registros

de deflagração dos escorregamentos (C), ocorreram dado que um determinado índice

  pluviométrico acumulado ( A) também tenha sido atingido. Tipicamente regras de

associação são consideradas interessantes se elas satisfazem ambos um limiar de

suporte mínimo e um limiar de confiança mínimo. Tais limiares podem ser agrupados

 por usuários ou domínios especialistas [40].

O algoritmo  Apriori desenvolvido por AGRAWAL and SRIKANT [42] é

eficiente como regra de associação de mineração e explora as propriedades de um nível

discreto de mineração Apriori: todos subconjuntos não vazios de um   frequent itemset devem também ser freqüente. A k -ésima iteração (para k>1) forma freqüente (k+1)-

itemset candidatos baseados nos freqüentes k -itemsets, e varre a base de dados uma vez

 para encontrar o conjunto completo de freqüentes (k+1)-itemsets, Lk+1.

As variações envolvendo redução de misturas e transações podem ser usadas

 para fazer o procedimento mais eficiente. Outras variações incluem particionar os dados

(minerando cada partição e então combinando os resultados), e amostrando os dados

(minerando em um subconjunto dos dados). Essas variações podem reduzir o número deiterações requeridas para um pequeno número, tal como dois ou um [42].

2.4.7 Análise de regras interessantes.

Enquanto as Regras de Associação têm provado serem muito úteis em

aplicações práticas, os algoritmos de regra de associação em mineração tendem a

 produzir grandes números de regras, muitas das quais não são interessantes. Usuários

Page 24: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 24/115

 

 

17

têm considerável dificuldade manual de analisar tantas regras para identificar algumas

verdadeiramente interessantes. Para resolver tal problema, tem sido desenvolvida [41]

uma aproximação para ajudá-los a encontrar regras interessantes (em particular, regras

inesperadas) de um conjunto de regras de associação descoberto. A   Análise de

 Interessabilidade alavanca o conhecimento do domínio existente para analisar 

associações descobertas e então classificar as regras descobertas de acordo com os

vários critérios de  Interessabilidade, tal como conformidade e vários tipos de

inesperados.

O procedimento de  Interessabilidade refere-se a encontrar regras que são

interessantes e úteis aos usuários, não somente qualquer regra possível. Pesquisas em

  Mineração de Dados tem mostrado que podemos medir a  Interessabilidade de uma

regra usando ambas medidas: objetivas e subjetivas.

Medidas objetivas envolvem analisar a estrutura das regras, a performance

  preditiva, e a significância estatística. Em regras de associação, tais medidas incluem

suporte e confiança. Entretanto, medidas objetivas são insuficientes para determinar a

 Interessabilidade de uma regra descoberta, sendo necessárias medidas subjetivas.

As duas principais medidas subjetivas de Interessabilidade são:

•   Inesperabilidade: As regras são interessantes se elas são desconhecidas dousuário ou contradizem ao existente conhecimento do usuário (ou esperado);

•   Acionabilidade: As regras são interessantes se os usuários podem acionar 

alguma atividade que produza benefício.

As regras interessantes podem ser classificadas dentro de três categorias:

•  Regras que são ambas inesperadas e acionáveis;

•  Regras que são inesperadas, mas não são acionáveis, e

•  Regras que são acionáveis, mas esperadas.

O foco deste trabalho é para o inesperado. A acionabilidade é parcialmente

manuseada diretamente com o inesperado, porque as regras acionáveis são ou esperadas

ou inesperadas.

Regras esperadas são também chamadas de regras conformes porque elas

correspondem conhecimentos existentes ou expectativas dos usuários. Este modelo de

regra é mais geral que o modelo original que AGRAWAL et al. [43] desenvolveram.

Page 25: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 25/115

 

 

18

Define-se regra de associação (generalizada) em mineração como segue:

Seja  I = {i1, . . ., iw} um conjunto de itens. Seja G uma representação acíclica

direcionada dos itens. Uma extremidade em G representa uma iso - relação. Então, G é

um conjunto de taxonomias. A Figura 3 ilustra um exemplo de taxonomias.

Figura 3 – Exemplo de Taxonomias.

A  Análise de Interessabilidade é uma técnica interativa e iterativa. Em cada

iteração, deve-se especificar os conhecimentos existentes sobre o domínio. Então o uso

deste conhecimento analisa as regras descobertas de acordo com algum critério de

 Interessabilidade, e através de tal análise identifica aquelas regras potencialmente

interessantes. Basicamente o algoritmo trabalha como segue:

Repete até que o usuário decida parar:

•  o usuário especifica algum conhecimento existente ou modifica o

conhecimento especificado previamente;

•  o sistema analisa as regras descobertas de acordo com suas conformidade e

inesperabilidade;

•  o usuário inspeciona os resultados da análise através do sistema de

visualização, salva as regras interessantes, e remove as regras não

interessantes.

A linguagem de especificação é bastante simples e permite aos usuários

expressarem seus conhecimentos existentes. A linguagem permite três tipos

especificações, cada conhecimento representando um grau diferente de precisão:

•  impressões gerais ( IG),

•  conceitos precisos razoáveis ( RPC ), e•  conhecimento preciso (PK ).

Volume Danos

Escorregamentos

Tipologia

Solo Rocha Pequeno Médio Grande Pequenos Graves

Page 26: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 26/115

 

 

19

Os dois primeiros tipos de conhecimento representam o sentimento vago do

usuário, e o último tipo representa o conhecimento preciso. Esta divisão é importante

  porque o conhecimento humano tem granularidades. Alguns aspectos de nosso

conhecimento sobre o domínio são em geral completamente vago, enquanto outros são

muito precisos.

É crucial permitir diferentes tipos de conhecimento para serem especificados.

Isto não somente determina como podemos fazer uso do conhecimento, mas também

 podemos fazer uso de todos possíveis conhecimentos do usuário. Por exemplo, se um

sistema pode somente manusear conhecimento preciso, o usuário o qual tem somente

vagas impressões não pode usar o sistema.

A linguagem de especificação também faz uso da idéia da clássica hierarquia(ou taxonomia), que é a mesma como usada em regras de associação generalizadas.

Depois das regras descobertas terem sido analisadas, a análise mostra

diferentes tipos de regras potencialmente interessantes aos usuários. A chave é mostrar 

os aspectos essenciais das regras tal que elas possam levar vantagem às capacidades

visuais humanas para possibilitar o usuário a identificar as regras verdadeiramente

interessantes com rapidez e facilmente. Os aspectos essenciais são:

•  Tipos de regras potencialmente interessantes: Diferentes tipos de regrasinteressantes devem ser separadas porque elas dão ao usuário diferentes tipos

de conhecimento interessante.

•  Graus de Interessabilidade (valores “igualados”): As regras devem ser 

agrupadas de acordo com seus graus de Interessabilidade. Isto permite ao

usuário focalizar primeiramente nas regras máximo inesperado (ou

correspondente) e decidir se olha às regras com menor grau de

Interessabilidade.•  Itens Interessantes: Mostrando os itens interessantes numa regra são mais

importantes que toda a regra. Isto é talvez a decisão crucial máxima. Os itens

inesperados são aqueles mais importantes ao usuário devido ao primeiro

aspecto acima, os usuários já sabem qual tipo de regras interessantes eles estão

  procurando. Por exemplo, quando eles olham para as regras conseqüentes

inesperadas, é natural que a primeira coisa que eles querem saber é o quais são

os itens inesperados nas partes conseqüentes. Sempre que se quer mostrar todo

Page 27: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 27/115

 

 

20

o conjunto de regras, os usuários ainda precisam procurar pelos itens

inesperados nas regras.

Maiores detalhes podem ser obtidos em [41]. Este procedimento é

extremamente útil e será utilizado para extrair regras interessantes do banco de dados de

escorregamentos, neste trabalho.

2.4.8 Regras de Classificação de Dados.

A classificação baseada em regras de associação consiste basicamente em

descobrir um pequeno conjunto de regras numa base de dados que forme um

classificador acurado, LIU et al. [44]. Para as regras de associação, o alvo da mineração

não é predeterminado, mas para as regras de classificação existe um e somente um alvo

 predeterminado, a classe. A particularidade desse conjunto de regras de classificação,

 portanto, é de possuir o atributo classe posicionado do lado direito da regra.

Esta metodologia de classificação assume que o banco de dados é uma tabela

relacional, que consiste de N casos descritos por l distintos atributos. Estes N casos têm

sido classificados dentro de q classes conhecidas. Um atributo pode ser categórico

(discreto) ou contínuo (numérico). Durante a classificação, todos os atributos são

tratados uniformemente. Para um atributo categórico, todos os possíveis valores são

mapeados para um conjunto de positivos inteiros consecutivos. Para um atributo

contínuo, seu valor é discretizado dentro de intervalos, e os intervalos também são

mapeados em um conjunto de positivos inteiros consecutivos. Com esses mapeamentos,

 pode-se tratar um caso (objeto ou registro) como um conjunto de pares (atributo, valor 

inteiro) e um rótulo de classe. Cada par (atributo, valor inteiro) é chamado de item.Seja D o conjunto de dados, I o conjunto de todos os itens em D, e Y o conjunto

de rótulos de classes. Pode-se dizer que um caso d  ∈ D contém X  ⊆  I , um subconjunto

de itens, se  X  ⊆  D. Uma regra de associação de classificação ( RAC ) é uma implicação

da forma X  →  y, onde  X  ⊆  I , e  y ∈ Y . Uma regra X  →  y em D tem confiança c se c% 

dos casos em D que contém X são rotulados com a classe y. A regra X  →  y tem suporte

s em D se s % dos casos em D que contém X são rotulados com a classe y.

Page 28: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 28/115

 

 

21

Para produzir o melhor classificador de todo o conjunto de regras efetua-se a

avaliação de todos os possíveis subconjuntos gerados durante o treinamento dos dados e

a seleção dos subconjuntos com uma seqüência de regras que consegue o menor número

de erro, considerando uma ordem para a seleção destas regras. Dado duas regras, r i e r  j,

r i › r  j (também chamado r i que precede r  j ou tem uma maior precedência que r  j) se:

1.  a confiança de r i é maior que r  j, ou

2.  suas confianças são as mesmas, mas o suporte de r i é maior que r  j, ou

3.  ambos confiança e suporte de r i e r  j são os mesmos, mas r i é gerado antes

que r  j.

Se  R é o conjunto de regras geradas, e  D os dados de treinamento, a idéia básica do algoritmo é escolher um conjunto de regras precedentes em R para cobrir  D. O

algoritmo do classificador é construído em três passos.

•  Classifica o conjunto de regras R de acordo com a relação de precedência para

assegurar regras altamente precedentes;

•  Seleciona as regras para o classificador da seqüência de regras classificada.

Para cada regra r , o algoritmo varre D e encontra aqueles casos cobertos por r  

(elas satisfazem as condições de r ). É marcada a regra r  se ela classifica

corretamente o caso d . Se r pode classificar corretamente ao menos um caso

(se r é marcada) ela será considerada uma regra potencial para o classificador.

Aqueles casos cobertos são removidos de  D. Uma classe é também

selecionada (a classe majoritária nos dados remanescentes), que define o

critério de parada da seleção de mais regras para o classificador C . Calcula-se

e registra-se o número de erros durante a classificação, Quando não existirem

mais regras ou casos de treinamento errados, o processo de seleção está

completo;

•  São descartadas todas as regras em C  que não melhoram a acurácia do

classificador. A primeira regra em que exista o número mínimo de erros

registrados em  D é a regra que limita a poda. Todas as regras depois desta

regra podem ser descartadas porque elas irão produzir mais erros. As regras

não descartadas e a classe da última regra selecionada em C  formam oclassificador.

Page 29: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 29/115

 

 

22

Esta técnica de classificação é muito eficiente, maiores detalhes em [44]. Foi

construído neste trabalho um classificador para predição de escorregamentos usando a

técnica de classificação baseada em associação.

Page 30: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 30/115

 

 

23

CAPÍTULO 3VIABILIDADE

A cidade do Rio de Janeiro possui características físicas favoráveis ao

desenvolvimento de escorregamentos em encostas. O relevo acidentado e a ocupação

das áreas de encostas pela população, desconfiguram o meio natural que se torna

suscetível aos escorregamentos durante a ocorrência de chuvas intensas.

A previsão destes acidentes é de fundamental importância para agilizar a

mobilização das instituições responsáveis em prestar socorro aos moradores das

encostas. Este estudo propõe a construção de um modelo para a previsão dos

escorregamentos auxiliando o sistema de alerta existente.

3.1 Descrição do Problema.

A Fundação Geo-Rio emite anualmente um relatório de escorregamentos

composto de acidentes geotécnicos ocorridos nas encostas do Município do Rio deJaneiro. Os acidentes são aqueles relacionados a eventos chuvosos e consolidados

através de laudos técnicos obtidos após vistorias de campo pelos técnicos da Geo-Rio.

A partir dessas informações básicas encontradas no relatório de

escorregamentos, buscou-se criar um banco de dados com todas as possíveis variáveis

relacionadas ao fenômeno.

3.2 Banco de Dados.

Os registros de escorregamentos disponíveis para este estudo contemplam os

anos de 1998 a 2001. Foram realizadas visitas às instituições responsáveis por base de

dados meteorológicos e de uso e ocupação do solo, a fim de criar um banco de dados

adequado para a extração de conhecimento do fenômeno estudado. Durante a fase deobtenção dos dados, não se teve a preocupação com a escala temporal (freqüência de

Page 31: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 31/115

 

 

24

amostragem dos dados), nem com a localização das estações meteorológicas (desde que

estas se situassem dentro do estado do Rio de Janeiro).

Os itens seguintes detalham a base de dados obtida em cada instituição

visitada.

3.2.1 Dados de Escorregamentos.

Embora possam existir outras bases de dados de escorregamentos, foram

obtidos para esta tese somente os dados fornecidos pela Geo-Rio, pois estes dados são

mais detalhados cronologicamente e espacialmente.

•  Fundação Geo-Rio.

  Nos relatórios anuais da Geo-Rio encontram-se os registros de

escorregamentos [22], [23], [24] e [25]. Em cada registro são anotados o local (bairro

em que ocorreu o acidente), data, hora, tipologia do acidente, volume escorregado

(estimado em metros cúbicos) e os danos ou conseqüências causadas pelos

escorregamentos. A tabela 5 ilustra um registro de escorregamento obtido do relatório

da Geo-Rio:

Tabela 5 - Registro de Escorregamento da Geo-Rio.

Localização Data Hora Descrição da Classe Volume Conseqüências(Rua /Bairro) Ocorrência (m3)

Rua AntônioRego, 1447 -

Ramos

08 /Jan/

1998

20:00 Escorregamentode solo em talude

de corte

ES/tc 15 Danos à moradia

 

3.2.2 Dados Meteorológicos.

Os parâmetros medidos pelas estações meteorológicas, além dos dados de

 precipitação, são importantes indicadores dos processos de formação de grandes chuvas,

e motivou a obtenção desses dados para uma possível análise de uso na construção do

modelo. Foram obtidos dados meteorológicos nas seguintes instituições:

Page 32: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 32/115

 

 

25

•  Fundação Geo-Rio.

Os registros dos dados pluviométricos obtidos na Geo-Rio se processam

através do Sistema Alerta Rio, composto por 32 pluviômetros automáticos,

estrategicamente distribuídos na área do Município, e capazes de enviar,

ininterruptamente, em tempo real e a cada 15 minutos, registros de precipitação para

uma estação central computadorizada, localizada na sede da Geo-Rio. Os dados de

 precipitação são importantes para a modelagem do fenômeno de escorregamentos, pois

se sabe que as chuvas intensas contribuem para a saturação e conseqüente instabilidade

do solo nas encostas [5], [6], [7], [8] e [9].

A base de dados de chuva cedida pela Geo-Rio para o desenvolvimento desta

tese é composta dos registros de chuva a cada 15 minutos, de 30 pluviômetros da rede

automática, e a partir de 6 dias antecedentes e inclusive aos dias dos acidentes. A Figura

4 ilustra a rede dos 30 pluviômetros automáticos:

Figura 4 - Rede de Pluviômetros Automáticos.

Page 33: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 33/115

 

 

26

•  Departamento de Controle do Espaço Aéreo –  DECEA.

As estações meteorológicas da Diretoria de Proteção ao Vôo estão localizadas

nos cinco principais aeroportos da cidade do Rio de Janeiro e registram a cada 6 horas(4 registros diários) os parâmetros atmosféricos: temperaturas do bulbo úmido e seco;

 pressões mínima, média e máxima; registro médio diário da direção e intensidade do

vento; temperaturas mínima e máxima do ar; umidade relativa; precipitação diária;

duração da precipitação no dia, duração de nevoeiro; e duração de trovoada.

A base de dados obtida no  DECEA abrange o período de janeiro de 1998 a

dezembro de 2000, das estações meteorológicas conforme tabela 6. 

Tabela 6 - Estações Meteorológicas do DECEA (Aeronáutica Brasileira).

CoordenadasNº Nome da Estação - Sigla UTM (E) UTM (N)

Cota (m)

1 Afonsos – AF 665883.09 7470331.04 34,02 Galeão - GL 679652.94 7477557.18 9,03 Jacarepaguá – JR 667449.86 7457393.43 3,04 Santos Dumont – RJ 689781.24 7466358.12 4,05 Santa Cruz - SC 631615.59 7463286.15 1,5

•  Instituto Nacional de Meteorologia - INMET .

A base de dados cedida pelo  INMET é composta de registros pluviométricos

diários de 3 estações localizadas no município do Rio de Janeiro e durante os anos de

1998, 1999 e 2000, conforme tabela 7.

Tabela 7 - Pluviômetros do Instituto Nacional de Meteorologia ( INMET ).

CoordenadasNº Nome da Estação UTM (E) UTM (N)

Cota (m)

1 Alto da Boa Vista 677,72638 7460,93356 347,02 Bangu 657,31198 7470,38896 40,03 Jardim Botânico 682,83183 7459,02653 5,0

•  Secretaria Estadual de Rios e Lagoas - SERLA.

A base de dados cedida pela SERLA é composta de registros pluviométricos

diários de 4 estações localizadas no município do Rio de Janeiro e durante os anos de1998, 1999 e 2000, conforme tabela 8.

Page 34: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 34/115

 

 

27

Tabela 8 - Pluviômetros da Secretaria Estadual de Rios e Lagoas (SERLA).

CoordenadasNº Nome da Estação UTM (E) UTM (N)

Cota (m)

1 Capela Mayrink 676,576 7460,085 460,02 Benfica (CCPL) 679,631 7467,771 2,03 Realengo 661,502 7470,437 30,04 Via 11- SUDEBAR 667,439 7455,667 10,0

•  Estação Meteorológica da Universidade do Estado do Rio de Janeiro - UERJ .

A estação Meteorológica da UERJ , situada na coordenada UTM 679,831 (E),

7353,840 (N) e cota 11,0 m de altitude, registra a cada 8 horas (3 dados diários) os

seguintes parâmetros atmosféricos: umidade relativa do ar, direção e intensidade do

vento, precipitação, temperatura do ar, temperaturas diária mínima e máxima. O banco

de dados da UERJ , abrange o período de janeiro de 1997 a setembro de 2000.

•  Estação Meteorológica da Universidade Federal do Rio de Janeiro – UFRJ .

A estação Meteorológica da UFRJ , situada na coordenada UTM 680,505 (E),

7471,791 (N) e cota 5,0 m de altitude, registra 2 vezes ao dia (12 UTC e 18 UTC) os

seguintes parâmetros atmosféricos: temperatura barômetro, leitura barométrica, pressão

nível estática, barógrafo, term. seco, temperatura do ar, term. úmido, temperatura bulbo

úmido, term. máxima, temperatura máxima, term. mínima, temperatura mínima,

umidade tabular, termógrafo, higrógrafo, direção e velocidade do vento, anemômetro,

visibilidade, alcance, precipitação, evaporação, nebulosidade, cobertura, fenômenos

diversos. O banco de dados cedido pela UFRJ contempla os anos de 1998 e 1999.

•  Estações Meteorológicas da Diretoria de Hidrografia e Navegação - DHN .

As estações meteorológicas da Marinha do Brasil registram a cada 3 horas (8

medições diárias), os parâmetros atmosféricos: direção e intensidade do vento, altura

(vagas), período (vagas), altura marul., direção, marul., período marul., temperatura daágua do mar, NR céu coberto, NR cobertura nuvens baixas, tipos nuvens altas, tipos

Page 35: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 35/115

 

 

28

nuvens baixas, tipos nuvens médias, altura base nuvem mais baixa, codificação do

tempo presente, codificação visibilidade horizontal, temperatura bulbo úmido,

temperatura bulbo seco, temperatura do ponto de orvalho, umidade relativa, pressão,

 precipitação. A base de dados das estações meteorológicas cedida pela DHN contempla

o período de janeiro de 1995 a outubro de 2000, conforme tabela 9.

Tabela 9 - Estações Meteorológicas da DHN (Marinha do Brasil).

CoordenadasNº Nome da Estação UTM (E) UTM (N)

Cota (m)

1 São Tomé 907,829 7556,323 ≅0,02 Ilha Rasa 689,528 7447,867 ≅0,03 São Pedro da Aldeia 797,698 7473,818 ≅0,0

•  Estações de Radiossondagem - Wyoming University.

As radiossondas são equipamentos utilizados para medição de parâmetros

meteorológicos na atmosfera, desde a superfície até cerca de 30 km de altura. Estes

equipamentos possuem sensores de temperatura, umidade e pressão, parâmetros estes

que são transmitidos na freqüência usual do equipamento e recebidos no solo pela

estação de recepção.

O banco de dados de radiossondagem é composto por duas perfilagens diárias

da atmosfera (12 UTC e 24 UTC), compreendendo o período de 1994 a 2000. Os vários

  parâmetros medidos permitem identificar padrões de riscos de ocorrência de

tempestades e chuvas intensas. As estações da base de dados obtida são apresentadas na

tabela 10.

Tabela 10 - Estações de Radiossondagem.

CoordenadasNº Nome da Estação Longitude Latitude

1 SBAF (Afonsos) 43° 37´ W 22° 87´ S2 SBGL (Galeão) 43° 25´ W 22° 82´ S3 SBME 41° 77´ W 22° 35´ S4 SBRJ (Santos Dumont) 43° 17´ W 22° 90´ S5 SBSC (Sta. Cruz) 43° 72´ W 22° 93´ S

Page 36: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 36/115

 

 

29

3.2.3 Dados de Parâmetros do Solo.

Os parâmetros do solo são variáveis importantes no estudo de

escorregamentos, pois cada encosta possui sua resistência característica ao

desenvolvimento dos acidentes [29]. Foram obtidos dados de parâmetros do solo na

seguinte instituição:

•  Secretaria Municipal de Meio Ambiente do Rio de Janeiro (SMAC )

A SMAC [45] desenvolve uma estratégia de elaboração de diagnósticos

técnicos sobre as condições ambientais da cidade do Rio de Janeiro. Estes estudos são

realizados desde 1984 a partir da análise de imagens de satélite e resultados deste

levantamento proporcionam informações sobre as condições da estrutura e cobertura do

solo no município, mostrando seus problemas e propiciando um melhor planejamento e

a implementação de ações de recuperação e controle das áreas críticas.

A base de dados obtida junto a SMAC  contempla o cálculo das áreas dosmapeamentos classificados por 159 bairros do município do Rio de Janeiro. As áreas

calculadas para cada bairro são referentes a 5 taxonomias diferentes (cobertura e uso do

solo, aptidão para reflorestamento e olericultura, qualidade ambiental das terras,

vulnerabilidade ambiental das terras e pedologia), totalizando 46 parâmetros, descritos

detalhadamente no Anexo I. Os dados fornecidos são da classificação realizada no ano

de 1999. A tabela 11 ilustra os 46 parâmetros das 5 taxonomias diferentes usados na

modelagem. Esta tabela é bastante útil para interpretar as siglas utilizadas na

modelagem.

Page 37: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 37/115

 

 

30

Tabela 11 – Taxonomias, Parâmetros dos Solos e Siglas.

Taxonomia Parâmetro SiglaFloresta Uso_flor 

Floresta Alterada Uso_flat

Mangue Uso_mangApicum Uso_apicRestinga Uso_rest

Área Úmida Uso_arumCampo Antrópico Uso_cpoaCultura / Pastagem Uso_cupa

Praia Uso_praiAfloramento Rochoso Uso_afro

Área Urbana Uso_urbÁrea Urbana Não Consolidada Uso_urbn

Parques Uso_parqSolo Exposto Uso_sexp

Cobertura

e

Uso

do

Solo

Água Uso_aguaBoa Apt_boa

Regular Apt_regRestrita Apt_restEspecial Apt_esp

Sem Aptidão Apt_sem

Aptidão para

Reflorestamento e

OlericulturaOutros Apt_out

Área de Alerta Qld_aler Conservada Qld_cons

Extremamente Degradada Qld_extdFortemente Degradada Qld_ftmd

Ligeiramente Degradada Qld_ligdModeradamente Qld_mod

Qualidade

Ambiental

das TerrasOutros Qld_out

Alta Vul_boaBaixa Vul_reg

Extremamente Alta Vul_restModerada Vul_espMuito Alta Vul_sem

Vulnerabilidade

Ambiental

das Terras

Outros Vul_outAfloramento de Rocha Sol_aflr 

Brunizém Sol_bruzLatossolo Sol_lats

Manguezal Sol_mangPlanossolos Sol_plan

Podzol Sol_podzSolos Aluviais Sol_aluv

Profundos Sol_prof Solos Glei Sol_glei

Solos Orgânicos Sol_orgSolos Podzólicos Sol_zoli

Pedologia

Outros Sol_out

Page 38: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 38/115

 

 

31

3.2.4 Topografia.

A declividade de uma encosta é de fundamental importância no estudo de

escorregamentos. Infelizmente não foi obtido nenhum mapa digital de elevação do

terreno. Para incluir algum tipo de informação topográfica para o modelo, foi incluída

na base de dados a variável exposição relativa, uma medida relacionada às altitudes

circunvizinhas do local em estudo, BROWER [46].

A exposição relativa (ER) é igual a exposição absoluta (EA) dividida pela

diferença entre as elevações máxima e mínima nas áreas circunvizinhas. Define-se a

exposição absoluta como a diferença entre a elevação de uma particular célula e aelevação média das células circunvizinhas.

  Neste trabalho foram utilizadas as cotas dos pluviômetros para o cálculo das

exposições relativas, pois estas foram as únicas informações de altitude obtidas. A

Figura 5 ilustra os polígonos de Thiessen, delimitadores das áreas de abrangência de

cada pluviômetro, rotulados pela letra P seguido do número correspondente do

 pluviômetro, além da letra C (cota) seguida do valor da altitude (em metros).

Figura 5 – Cálculo da Exposição Relativa

Page 39: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 39/115

 

 

32

Para se obter a exposição relativa do pluviômetro localizado em Gericinó (P-

21), é apresentado um roteiro do cálculo que se torna de fácil entendimento ao observar 

a figura esquemática:

EA (P21) = ABS {C21 – [Média (C29, C26, C 22)]} (4)

EA (P21) = ABS {0 – [(15+30+736)/3]} (5)

EA (P21) = 260.63 

ER (P21) = 100*EA / { [Máximo (C29, C26, C22)] - [Mínimo (C29, C26, C 22)] } (6)

ER (P21) = 100*260.63/ [736 - 15] (7)

ER (P21) = 36,11% 

Um valor de ER próximo de 100 significa que este pluviômetro está localizado

numa região de maior altitude em comparação com os pluviômetros vizinhos; e um

valor de ER próximo de 0 (zero) significa que este pluviômetro está localizado num

 ponto baixo em relação aos pluviômetros vizinhos.

Também é importante ressaltar que foram consideradas algumas

 particularidades durante os cálculos:

•  Se o pluviômetro (polígono) fosse vizinho do mar, esta informação também foi

considerada assinando a cota 0 para o cálculo;

•  Se o pluviômetro (polígono) fosse vizinho de outro município, esta informação

não foi considerada por não haver dados de altimetria dos municípios vizinhos.

Page 40: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 40/115

 

 

33

CAPÍTULO 4METODOLOGIA

As atividades necessárias para o desenvolvimento deste trabalho basicamente

consistem da obtenção, digitalização, preparação e modelagem dos dados. A primeira

atividade foi descrita no item 3.2 (Banco de Dados). Os itens seguintes da metodologia

descrevem as duas últimas atividades: preparação dos dados e modelagem.

4.1 Estudo de Aproveitamento dos Dados.

A base de dados obtida apresenta uma diversidade de parâmetros medidos,

escalas espaciais completamente aleatórias e diferentes freqüências de amostragem.

Para definir em que escalas de tempo e espaço seria viável trabalhar foi necessário

  primeiramente “minerar” esta quantidade de dados e informações. A definição das

escalas foi realizada confrontando os diversos parâmetros medidos em relação aoespaço e ao tempo, mas de forma simultânea.

4.1.1 Análise dos Dados de Pluviometria.

A principal causa dos escorregamentos analisada neste trabalho é a

  pluviosidade acumulada. A rede de pluviômetros da Geo-Rio registra a cada 15minutos, os níveis de pluviometria na cidade do Rio de Janeiro. Esta freqüência de

amostragem permite com facilidade a obtenção de uma relação cronológica do

momento em que ocorreu o acidente e os índices pluviométricos acumulados

associados.

Os outros dados de chuva obtidos são medições diárias, e uma possível relação

cronológica com o momento do acidente seria muito incerta, devido ao intervalo muito

grande entre uma medição e outra. Sob a ótica espacial, a rede de pluviômetros da Geo-

Rio consegue cobrir as áreas de abrangência das estações de medições diárias.

Page 41: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 41/115

 

 

34

Dessa forma, os dados diários de pluviometria foram descartados e os dados da

rede automática foram selecionados para o tratamento de consistência ou preparação.

4.1.2 Análise dos Dados de Parâmetros Meteorológicos.

Os dados meteorológicos obtidos contemplam estações localizadas no

município do Rio de Janeiro, além de estações localizadas no estado fluminense.

Foi realizado um estudo estatístico da distribuição da velocidade e direção do

vento de quatro estações meteorológicas: UERJ e Ilha Rasa localizadas no município do

Rio de Janeiro, e São Tomé e São Pedro da Aldeia localizadas no norte do estado. Estas

estações realizam no mínimo 3 medições diárias e no máximo 5 medições diárias.

Para calcular as freqüências dos dados de direção do vento da estação

meteorológica da UERJ , que originalmente apresentava-se na forma categórica, C

(calmaria), N, NE, E, SE, S, SW, W e NW, foi primeiramente necessário, que os valores

categóricos fossem convertidos para numéricos na mesma ordem, 0, 1, 2, 3, 4, 5, 6, 7 e

8. A Figura 6 ilustra a rosa dos ventos com a configuração original:

Figura 6 – Rosa dos Ventos.

Este estudo teve o objetivo de se identificar algum padrão que ocorresse nos

dias dos escorregamentos que fosse diferente do padrão encontrado na população dos

dados. Portanto, foram gerados histogramas de velocidade e rosa dos ventos para três

amostragens diferentes: população, 8 dias anteriores e inclusive os dias dos acidentes, edias dos acidentes. Não foi identificado nenhum padrão diferente nos dias dos

Page 42: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 42/115

 

 

35

escorregamentos quando comparado à estatística da população. Além desta constatação,

a freqüência de medição do vento e de outros parâmetros atmosféricos também dificulta

uma associação cronológica com o momento do escorregamento. Por estes motivos,

foram descartados os dados dos parâmetros meteorológicos para a construção do

modelo. Os resultados deste estudo de vento são apresentados no Capítulo 5.

4.1.3 Análise dos Dados de Parâmetros do Solo.

A base de dados obtida junto a SMAC  contempla o cálculo das áreas dos

mapeamentos classificados por 159 bairros do município do Rio de Janeiro. O mapa de

  bairros georreferenciado foi adotado como base para esta tese, e os valores das

coordenadas dos pluviômetros da rede automática foram convertidos para o mesmo

sistema de referência (Datum SAD 69).

4.2 Preparação dos Dados.

Os dados são uma coleção de observações de eventos, que acontecem em

função de outros, e que possuem uma relação com o mundo real de onde ele foi

coletado. A manipulação dos dados promove o entendimento da natureza da qual ele foi

medido. Contudo, antes de se aplicar qualquer método de análise nos dados, é preciso

 prepará-los previamente corrigindo qualquer inconsistência presente.

A preparação de dados é a parte mais importante de qualquer projeto, PYLE

[47], e o conjunto de dados preparado cuidadosamente expõe melhor a informação

contida para as ferramentas de modelagem.

As variáveis constantes devem ser descartadas, pois não alteram seu padrão

com a mudança de circunstância e com isso não alcançam informação e entendimento.

As variáveis esparsas possuem muitos valores vazios e a mudança desses valores traz

 pouca informação. Os dados altamente esparsos devem ser reduzidos a um número de

variáveis de tal modo que permita a extração de conhecimento. Esta redução também

Page 43: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 43/115

 

 

36

deve ser aplicada às variáveis redundantes e colineares. A numeração de variáveis

categóricas pode também ser útil em muitas aplicações.

  Nos bancos de dados na vida real, algumas observações de um ou mais

atributos estão tipicamente ausentes.

Estes valores ausentes são um problema crítico para os métodos de mineração

dos dados, que muitas vezes não são aptos para manuseá-los numa forma automática, ou

seja, sem a prévia preparação dos dados. Em geral, existem várias aproximações para

 proceder com o problema de valores ausentes: i) ignorar os objetos contendo valores

ausentes; ii) preencher os vazios manualmente; iii) substituir os valores ausentes por 

uma constante; iv) usar a média ou moda dos dados na mesma classe como um valor de

substituição; e v) usar o valor mais provável para preencher os valores ausentes. A

  primeira aproximação envolve remover os exemplos e /ou atributos com valores

ausentes. Contudo, a perda dos dados pode ser considerável e o conjunto de dados

incompleto pode ficar vulnerável a tendências nas análises estatísticas. A segunda

aproximação é normalmente impossível nas tarefas de mineração de dados, devido a

grande dimensionalidade dos conjuntos de dados analisados. A terceira aproximação

assume que todos os valores ausentes representam o mesmo valor, permitindo

consideráveis distorções. A substituição pelo valor médio /moda é uma prática comum e

algumas vezes pode-se chegar a resultados razoáveis, contudo, esta aproximação não

considera a relação entre as variáveis, que são usualmente úteis para o processo de

substituição dos valores ausentes. Por essa razão, a melhor aproximação envolve o

 preenchimento dos valores ausentes com o método do valor mais provável.

A substituição dos valores ausentes, também chamada imputação, não deve

mudar as características importantes do conjunto de dados. Neste sentido, é necessário

definir as características importantes para serem mantidas. Os métodos de mineração de

dados usualmente exploram, as relações entre as variáveis e, dessa forma, as preservam,

tanto quanto possível, quando substituem os valores ausentes. Em outras palavras, o

objetivo da imputação é substituir os valores ausentes cuidadosamente, tentando evitar a

imputação de tendências no conjunto de dados. Quando a imputação é realizada de uma

maneira apropriada, são produzidos dados com alta qualidade, e o resultado da

mineração de dados pode ser melhorado.

A Figura 7 ilustra as atividades desenvolvidas por SOUZA & EBECKEN [48],

durante a preparação dos dados.

Page 44: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 44/115

 

 

37

Figura 7 – Atividades necessárias para a preparação dos dados.

4.2.1 Preparação das Variáveis de Escorregamento.

Os valores das variáveis categóricas data, hora, danos causados e tipologia 

foram convertidos para números inteiros positivos. Os valores da variável data foram

convertidos para números inteiros positivos no intervalo de 1 a 12, referentes aos meses

do ano; e os valores da variável hora para números inteiros positivos no intervalo de 1 a

4, referentes aos períodos do dia, sendo 1, 2, 3 e 4, para os registros ocorridos entre

03as09h, 09as15h, 15as21h e 21as03h, respectivamente. Os valores da variável danos

causados foram convertidos para números inteiros positivos no intervalo de 1 a 6,

conforme ilustra a última coluna da Tabela 12:

Tabela 12 - Classes de Danos Causados.

Danos Causados Sigla ClasseSem Danos, Sem conseqüências Sem dano 1Danos à Acessos, Vias, Ruas, Log. Público, Bens Públicos AVRL 2Talude, Meio Ambiente, Erosão, Assoreamento MeioAmb 3Danos à estrutura de contenção, Água/Drenagem/Esg. ContADE 4Dano(s) à Moradia(s), Terrenos, Bens Materiais MorTB 5

Destruição (total/parcial) de moradia(s) / Vítimas (fatais ou não) VITDEST 6

 

Cálculo dasTaxas por 

Bairros

Regionalização

Predição da FalhaRNA

Data/ Hora/ Local

Índices de Chuva Acumulada

Predição do Volume (KNN)

Solos Chuva Escorregamentos

Page 45: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 45/115

 

 

38

Os valores da variável tipologia foram convertidos para números inteiros

 positivos no intervalo de 1 a 12, conforme ilustra a última coluna da Tabela 13:

Tabela 13 - Classes de Tipologia dos Acidentes.

Tipologia Sigla Classe  Não Ocorrência Nada 1Pânico PANICO 2Escorregamento de Tálus, Corrida ETOC 3Escorregamento de Rocha ER 4Ruptura de Aterro RA 5Processos Erosivos/ Assoreamento PE/A 6Escorregamento de Solo encosta ES/en 7Queda/Rolamento de Blocos ou Lascas Rochosos Q/R 8

Escorregamento de Lixo/Entulho EL/E 9Escorregamento de Solo e Rocha ES/R 10Ruptura de Estrutura de Contenção REC 11Escorregamento de Solo em talude ES/tc 12

Os relatórios de escorregamentos da GEO-RIO apresentam os acidentes

geotécnicos localizados pelo endereço e proximidade do pluviômetro, mas sem as

coordenadas geográficas, conforme exemplo da Tabela 14.

Tabela 14 – Exemplo de laudo da GEO-RIO.

No Localização Data Descrição daOcorrência

Pluviômetro Laudo

30 Rua Iguatemino 321, Ilha do

Governador 

15/jan Ruptura deestrutura decontenção

Ilha doGovernador 

119/99

A localização do acidente foi georreferenciada de acordo com o mapa de

  bairros, com a devida Área de Planejamento (AP) e Região Administrativa (RA),

conforme ilustra a tabela 15.

Tabela 15 - Exemplo de laudo da GEO-RIO com a nova informação.

No Localização Data Descrição daOcorrência

Pluviômetro Laudo RA AP Bairro

30 Rua Iguatemino 321, IlhaGovernador 

15/jan Ruptura deestrutura decontenção

Ilha doGovernador 

119/99 XX AP-3

TAUA

O exemplo da tabela 15 posiciona melhor geograficamente o bairro Tauá, que

é somente um dentre os vários bairros que compõem a Ilha do Governador .

Page 46: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 46/115

 

 

39

4.2.2 Regionalização dos Dados de Chuva, Substituição dos Valores Ausentes eCálculo dos Índices Acumulados de Chuva.

O banco de dados de chuva é composto por registros de precipitação, a

intervalos de 15 minutos, coletados em 30 pluviômetros automáticos instalados no

município. Foram selecionados 28 eventos ou períodos chuvosos, durante os quais

ocorreram escorregamentos nos anos de 1998 a 2001.

Os índices de chuva acumulada devem ser calculados com dados do

 pluviômetro mais próximo ao bairro onde ocorreu o escorregamento.Contudo, o banco de dados de chuva apresentava-se com registros ausentes.

Para que se pudesse alcançar uma melhor estimativa dos padrões de chuvas causadores

dos escorregamentos, foi preciso preencher essas falhas.

O preenchimento pôde ser feito com auxílio da técnica de redes neurais

artificiais ( RNA’s), e os dados usados para o treinamento, teste e verificação das RNA’s,

foram agrupados com técnicas de redução de dimensionalidade (regionalização da

chuva).

A Figura 8 ilustra a metodologia utilizada na substituição dos valores ausentes.

Regionalização (preparação de dados)

Redes Neurais (predição) 

Camada / Camadade -- deEntrada \ Saída

(Valor Predito)

Figura 8 – Metodologia de substituição de dados ausentes (falhas).

A regionalização dos dados foi necessária para identificar os padrões espaciais

da chuva e permitir que o treinamento da  RNA fosse realizado com dados de

Page 47: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 47/115

 

 

40

 pluviômetros próximos daquele pluviômetro com falhas. Ou seja, se o treinamento fosse

realizado com todos os dados possíveis, tender-se-ia a adicionar ruído proveniente de

dados de pluviômetros distantes, uma vez que existe uma grande variabilidade espaço-

temporal da chuva no município do Rio de Janeiro. Além disso, a regionalização

configura um número reduzido de variáveis para o treinamento da  RNA, reduzindo o

esforço computacional.

SOUZA and EBECKEN [49] utilizaram quatro metodologias neste estudo de

regionalização:   Análise de Componente Principal ( ACP),   Matriz de Auto-Correlação 

( MAC ), Árvore de Agrupamento e o Método K-Means.

Uma vez agrupados os pluviômetros segundo as técnicas de regionalização

citadas, os bancos de dados de chuva puderam ser preparados para o treinamento, teste e

 predição dos valores ausentes através das RNA’s, SOUZA and EBECKEN [50].

Os resultados deste preenchimento dos dados ausentes de chuva são

apresentados no Capítulo 5 - Resultados e Discussão.

Depois de substituído os valores ausentes de chuva, foi possível calcular os

índices de chuva acumulada associados a cada escorregamento. Foram calculados 17

índices pluviométricos de acordo com a localização (dados de chuva do pluviômetro

mais perto), data e hora do acidente reportado. Os índices calculados foram: 15, 30, 45 e

90 minutos; 1, 2, 3, 4, 6, 8 e 12 horas, 1, 2, 3, 4, 5 e 6 dias.

4.2.3 Cálculo das Taxas dos Parâmetros do Solo.

Os dados obtidos dos parâmetros do solo são compostos pelas áreas de

ocupação de cada parâmetro (em ha.) para cada um dos 159 bairros existentes nomunicípio do Rio de Janeiro. Portanto, existe uma grande diversidade de grandezas

associadas no banco de dados. Para agregar estes dados no presente estudo, esses

valores de áreas dos parâmetros foram transformados em taxas, ou seja, os valores

foram normalizados entre 0 e 100% seguindo dois critérios: (1) preparação dos dados e

(2) modelagem.

Durante a preparação dos dados, os valores normalizados foram obtidos

dividindo-se a área de ocupação de um determinado parâmetro pela área total do bairro.

A seguir é ilustrado o procedimento da normalização:

Page 48: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 48/115

 

 

41

(1) Dados:

Bairro: Copacabana - Área do Bairro: 409 ha. - Área Urbana: 257 ha.

USO_URB Copacabana = 257 / 409 * 100 (8)

USO_URB Copacabana = 62.78 %

A resolução espacial do modelo é o polígono de Thiessen. Os valores dos

índices pluviométricos foram normalizados dividindo-se a área de ocupação de um

determinado parâmetro (dentro da área de abrangência de um determinado pluviômetro

onde ocorreu o escorregamento) pela área total dos bairros pertencentes ao mesmo

 pluviômetro. A seguir é ilustrado um exemplo do procedimento da normalização:

(2) Dados:

Pluviômetro: Copacabana

Bairros pertencentes ao Pluviômetro de Copacabana: Copacabana e Ipanema

Copacabana - Área do Bairro: 409 ha. - Área Urbana: 257 ha.

Ipanema - Área do Bairro: 203 ha. - Área Urbana: 165 ha.

USO_URB Pluv - Copacabana = [(257+165) / (409+203)] * 100 (9)

USO_URB Pluv - Copacabana = 68.94 %

4.2.4 Substituição dos Valores Ausentes de Volume de Escorregamento.

Tal como o banco de dados de chuva, a variável volume de escorregamento

também se apresentava com valores ausentes. Para substituir os valores ausentes devolume foi adotado o método KNN , [38].

Page 49: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 49/115

 

 

42

As ferramentas de mineração de dados usadas neste trabalho, tal como o

método KNN , requerem a construção de um mapa cognitivo que contenha todos os

 possíveis parâmetros relacionados ao fenômeno estudo (escorregamentos). Assim, os

índices de chuva acumulada associados a cada escorregamento foram unidos a uma

matriz que inclui todos os parâmetros de solo envolvidos.

Os atributos desta matriz são todas as variáveis relacionadas aos

escorregamentos (data, hora, local, danos causados, tipologia, volume, índices

acumulados de chuva e parâmetros dos solos do bairro onde o acidente ocorreu).

A matriz completa apresenta 1266 registros, sendo que 977 registros são

completos (~77%) e 289 registros apresentam falhas na variável volume de

escorregamento (~23%).

O algoritmo KNN construído para a substituição dos dados ausentes de volume,

teve algumas adaptações específicas para o problema de escorregamentos. O universo

dos objetos foi dividido em três espaços de busca diferentes, ou seja, três valores de k  

diferentes. Também foi considerado no cálculo a interseção e união entre as classes de

três variáveis relacionadas aos escorregamentos:

a) a sazonalidade dos eventos (mês do ano em que aconteceu o escorregamento);

 b) tipos de danos causados pelos escorregamentos (sem danos, danos ambientais, danos

a bens públicos, danos a moradias, vítimas, etc.);

c) tipologia dos escorregamentos (solos, lixo, ruptura de estruturas de contenção, etc.).

A Figura 9 ilustra a divisão dos espaços de busca. Neste desenho, as figuras

geométricas (losango, quadrado e círculo) são proporcionais aos tamanhos das classes.

É importante ressaltar que ao observar essa figura, nos espaços 0 e 1, quando existeinterseção das classes, sabe-se que a região fora da interseção pertence ao espaço de

 busca 2.

A tarefa de substituição dos dados ausentes de volume foi dividida em duas

etapas. Na 1a etapa foram realizados o treinamento e teste do algoritmo KNN em uma

amostra de 98 registros. Na 2a etapa foi realizado o preenchimento dos dados ausentes.

  Na 1ª etapa, foram realizadas várias simulações com o algoritmo KNN ,

mudando o número de variáveis, o número de k  ou vizinhos para os três espaços de busca diferentes e foram registrados o erro médio absoluto e a correlação do modelo

Page 50: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 50/115

 

 

43

com os dados medidos da amostra. Foram utilizadas duas métricas de análise:

Distâncias Euclidiana e Manhattan [38].

Figura 9 – Divisão do espaço de busca do algoritmo KNN .

Depois de inúmeras simulações, foram extraídos os melhores resultados,

avaliando-se o melhor valor de vizinhos (k=ótimo) que minimizasse o erro absoluto e

maximizasse a correlação dos resultados imputados com os dados medidos.

A configuração de melhor resultado (erro médio mínimo e máxima correlação)

 para as duas distâncias (Euclidiana e Manhattan) foi utilizada na 2a etapa para completar 

os valores ausentes de volume.

O proposto método KNN pode ser facilmente adaptado para conjunto de dados

formados por atributos discretos. Para fazer isto é necessária a mudança da distância

Euclidiana / Manhattan pela Aproximação Simple Matching, KAUFMAN &

ROUSSEEUW [51].

4.2.5 Discretização das Variáveis para Extração de Regras.

O algoritmo utilizado para a extração de regras requer que os atributoscontínuos sejam previamente discretizados em intervalos. Existem algoritmos propostos

Tipo 1

Tipo 2

Tipo

11

Tipo 12

Dano 1

Dano

3

Dano 5

Mês 1

Mês

2

Mês

12

Tipo 10

Tipo 4

Mês 11

Mês 9

Tipo 5

Mês 7

Dano 4

Tipo 6

Tipo 7

Tipo 9

Dano 6

Mês 5

Tipo 3

Tipo 8

Meses 4, 5, 6 e 8

Mês 10Dano 2

0

 2

1

Tipologia

Danos

Meses

Page 51: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 51/115

 

 

44

  para discretização, DOUGHERTY et al.[52]. A discretização adotada neste trabalho

 baseou-se no balanceamento da distribuição estatística, usando como limites de divisão

das classes, os valores de freqüências (Hz) de notas musicais, [49]. A Figura 10 ilustra

dois gráficos usados para a discretização de duas variáveis (chuva acumulada de 2 e de

6 dias). O gráfico de curvas (1) corresponde aos valores de freqüência (Hz) das notas

musicais e o gráfico de barras (2) ilustra a distribuição estatística das classes (freqüência

em porcentagem) obtidas em função dos valores limites determinados em (1).

Figura 10 – Metodologia para a discretização de duas variáveis dos dados de pluviometria (chuva acumulada de 2 e de 6 dias)

4.3 Modelagem

SOUZA and EBECKEN [53] desenvolveram um processo de modelagem

envolvendo três abordagens: (1) predição dos escorregamentos; (2) extração de regras

de associação da base de dados. (3) predição de chuvas intensas.

  Na primeira abordagem foram construídos modelos usando duas técnicas

diferentes de classificação: as  RNA’s [36] e  Regras de Classificação [44]. A segunda

abordagem considerou a extração de regras da base de dados [41]. Na terceira

0

100

200

300

400

500

Sol -8 Sol -6 Sol -4 Sol -2 Sol o Sol 2 Sol 4 Sol 6 Sol 8

Notas Musicais

   F  r  e  q  u   ü   ê  n  c   i  a   (   H  z   )

Regressão

Limites (d_2)

Limites (d_6)

0

4

8

12

16

20

1 2 3 4 5 6Classes

   F  r  e  q   ü   ê  n

  c   i  a   (   %   )

d _2 d _6

Page 52: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 52/115

 

 

45

abordagem, foi construído um modelo para predição de chuvas intensas a partir dos

dados de chuvas passadas [36].

As duas últimas abordagens se complementam e formam mais um modelo de

  predição de escorregamento. Ou seja, dado que exista uma regra que descreva a

ocorrência de um escorregamento a partir de um determinado índice pluviométrico, e se

é possível predizer este índice pluviométrico, então também é possível fazer uma

associação ao risco do escorregamento de acordo com o nível de confiança da regra. A

regra a seguir ilustra um exemplo desta aplicação:

Rule 1:IF d_1_>_65.4mmTHEN ->> ACIDENTE

(6.635% 100.0% 84 84 6.635%) (10)

(em 84 vezes que o índice pluviométrico acumulado em um dia ultrapassou 65.4 mm,

ocorreram acidentes em todas as vezes).

4.3.1 Montagem da Matriz dos Dados de Escorregamentos.

As ferramentas baseadas em princípio de inteligência artificial requerem para oestudo de um fenômeno uma estrutura composta por entrada (varáveis envolvidas no

fenômeno) e saída (variáveis do próprio fenômeno). Neste estudo a estrutura montada

foi uma matriz, composta por linhas e colunas.

As linhas são formadas pelos 1033 registros correspondentes aos eventos de

escorregamentos ocorridos no período de 1998 a 2001, mais 233 registros inseridos

artificialmente para compor o padrão de não ocorrência, totalizando 1266 registros.

As colunas são as variáveis ou atributos de entrada relacionados aosescorregamentos (entrada e saída). As variáveis de entrada são todos os índices

 pluviométricos associados aos acidentes, parâmetros do solo e exposição relativa. Como

variáveis de saída, foram considerados quatro parâmetros (ou resultados) diferentes:

tipologia do acidente, volume de material escorregado (distâncias Euclidiana e

Manhattan) e conseqüências dos acidentes. E dentro de cada saída, procuraram-se dois

níveis de detalhamento, ilustrados na Tabela 16.

Page 53: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 53/115

 

 

46

Tabela 16 - Níveis de Detalhamento da Saída dos Modelos.

Tipologia Euclidiana/Manhattan (m3) ConseqüênciasclasseNível 1 Nível 2 Nível 1 Nível 2 Nível 1 Nível 2

1 Nada Nada V= 0 0.0 Sem Danos Sem Danos

2 Pânico Pânico V >0 0.1 e 5.14 Com Danos Infra-Estrutura3 Acidente Es/tc 5.15 e 14.56 Meio Ambiente4 REC > 14.56 Moradia/Vítima5 Outros

A Tabela 16 foi utilizada como referência para a montagem da matriz na

modelagem. Uma matriz construída de acordo com o Nível 1 apresenta menor número

de classes e maior número de registros para o treinamento de cada classe, favorecendo a

identificação e aprendizagem dos padrões pelas ferramentas. Na montagem de uma

matriz com o Nível 2, aumenta-se o número de classes, e embora o modelo enriqueçaem detalhe, existe um número menor de registros para o treinamento de cada classe, e

dificultando a identificação e aprendizagem dos padrões pelas ferramentas.

4.3.2 Classificação com Redes Neurais.

O modelo para predição de escorregamentos foi construído com as técnicas de

 RNA’s e considerando duas camadas ou sub-modelos conforme ilustra a Figura 11. Este

artifício foi utilizado devido à dificuldade encontrada pelas  RNA’s em classificar mais

de duas classes numa só camada neste problema de escorregamentos. Portanto, no

estudo com  RNA’s os resultados foram estimados somente para o primeiro nível de

detalhamento.

Os resultados do modelo são as estimativas de três taxonomias utilizadas neste

estudo, considerando que existam chuvas intensas sobre as encostas do município do

Rio de Janeiro: tipologia do acidente, danos causados pelos acidentes e volume do

escorregamento (considerando os dois resultados obtidos no preenchimento dos dados

ausentes de volume usando o método KNN , ou seja, as duas distâncias Euclidiana e

Manhattan).

Page 54: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 54/115

 

 

47

Treinamento com todos os registros

Treinamento com os registros sem a Classe Nada

Figura 11 - Configuração do Modelo com RNA’s.

 No Capítulo 5 são apresentados os resultados do modelo e também discutida a

acurácia.

4.3.3 Geração de Regras de Associação e Análise das Regras Interessantes.

As regras de associação, como o próprio nome sugere, são associações de

causa e efeito entre os parâmetros de uma base de dados, indexadas principalmente por 

dois valores, suporte e confiança [41]. Neste estudo foram extraídas regras para as trêstaxonomias: tipologia, danos e volume, para os dois níveis de detalhamento e

considerando os valores mínimos de suporte igual a 8% e confiança igual a 90%.

As regras geradas foram endereçadas para um sistema que as classifica de

acordo com um conhecimento imputado e extrai as regras interessantes [41]. Idealmente

esse conhecimento deve ser imputado por um especialista. Mas neste estudo, o

conhecimento foi classificado de acordo com uma impressão geral adquirida durante a

realização desta tese. As regras interessantes e uma discussão desta aplicação sãoapresentadas no Capítulo 5.

Nada Pânico ou Acidente

Fim

1a Classificação

2a Classificação

TipologiaVolume

(Euclidiana)

VolumeManhattan Danos

Nível 1(N1)

N1N1

N1

Page 55: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 55/115

 

 

48

4.3.4 Regras de Classificação.

Um modelo para a predição de escorregamentos foi construído com as regras

de classificação, considerando duas abordagens: (1) semelhante ao modelo construído

com as técnicas de  RNA’s, segmentando em duas camadas ou dois sub-modelos e (2)

realizando a predição em uma só camada [53].

  Nestes estudos realizados com as técnicas de classificação com regras de

associação, foram utilizados os conhecimentos adquiridos durante a modelagem com as

técnicas de RNA`s, tais como as variáveis de entrada que contribuíram para os modelosmais acurados. Também foram estudadas as três taxonomias na saída do modelo: 

tipologia, danos e volume, para os dois níveis de detalhamento.

4.3.5 Predição de Chuvas Intensas.

A predição de chuvas intensas é de fundamental importância para o sistema de

alerta da Geo-Rio, pois essa informação contribui para um modelo construído a partir de

regras de associação [41]. Se um nível pluviométrico acumulado de uma dada regra

indica a possibilidade de deflagrar um escorregamento, então se deve ficar atento se tal

índice vai ser atingido com um modelo de predição de chuvas.

O modelo proposto para a predição de chuvas intensas também foi construído

com as técnicas de  RNA`s [36]. Os resultados desta modelagem são apresentados no

Capítulo 5.

Page 56: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 56/115

 

 

49

CAPÍTULO 5RESULTADOS E DISCUSSÃO

Durante a apresentação dos resultados serão descritos os critérios adotados e

mostrados alguns exemplos da aplicação da metodologia, podendo aparecer a

nomenclatura dos pluviômetros adotada pela Geo-Rio. Para auxiliar na localização

espacial dos pluviômetros, optou-se por apresentar no início deste Capítulo, uma figura

contendo o mapa de bairros do município do Rio de Janeiro, com a rede de

 pluviômetros automáticos e a respectiva legenda.

Legenda:

1 - Vidigal 11 – Irajá 21 – Gericinó2 – Urca 12 – Bangu 22 – Santa Cruz3 – São Conrado 13 – Piedade 23 – Cachambi4 – Tijuca 14 – Tanque 24 – Anchieta5 – Santa Tereza 15 – Saúde 25 – Grota Funda6 – Copacabana 16 – Jardim Botânico 26 – Campo Grande7 – Grajaú 17 – Itanhangá 27 – Sepetiba8 – Ilha do Governador  18 – Cidade de Deus 28 – Sumaré9 – Penha 19 – RioCentro 29 – Mendanha10 – Madureira 20 – Guaratiba 30 – Itaúna

Figura 12 – Rede de Pluviômetros Automáticos da Geo-Rio.

Page 57: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 57/115

 

 

50

A seguir são apresentados os resultados obtidos durante o desenvolvimento

desta tese e a análise de tais resultados.

5.1 Estudo da Distribuição da Velocidade e Direção do Vento.

Este estudo teve o objetivo de se identificar algum padrão que ocorresse nos

dias dos escorregamentos que fosse diferente do padrão encontrado na população dos

dados. Portanto, foram gerados histogramas de velocidade e rosa dos ventos para três

amostragens diferentes: população (total de registros obtidos - 1995 a 2000 das estações

da  DHN e 1997 a 2000 da estação da UERJ ), 8 dias anteriores e inclusive os dias dos

acidentes, e dias dos acidentes. As próximas três figuras ilustram a estatística dos

 padrões da direção do vento calculados para as três amostragens:

Figura 13 – Rosa dos Ventos da População dos Dados.

Page 58: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 58/115

 

 

51

Figura 14 – Rosa dos Ventos dos 8 Dias Anteriores e Dias dos Acidentes.

Figura 15 – Rosa dos Ventos dos Dias dos Acidentes.

A estação São Tomé possui maior freqüência de registros de ventos

 provenientes das direções E e NE, cerca de 38% dos registros. A estação São Pedro da

Aldeia possui maior freqüência de registros de ventos provenientes da direção E e SE,

Page 59: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 59/115

 

 

52

cerca de 52% dos registros. A estação de Ilha Rasa possui maior freqüência de registros

de ventos provenientes da direção E e SE, cerca de 49% dos registros. A estação da

UERJ possui maior freqüência de registros de ventos provenientes da direção SW, cerca

de 15% dos registros, porém, a maioria dos registros (49%) são de calmaria.

Também foram calculadas as freqüências dos dados de intensidade do vento

  para as 6 classes: c1=0, 0< c2 <1, 1< c3 <2, 2< c4 <3, 3< c5 ≤4, c6>4 m/s para a

estação da UERJ , e c1=0, 0< c2 <2,6, 2,6< c3 <5,1, 5,1< c4 <7,6, 7,7< c5 ≤10,3, c6>

10,3 m/s para as estações da DHN . Os padrões de velocidade do vento são ilustrados nas

 próximas três figuras.

Figura 16 – Histograma das Velocidades do Vento da População dos Dados.

As estações São Tomé, São Pedro da Aldeia e Ilha Rasa, possuem maior 

freqüência de registros de ventos de intensidades entre 5,1 e 7,7 m/s, próximos de 40,

40, e 43% dos registros, respectivamente. A estação da UERJ possui maior freqüência

de registros de ventos de intensidades nulas (calmaria), cerca de 50% dos registros, e

mais de 35% dos registros variam entre as intensidades de 1 a 2 m/s.

Page 60: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 60/115

 

 

53

Figura 17 – Histograma das Velocidades do Vento 8 Dias Anteriores e Dias dosAcidentes.

Figura 18 – Histograma das Velocidades do Vento dos Dias dos Acidentes.

Observando as Figuras 13 a 18 das Rosas dos Ventos e dos Histogramas das

Velocidades do Vento, não se constatou nenhum padrão diferente nos dias dosescorregamentos em relação aos padrões da população dos dados. Neste sentido, não

Page 61: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 61/115

 

 

54

houve nenhum ganho de conhecimento ou algum indicativo a partir dos dados de vento

que pudesse auxiliar na emissão de alertas para a deflagração dos acidentes.

5.2 Regionalização das Chuvas.

As atividades necessárias à identificação dos padrões de chuva acumulada que

causam os escorregamentos, requerem o cálculo dos índices acumulados de chuva, que

 por sua vez, dependem do preenchimento dos dados ausentes.

A predição dos valores ausentes de chuva foi realizada através das técnicas de

 RNA’s depois das atividades de regionalização. Uma vez identificado o pluviômetro

com dado ausente (camada de saída das  RNA’s), então é necessário utilizar as técnicas

de regionalização, que servem para selecionar os pluviômetros para o treinamento das

 RNA`s (camada de entrada).

Foram adotadas [49],[50] quatro técnicas para a regionalização dos dados de

chuva:   Análise de Componente Principal ( ACP),   Matriz de Auto-Correlação ( MAC ),

 Árvore de Agrupamento e o Método K-Means.

Os resultados da regionalização para um exemplo de pluviômetro com dado

ausente são descritos a seguir. As simulações foram realizadas com os dados medidos

dos 30 pluviômetros durante o período de 31 de dezembro de 1998 a 13 de janeiro de

1999. Foi escolhido o pluviômetro instalado em Santa Tereza, polígono 5 da Figura 12

que abre o Capítulo ou polígono branco à leste do município nas próximas figuras, por 

apresentar valores elevados de precipitação (pico de 26.8 mm / 15min).

 Na abordagem que considera ACP, foram agrupados os pluviômetros em cinza

escuro (polígonos de Thiessen) com o mesmo fator do pluviômetro de Santa Tereza

(inclusive), conforme ilustra a Figura 19.

O critério de correlação agrupou os pluviômetros em cinza escuro cujas

medidas de correlação da  MAC  fossem maiores ou iguais a 0,70 (c≥0,70), se

comparados com o pluviômetro de Santa Tereza (inclusive), conforme ilustra a Figura

20.

Page 62: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 62/115

 

 

55

Figura 19 - Pluviômetros Selecionados com o Critério de ACP.

Figura 20 - Pluviômetros Selecionados com o Critério de Correlação.

Page 63: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 63/115

 

 

56

  No critério da árvore de agrupamento foram agrupados os pluviômetros em

cinza escuro (Figura 21) pertencentes ao mesmo “galho” (Figura 22) da árvore que

 possui o pluviômetro de Santa Tereza (inclusive).

Figura 21 - Pluviômetros Selecionados com o Critério de Árvore. 

    M    A    D    U    R_

    1    0

    A    N    C    H    T_

    2    4

    I    L    H    A    G    V_

    8

    G    T    F    D    A_

    2    5

    B    A    N    G    U_

    1    2

    P    I    E    D    A_

    1    3

    C    A    C    H    B_

    2    3

    G    R    A    J    A    U_

    7

    S    U    M    A    R_

    2    8

    S    T    A    T    Z    A_

    5

    S    A    U    D    E_

    1    5

    T    I    J    U    C    A_

    4

    R    C    T    R    O_

    1    9

    I    T    A    G    A_

    1    7

    C    D    E    U    S_

    1    8

    T    A    N    Q    E_

    1    4

    G    U    A    B    A_

    2    0

    M    D    N    H    A_

    2    9

    P    E    N    H    A_

    9

    S    C    R    U    Z_

    2    2

    S    E    P    B    A_

    2    7

    C    P    G    D    E_

    2    6

    G    E    R    I    C_

    2    1

    I    T    A    U    N_

    3    0

    U    R    C    A_

    2

    J    D    B    O    T_

    1    6

    C    O    P    A    C    A_

    6

    S    C    O    N    D    O_

    3

    V    I    D    G    A    L_

    1

    I    R    A    J    A_

    1    1

5

10

15

20

25

30

35

40

   D   i  s  t   â  n  c   i  a   E  u  c   l   i   d   i  a  n  a

 

Figura 22 – Dendograma [33] com os Pluviômetros Agrupados na Árvore.

Page 64: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 64/115

 

 

57

Para o método de K-Means foram agrupados os pluviômetros em cinza escuro

  pertencentes à mesma classe que possui o pluviômetro de Santa Tereza (inclusive), e

 para o valor de k=3 (3 classes), conforme Figura 23.

Figura 23 - Pluviômetros Selecionados com o Critério K-means. 

A escolha do método de regionalização foi realizada em função do melhor 

resultado de predição das RNA’s. Se em nenhuma das quatro abordagens citadas fossem

conseguidos bons resultados de predição, então se optou por outras abordagens de

redução de dimensionalidade ou de agrupamento, além do critério mero geográfico ou

de proximidade espacial (pluviômetros vizinhos daquele com falhas). Depois determinada a etapa de regionalização então foram realizadas as simulações com as

 RNA’s, visando a predição dos valores ausentes.

Page 65: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 65/115

 

 

58

5.3 Predição do Valor Ausente de Chuva

Para o preenchimento das falhas com  RNA’s foram selecionados somente

aqueles intervalos vazios em que se observasse valor de precipitação diferente de zeroem pelo menos um pluviômetro da rede, e em pelo menos duas horas antes ou depois da

falha. Pois diferente destas condições, os vazios puderam ser preenchidos com o valor 

zero (não chove no município).

Para o treinamento das redes neurais, foram descartados os registros cuja soma

de precipitação de todos os pluviômetros fosse igual a zero (não chove no município).

Este tipo de registro dificulta o aprendizado da rede, além de consumir esforço

computacional, pois muitas vezes abrangem mais de 90% do banco de dados de chuva.

As simulações com as [49], [50]  RNA’s foram realizadas com os bancos de

dados dos 28 eventos chuvosos, pois todo evento apresentava falha em pelo menos um

 pluviômetro. Foi utilizada a rede do tipo PMC’s séries temporais (3 camadas). Devido à

escassez de dados, foi preciso separar grande parte do banco de dados para o

treinamento (mais de 90% dos registros por várias vezes), para que a rede obtivesse boa

 performance preditiva.

A tabela 17 apresenta um resumo estatístico da parcela de validação, com

resultados de dois parâmetros determinantes na escolha da melhor predição.

Tabela 17 – Resumo estatístico das predições (validação).

Métodos Razão deDesvioPadrão 

Correlaçãode

Pearson-R  ACP 0,34 0,94Correlação 0,34 0,95

Árvore 0,55 0,83K-Means 0,48 0,89

Esta simulação teve na camada de saída o pluviômetro com falhas (Santa

Tereza no 1º evento). A razão de desvio padrão é o quociente entre o desvio padrão dos

erros e o desvio padrão dos dados medidos, e quanto menor for seu valor, indica uma

melhor predição. O coeficiente de correlação de Pearson-R é uma métrica usada para

avaliar a relação entre os valores preditos e os dados, e quanto mais próximo do valor 1,

indica uma melhor predição. Pode-se observar na tabela 17 que as melhores prediçõesforam obtidas das regionalizações com critérios de Correlação e ACP.

Page 66: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 66/115

 

 

59

A Figura 24 ilustra o resultado da predição com Correlação.

Dados Medidos

Predição

740 742 744 746 748 750 752

Casos

0

5

10

15

20

25

30

   P  r  e  c

   i  p   i   t  a  ç   ã  o   (  m  m    /

   1   5  m   i  n   )

 

Figura 24 - Resultado da predição (Correlação ou MAC ).

Pode-se observar na Figura 24 que a linha de predição (pontilhada) apresenta

  boa aderência com a linha dos dados medidos (linha cheia). A linha de predição

consegue aproximar os valores máximos registrados e as variações bruscas no tempo

com resultados satisfatórios.

Os erros absolutos ficaram muito próximos do valor zero durante quase todas

as simulações, e os valores dos erros nunca ultrapassaram o intervalo de -4,0 a +4,0

mm/15min.Os erros médios quadráticos também ficaram muito próximos do valor zero

durante quase todas as simulações, e quando a linha se deslocou do eixo, os valores dos

erros nunca ultrapassaram o intervalo de -0,2 a +0,2.

A escolha do critério de regionalização dependeu, portanto, da análise dos

vários resultados obtidos:

•  Resultados estatísticos e erros;

Page 67: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 67/115

 

 

60

•  Aderência da linha de predição aos dados (identificação dos valores máximos e

variações bruscas no tempo).

Estes resultados indicaram que o critério de Correlação (c ≥ 0,70) pôde ser 

adotado para o preenchimento da falha do pluviômetro de Santa Tereza.

Quando o intervalo de preenchimento da falha ultrapassou dois valores (maior 

que meia hora), então foi realizado um estudo adicional considerando a “vizinhança”. A

Figura 25 ilustra um exemplo de comparação da predição da  RNA’s e os dados de

 pluviômetros vizinhos:

Predição

Dados

GRAJAU_7

SAUDE_15

CACHB_23

STATZA_5

JDBOT_16

SUMAR_28

Méd_viz1978 1980 1982 1984 1986 1988 1990

Casos

-0.5

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

   P  r  e  c   i  p   i   t  a  ç   ã  o   (  m  m   /   1   5  m   i  n  u   t  o  s   )

 Figura 25 – Estudo regional (pluviômetros vizinhos).

 Neste exemplo da figura 25, os dados medidos (linha cheia preta) durante o 20º

evento chuvoso são do pluviômetro instalado na Tijuca (no 4 da Figura 12). A predição

da rede (linha cheia cinza) apresenta coerência quando comparada com os valores

médios dos dados medidos nos pluviômetros vizinhos (linha fina preta), e pode ser 

adotada para a substituição das falhas.

A Tabela 18 resume os resultados quantitativos dos critérios de regionalizaçãoadotados como eficientes para a substituição das falhas. Conforme se pode observar na

Page 68: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 68/115

 

 

61

Tabela 18, o método de  ACP foi o que alcançou mais vezes as melhores predições

(considerando os resultados estatísticos, aderências da linha de predição aos dados e

erros), e foi o método mais utilizado para o preenchimento das falhas.

Tabela 18 – Resumo da eficiência dos métodos adotados.

Métodos BoaPerformance

(%) 

PobrePerformance

(%) ACP 67,6 25,0Correlação 13,3 20,0Árvore 10,5 35,0K-Means 7,6 15,0

O método com  ACP também foi o que mais abrangeu as áreas atingidas por escorregamentos (bairros com contorno branco nas Figuras 19, 20, 21 e 23).

Durante o estudo de preenchimento de falhas nos dados de chuva, deve-se

 priorizar os métodos de regionalização por  ACP e Matriz de Auto-Correlação, e depois

se deve tentar os métodos de Árvore de Agrupamento, K-Means, além de outros.

5.4 Predição do Valor Ausente de Volume

Depois de substituído os valores ausentes de chuva, foi possível calcular os

índices de chuva acumulada associados a cada escorregamento e a montagem de uma

matriz com todos os parâmetros envolvidos.

Contudo, a variável volume de escorregamento também se apresentava com

dados ausentes. Para estimar e substituir os valores vazios de volume foi utilizada atécnica de KNN [38].

Durante as simulações, vários artifícios foram considerados buscando-se

encontrar os menores erros e as maiores correlações das predições com os dados

medidos. Portanto, vários conjuntos de variáveis foram testados como parâmetros de

entrada, e o número de vizinhos mais próximos foi alterado nos três espaços de busca.

Em todas as simulações foram utilizadas como parâmetros de entrada valores

discretos (meses,  período diário, tipologia e danos causados) e contínuos (índices de

chuva acumulada e parâmetros do solo).

Page 69: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 69/115

 

 

62

Dentre todas as simulações, foram extraídos três conjuntos de configurações

com boa performance. Todos estes três conjuntos tiveram como parâmetros de entrada

todas as variáveis discretas, e diferentes variáveis contínuas:

(1) índices de chuva acumulada –  ICA (um, dois, cinco e seis dias, quatro e oito

horas) e parâmetros do solo;

(2) ICA (dois, cinco e seis dias); e

(3) ICA (cinco e seis dias).

A Tabela 19 ilustra os resultados das simulações usando duas diferentes

distâncias, Euclidiana (Euc) e Manhattan ( Man).

Tabela 19 – Resultados das predições (KNN).

Erro Médio (m3) CorrelaçãoConfiguraçõesEuc Man Euc Man

(1) 6.192 6.248 0.476 0.421(2) 5.652 5.014 0.468 0.573(3) 5.129 3.857 0.673 0.836

Os números de vizinhos mais próximos ótimos são 9, 13 e 6, para o primeiro,segundo e terceiro espaço de busca, respectivamente.

Os erros estimados (em metros cúbicos) pelo método Manhattan na terceira

configuração podem ser considerados excelentes (< 4 m3), uma vez que esta informação

é adquirida no campo por uma inspeção visual e esta metodologia de medição introduz

incertezas nos dados.

O melhor resultado de correlação também foi obtido na terceira configuração

(índices acumulados de chuva correspondentes a 5 e 6 dias como variáveis de entrada).

Depois que o método foi validado, os valores ausentes foram substituídos usando a

terceira configuração da Tabela 19 e com as duas distâncias Euc e Man.

A Figura 26 ilustra os resultados da distribuição estatística antes e depois da

substituição pelo método KNN .

A distribuição das classes não sofreu com a introdução de tendência e,

  portanto, esta metodologia pode ser aplicada para a tarefa de substituição dos valores

ausentes dos dados de volume de escorregamento.

Page 70: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 70/115

 

 

63

0

5

10

15

20

25

30

3540

45

50

55

60

<=0.09 0.09 a 2.88 2.88 a 4.85 4.85 a 9.72 9.72 a 29.1 >29.1

Classes de volume (m

3

)

   F  r  e  q   ü   ê  n  c   i  a   (   %

   )

(% - Registros Completos - antes da substituição)

(% - Euclidiana - depois da substituição)

(% - Manhattan - depois da substituição)

 

Figura 26 – Distribuição Estatística – antes e depois da substituição com KNN.

Uma vez preparada e consistida toda a base de dados, pôde-se dar início ao

 processo de modelagem. Os tópicos seguintes ilustram os resultados da modelagem.

5.5 Classificação com RNA’s.

Um modelo para predição de escorregamentos foi construído com as técnicas

de  RNA’s usando a arquitetura de PMC’s e o algoritmo de treinamento

 BackPropagation.

Este modelo de RNA’s considerou duas camadas ou sub-modelos. Na primeira

camada são usados todos os registros da base de dados e o processo termina se aestimativa o modelo for  Nada, ou seja, embora a cidade esteja sendo castigada por 

chuvas intensas, o modelo indica que não ocorrerá escorregamento. Se a estimativa

desta primeira camada for diferente de  Nada, ou seja, pode ocorrer algo, então a

segunda camada, treinada com todos os registros menos a classe  Nada, é acionada. As

respostas da segunda camada são as estimativas das três taxonomias: tipologia, danos

causados, e volume do escorregamento, porém, somente para o Nível 1.

Durante a construção do modelo, e na primeira simulação, foram utilizados

como parâmetros de entrada, todas as variáveis envolvidas no fenômeno, ou seja,

Page 71: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 71/115

 

 

64

índices pluviométricos acumulados, parâmetros do solo e exposição relativa da região

do pluviômetro. A partir da análise da sensibilidade da rede, em que são avaliadas quais

variáveis foram sensíveis durante o treinamento e na performance preditiva, foi

selecionado um outro conjunto de variáveis para a segunda simulação, e assim

sucessivamente, até ser encontrado um resultado considerado aceitável dentro da

realidade do problema.

As amostras para o treinamento, teste e validação foram compostas de 80, 10 e

10 % dos registros, respectivamente.

A Figura 27 apresenta um resultado estatístico de todas as simulações para a

construção da primeira camada do modelo.

Figura 27- Estatística das Simulações– Acerto Médio na Validaçãoda Primeira Camada.

A grande maioria das simulações, mais de 65%, apresentaram bons resultados

(taxa média de acerto na validação maior que 70%).

Dentre as inúmeras simulações realizadas na construção do sub-modelo inicial,

ou primeira camada, foram selecionados três resultados considerados bons e

apresentados na Tabela 20.

0

5

10

15

20

25

30

35

40

45

<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95

Faixas de Acerto (%)

   A  c  e  r   t  o   (   %   )   /   F  a   i  x  a

Page 72: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 72/115

 

 

65

Tabela 20 - Resultados da Simulação das RNA’s – Validação do Modelo.

Taxa de Acerto (%)Classe 1- Nada

Classe 2 – Pânico ouAcidente

Médio No de

Var.Variáveis de Entrada

94.12 93.58 93.85 6 MES, TURNO, D_2, D_3, D_4, D_694.74 88.79 91.76 7 MES, TURNO, D_2, D_3, D_4, D_5, D_695.83 87.25 91.54 7 MES, TURNO, H_12, D_2, D_6,

USO_FLOR, USO_SEXP

A Tabela 20 ilustra os resultados da classificação da primeira camada. As três

  primeiras colunas mostram as taxas de acerto na validação do modelo, para as duas

classes  Nada e algo que pode ocorrer (Pânico ou Acidente e acionada a segunda

camada), e a média das duas primeiras colunas. A quarta coluna da tabela mostra o

número de variáveis usadas na camada de entrada da  RNA, e essas variáveis são

apresentadas na quinta coluna. A tabela apresentada no item 3.2.3 auxilia na

compreensão da codificação das variáveis.

A segunda camada do modelo realiza as estimativas das três taxonomias deste

estudo: tipologia, danos causados e volume do escorregamento. As simulações foram

realizadas de forma análoga à construção da primeira camada, com a exceção de que osregistros usados para o treinamento não contemplam a classe Nada.

Dentre as inúmeras simulações realizadas na construção do sub-modelo final,

ou segunda camada, foram selecionados três resultados considerados bons para a

estimativa da tipologia do escorregamento e apresentados na Tabela 21.

Tabela 21 - Resultados da Simulação das RNA’s – Validação do Modelo.

Taxa de Acerto (%)Classe 1Pânico

Classe 2Acidente

Médio  No de

Var.

Variáveis de Entrada

93.58 72.37 88.67 5 MES, TURNO, H_2, D_5, D_683.90 78.40 86.72 5 MES, TURNO, H_4, D_2, D_681.50 79.28 85.91 4 MES, TURNO, D_5, D_6

A interpretação desta tabela é análoga aos resultados apresentados na

classificação da primeira camada, porém, os valores das duas primeiras colunas foram

calculados considerando a probabilidade condicional em relação ao resultado do sub-

Page 73: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 73/115

 

 

66

modelo inicial, ou camada de entrada. Portanto, a classificação de Pânico na primeira

linha da tabela acima teve uma acurácia de 100 %, mas devido à probabilidade

condicional, este valor foi igualado à incerteza da segunda classe na primeira camada do

modelo.

Ainda assim, pode-se observar que o modelo estima com uma boa acurácia as

duas situações: Pânico e Acidente.

A Figura 28 apresenta um resultado estatístico de todas as simulações para a

estimativa da tipologia do escorregamento (segunda camada do modelo).

Figura 28 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa da tipologia do escorregamento.

A grande maioria das simulações, mais de 90 %, apresentaram bons resultados(taxa média de acerto na validação maior que 65%).

Dando seqüência aos resultados obtidos na construção do sub-modelo final, ou

segunda camada, são apresentados na Tabela 22 três resultados considerados bons para

a estimativa do volume do escorregamento, considerando o preenchimento dos dados

ausentes do volume utilizando o critério da distância Euclidiana.

0

5

10

15

20

25

30

35

40

45

<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95

Faixas de Acerto (%)

   A  c  e  r   t  o   (   %   )   /   F  a   i  x  a

Page 74: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 74/115

 

 

67

Tabela 22 - Resultados da Simulação das RNA’s – Validação do Modelo.

Taxa de Acerto (%)Classe 1V=0 m3 

Classe 2 – V > 0 m3

Médio  No de

Var.

Variáveis de Entrada

87.12 75.87 87.09 4 MES, TURNO, H_3, D_681.37 77.20 84.73 4 MES, TURNO, H_2, D_678.48 76.68 82.91 4 MES, TURNO, H_4, D_6

A interpretação desta tabela com os resultados das estimativas de volume deve

ser feita de maneira análoga ao estudo da tipologia. Podem-se observar bons resultados

nas estimativas das duas classes, mas o modelo tem um acerto ligeiramente maior para a

classe de volume igual a zero (V=0m

3

). A Figura 29 apresenta um resultado estatísticode todas as simulações para a estimativa do volume do escorregamento (Euclidiana).

Figura 29 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa do volume do escorregamento.

A grande maioria das simulações, mais de 85 %, apresentaram bons resultados

(taxa média de acerto na validação maior que 65%).

  Na Tabela 23 são apresentados três resultados considerados bons para a

estimativa do volume do escorregamento, considerando o preenchimento dos dadosausentes do volume utilizando o critério da distância Manhattan.

0

5

10

15

20

25

30

35

40

45

<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95

Faixas de Acerto (%)

   A  c  e  r   t  o   (   %   )   /   F  a   i  x  a

Page 75: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 75/115

 

 

68

Tabela 23 - Resultados da Simulação das RNA’s – Validação do Modelo.

Taxa de Acerto (%)Classe 1

V=0 m3 

Classe 2 – 

V > 0 m3

Médio  No de

Var.

Variáveis de Entrada

90.35 74.61 88.14 8 MES, TURNO, H_6, D_4, D_5,USO_PARQ, USO_SEXP, USO_URB

84.81 77.76 86.86 8 MES, TURNO, H_4, D_4, D_5,USO_PARQ, USO_SEXP, USO_URB

83.18 76.34 85.23 8 MES, TURNO, H_4, D_5, D_6,USO_PARQ, USO_SEXP, USO_URB

Pode-se observar bons resultados nas estimativas das duas classes, mas o

modelo tem um acerto considerável em favor para a classe de volume igual a zero

(V=0m3). É importante ressaltar que durante a tarefa de preenchimento dos dados

ausentes de volume, os resultados obtidos com a distância Manhattan também foram

melhores que os obtidos com o cálculo da Distância Euclidiana.

A Figura 30 apresenta um resultado estatístico de todas as simulações para a

estimativa da volume do escorregamento (Distância Manhattan).

Figura 30 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa do volume do escorregamento.

0

5

10

15

20

25

30

35

40

45

<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95

Faixas de Acerto (%)

   A  c  e  r   t  o   (   %   )   /   F  a   i  x  a

Page 76: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 76/115

 

 

69

A grande maioria das simulações, mais de 90 %, apresentaram bons resultados

(taxa média de acerto na validação maior que 65%),.

  Na Tabela 24 são apresentados três resultados considerados bons para a

estimativa dos danos causados pelo escorregamento.

Tabela 24 - Resultados da Simulação das RNA’s – Validação do Modelo.

Taxa de Acerto (%)Classe 1

SemDanos

Classe 2Com

Danos

Médio  No de

Var.

Variáveis de Entrada

80.21 70.75 80.66 6 MES, TURNO, D_3, D_5, D_6, USO_URB86.38 60.76 78.62 6 MES, TURNO, D_2, D_3, D_5, D_6

79.54 63.14 76.23 5 MES, TURNO, D_2, D_3, D_5

Podem-se observar bons resultados na estimativa da primeira classe, mas

razoáveis para a estimativa da segunda classe.

A Figura 31 apresenta um resultado estatístico de todas as simulações para a

estimativa dos danos causados pelo escorregamento.

Figura 31 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa dos danos causados pelo escorregamento.

A grande maioria das simulações, mais de 60 %, apresentaram bons resultados(taxa média de acerto na validação maior que 65%).

0

5

10

15

20

25

30

35

40

45

<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95

Faixas de Acerto (%)

   A  c  e  r   t  o   (   %   )   /   F  a   i  x  a

Page 77: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 77/115

 

 

70

A Figura 32 ilustra a configuração do modelo total, obtida da escolha dos

melhores resultados:

Treinamento com todos os registros

Variáveis de entrada (VE) – MES, TURNO, D_2, D_3, D_4, D_6

Treinamento com os registros sem a Classe Nada

VE (MES, TURNO, H_2, D_5, D_6) VE (MES, TURNO, H_3, D_6)

VE (MES, TURNO, H_6, D_4, D_5, VE (MES, TURNO, D_3, D_5,USO_PARQ,USO_SEXP, USO_URB) D_6, USO_URB)

Figura 32 - Configuração Final do Modelo de RNA’s.

A análise do modelo acima permite concluir que a ferramenta de  RNA’s é um

 bom estimador para o problema de escorregamentos. O modelo obteve taxa média de

acerto sempre maior que 70% em todas as classes.

Nada94.12 %

Pânico ou Acidente93.58 %

Fim

1

a

Classificação

2a Classificação

TipologiaVolume(Euclidiana)

VolumeManhattan

Danos

Pânico(100.0 %)P(2a|1a)93.58 %

Acidente(77.33 %)P(2a|1a)72.37 %

V=0 m3 (93.10 %)P(2a|1a)87.12 %

V>0 m3 (81.08 %)P(2a|1a)75.87 %

V=0 m3 (96.55 %)P(2a|1a)90.35 %

V>0 m3 (79.72 %)P(2a|1a)74.61 %

Sem Danos(85.71 %)P(2a|1a)80.21 %

Com Danos (75.61 %)P(2a|1a)70.75 %

Page 78: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 78/115

 

 

71

5.6 Extração de Regras de Associação Interessantes.

A tarefa de geração de regras foi realizada explorando-se as variáveis que

contribuíram para a construção do modelo de  RNA’s. Além dessas variáveis, foramincluídas algumas a partir do conhecimento adquirido durante o desenvolvimento da

tese.

Foram extraídas regras para as três taxonomias: tipologia, danos e volume do

escorregamento, para os dois níveis de detalhamento e considerando os valores mínimos

de suporte igual a 8% e confiança igual a 90%.

Dois critérios foram utilizados para estudar os índices pluviométricos

acumulados ( IPA’s) nas regras: o primeiro critério usou os IPA’s importantes do modelo

de  RNA’s e o segundo critério usou os  IPA’s adotados como índices para emissão de

alerta da Geo-Rio (chuvas acumuladas de 1 hora, 1 dia e 4 dias). A Tabela 25 apresenta

o número de regras geradas para os dois critérios.

Tabela 25 – Número de Regras de Associação Geradas.

 Número de Regras GeradasModelosModelo RNA’s Geo-Rio

Tipo – Nível1 (N1) 49705 49740Tipo – Nível2 (N2) 45717 45807Volume – EUC (N1) 49611 49822Volume – EUC (N2) 46059 46276Volume – MAN (N1) 49793 49822Volume – MAN (N2) 45971 46057Danos (N1) 49791 49848Danos (N2) 45837 45936

Conforme pode ser observado na Tabela 25, o número de regras geradas pelos

 IPA’s da Geo-Rio são ligeiramente maiores que o número de regras geradas pelos IPA’s do modelo de RNA’s. O número de regras geradas nos dois critérios possui uma ordem

de grandeza muito grande, e muitas das quais não são interessantes.

Portanto, as regras geradas foram endereçadas para um sistema que as

classifica de acordo com um conhecimento imputado e extrai as regras interessantes.

Idealmente esse conhecimento deve ser imputado por um especialista. Mas neste estudo,

o conhecimento foi classificado de acordo com uma impressão geral adquirida durante a

realização desta tese. A Tabela 26 apresenta o conhecimento imputado.

Page 79: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 79/115

 

 

72

Tabela 26 – Conhecimento Imputado para a Classificação.

Conhecimento para a ClassificaçãoModelosModelo RNA’s Geo-Rio

Tipo (N1) [h_6_0.01a8.6mm, PANICO] [h_1_>9.17mm, PANICO]

Tipo (N2) [h_6_0.01a8.6mm, Pânico] [h_1_>9.17mm, Pânico]EUC (N1) [d_6_>92.6mm, EUC>0 m3] [d_4_>87.4mm, EUC>0 m3]EUC (N2) [d_6_>92.6mm, EUC_0.09a5.14m3] [d_4_>87.4mm, EUC_0.09a5.14m3]

AN (N1) [d_5_>87.4mm, MAN>0 m3] [d_4_>87.4mm, MAN>0 m3]AN (N2) [d_5_>87.4mm, MAN_0.09a5.14m3] [d_4_>87.4mm, MAN_0.09a5.14m3]anos (N1) [d_6_>92.6mm, COM DANOS] [d_4_>87.4mm, COM DANOS]anos (N2) [d_6_>92.6mm, MorTB] [d_4_>87.4mm, MorTB]

A seguir são apresentadas algumas regras interessantes que podem ser 

acionáveis e contribuir com o sistema alerta existente. As três primeiras regras são

referentes à ocorrência de qualquer tipo de escorregamento (ACIDENTE):

Rule 9:" d_6_>_92.6mm " = Y-> " ACIDENTE = Y

(25.513% 91.950% 323 297) (11)

Explicando os índices da regra acima:

25.513% - é o valor  suporte da regra (porcentagem das vezes em que a chuva

acumulada em 6 dias ultrapassa 92.6mm ou que ocorre acidente ou

escorregamento), ou seja, do total de 1266 registros da base de dados, 323

registros apresentam um dos dois itens: d_6_>_92.6mm ou ACIDENTE.

91.950% - é a confiança da regra, ou seja, dado que o primeiro item aconteça

(d_6_>_92.6mm), existe uma probabilidade de 91.95% que aconteça o

segundo item (ACIDENTE).

323 - é o valor  suporte da regra expresso em número de vezes que ocorre os itens

d_6_>_92.6mm ou ACIDENTE.

297 – é o número de vezes em que os dois itens ocorrem simultaneamente

d_6_>_92.6mm e ACIDENTE.

Rule 18: Rule 10:"d_4_>_87.4mm" = Y " d_2_>_73.5mm " = Y

-> "ACIDENTE" = Y -> " ACIDENTE = Y(25.039% 91.480% 317 290) (25.118% 91.510% 318 291)

Page 80: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 80/115

 

 

73

Observando as três regras associadas com ACIDENTE, nota-se que todas

apresentam altos valores de suporte e confiança, acima de 25% e 91% dos registros,

respectivamente. A regra número 9 apresenta os maiores valores de suporte e confiança.

As quatro próximas regras são referentes ao volume do escorregamento, em

que os dados foram preenchidos com o critério da distância Euclidiana:

Rule 8: Rule 21:" d_6_>_92.6mm " = Y "d_4_>_87.4mm

-> " EUC>0 = Y -> "EUC>0 = Y(25.513% 91.950% 323 297) (25.039% 91.480% 317 290)

Rule 20: Rule 14:

"d_1_>_65.4mm" = Y " h_6_>_43.7mm " = Y-> "EUC>0 = Y " Exp_Rel_20.61a23.14" = Y(25.276% 91.560% 320 293) " Qld_extd_ate_0.09 " = Y

" Apt_boa_ate_0.09 " = Y-> " EUC>0 = Y(9.242% 90.600% 117 106)

 Novamente pode-se observar altos valores de suporte e confiança nas regras e

de novo o índice de chuva acumulada em 6 dias apresentou o melhor resultado.

A regra 14 possui a exposição relativa (Exp_Rel) e parâmetros do solo

associados, permitindo que esta regra seja mapeada. O índice pluviométrico acumulado

( IPA) de 6 horas que descreve a regra permite que esta regra tenha um suporte inferior 

(apenas 10.032%) se comparado ao suporte das regras com IPA maior que 1 dia.

As cinco próximas regras são referentes ao volume do escorregamento, em que

os dados foram preenchidos com o critério da distância Manhattan:

Rule 19: Rule 23:" d_5_>_87.4mm " = Y "d_4_>_87.4mm" = Y

-> " MAN>0 = Y -> "MAN>0 = Y(26.066% 90.610% 330 299) (25.039% 91.480% 317 290)

Rule 13: Rule 22:" d_2_>_73.5mm " = Y "d_1_>_65.4mm" = Y-> " MAN>0 = Y -> "MAN>0 = Y

(25.118% 91.510% 318 291) (25.276% 91.560% 320 293)

Rule 20:" h_6_>_43.7mm " = Y" Uso_urb_58.34a77.89" = Y-> " MAN>0 = Y

(10.032% 90.550% 127 115)

Page 81: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 81/115

 

 

74

  Novamente pode-se observar que a regra de maior suporte também é a que

 possui maior  IPA. A regra 20 associa o  IPA de 6 horas às áreas urbanas e pode ser 

mapeada. Porém, esta regra possui suporte inferior (apenas 10.032%) às demais regras

com IPA maior que 1 dia.

As três próximas regras são referentes aos danos causados pelo

escorregamento:

Rule 1: Rule 2:" d_3_>_82.5mm " = Y " d_6_>_92.6mm " = Y" Sol_lats_>_17.33 " = Y " Sol_lats_>_17.33 " = Y-> " COMDANOS = Y -> " COMDANOS = Y

(10.111% 92.190% 128 118) (10.900% 92.030% 138 127)Rule 13: Rule 3:

" d_3_>_82.5mm " = Y "d_4_>_87.4mm" = Y" Qld_extd_ate_0.09 " = Y "Sol_lats_>_17.33" = Y" Apt_boa_ate_0.09 " = Y -> "COMDANOS = Y-> " COMDANOS = Y (10.269% 91.540% 130 119)

(12.085% 90.200% 153 138)

As quatro regras acima apresentam suporte inferior àquelas obtidas nos estudos

de tipologia e volume. As regras 1, 2 e 3 apresentam o parâmetro de solo Latossolo comtaxas maiores que 17.33%. Este tipo de solo possui textura argilosa e sua associação

com danos causados merece um estudo mais detalhado.

5.7 Classificação com Regras de Associação.

Um modelo para a predição de escorregamentos foi construído com as regras

de classificação, considerando duas abordagens: (1) realizando a predição em uma só

camada e (2) semelhante ao modelo construído com as técnicas de RNA’s, segmentando

em duas camadas ou dois sub-modelos.

Foram utilizadas nestes estudos as variáveis de entrada que contribuíram para

os modelos de RNA`s mais acurados. Foram consideradas as três taxonomias na saída do

modelo: tipologia, danos e volume, para os dois níveis de detalhamento.

Page 82: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 82/115

 

 

75

As Figuras 33 e 34 ilustram dois modelos construídos em uma só camada, para

os níveis de detalhamento 1 e 2, respectivamente.

Treinamento com todos os registros

IP – H_6, D_2, D_6

IP – H_3, H_6, D_6 IP – H_1, H_2, H_3, H_6, D_1, D_2, D_3,

D_4, D_5, D_6

IP - H_1, H_2, H_3, H_6, D_1, D_2, D_3, D_4, D_5, D_6

Figura 33 –Modelo de Regras de Classificação – Nível 1.

Conforme se observa na Figura 33, este modelo construído com as técnicas de

Regras de Classificação apresentou ótima acurácia de predição. A taxa de acerto médio

foi sempre superior a 79% em todas as classes. A taxonomia de tipologia teve

 performance inferior ao modelo construído com as técnicas de  RNA’s para as classes

 Nada e Pânico, mas teve índice de acerto maior para a classe Acidente. Nas taxonomias

volume de escorregamento e danos causados a metodologia de Regras de Classificaçãoteve performance preditiva superior ao modelo construído com as técnicas de RNA’s.

Nada80.69 %

Pânico89.35 %

Acidente79.03 %

Tipologia

Vol = 0 m3 89.34 %

Vol > 0 m388.09 %

Volume (Euclidiana) Volume (Manhattan)

Vol = 0 m3 87.32 %

Vol > 0 m391.27 %

Sem Danos91.45 %

Com Danos88.10 %

Danos

Page 83: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 83/115

 

 

76

Treinamento com todos os registros - IP da GEO-RIO – H_1, D_1, D_4

Figura 34 – Modelo de Regras de Classificação – Nível 2.

Conforme pode ser observado na Figura 34, o modelo diminui a performance preditiva quando simula o nível de detalhamento 2. Isto se deve ao menor número de

amostras para o treinamento de cada classe.

A Figura 35 apresenta um resultado obtido na tentativa construir um modelo

semelhante ao das RNA’s, ou seja, em duas camadas.

Treinamento com todos os registrosVariáveis de entrada (VE) – todas

Figura 35 – Predição do Modelo Inicial com Regras de Classificação.

Conforme pode ser observado na Figura 35, o modelo apresenta um resultado

excelente na predição das classes Pânico ou Acidente, mas razoável para a classe Nada.

 Nada78.54 % 

Pânico ou Acidente98.84 %

1a Classificação

Nada82.40 %

Es/tc72.73 %

REC66.09 %

Tipologia

Vol = 0 m3 89.54 %

Volume (Manhattan)

Vol entre 0.1 e 5.14 m3 64.75 %

Vol > 14.56 m362.60 %

Pânico81.29 %

Outros73.36 %

Vol entre 5.15 e 14.56 m3 64.50 %

Page 84: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 84/115

 

 

77

Uma outra tentativa foi a de construir um modelo misto, sendo a primeira

camada composta pelo modelo de RNA’s e a segunda camada construída com as Regras

de Classificação. Dentro desta abordagem ainda tentou-se estimar os escorregamentos

 para as três taxonomias (tipologia, volume e danos causados) e para os dois níveis de

detalhamento.

A Figura 36 ilustra um modelo misto, construído com as duas técnicas:

Treinamento com todos os registros ( RNA – PMC’s)Variáveis de entrada (VE) – MES, TURNO, D_2, D_3, D_4, D_6

Treinamento com os registros sem a Classe Nada ( Regras de Classificação)VE – Selecionadas do modelo de RNA’s

Figura 36 - Configuração de um Modelo Misto com RNA’s e Regras de Classificação.

Conforme ilustra a Figura 36, o modelo apresenta performance preditiva

comprometida quando simula o nível de detalhamento 2. Isto se deve ao menor número

de amostras para o treinamento de cada classe.

Nada

94.12 %

Pânico ou Acidente

93.58 %

Fim

1a Classificação

2a Classificação

Vol = 0 m3

(87.18 %)P(2a|1a) 81.58 %

Volume (Euclidiana)

Vol entre 0.1 e 5.14 m3 (72.61 %)P(2a|1a) 67.95 %

Vol > 14.56 m3(69.76 %)P(2a|1a) 65.28 %

Vol entre 5.15 e 14.56 m3 (71.55 %)P(2a|1a) 66.96 %

Page 85: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 85/115

 

 

78

5.8 Predição de Chuvas Intensas.

A matriz dos dados de escorregamentos construída para a modelagem possui

como parâmetros de entrada os índices pluviométricos acumulados ( IPA) associados aosescorregamentos, parâmetros do solo e exposição relativa.

A partir dos índices pluviométricos calculados, foi construído um modelo para

  predição de chuvas intensas usando as técnicas de RNA’s usando a arquitetura de

PMC’s e o algoritmo de treinamento BackPropagation.

Foram realizadas simulações com os PMC’s, usando como parâmetros de

entrada das  RNA’s, os  IPA’s relacionados aos escorregamentos e anteriores ao da

  previsão. Na saída das RNA’s, foram estimados 5 índices pluviométricos conforme

ilustra a Tabela 27.

Tabela 27 - Previsão de Chuvas com RNA’s.

Índices Pluviométricos (IP) -Saída

IPEntrada 

d_4 d_1 h_4 h_1 min_15min_15min_30 *

min_45 *h_1 *min_90 * *

h_2 * *h_3 * *h_4 * *h_6 * * *h_8 * * *

h_12 * * *d_1 * * *d_2 * * * *d_3 * * * *d_4 * * * *d_5 * * * * *d_6 * * * * *

O número de amostras para o treinamento, teste e validação, variou para os 5

diferentes modelos, e conforme mostra a tabela 28.

Page 86: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 86/115

 

 

79

Tabela 28 – Número de amostras.

Índices Pluviométricos (IP)Amostras(%)  d_4 d_1 h_4 h_1 15min

Treinamento 80 85.0 90 85.0 80

Teste 10 7.5 5 7.5 10Validação 10 7.5 5 7.5 10

A Tabela 29 apresenta um resumo estatístico das predições da parcela de

validação, para os 5 modelos, com resultados de dois parâmetros:   Razão de Desvio

Padrão ( RDP) e Correlação de Pearson-R (CPR).

Tabela 29 – Resultados Estatísticos.

Índices Pluviométricos (IP)mostras(%)  d_4 d_1 h_4 h_1 15min RDP  0.19 0.28 0.24 0.28 0.32CPR  0.98 0.96 0.97 0.96 0.95

Conforme se observa na Tabela 29, a razão de desvio padrão apresenta valores

 baixos, próximos de 0, e o coeficiente de correlação de Pearson-R apresenta valores

 próximos do valor 1, indicando boas predições.

A Figura 37 ilustra o resultado da predição do  IPA de 4 horas nos casos de

maiores precipitações.

0

20

40

60

80

100

120

140

160

180

35 55 75 95 115 135 155 175 195 215

Casos

   P  r  e  c   i  p   i   t  a  ç   ã  o   (  m  m   )

 

Predição

Dado

 

Figura 37 – Resultado da Predição do IPA de 4 horas.

Page 87: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 87/115

 

 

80

Pode-se observar na Figura 37 que a linha de predição (pontilhada) apresenta

 boa aderência com a linha dos dados medidos (linha cheia). Portanto, pode-se concluir 

que a técnica de RNA’s é excelente para este tipo de tarefa.

O modelo de previsão de chuvas intensas pode ser integrado às regras de

associação e formarem mais um modelo de predição de escorregamento. Ou seja, dado

que exista uma regra que descreva a ocorrência de um escorregamento a partir de um

determinado índice pluviométrico, e se é possível predizer este índice pluviométrico,

então também é possível fazer uma associação dos modelos.

5.9 Desempenho de Classificadores.

Muitas pesquisas em construção de classificadores tem sido focalizadas no erro

mínimo de classificação. Este critério permite minimizar o número de predições ou

classificações incorretas feitas pelos classificadores. Este tipo de método de

aprendizagem ignora as diferenças entre os diferentes tipos de predição incorreta, TING

and ZHENG [54]. É muito comum nas aplicações do mundo real que diferentes tipos de predições incorretas possuem custos diferentes.

5.9.1 Custos de Classificação.

O custo das predições incorretas muitas vezes é mais importante que o número

de predições incorretas em muitas áreas do mundo real, tais como as financeiras e

médica. Por exemplo, no diagnóstico médico, diagnosticando alguém como saudável

quando essa pessoa tem uma moléstia ameaçadora de vida é usualmente considerado

mais sério (deste modo com maior custo) que um outro tipo de erro – de diagnosticar 

alguém como doente quando essa pessoa está de fato saudável.

Apesar disso, muito pouca atenção tem sido dada ao custo sensibilidade de

classificação onde o objetivo é minimizar o custo total de predições incorretas ou ao alto

número de erros de custo.

Page 88: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 88/115

 

 

81

A estimativa da acurácia de um classificador é importante para a avaliar o quão

 preciso um determinado classificador irá se comportar com os dados futuros, ou seja,

nos dados em que o classificador não foi treinado, [33].

5.9.2 Melhorando a Acurácia de um Classificador.

Existem técnicas para melhorar a acurácia do classificador, tais como

“ Bagging” (ou bootsrap aggregation) e “boosting” [33]. Cada técnica combina uma

série de T  classificadores treinados, C 1, C 2, ..., C T  com o objetivo de criar um

classificador composto melhorado, C *.Supondo que um paciente queira ter um diagnóstico feito baseado nos seus

sintomas. Ao invés de perguntar a um médico, ele pode perguntar para vários. Se um

certo diagnóstico ocorre mais do que outros, então esse pode ser o melhor diagnóstico

ou o final. Substituindo cada médico por um classificador, tem-se a intuição de um

bagging.

Supondo que sejam atribuídos pesos ou importâncias aos “valores” de cada

diagnóstico médico, baseado na acurácia dos diagnósticos prévios que eles tenham feito.O diagnóstico final é então uma combinação dos diagnósticos ponderados. Esta é a

essência de um boosting.

Dado um conjunto S de s amostras, pode-se utilizar “bagging”, que trabalha

como descrito a seguir. Para iteração t (t = 1, 2, ..., T ), um conjunto de treinamento St  é

amostrado em substituição ao conjunto original de amostras, S. Uma vez que a

amostragem em substituição é usada, algo das amostras de S original pode não estar 

incluída em St , enquanto outras podem ocorrer mais de uma vez. Um classificador  C t  será treinado para cada conjunto de treinamento St . Para classificar uma amostra não

conhecida, X , cada classificador C t  retorna sua classe de predição, que conta como um

voto. O classificador bagged , C *, conta os votos e assim a classe com o maior número

de votos para X . Bagging pode ser aplicado a predição de valores contínuos utilizando o

valor médio da predição de cada classificador.

Em Boosting, os pesos são fixados para cada amostra de treinamento. Um série

de classificadores é treinado. Depois que um classificador C t  está treinado, os pesos são

atualizados para permitir o classificador subseqüente, C  t+1, para “corrigir” os erros de

Page 89: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 89/115

 

 

82

classificação feitos por C t . O classificador final boosted , C *, combina os votos de cada

classificador individual, onde o peso de cada voto do classificador é uma função da sua

acurácia. O algoritmo boosting pode ser estendido para a predição de valores contínuos.

5.9.3 Sensibilidade, Singularidade e Precisão – Medindo a Acurácia.

Supondo que se tenha um classificador treinado para classificar amostras de

dados médicos como ou “câncer ” ou “sem câncer ”. Uma taxa de acurácia de 90 % pode

fazer parecer o classificador bastante acurado, mas o que fazer, se somente 3 ou 4 % das

amostras de treinamento são realmente “câncer ”? Claramente, uma taxa de acurácia de

90% não pode ser aceitável – o classificador poderia corretamente rotular somenteamostras “sem câncer ”, por exemplo. Ao invés, se quisesse ter acesso a quão bem o

classificador pode reconhecer as amostras “câncer ” (referidas como amostras positivas)

e quão bem o classificador poderia reconhecer as amostras “sem câncer ” (referidas

como amostras negativas). As medidas de sensibilidade e singularidade podem ser 

usadas, respectivamente para este propósito. Além disso, pode-se usar a precisão para

acessar a porcentagem de amostras rotuladas como “câncer ” que são realmente

amostras “câncer ”. Estas medidas são definidas como:

Sensibilidade = t_pos / pos (12)

Singularidade = t_neg / neg (13)

Precisão = t_pos / (t_pos+f_pos) (14)

onde:

t_pos é o número de positivos verdadeiros (amostras “câncer ” que foram corretamente

classificadas como tais),

 pos é o número de amostras positivas (“câncer ”),

t_neg é o número de negativos verdadeiros (amostras “sem câncer ” que foram

classificadas corretamente como tais),

neg é o número de amostras negativas (“sem câncer ”), e

 f_pos é o número de positivos falsos (amostras “sem câncer ”que foram incorretamente

rotuladas como “câncer ”).

Page 90: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 90/115

 

 

83

Dessa forma pode ser mostrado que acurácia é uma função de sensibilidade e

singularidade:

 Acurácia = { sensibilidade [pos/(pos+neg)]} + {singularidade [neg / (pos + neg)]} (15)

5.9.4 Melhorando a Acurácia do Classificador de Escorregamentos.

Os modelos estudados nesta tese ainda requerem um pós-processamento para

serem implementados como um sistema de apoio à decisão. Durante a ocorrência de

chuvas intensas nas encostas, o custo de classificar incorretamente a situação Nada (não

vai ocorrer escorregamento), tem um custo diferente de um erro de classificação do Acidente. É muito mais grave errar na primeira situação - tranqüilizando a população

das encostas de que não vai haver escorregamento, quando de fato ocorre - do que

alertar a população de um possível escorregamento que não venha a ocorrer.

Muitos classificadores são construídos visando minimizar o número de erros

global da classificação. Nessa metodologia, o classificador busca classificar 

corretamente todas as classes em igual proporção, adotando como limite de decisão, um

eixo que delimita o ponto médio da região de interseção das curvas de distribuição de

 probabilidades, conforme ilustra o eixo na posição 1 da Figura 38.

DUDA et al. [55] propõe técnicas de ponderação em que este eixo pode ser 

deslocado para a esquerda (posição 2 da Figura 38), durante a construção do

classificador. Nesta segunda abordagem, o erro global da classificação vai aumentar,

mas também aumenta a confiança de que a classe Nada seja classificada corretamente.

Ou seja, o sistema comporta-se com pesos diferenciados, mas dando maior 

confiabilidade ao sistema de alerta.

Além disso, a aplicação das técnicas de  Bagging e Boosting merece um estudo

mais detalhado para melhorar a acurácia dos modelos propostos nesta tese, e garantir 

um índice de confiança maior no processo de tomada de decisão.

  Na realidade os classificadores desenvolvidos no presente trabalho serão

atualizados em dados recentes, relativos aos anos de 2002, 2003 e 2004, o que

certamente, seguindo a metodologia desenvolvida refletirá em crescente melhoria do

desempenho.

Page 91: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 91/115

 

 

84

Figura 38 – Metodologias para construção dos Classificadores

Page 92: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 92/115

 

 

85

CAPÍTULO 6CONCLUSÕES E RECOMENDAÇÕES

Esta tese teve como objetivo principal, desenvolver uma metodologia de

  Mineração de Dados, utilizando Sistemas Geográficos de Informação (SIG), para

estudar a ocorrência dos escorregamentos nas encostas do Município do Rio de Janeiro,

ocasionados por chuvas intensas.

A mineração dos dados é uma atividade multidisciplinar e engloba o

desenvolvimento de modelos aplicáveis a fenômenos em engenharia nas diversas

escalas: espacial, temporal e multivariada.

A fase mais importante de um projeto em Mineração de Dados, é a Preparação

dos Dados [47]. A metodologia desenvolvida para a tarefa de preenchimento dos dados

ausentes de chuva utilizou técnicas estatísticas, atividades de agrupamento de dados e

redes neurais artificiais [48], [49], [50]. Os resultados obtidos podem ser considerados

satisfatórios. A variável volume de escorregamento também apresentava valores

ausentes. O preenchimento desses valores foi realizado aplicando o algoritmo KNN  

[38], [39], [40], e os resultados podem ser considerados excelentes, dada a condição em

que a variável é medida.

Depois de terminada a fase de preparação dos dados, foram construídos

modelos para a predição dos escorregamentos e de chuvas intensas na cidade do Rio de

Janeiro [53].

Os modelos construídos com as técnicas em Redes Neurais Artificiais ( RNA’s)

[36] mostraram boa performance preditiva para um determinado nível de detalhamento

e os resultados mostraram que as  RNA’s são bastante úteis para o estudo de

escorregamentos.

Os modelos de Classificação construídos com as  Regras de Associação [41],

[44] também apresentaram boa performance preditiva, e os resultados mostraram que

aplicação destas técnicas podem atingir um nível de detalhamento maior na predição, se

comparadas às RNA’s.

Os modelos para a previsão de chuvas intensas, construídos com as técnicas de

 RNA’s, apresentaram excelentes resultados de precisão. Estes modelos podem ser 

acoplados às  Regras de Associação Interessantes [41], e obtendo-se mais um modelo para a predição de escorregamentos.

Page 93: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 93/115

 

 

86

Os classificadores desenvolvidos no presente trabalho podem ainda conseguir 

melhoria no desempenho, após atualização com dados recentes e com a aplicação de

técnicas para enriquecer a performance preditiva.

Os SIG’s provaram ser bastante úteis para a análise espacial do problema de

escorregamentos, e permitem uma visualização clara das relações entre as variáveis no

tempo e no espaço. Os SIG’s também podem ser considerados ferramentas de

mineração de dados, pois extraem informações do banco de dados de forma automática

e explícita.

A metodologia implementada supriu a escassez de dados consistidos e permitiu

gerar diversos modelos para construir classificadores. Muito esforço deve ser ainda feito

 para construir uma ferramenta de uso prático e integrada no ambiente de alerta.

Algumas recomendações são feitas para estudos mais detalhados do problema

de escorregamentos no Município do Rio de Janeiro.

•  As imagens de radar coletadas pela Geo-Rio, atualmente, são descartadas após

um período de 2 ou 3 meses. O possível arquivamento das imagens de radar 

 poderia servir para incorporar estes dados na modelagem.

•  Uma encosta na região do Pluviômetro instalado no bairro de Itanhangá

(polígono 17 da Figura 12) é monitorada com instrumentação geotécnica. A

utilização destes dados para a extração de regras seria bastante útil para

entender a relação das variáveis de Geotecnia no problema de

escorregamentos.

•  Um modelo para a predição dos escorregamentos considerando as técnicas de

melhoramento do desempenho deve ser implementado para auxiliar o sistema

de alerta existente. A Figura 39 apresenta um fluxograma do modelo proposto.

  Neste sistema, seria gerado um mapa com granularidades de risco,

contribuindo para o controle da mobilização das instituições responsáveis em

 prestar auxílio aos moradores das encostas. É evidente que a construção de um

ensemble de classificadores fornece o melhor desempenho de predições.

Page 94: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 94/115

 

 

87

Deve-se ressaltar que todo o conhecimento adquirido na metodologia proposta

foi obtido de dados monitorados; resta ainda a consideração do conhecimento dos

especialistas que em muito pode acrescentar em benefício da qualidade das predições.

Dados

BaggingHAN (2001);PonderaçãoDUDA (2001);BoostingTING & ZHENG (1998)

Figura 39 – Modelo de Previsão de Escorregamentos.

Page 95: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 95/115

 

 

88

REFERÊNCIAS BIBLIOGRÁFICAS

[1]  MENEZES, W. F., PAIVA, L. M. S, SILVA, M. G. A. J. et al., 2000, “Estudo

do Ambiente Favorável à Propagação de Sistemas Convectivos de

Mesoescala sobre o Município do Rio de Janeiro”,   In XI Congresso

 Brasileiro de Meteorologia, Rio de Janeiro.

[2]  ALERTA-RIO, 1996, “Condições das Chuvas e Probabilidade de

Escorregamentos no Município do Rio de Janeiro”,

http://www2.rio.rj.gov.br/georio/site/alerta/alerta.htm.

[3]  KAIBORI, M., KUWADA, S., UMEKI, K., 2001, “Some Features of debris

flow movements from the view point of disaster prevention”, Pre-prints of 

Papers for the Asian Technical Committee on Geotechnology for Natural

 Hazards, Hong Kong, December.

[4]  ENOKI, M, 2001, “Mechanism of rain-induced landslide of slope surface”, Pre-

 prints of Papers for the Asian Technical Committee on Geotechnology for 

 Natural Hazards, Hong Kong, December.

[5]  ABOSHI, H. et al., 1976, A fundamental study on prediction of slope failure and 

classification of dangerous zone, Report of Kagaku-Kenkyu-Seika (in

Japanese).

[6]  HARUYAMA, M., 1983, Slope failures caused by heavy rainfall in Shirasu

region in southern Kyu-shu, Tsuchi to Kiso, 31 (1): pp. 105-110 (in

Japanese).

[7]  KITAMURA, R., 1988, A study on failure mechanism of Shirasu slopes, Report

of Kagaku-Kenkyu-Seika (in Japanese).

Page 96: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 96/115

 

 

89

[8]  YAGHI, N., ENOKI, M., YATABE, R., 1991, “Prediction of slope failure based

on amount of rainfall”, Proceedings of International Symposium on Natural

  Disaster Prevention and Civil Engineering, Japanese Society of Civil

Engineering: pp. 349-358.

[9]  SASAKI, Y. et al., 2000,   Rainfall property and critical amount of rainfall of 

 Masado slopes in the rain-induced disaster in the end of June 1999, Report

on the Rain-induced Disasters in Hiroshima, 1999, pp. 141-152 (in

Japanese).

[10] 

ARRAIS, Y. R., ARRAES, F. F., 2001, Estabilidade de Lixo em Encostas,Projeto Final do Curso de Engenharia Civil com ênfase em Meio Ambiente e

Geotecnia, PUC-RJ, p. 1-90, Rio de Janeiro.

[11]  FEIJÓ, R. L., PAES, N. M., et al., 2001, “Chuvas e Movimentos de Massa no

Município do Rio de Janeiro”, III Conferência Brasileira de Estabilidade de

Encostas, Novembro, Rio de Janeiro.

[12]  ZÁRUBA, Q., MENEL, V., 1969, “Landslides and their control”, Elsevier , p 31.

[13]  KITAMURA, R., MIYAMOTO, Y., SAKO, K., 2001, “In Situ Measurement of 

Suction Change in Soil due to Rainfall in Kagoshima, Japan”, Pre-prints of 

Papers for the Asian Technical Committee on Geotechnology for Natural

 Hazards, Hong Kong, December.

[14]  KITAMURA, R., SAKO, K., 2001, “A Synthetic Research Strategy for 

Prediction of Slope Failures due to Heavy Rain”, Pre-prints of Papers for 

the Asian Technical Committee on Geotechnology for Natural Hazards,

Hong Kong, December.

Page 97: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 97/115

 

 

90

[15]  IKEYA, H., KONDO, K., 2001, “On the New Measures for Sediment Disasters

  based on the Hiroshima Sediment Disaster of 1999”, Pre-prints of Papers

 for the Asian Technical Committee on Geotechnology for Natural Hazards,

Hong Kong, December.

[16]  CHEN, Z. Y., 2001, “Case Record of several Rainfall-Induced Landslides in

China’s Water Resources Development”, Pre-prints of Papers for the Asian

Technical Committee on Geotechnology for Natural Hazards, Hong Kong,

December.

[17] 

LIN, M. L., JENG, F. S., 2001, “Hazards induced by extremely heavy Rainfallin a major Fault Zone”, Pre-prints of Papers for the Asian Technical

Committee on Geotechnology for Natural Hazards, Hong Kong, December.

[18]  CHEUNG, P., LAI, E. S. T., 2001, “Short-range rainfall forecast in Hong

Kong”, Pre-prints of Papers for the Asian Technical Committee on

Geotechnology for Natural Hazards, Hong Kong, December.

[19]  SASAKI, Y., MORIWAKI, T., DISSANAYAKE, A. K., KANO, S., 2001,

“Geotechnical Aspects of Rain-Induced Landslides in Hiroshima, June

1999”, Pre-prints of Papers for the Asian Technical Committee on

Geotechnology for Natural Hazards, Hong Kong, December.

[20]  GUIDICINI, G., NIEBLE, C. M., 1976, “Estabilidade de Taludes Naturais e de

Escavação”, Ed. Edgard Blücher e Ed. da Universidade de São Paulo.

[21]  FREIRE, E. S. M., 1965, “Movimentos Coletivos de Solos e Rochas e sua

Moderna Sistemática”, Construção, Rio de Janeiro, (95): pp. 10 -18.

[22]  FUNDAÇÃO GEORIO, 1998,  Relatório de Escorregamentos, In: Prefeitura da

Cidade do Rio de Janeiro.

Page 98: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 98/115

 

 

91

[23]  FUNDAÇÃO GEORIO, 1999,  Relatório de Escorregamentos, In: Prefeitura da

Cidade do Rio de Janeiro.

[24] 

FUNDAÇÃO GEORIO, 2000,  Relatório de Escorregamentos, In: Prefeitura daCidade do Rio de Janeiro.

[25]  FUNDAÇÃO GEORIO, 2001,  Relatório de Escorregamentos, In: Prefeitura da

Cidade do Rio de Janeiro.

[26]  OHNUMA, C. S., SILVA, F. S. M., MAGRO, S. O., 1994, “Riscos Geológicos

no Brasil”, 38º Congresso Brasileiro de Geologia.

[27]  HEIMILLER, D. M., HAYMES, S. R., 2001, “Geographic Information Systems

in Support of Wind Energy Activities at NREL”, 39th AIAA Aerospace

Sciences Meeting, Reno, Nevada, January 8–11.

[28]  FELGUEIRAS, C. A., 1987,   Desenvolvimento de um Sistema de Modelagem

 Digital de Terreno para Microcomputadores. Tese de M.Sc., INPE, São Josédos Campos, SP, Brasil.

[29]  BABU, G. L. S., MUKESH, M. D., 2001,   Landslide Analysis in Geographic

  Information Systems, Department of Civil Engineering Indiana Institute of 

Science, Bangalore.

[30]  EBECKEN, N. F. F., EVSUKOFF, A. G., 2003, “Métodos Numéricos em

Recursos Hídricos”, Associação Brasileira de Recursos Hídricos, Volume 6,

Capítulo 1, pp. 1 -92.

[31]  PEARSON, K., “Regression, heredity, and panmixia”, Philosophical

Transactions of the Royal Society of London, Ser. A, 187, 253-318, 1896.

Page 99: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 99/115

 

 

92

[32]  WHERRY, R. J., Contributions to correlational analysis, New York: Academic

Press, 1984.

[33] 

HAN, J., KAMBER, H., 2001,   Data Mining - Concepts and Techniques – Chapters 6, 7 and 8.

[34]  RUMELHART, D.E., McCLELLAND, J., 1986, “Parallel Distributed

Processing”, MA: MIT Press, Cambridge, Vol. 1.

[35]  BISHOP, C., 1995,   Neural Networks for Pattern Recognition, Oxford:

University Press.

[36]  HAIKIN, S, 2001,  Redes Neurais – Princípios e Prática, 2.ed., Porto Alegre,

Bookman.

[37]  ROSENBLATT, F., 1958. “The Perceptron: A probabilistic model for 

information storage and organization in the brain”, Psychological Review,

vol. 65, pp. 386-408.

[38]  MITCHELL, T. M., 1997, Machine Learning, McGraw-Hill.

[39]  KENNEDY, R., LEE, Y., REED, C., ROY, B. V., 1997, Solving Pattern

 Recognition Problems, Unica Technologies, Lincoln.

[40]  HRUSCHKA, E. R., HRUSCHKA Jr, E. R., EBECKEN, N. F. F., 2003.

“Evaluating a Nearest-Neighbor Method to Substitute Continuous Missing

Values”, Australian Conference on Artificial Intelligence, pp. 723-734.

[41]  LIU, B., HSU, W., CHEN, S., MA, Y., 2000, “Analyzing the Subjective

Interestingness of Association Rules”,   IEEE Intelligent Systems, National

University of Singapore.

Page 100: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 100/115

 

 

93

[42]  AGRAWAL, R., SRIKANT, R., 1994, “Fast algorithms for mining association

rules”, VLDB-94.

[43] 

AGRAWAL, R., IMIELINKSI, T., SWAMIZ, A., 1993, “Mining AssociationRules between Sets of Ítems in Large Databases”, Proc. SIG-MOD-93, ACM 

Press, New Cork, 1993, pp. 207-216.

[44]  LIU, B., HSU, W., CHEN, S., MA, Y., 1998, “Integrating Classification and

Association Rule Mining”, KDD-98, August, New York.

[45]  SMAC, 1999,   Mapeamento e Caracterização do uso das Terras e CoberturaVegetal no Município do Rio de Janeiro entre os anos de 1984 e 1999 , In:

Secretaria Municipal de Meio Ambiente, Prefeitura da Cidade do Rio de

Janeiro.

[46]  BROWER, M., 1997,  New Mexico Wind Resources - A GIS Approach, In: A

Report to the State of new Mexico, Energy, Minerals, and Natural Resources

Department, September.

[47]  PYLE, D., 1999.   Data Preparation for Data Mining, Morgan Kaufmann

Publishers, Inc., San Francisco, California, pp. 9-43.

[48]  SOUZA, F. T., EBECKEN, N. F. F., 2004, “Landslides Data Preparation for 

Data Mining”, Paper accepted to published at the IX International

Symposium on Landslides, June 28 to July 2, Rio de Janeiro.

[49]  SOUZA, F. T., EBECKEN, N. F. F., 2003, “A Data Mining Approach for 

Landslide Analysis Caused by Rainfall in Rio de Janeiro”,  International

Conference on Slope Engineering, pp.611-616, 8-10 December, Hong Kong.

Page 101: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 101/115

 

 

94

[50]  SOUZA, F. T., EBECKEN, N. F. F., 2004, “Preparação de Dados de Chuvas

Intensas utilizando técnicas de Mineração de Dados”,   Artigo aceito para

  publicação na Revista Brasileira de Recursos Hídricos (ABRH), Porto

Alegre, Setembro, vol. 9, número 2.

[51]  KAUFMAN, L., ROUSSEEUW, P. J., 1990, Finding Groups in Data – An

 Introduction to Cluster Analysis, Wiley Inter-Science, Brussels, Belgium.

[52]  DOUGHERTY, J., KOHAVI, R., SAHAMI, M., 1995, “Supervised and

unsupervised discretization of continuous features”, ICML-95.

[53]  SOUZA, F. T., EBECKEN, N. F. F., 2004, “A Data Mining Approach to

Landslides Prediction”,   Abstract accepted at the Data Mining 2004, Fifth

  International Conference on Data Mining, Text Mining and their Business

 Applications, 15 - 17 September, Malaga, Spain.

[54]  TING, K. M., ZHENG, Z., 1998, “Boosting Trees for Cost-Sensitive

Classifications”, Proceedings of the Tenth European Conference on Machine Learning, LNAI-1398, Berlin: Springer-Verlag, pp. 190-195.

[55]  DUDA, R. O., HART, P. E., STORK, D. G., 2001, Pattern Classification, Wiley

Interscience, Second Edition.

[56]  EMBRAPA, 2001, Os Solos do Estado do Rio de Janeiro – Estudo

GeoAmbiental do Estado do Rio de Janeiro, Empresa Brasileira de PesquisaAgropecuária, Centro Nacional de Pesquisa de Solos.

Page 102: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 102/115

 

 

95

Conforme descrito no item 3.2.3, são apresentadas a seguir as descrições dos

 parâmetros do solo:

ANEXO I 

COBERTURA E USO DO SOLO.

O “Mapeamento e Caracterização do Uso das Terras e Cobertura Vegetal no

Município do Rio de Janeiro entre os anos de 1984 e 1999” possuem a intenção básica

de retratar os remanescentes dos grandes ecossistemas presentes na cidade. Neste

mapeamento conduzido pela [45] foram incluídas importantes classes do ponto de vista

ecológico. Classificadas sob a ótica dos grandes ecossistemas presentes na cidade, as

diferentes classes de mapeamento puderam ser agregadas em “áreas artificializadas” e

“áreas naturais”.

ÁREAS ARTIFICIALIZADAS 

SÍMBOLO DESCRIÇÃO

Au – Área

Urbana

Inclui um grupo heterogêneo de alvos espectrais característicos de

áreas urbanas densas, em grande parte não separáveisespacialmente, na escala 1:50.000

Ac – ÁreaUrbana NãoConsolidada

Inclui as áreas com ocupação humana esparsa, seja por estarem em processo de ocupação ou por serem áreas onde incidem limitaçõesfísicas ou legais para o processo de ocupação urbana. Inclui, ainda,áreas com concentrações de pequenas propriedades com atividadeagropecuária e de chácaras para lazer.

Vp – Vegetaçãoem ParquesPúblicos

Áreas com vegetação de campo e porte arbóreo inseridas nosgrandes parques públicos da cidade. O Jardim Botânico do Rio deJaneiro, por apresentar dentro dos seus limites áreas de florestanatural e por ser contíguo à Floresta da Tijuca, foi incluído noconjunto da cobertura vegetal nativa do município.

Ca – CampoAntrópico

Áreas de origem antrópica em sua quase totalidade, incluindocampos de capim-colonião, de outras gramíneas, de dicotiledôneasherbáceas, e áreas de macega.

CP – Cultura ePastagem

Inclui as áreas de no mínimo 4 ha. onde se identificou o usoagropastoril.

Sm – Solo

Exposto e Áreade Mineração

Inclui áreas de solo exposto, seja por ocorrência de terraplenagens,

deslizamentos ou outras causas, e áreas de mineração, pedreiras,saibreiras e afins.

Page 103: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 103/115

 

 

96

ÁREAS NATURAIS 

SÍMBOLO DESCRIÇÃOF - Floresta Floresta ombrófila densa – Mata Atlântica – pouco

alterada ou não alterada. Pode também representar uma floresta secundária tardiaFa – Floresta Alterada Inclui diversas fitofisionomias associadas à alteração

das florestas nativas, como raleamento por corteseletivo ou pequenas áreas de desmatamento, além deassociadas às diversas fases sucessionais que seguema supressão total ou parcial da floresta nativa. Inclui,também, os bananais que ocupam diversos trechosdas encostas, principalmente no maciço da pedraBranca, que não puderam ser separados das florestasnativas de forma segura devido à semelhança das

assinaturas espectrais e à interposição espacial entreos dois alvos.

M - Mangue Inclui as várias fisionomias de mangue, comvegetação halófita de porte arbustivo-arbóreo, emdiferentes estados de conservação.

A - Apicum Inclui as áreas de mangue não cobertas por vegetação, ou com vegetação halófita herbácea, como típico substrato lodoso, sendo parte integrante dosecossistemas de manguezal.

R – Vegetação de Restinga Inclui os remanescentes de restinga, arbóreo-

arbustiva e arbustiva-herbácea, além dosremanescentes de “mata-de-caixeta” (floresta paludosa) que existem na Baixada de Jacarepaguá.

B – Área Úmida comVegetação

Inclui as áreas com vegetação arbustivo-herbácea-nativa, secundária ou invasora – sobre solosencharcados, seja por deficiência de drenagem, seja

 por afloramento de lençol freático. Foram mapeadasas áreas que apresentavam resposta espectral típica desolo encharcado, com presença de vegetação, naimagem de satélite.

Am – Ambientes Marinhos Inclui as baías de sepetiba e da Guanabara, além da

zona costeira do Oceano Atlântico.H – Águas Continentais eAmbientes Estuarinos

Inclui as lagoas, rios, córregos e canais, além de áreasestuarinas no município.

PA – Praia e Areal Inclui as baías de Sepetiba e Guanabara e o OceanoAtlântico, nos limites do Município do Rio deJaneiro.

Ar – Afloramento Rochoso Inclui os afloramentos de rocha de origem natural ecostões rochosos.

Rf - Reflorestamento Pontos assinalados onde existem áreas emreflorestamento ou reflorestadas.

Page 104: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 104/115

 

 

97

ANEXO II

APTIDÃO PARA REFLORESTAMENTO E OLERICULTURA.

Foi estimada a partir dos graus de limitação de parâmetros que sintetizam as

qualidades de um ecossistema, a saber: deficiência de fertilidade, deficiência de água,

excesso de água / deficiência de oxigênio, suscetibilidade à erosão e impedimentos ao

manejo. Os graus de limitação foram estimados considerando-se as informações desolos e das paisagens recuperadas do mapeamento de cobertura vegetal.

(APTIDÃO BOA)

SÍMBOLO DESCRIÇÃO

1 Ro / h Terras com aptidão boa para reflorestamento e regular para olericultura.Fator limitante: deficiência de água.

1 Ro / fh Terras com aptidão boa para reflorestamento e regular para olericultura.Fatores limitantes: deficiência de fertilidade e de água.

1 R(o) /hem

Terras com aptidão boa para reflorestamento. Fatores limitantes:deficiência de água e erosão. Terras com aptidão restrita paraolericultura. Fatores limitantes: suscetibilidade à erosão e impedimentosao manejo.

1 R(o) /fhem Terras com aptidão boa para reflorestamento. Fatores limitantes:deficiência de fertilidade e de água. Terras com aptidão restrita paraolericultura. Fatores limitantes: deficiência de fertilidade,suscetibilidade à erosão e impedimentos ao manejo.

1 R(o) / e Terras com aptidão boa para reflorestamento e restrita para olericultura.Fator limitante: suscetibilidade à erosão.

1 O Terras com aptidão boa para olericultura, sem fator limitante.

Page 105: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 105/115

 

 

98

(APTIDÃO REGULAR)

SÍMBOLO DESCRIÇÃO2 r / fhe Terras com aptidão regular para reflorestamento. Fatores

limitantes: deficiência de fertilidade e de água esuscetibilidade à erosão.

2 r / fhe ==== Terras com aptidão regular para reflorestamento. Fatoreslimitantes: deficiência de fertilidade e de água esuscetibilidade à erosão. Apresentam, em menor proporção,terras com aptidão inferior.

2 r / hem ==== Terras com aptidão regular para reflorestamento. Fatoreslimitantes: deficiência de água, suscetibilidade à erosão eimpedimentos ao manejo. Apresentam, em menor proporção,terras com aptidão inferior.

2 o / f Terras com aptidão regular para olericultura. Fator limitante:deficiência de fertilidade.

2 o / fom Terras com aptidão regular para olericultura. Fatoreslimitantes: deficiência de fertilidade, excesso deágua/deficiência de oxigênio e impedimentos ao manejo.

(APTIDÃO RESTRITA) 

SÍMBOLO DESCRIÇÃO3 (r) / e Terras com aptidão restrita para reflorestamento. Fator 

limitante: suscetibilidade à erosão.3 (r) / e ---- Terras com aptidão restrita para reflorestamento. Fator 

limitante: suscetibilidade à erosão. Apresentam, em menor  proporção, terras com aptidão superior.

3 (r) / e ==== Terras com aptidão restrita para reflorestamento. Fator limitante: suscetibilidade à erosão. Apresentam, em menor 

 proporção, terras com aptidão inferior.3 (r) / em Terras com aptidão restrita para reflorestamento. Fatores

limitantes: suscetibilidade à erosão e impedimentos ao manejo.3 (o) / fom Terras com aptidão restrita para olericultura. Fatores

limitantes: deficiência de fertilidade, excesso deágua/deficiência de oxigênio e impedimentos ao manejo.

(APTIDÃO ESPECIAL) 

SÍMBOLO DESCRIÇÃO

4 E r Terras com aptidão especial para reflorestamento. Paisagens derestinga incluindo dunas.

4 E ma Terras com aptidão especial para reflorestamento. Paisagens demangue.

Page 106: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 106/115

 

 

99

(SEM APTIDÃO) 

SÍMBOLO DESCRIÇÃO

5 I ar Terras sem aptidão para reflorestamento e olericultura.Paisagens de afloramentos de rocha.

5 i s Terras sem aptidão para reflorestamento e olericultura.Paisagens de solos hidromórficos com caráter salino e/outiomorfismo.

Page 107: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 107/115

 

 

100

ANEXO III

QUALIDADE AMBIENTAL DAS TERRAS. 

 Nível de pressão que as ações antrópicas exercem sobre os atributos naturais e

de como o próprio ambiente reage a esta pressão. A avaliação tomou por base as

informações de vulnerabilidade ambiental em cruzamento com a cobertura vegetal

atual.

QUALIDADE (ÁREA DE ALERTA) 

SÍMBOLO DESCRIÇÃO

ALa Áreas de alerta referentes a presença de afloramentos de rocha.Representam risco para as terras a jusante devido à queda de blocos.

Alb Áreas de alerta referentes aos mangues, Apicum e dunas. Representamambientes de preservação extremamente frágeis.

QUALIDADE (CONSERVADA) SÍMBOLO DESCRIÇÃO

Coa Terras conservadas. As interferências antrópicas são brandas, com pouco prejuízo na paisagem. Apresentam cobertura de Mata Atlântica.

Cob Terras conservadas. As interferências antrópicas são brandas, com  pouco prejuízo na paisagem. Correspondem à parte da restinga deMarambaia.

QUALIDADE (EXTREMAMENTE DEGRADADA) 

SÍMBOLO DESCRIÇÃO

Eda Terras extremamente degradadas. Áreas de solo exposto (decorrência deterraplanagens e deslizamentos) e de mineração (pedreiras e saibreiras).

Edb Terras extremamente degradadas. Áreas de solo exposto, decorrência deterraplanagens e retirada de areia.

Edu Terras extremamente degradadas. Áreas de solo exposto (decorrência de

terraplanagens e deslizamentos) e de mineração (pedreiras, saibreiras eretirada de aréola), inseridas na área urbana.

Page 108: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 108/115

 

 

101

QUALIDADE (FORTEMENTE DEGRADADA) 

SÍMBOLO DESCRIÇÃO

FDa Terras fortemente degradadas. As interferências antrópicascausam grandes prejuízos na qualidade das terras. Apresentamcobertura de campo antrópico associada à classe devulnerabilidade Muito Alta.

FDb Terras fortemente degradadas. As interferências antrópicascausam grandes prejuízos na qualidade das terras. Apresentamcobertura de cultura e pastagem associada à classe devulnerabilidade Muito Alta.

QUALIDADE (LIGEIRAMENTE DEGRADADA) 

SÍMBOLO DESCRIÇÃO

Lda Terras ligeiramente degradadas. As interferências antrópicascausam pequenos prejuízos na qualidade das terras.Apresentam cobertura de floresta alterada, reflorestamento ecampo antrópico, dependendo da classe de vulnerabilidade dasterras.

LDb Terras ligeiramente degradadas. As interferências antrópicascausam pequenos prejuízos na qualidade das terras.Apresentam coberturas de restinga, floresta alterada,reflorestamento e área úmida com vegetação e campoantrópico, dependendo da classe de vulnerabilidade.

QUALIDADE (MODERADAMENTE DEGRADADA) 

SÍMBOLO DESCRIÇÃO

Mda Terras moderadamente degradadas. As interferênciasantrópicas causam significativos prejuízos na qualidade dasterras. Apresentam coberturas de floresta alterada,reflorestamento e campo antrópico, dependendo da classe devulnerabilidade das terras.

MDb Terras moderadamente degradadas. As interferênciasantrópicas causam significativos prejuízos na qualidade dasterras. Apresentam coberturas de campo antrópico e cultura e

 pastagem, dependendo da classe de vulnerabilidade das terras.

Page 109: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 109/115

 

 

102

ANEXO IV

VULNERABILIDADE AMBIENTAL DAS TERRAS.

Os fatores considerados na avaliação da vulnerabilidade foram a

suscetibilidade à erosão no caso das terras altas e as restrições de drenagem no caso das

terras baixas. A avaliação foi elaborada a partir das informações contidas no

levantamento dos solos, considerando-se principalmente as características do solo,

drenagem, relevo, rochosidade, pedregosidade e vegetação original. Não foi

considerado o uso atual das terras.

VULNERABILIDADE (ALTA) 

SÍMBOLO DESCRIÇÃO

A v Vulnerabilidade alta, condicionada por textura arenosa ao longo do perfil. Vegetação original de restinga.

A hbw Vulnerabilidade alta, condicionada por presença de argilas expansivas,

camadas adensadas em subsuperfície e presença temporária de lençolfreático. Vegetação original de floresta tropical subcaducifólia.

A hfw Vulnerabilidade alta, condicionada por presença de argilas expansivas,risco de inundação e presença de lençol freático. Vegetação original decampo higrófilo de várzea.

A g Vulnerabilidade alta, condicionada por declividade. Vegetação originalde floresta tropical subcaducifólia.

A kgr Vulnerabilidade alta, condicionada por espessura do solo, declividade,rochosidade e pedregosidade. Vegetação original de floresta tropicalsubcaducifólia e caducifólia.

VULNERABILIDADE (BAIXA) 

SÍMBOLO DESCRIÇÃO

B g Vulnerabilidade baixa, condicionada por declividade. Vegetaçãooriginal de floresta tropical subcaducifólia.

B tg Vulnerabilidade baixa, condicionada por declividade e presença de

gradiente textural. Vegetação original de floresta tropicalsubcaducifólia.

Page 110: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 110/115

 

 

103

VULNERABILIDADE (EXTREMAMENTE ALTA) 

SÍMBOLO DESCRIÇÃO

EA gr Vulnerabilidade extremamente alta, condicionada por declividade erochosidade. Vegetação original de campo rupestre.

EA c Vulnerabilidade extremamente alta, condicionada por ambienteecológico muito frágil. Vegetação original de mangue.

EA v Vulnerabilidade extremamente alta, condicionada por textura arenosa.Vegetação original de restinga.

VULNERABILIDADE (MODERADA) 

SÍMBOLO DESCRIÇÃO

M fw Vulnerabilidade moderada, condicionada por risco ocasional deinundação e presença de lençol freático. Vegetação original de florestatropical subperenifólia de várzea.

M bw Vulnerabilidade moderada, condicionada por presença de camadasadensadas em subsuperfície e presença temporária de lençol freático.Vegetação original de floresta tropical subcaducifólia.

M tg Vulnerabilidade moderada, condicionada por declividade e presença degradiente textural; vegetação original de floresta tropical subcaducifólia.

VULNERABILIDADE (MUITO ALTA) 

SÍMBOLO DESCRIÇÃO

MA kgc Vulnerabilidade muito alta, condicionada por espessura do solo,declividade e clima; vegetação original de floresta tropicalsubperenifólia.

MA kgr Vulnerabilidade muito alta, condicionada por espessura do solo,declividade, rochosidade e pedregosidade. Vegetação original defloresta tropical subcaducifólia e caducifólia.

MA hgr Vulnerabilidade muito alta, condicionada por presença de argilasexpansivas, declividade, rochosidade e pedregosidade. Vegetaçãooriginal de floresta tropical subcaducifólia.

MA ofw Vulnerabilidade muito alta, condicionada por presença de camadasorgânicas, risco de inundação e presença de lençol freático. Vegetaçãooriginal de campo e floresta hidrófila de várzea.

MA sfw Vulnerabilidade muito alta, condicionada por presença no solo desalinidade e tiomorfismo, risco de inundação e presença de lençolfreático. Vegetação original de campo halófilo de várzea.

MA vw Vulnerabilidade muito alta, condicionada por textura arenosa e presençade lençol freático. Vegetação original de restinga.

Page 111: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 111/115

 

 

104

ANEXO V

PEDOLOGIA 

As principais classes de solos são definidas a seguir, em função das descrições

morfológicas, análises físicas, químicas e mineralógicas de seus perfis representativos,

EMBRAPA [56].

PEDOLOGIA (LATOSSOLOS) 

SÍMBOLO DESCRIÇÃO

Lap Latossolo amarelo álico podzólico A moderada textura argilosafase floresta subcaducifólia relevo suave ondulado.

LVa1 Latossolo vermelho-amarelo álico A moderada textura argilosafase floresta subcaducifólia relevo forte ondulado.

LVa2 Latossolo vermelho-amarelo álico pouco profundo A moderadatextura argilosa fase floresta subperenifólia relevo forte ondulado.

LVa3 Associação Latossolo vermelho-amarelo pouco profundo +Cambissolo latossólico fase substrato rochas alcalinas ambosálicos A moderada textura muito argilosa fase florestasubperenifólia relevo montanhoso.

LVa4 Associação Latossolo vermelho-amarelo pouco profundo +Cambissolo latossólico ambos textura argilosa + Cambissolo Tbtextura média cascalhenta + Solos Litólicos indiscriminados todos

álicos A moderada fase floresta subperenifólia relevo montanhososubstrato rochas cristalinas ácidas.

PEDOLOGIA (SOLOS PODZÓLICOS) 

SÍMBOLO DESCRIÇÃO

PVa1 Podzólico vermelho-amarelo Tb álico A moderada texturamédia/argilosa fase floresta subcaducifólia relevo ondulado.

Page 112: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 112/115

 

 

105

Continuação PEDOLOGIA (SOLOS PODZÓLICOS)

SÍMBOLO DESCRIÇÃO

PVa2 Associação Podzólico vermelho-amarelo Tb álico + Podzólicovermelho-amarelo Tb eutrófico raso ambos A moderada texturamédia/argilosa + Solos Litólicos indiscriminados fase substrato rochasgnáissicas ácidas todos fase floresta subcaducifólia relevo forteondulado.

PVa3 Associação Podzólico vermelho-amarelo Tb álico raso A moderadatextura média/argilosa fase floresta subcaducifólia relevo forte ondulado+ Afloramento de rocha.

PVl1 Podzólico vermelho-amarelo álico latossólico A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo suaveondulado.

PVl2 Podzólico vermelho-amarelo álico latossólico A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo ondulado.

PVd1 Associação Podzólico vermelho-amarelo Tb distrófico + Podzólicovermelho-amarelo álico latossólico ambos A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo suaveondulado.

PVd2 Associação Podzólico vermelho-amarelo Tb distrófico + Podzólicovermelho-amarelo Tb eutrófico ambos A moderada textura média/muito

argilosa fase floresta subcaducifólia relevo suave ondulado.PVd3 Podzólico vermelho-amarelo Tb distrófico planossólico A moderado,

textura arenosa/argilosa fase floresta subcaducifólia relevo suaveondulado.

PVe1 Podzólico vermelho-amarelo Tb eutrófico A moderada texturamédia/argilosa fase floresta subcaducifólia relevo ondulado.

PVe2 Associação Podzólico vermelho-amarelo Tb eutrófico raso A moderado+ Podzólico vermelho-amarelo Tb eutrófico A chernozêmico ambostextura médio/argilosa fase pedregosa I floresta subcaducifólia relevo

forte ondulado.

PVe3 Associação Podzólico vermelho-amarelo Tb eutrófico raso A moderado+ Podzólico vermelho-amarelo Tb eutrófico ambos A moderada texturamédia/argilosa fase floresta subcaducifólia + Solos Litólicosindiscriminados fase substrato rochas gnáissicas ácidas e básicas(migmatitos) floresta caducifólia todos relevo forte ondulado +Afloramento de rocha.

Page 113: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 113/115

 

 

106

Continuação PEDOLOGIA (SOLOS PODZÓLICOS)

SÍMBOLO DESCRIÇÃO

PVe4 Associação Podzólico vermelho-amarelo Tb eutrófico raso + Podzólicovermelho-amarelo Tb eutrófico + Podzólico vermelho-amarelo Tbdistrófico todos A moderada textura média/argilosa + Solos Litólicosindiscriminados fase substrato rochas graníticas e gnáissicas ácidas e

  básicas (migmatitos) todos fase floresta subcaducifólia relevo forteondulado.

PVe5 Associação Podzólico vermelho-amarelo Tb eutrófico A chernozêmicotextura argilosa/muito argilosa + Brunizém avermelhado texturamédia/argilosa fase erodida todos fase pedregosa I florestasubcaducifólia relevo forte ondulado.

PVe6 Associação Podzólico vermelho-amarelo Tb eutrófico raso textura

média/argilosa fase floresta subcaducifólia + Solos Litólicosindiscriminados fase floresta caducifólia substrato rochas gnáissicasambos A moderado relevo forte ondulado + Afloramento de rocha.

PEDOLOGIA (BRUNIZÉM) 

SÍMBOLO DESCRIÇÃO

BV Brunizém avermelhado textura argilosa e média/argilosa fase pedregosaI floresta subcaducifólia relevo forte ondulado.

PEDOLOGIA (PODZOL) 

SÍMBOLO DESCRIÇÃO

P1 Podzol profundo distrófico A moderada textura arenosa fase restingaarbustiva e campo de restinga relevo plano e suave ondulado.

P2 Podzol hidromórfico álico A moderada textura arenosa fase campo efloresta hidrófilos de restinga relevo plano.

P3 Associação Podzol hidromórfico álico + Areias quartzosas marinhasálicas intermediárias para Podzol ambos A moderado textura arenosafase campo e floresta hidrófilos de restinga relevo plano.

Page 114: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 114/115

 

 

107

PEDOLOGIA (PLANOSSOLOS) 

SÍMBOLO DESCRIÇÃO

PLa1 Planossolo Tb álico A proeminente textura arenosa/argilosa fasefloresta subcaducifólia relevo plano.

PLa2 Planossolo Tb álico A proeminente textura arenosa/média fasefloresta subcaducifólia relevo plano.

PLa3 Planossolo Tb álico A moderada textura arenosa/argilosa fasefloresta subcaducifólia relevo plano.

PLa4 Planossolo Tb álico A moderada textura arenosa/média fasefloresta subcaducifólia relevo plano.

PLa5 Associação Planossolo Tb álico textura arenosa/argilosa +

Planossolo Tb álico com fragipan textura arenosa/média ambosA moderada fase floresta subcaducifólia relevo plano.

PLS Associação Planossolo Ta solódico + Planossolo Tb solódicoambos A moderada textura média/argilosa fase florestasubcaducifólia relevo plano.

PEDOLOGIA (SOLOS GLEI) 

SÍMBOLO DESCRIÇÃOGHa1 Glei húmico Ta álico A Bi C textura argilosa e muito argilosa

fase campo higrófilo de várzea relevo plano.

GHa2 Glei húmico Ta álico AC textura argilosa e muito argilosa fasecampo higrófilo de várzea relevo plano.

GPa Glei pouco húmico Ta álico AC textura argilosa fase campohigrófilo de várzea relevo plano.

GHT Glei húmico salino tiomórfico textura argilosa e muito argilosa

fase campo halófilo de várzea relevo plano.GIS Associação complexa Solos glei salinos + Solos glei salinos

tiomórficos ambos indiscriminados fase campo halófilo devárzea relevo plano.

PEDOLOGIA (MANGUE) 

SÍMBOLO DESCRIÇÃO

M Manguezal

Page 115: SOUZA_FT_04_t_D_int

5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com

http://slidepdf.com/reader/full/souzaft04tdint 115/115

 

 

108

PEDOLOGIA (SOLOS ORGÂNICOS) 

SÍMBOLO DESCRIÇÃO

Od1 Solos orgânicos distróficos fase campo e floresta hidrófilos de várzea

relevo plano.Od2 Solos semi-orgânicos distróficos sobre areias ou argilas fase campo e

floresta hidrófilos de várzea relevo plano.

Oe Solos semi-orgânicos eutróficos sobre areias ou argilas conchíferas fasecampo e floresta hidrófilos de várzea relevo plano.

OT Solos orgânicos salinos tiomórficos fase campo halófilo de várzearelevo plano.

PEDOLOGIA (SOLOS ALUVIAIS) 

SÍMBOLO DESCRIÇÃO

Ae Associação Solos aluviais Tb distróficos e eutróficos + Cambissolo Tbdistrófico e eutrófico fase substrato sedimentos aluviais ambos Amoderada textura indiscriminada fase floresta subperenifólia de várzearelevo plano.

PEDOLOGIA (SOLOS ARENO QUARTZOSOS) 

SÍMBOLO DESCRIÇÃO

AMd Areias quartzosas marinhas distróficas (dunas) fase restinga arbustiva ecampo de restinga relevo plano e ondulado.

AMe Associação Areias quartzosas marinhas hidromórficas eutrófica Achernozêmico sobre areias conchíferas + Podzol hidromórfico álico Amoderada textura arenosa ambos campo e floresta hidrófilos de restingarelevo plano.

PEDOLOGIA (AFLORAMENTO DE ROCHA) 

SÍMBOLO DESCRIÇÃO

AR Afloramentos de rocha