Sistema Digital de Detecção e Classificação de Eventos de ...

Sistema Digital de Detecção e Classificação de Eventos de

Qualidade de Energia

Por

Rogério Marques Trindade

Dissertação apresentada ao Curso de Mestrado em Engenharia Elétrica da Faculdade de Engenharia da Universidade Federal de Juiz de Fora, como requisito para obtenção do título de Mestre em Engenharia Elétrica.

Orientadores:

Prof. Augusto Santiago Cerqueira, D.Sc. Prof. Carlos Augusto Duque, D.Sc.

Juiz de Fora Agosto de 2005

Abstract

Power quality events are related to deviations on the steady state regime of the power

systems. These deviations can be found on the voltage and current waveforms, although this

work focuses on the events related to the voltage waveforms.

Several events are related to the voltage waveform such as notches, harmonics, sags,

swells, faults, flickers, spikes, switching transitories, etc. The occurrence of such events on the

power system could cause bad functioning of electronic equipments, protection systems,

interference on communication systems, etc. The duration of such events could range from 50

ns for an impulse up to several minutes to an overvoltage or undervoltage for example. In such

way, the energy analyzers generate very long data files when monitoring power quality events,

resulting in problems to save and analyze the data.

In this work, a digital system was developed to detect, classify and store the power

quality events related to the voltage waveform. The detection is based on the error signal,

which is defined as the difference between the power system voltage signal and the

fundamental sinusoidal component generated by the algorithm itself, using the amplitude,

frequency and phase estimated from the monitored voltage waveform.

The event classification is performed over the error signal window, which is generated

by the detection algorithm. This is a new approach to solve the classification problem of

power quality events. To perform the classification, the events are aligned by the beginning,

down-sampled and presented to a feed forward neural network.

The results obtained from numerical simulations show the good performance and

flexibility of the proposed, as it could be easily trained on-line, and therefore tuned for the

particular behavior of the power system where the monitoring system is installed.

Resumo

Entende-se como evento de qualidade de energia qualquer falha ou desvio das

condições desejadas de funcionamento do sistema elétrico em regime permanente. De maneira

geral, os eventos de qualidade de energia se manifestam como deformidades nas formas de

onda de tensão e corrente, entretanto neste trabalho o foco são os eventos relacionados com a

forma de onda de tensão.

Considerando a forma de onda de tensão, podemos encontrar vários tipos de eventos

como notches, presença de harmônicos, faltas, sobre-tensão(swell), afundamentos(sag), flickers,

impulsos(spikes), transitórios de chaveamento, etc. A presença desses fenômenos indesejáveis

no sistema elétrico pode causar mau funcionamento de equipamentos eletrônicos, sistemas de

proteção, interferência em sistemas de comunicação, etc. Estes eventos podem ter duração de

50ns em transitórios impulsivos até vários minutos em afundamentos de tensão. Desta forma,

quando monitorados por analisadores de energia, geram arquivos de dados de grande extensão

que, além de serem difíceis de armazenar, trazem muitas vezes informações desnecessárias para

a avaliação da qualidade de energia.

Neste trabalho, foi desenvolvido um sistema capaz de detectar, armazenar em mídia

digital e classificar eventos de qualidade de energia. A detecção é feita a partir da monitoração

do sinal de erro definido como a diferença entre o sinal de tensão obtido da rede elétrica e a

componente senoidal fundamental gerada pelo próprio algoritmo com valores de amplitude,

freqüência e fase estimados a partir da tensão monitorada.

A classificação do evento é feita com base no sinal de erro obtido pelo algoritmo de

detecção proposto. A mesma janela de erro armazenada, referente ao evento detectado, é,

então, utilizada para classificação do mesmo. Esta é uma inovação importante proposta no

trabalho. A estrutura empregada realiza um processo de alinhamento dos distúrbios na janela

de erro e, em seguida uma sub-amostragem, com o objetivo de reduzir seu número de

amostras e, posteriormente, a aplica como entrada de uma Rede Neural que, devidamente

treinada, se mostra capaz de diferenciar e classificar alguns tipos de eventos.

Resultados obtidos a partir de simulações do algoritmo têm mostrado que a utilização

da janela de erro para a classificação de eventos é viável, e ainda, apresenta maior versatilidade

durante o processo de treinamento da rede em relação à janela de sinal monitorado.

Publicações

• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, ”Digital System for Detection and Classification of Electrical Events, ”IEEE International Symposium on Circuits and Systems, Kobe, Japan, 2005.

• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, “Sistema Digital de Detecção e Classificação de Eventos de Qualidade de Energia”, Revista IEEE América Latina, 2005 (em fase de revisão)

• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, "Redes Neurais na Classificação de Eventos de Qualidade de Energia Elétrica: uma Abordagem Comparativa", VI – Seminário Brasileiro de Qualidade de Energia Elétrica, agosto 2005, Belém, PA.

Agradecimentos

Gostaria de registrar algumas palavras de reconhecimento pelo apoio recebido durante

o desenvolvimento do presente trabalho. Em primeiro lugar, é importante lembrar que Deus

está sempre ao lado de todos nós, nos conduzindo e nos proporcionando vencer desafios cada

vez maiores, desafios estes, que nada mais são além da realização da própria vida.

A presença da família sempre contribuiu de forma decisiva na realização de grandes

projetos. Aos meus pais, Elazir e Roberto, fontes inesgotáveis de entusiasmo e otimismo,

deixo meu reconhecimento pelo apoio e dedicação recebidos durante a realização de mais este

importante passo em minha vida. De meu irmão, Roberto, tenho que reconhecer a grande

motivação recebida, sempre lembrando que o sucesso é fruto exclusivo do nosso próprio

esforço e dedicação. Uma pessoa muito importante e sempre presente é Renata, acredito que

seu apoio e paciência foram fundamentais para realização deste trabalho.

Aos amigos e professores com os quais tive o privilégio de trabalhar, ressalto meu

reconhecimento e a certeza de ter constituído grandes amizades que serão sempre lembradas.

Índice

Capítulo 1 – Ferramentas de Análise da Qualidade da Energia Elétrica ............................... 1

1.1 Introdução..................................................................................................................... 1

1.2 Técnicas utilizadas no estudo de fenômenos de qualidade de energia ......................... 2

1.3 Valor RMS (Root Mean Square) .................................................................................. 3

1.4 Transformada de Fourier (Fast Fourier Transform FFT) ............................................ 4

1.5 Banco de filtros e filtros adaptativos ............................................................................ 4

1.6 Filtros Kalman .............................................................................................................. 5

1.7 Wavelet......................................................................................................................... 5

1.8 Sistemas de reconhecimento de padrões ...................................................................... 6

1.9 Resumo do Capítulo ..................................................................................................... 7

Capítulo 2 – Distúrbios de Qualidade de Energia .................................................................. 8

2.1 Introdução..................................................................................................................... 8

2.2 Definição dos eventos mais comuns de qualidade de energia...................................... 9

2.3 Características dos Eventos de Qualidade de Energia................................................ 10

2.4 Possíveis causas de alguns eventos de qualidade de energia...................................... 12

2.5 Resumo do Capítulo ................................................................................................... 14

Capítulo 3 – Algoritmo Detector de Eventos ....................................................................... 15

3.1 Introdução................................................................................................................... 15

3.2 Visão geral do Algoritmo DE..................................................................................... 16

3.3 Estrutura de medição de fasor .................................................................................... 17

3.3.1 O Estimador de Freqüência ................................................................................. 18 3.3.2 O Gerador de Função Senoidal............................................................................ 19

3.4 Gerador da Componente Fundamental ....................................................................... 20

3.5 Controle da Atualização das Variáveis de Ambiente ................................................. 21

3.6 Obtenção do Sinal de Erro.......................................................................................... 21

3.7 Detecção e armazenamento dos eventos .................................................................... 22


Capítulo 4 – Rede Neural Aplicada à Classificação de Padrões .......................................... 25

4.1 Introdução................................................................................................................... 25

4.2 Redes neurais.............................................................................................................. 26

4.3 Modelos de Neurônio ................................................................................................. 26

4.4 Tipos de Função de Ativação ..................................................................................... 29

4.5 Arquiteturas de rede.................................................................................................... 31

4.6 Neurônio Perceptron................................................................................................... 35

4.7 Perceptron de múltiplas camadas ............................................................................... 37

4.8 Algoritmo de retropropagação.................................................................................... 38


Capítulo 5 – Geração de Dados ............................................................................................ 51

5.1 Introdução................................................................................................................... 51

5.2 Simulação dos eventos de Qualidade de Energia ....................................................... 52

5.3 Formação dos bancos de dados .................................................................................. 64


Capítulo 6 – Sistema de Classificação.................................................................................. 67

6.1 Introdução................................................................................................................... 67

6.2 O pré-processamento .................................................................................................. 68

6.3 O Classificador Neural ............................................................................................... 73

6.3.1 Treinamento da rede neural ................................................................................. 74 6.3.2 Esforço computacional no classificador .............................................................. 88


Capítulo 7 – Resultados........................................................................................................ 93

7.1 Introdução................................................................................................................... 93

7.2 Eventos simulados ...................................................................................................... 94

7.3 Dado real................................................................................................................... 105

7.4 Resumo do Capítulo ................................................................................................. 106

Capítulo 8 – Conclusões ..................................................................................................... 108

8.1 Sugestões para trabalhos futuros .............................................................................. 110

Referências ......................................................................................................................... 112

Capítulo 1

Ferramentas de Análise da Qualidade da Energia Elétrica

1.1 Introdução

O tema qualidade de energia tem se tornado um assunto de extrema importância no

mercado atual de energia elétrica. Dentre vários motivos, podemos ressaltar os seguintes: (1) a

falta de padrões definidos para estabelecer índices capazes de estimar de forma consistente a

qualidade da energia fornecida pelas concessionárias, (2) o desenvolvimento e a utilização cada

vez maior de equipamentos como inversores e conversores para acionamento de cargas de

potências cada vez mais elevadas, (3) a proliferação de sistemas micro-processados bastante

sensíveis às perturbações do sistema elétrico e, ainda, (4) a crescente interligação entre

processos produtivos no ambiente industrial [1]. Considerando as condições atuais de

funcionamento dos sistemas de potência, podemos considerar ainda, duas características

importantes, diretamente relacionadas com a qualidade da energia: a capacidade do sistema de

operar cargas sem comprometer o funcionamento das mesmas, mantendo níveis de qualidade

da tensão fornecida nos pontos comuns de acoplamento e a habilidade das cargas de operarem

sem causar distúrbios no sistema, comprometendo assim sua eficiência. Esta segunda

característica está intimamente ligada a forma de onda de corrente absorvida pela carga [2].

Estes aspectos levantados como motivadores das discussões sobre qualidade de energia

tornam a preocupação com a confiabilidade e o bom funcionamento do sistema elétrico um

Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica

2

compromisso não apenas das concessionárias, mas também dos consumidores.

Entende-se como evento de qualidade de energia qualquer falha ou desvio das

condições desejadas de funcionamento do sistema elétrico em regime permanente. De maneira

geral, os eventos de qualidade de energia se manifestam como deformidades nas formas de

onda de tensão causadas por desvios das condições normais de funcionamento do sistema em

regime permanente. Considerando a forma de onda de tensão, podemos encontrar vários tipos

de eventos como notches, presença de harmônicos, faltas, sobre-tensão (swell), afundamentos

(sag), flickers, impulsos, spikes, transitórios de chaveamento, etc. As características destes eventos

serão abordadas no Capítulo 2, onde será feita uma análise geral das principais características e

das possíveis causas dos eventos mais comuns de qualidade de energia. No Capítulo atual, será

apresentada uma breve revisão sobre algumas ferramentas importantes no processamento

digital de sinais que são empregadas na detecção e classificação de eventos de qualidade de

energia.

1.2 Técnicas utilizadas no estudo de fenômenos de qualidade de energia

Com o objetivo de detectar e classificar eventos de qualidade de energia, várias técnicas

de processamento digital de sinais são usualmente empregadas. Recursos como DFT

(Transformada Discreta de Fourier), DWT (Discrete Wavelet Transform), e outros, são

utilizados para extrair características intrínsecas de cada tipo de evento. Com base nestas

características é feita a classificação do evento por meio de Redes Neurais, Lógica Fuzzy ou

qualquer outro método capaz de classificar padrões [3]. Todos esses processamentos são

realizados, de maneira geral, sobre o sinal da rede armazenado que contém o evento a ser

classificado. Considerando que o sinal de tensão monitorado apresenta parâmetros que podem

variar com o tempo, podemos representar o sinal no tempo discreto através da Equação (1.1)

( ) ( ) [ ( ) ( )]s n A n sen n nω φ= + (1.1)

onde,


3

A(n) é a amplitude do sinal de tensão em função do tempo, ω é a freqüência angular do sinal,

que é função da freqüência fundamental do sistema monitorado, e, finalmente, o índice n

denota o tempo discreto.

1.3 Valor RMS (Root Mean Square)

Uma aproximação da amplitude do sinal descrito pela Equação (1.1) pode ser

facilmente encontrada através do cálculo de seu valor rms [4], que é obtido utilizando a

Equação (1.2). Que pode ser calculada em um intervalo de tempo de um ou meio ciclo da

componente fundamental do sistema, este intervalo é definido pelo comprimento da janela de

dados considerada (N).

2

1

1( ) ( )N

rmsi

s n N s n iN =

+ = +∑ (1.2)

O cálculo do valor rms, devido a sua extrema simplicidade, que garante uma alta

velocidade de processamento e a mínima necessidade de memória do sistema, é uma das

ferramentas de processamento digital de sinais mais utilizadas para a estimação do valor da

amplitude de um sinal de interesse. Suas limitações se encontram no fato de que a precisão do

valor rms estimado depende do comprimento da janela de dados. Em sinais suaves, uma janela

de comprimento de um ciclo apresenta resultados mais precisos em relação a outra janela de

comprimento de apenas meio ciclo da componente fundamental, a conseqüência direta do uso

de uma janela de comprimento maior é a diminuição da resolução no tempo do valor

estimado. Outro aspecto importante que deve ser levado em consideração a respeito da

estimação do valor rms é que esta técnica não distingue a componente fundamental de

componentes harmônicas ou de ruído presente no sistema, por conseqüência, a precisão da

estimativa do valor da amplitude do sinal dependerá diretamente da presença de harmônicos e

de ruído no sinal.


4

1.4 Transformada de Fourier (Fast Fourier Transform FFT)

Outra ferramenta muito utilizada no processamento digital de sinais com o objetivo de

se estimar a amplitude e a fase da componente fundamental de um sinal é a Transformada

Discreta de Fourier (DFT) [5]. Esta ferramenta pode extrair características dos espectros dos

eventos de qualidade de energia que são suficientes para sua classificação, como foi mostrado

em [4]. A Transformada Discreta de Fourier leva a representação de um sinal no domínio do

tempo para o domínio da freqüência. A equação básica que descreve a DFT é a seguinte:

1

0

1( ) ( ) k

Nj n

nS k s n e

Nω

−−

=

= ∑ (1.3)

onde S(k) é a DFT calculada nas freqüências ωk, N é o comprimento da janela onde

2k

kNπω ⎧ ⎫=⎨ ⎬

⎩ ⎭ define um conjunto fixo e igualmente espaçado de freqüências para 0 ≤ k ≤ N - 1.

A Transformada Rápida de Fourier (FFT) é uma implementação eficiente do algoritmo

da DFT onde sua velocidade, resultado de um número menor de operações, é considerada

uma importante vantagem. Com esta ferramenta é possível obter uma estimação da amplitude

da componente fundamental e dos harmônicos com razoável precisão. A boa performance da

FFT é observada na estimação de amplitude e fase de sinais estacionários, o mesmo não ocorre

quando o sinal sofre mudanças repentinas em suas características como, por exemplo, em

transitórios e afundamentos rápidos. Em alguns casos o resultado da estimação pode ser

melhorado através do processo de janelamento, por exemplo, utilizando janelas de Hanning,

Hamming, Kaiser ou filtros passa-baixas ou passa-alta.[5]. Outra desvantagem da FFT é que

sua resolução em freqüência depende do comprimento da janela de dados(N), quanto maior a

janela de dados, maior será a resolução em freqüência.

1.5 Banco de filtros e filtros adaptativos

Filtros são utilizados normalmente para extrair sinais em determinada faixa de

freqüência, por exemplo, passa-baixa, passa-alta e passa faixa. Uma aplicação interessante de


5

filtro adaptativo é apresentada em [7]. Os bancos de filtros são implementações compactas de

filtros simples. Este tipo de implementação é utilizado para estudar em detalhes uma faixa

específica do espectro de freqüência do sinal. Esta técnica é útil para detectar variações rápidas

na forma de onda ou estimar as componentes do sinal em uma faixa específica de freqüências,

por exemplo, o conteúdo harmônico entre 500 e 1000 Hz, possivelmente resultado do

chaveamento de um banco de capacitores no sistema.

1.6 Filtros Kalman

Outra técnica conhecida é a chamada filtro Kalman [8]. Esta técnica é definida como

um modelo de espaço de estados e pode ser utilizada para rastrear a amplitude e o ângulo de

fase das componentes fundamental e harmônicas em tempo real. Uma aplicação desta

ferramenta pode ser encontrada em [7],[9].

1.7 Transformada Wavelet

Esta técnica é utilizada para decompor o sinal em diferentes faixas de freqüências e

estudar suas características separadamente. Atualmente, é uma das ferramentas mais

empregadas na análise de fenômenos de qualidade de energia, como pode ser visto em [10],

[11] e [12]. O desempenho da Wavelet [5] se mostra melhor em sinais não periódicos que

contém componentes impulsivas de curta duração, situação comum em sistemas elétricos de

potência. Vários tipos de Wavelets têm sido utilizados para identificar eventos de qualidade de

energia, algumas delas são: Daubechies, Dyadic, Coiflets, Morlet e Symlets. Estes tipos de

Wavelets têm se mostrado mais adequados ao estudo de distúrbios de qualidade de energia,

ainda que o tipo de Wavelet deva ser escolhido em função do tipo de evento a ser analisado, o

que acaba resultando em uma redução da generalização das técnicas que empregam esta

ferramenta em determinadas situações.


6

1.8 Sistemas de reconhecimento de padrões

Ainda que a Wavelet apresente alguma limitação em sua capacidade de generalização, a

grande maioria das técnicas de classificação de eventos de qualidade de energia empregam esta

ferramenta, uma vez que podemos assumir que a energia contida nas componentes diferentes

da componente fundamental de um sinal depende do tipo de evento ocorrido. A Fig. 1.1

mostra um sistema típico de classificação de eventos de qualidade de energia.

Fig. 1.1. Sistema simplificado de um classificador de eventos de qualidade de energia.

O sistema apresentado na Fig. 1.1 mostra as três fases do processo de classificação:

• Pré-processamento: O pré-processamento é responsável pela aquisição e a preparação

dos dados para a sua utilização nas etapas posteriores. Na fase de pré-processamento

temos a sub-amostragem dos dados, a normalização, e a identificação do início e fim

do evento, entre outras operações.

• Extração de características: Este bloco é encarregado de obter informações capazes de

diferenciar alguns dos vários tipos de eventos que podem ocorrer no sistema. Estas

características podem ser obtidas por qualquer uma das ferramentas mostradas

anteriormente. De maneira geral, a ferramenta mais empregada atualmente para esta

função tem sido a Transformada Wavelet, onde os níveis de decomposição dos sinais

revelam diferentes componentes em função do tipo de evento.

• Classificação: a classificação dos eventos é feita através de ferramentas capazes de

reconhecer diferentes padrões de entrada, neste horizonte surgem as propostas dos

classificadores bayessianos, lineares e não lineares, lógica fuzzy [13], redes neurais [14]-

[15] , etc.


7

• O sistema de classificação adotado no presente trabalho emprega uma rede neural

como ferramenta principal para reconhecimento de padrões, os detalhes sobre a

utilização da rede serão apresentados oportunamente.

Uma proposta inovadora deste trabalho é realizar a classificação com base no sinal de

erro, que será definido no capítulo 3, obtido pelo algoritmo de detecção. A mesma janela de

sinal de erro armazenada, referente ao evento detectado, será, então, utilizada para sua

classificação.

1.9 Resumo do Capítulo

Este capítulo apresentou uma relação de algumas das ferramentas de processamento

digital de sinais mais utilizadas na análise da qualidade da energia elétrica. Existem ainda, outras

ferramentas como a transformada S [16] e tantas outras que vêm ganhando a atenção de

muitos pesquisadores da área. Com o conhecimento das técnicas apresentadas o leitor

perceberá, ao longo do trabalho, a inovação proposta em termos de realizar a classificação dos

eventos de qualidade de energia através do sinal de erro.

O capítulo 2 faz uma breve revisão dos principais eventos de qualidade de energia e

suas possíveis causas. Em seguida, será apresentado o algoritmo de detecção de eventos, onde

será gerado o sinal de erro que será utilizado para a classificação dos eventos. No capítulo 4 a

questão do uso da rede neural como classificador de padrões será retomada.

Capítulo 2

Distúrbios de Qualidade de Energia

2.1 Introdução

Este capítulo apresenta, de forma geral, alguns dos principais tipos de distúrbios,

ligados à “qualidade de energia”, que podem ocorrer em sistemas elétricos. Estes distúrbios

podem ser encontrados tanto em sistemas de transmissão como de distribuição de energia.

Cada tipo de distúrbio apresenta características próprias e, por isso, pode causar diferentes

falhas nos equipamentos conectados a rede elétrica, estas características são, ainda, uma

importante referência para o processo de classificação do distúrbio.

O termo “qualidade de energia”, em seu sentido amplo, deve ser interpretado como

qualidade de serviço, englobando três aspectos: confiabilidade, qualidade de energia oferecida e

provisão de informação [17]. Uma definição mais restrita está relacionada à habilidade do

sistema elétrico de operar cargas sem danificá-las e a habilidade de cargas operarem no sistema

sem perturbar ou reduzir a eficiência do sistema elétrico. A esta definição restrita que

estaremos nos referindo daqui por diante.

Contrastando com o termo confiabilidade [18], eventos típicos em qualidade de energia

dizem respeito a: a) eventos de curta duração, como afundamentos ou sobre-tensões que

durem poucos ciclos até alguns segundos causados por faltas em alimentadores ou pelo

ligamento de grandes cargas; b) eventos que durem menos de um ciclo, tais como transientes

Capítulo 2- Distúrbios de Qualidade de Energia

9

causados pelo chaveamento de capacitores, descargas elétricas, etc.; c) eventos de longas

durações como Harmônicos e flickers [19]-[22].

Características importantes para a classificação dos eventos de qualidade de energia

serão apresentadas neste capítulo, como a duração do evento, espectro harmônico do evento,

suas possíveis causas e os possíveis danos causados às cargas sujeitas a estes distúrbios.

2.2 Definição dos eventos mais comuns de qualidade de energia

Existe uma grande variedade de fenômenos elétricos que são considerados como

distúrbios de qualidade de energia quando presentes em sistemas de potência. As principais

características destes tipos de distúrbios serão apresentadas na Tabela 2.1 Um breve resumo das

definições dos distúrbios mais comuns apresentados em [1] é mostrado a seguir.

Transitórios

O termo transitório é empregado para caracterizar a ocorrência de um evento de curta

duração no sistema elétrico. Normalmente os fenômenos transitórios de interesse para a

qualidade de energia são impulsivos ou oscilatórios, como será visto adiante. Este termo

também é utilizado como referência ao tempo levado pelo sistema para restabelecer seu

funcionamento em regime permanente após uma alteração planejada em sua configuração de

funcionamento.

Variações de tensão de curta duração

As variações de tensão de curta duração são caracterizadas pela elevação (swell), ou

redução (sag) da amplitude da tensão no sistema durante um curto intervalo de tempo. A

redução da amplitude da tensão a valores inferiores a 0,1 pu (por unidade) caracteriza uma

interrupção momentânea do sistema. Os limites de tempo de ocorrência e os intervalos de

variação da amplitude da tensão para estes eventos são mostrados na Tabela 2.1.


10

Variações de tensão de longa duração

As variações de tensão de longa duração são caracterizadas pela alteração do valor

RMS da tensão na freqüência fundamental do sistema por um período maior que 1 minuto.

Estas variações podem ser positivas, caracterizando uma sobre-tensão, ou negativas,

ocasionando uma sub-tensão.

Deformação da forma de onda de tensão

As distorções das formas de onda de tensão são definidas como desvios da forma

senoidal da tensão na freqüência fundamental do sistema. Estas distorções se apresentam em

regime permanente no sistema e são causadas, em sua grande maioria, pela presença de tensão

de offset, harmônicos, inter-harmônicos, notches e ruídos no sistema elétrico.

2.3 Características dos Eventos de Qualidade de Energia

As principais características observadas em eventos de qualidade de energia são: 1)

tempo de duração do distúrbio, 2) espectro harmônico e 3) variação na amplitude do sinal de

tensão observado no sistema elétrico. Os eventos de qualidade de energia podem ser divididos

em categorias e subcategorias de acordo com suas características [1]. A Tabela 2.1 apresenta

alguns tipos de eventos e suas principais características.

Tabela 2.1 Características de alguns distúrbios de qualidade de energia.

Categoria Conteúdo espectral Duração típica Amplitude típica Transitórios

Transitórios Impulsivos

Tempo de subida entre 5 ns e 1 ms < 1 ms

Transitórios Oscilatórios Até 5 MHz 5 µs – 50 ms 0 – 8 pu

Variações de curta duração Sag (afundamento) 0,5 ciclo – 1 min. 0,1 – 0,9 pu


11

Swell (sobre-tensão) 0,5 ciclo – 1 min. 1,1 – 1,8 pu Interrupção < 1 min. < 0,1 pu

Variações de longa duração Sub-tensão > 1 min. 0,8 – 0,9 pu

Sobre-tensão > 1 min. 1,1 – 1,2 pu Interrupção sustentada > 1 min. 0,0 pu

Distorções da forma de onda Dc offset Regime permanente 0 – 0,1%

Harmônicos 0 – 100º harmônico Regime permanente 0 – 20% Inter harmônicos 0 – 6 KHz Regime permanente 0 – 2%

Notching Regime permanente Ruído Toda banda Regime permanente 0 – 1%

Outros distúrbios Desbalanceamento de

tensão Regime permanente 0,5 – 2%

Flutuação de tensão (flicker) < 25 Hz Intermitente 0,1 – 7%

Variações na freqüência

fundamental < 10 s

Algumas categorias mostradas na Tabela 2.1 ainda podem ser subdivididas em sub-

categorias menores, considerando como item de subdivisão alguma característica do evento em

questão. Os eventos transitórios oscilatórios, por exemplo, podem ser subdivididos

considerando a freqüência de oscilação como característica de distinção entre as sub-categorias

da seguinte forma: eventos oscilatórios de baixa freqüência (< 5 KHz), média freqüência (5 –

500 KHz) e alta freqüência (0,5 – 5 MHz). Do mesmo modo, o tempo de duração dos eventos

pode ser utilizado para subdividir as variações de tensão de curta duração (interrupção, sag e

swell) em sub-categorias de eventos instantâneos (0,5 ciclos – 30 ciclos), eventos momentâneos

(30 ciclos – 3 s) e temporários (3 s – 1 minuto).

Como pode ser observado na Tabela 2.1, os eventos de qualidade de energia

apresentam um amplo espectro de freqüência e tempo de duração em sua composição, desde

eventos de ocorrência lenta, como nas flutuações de tensão (flicker), até eventos transitórios

rápidos, com duração da ordem de microssegundos. Como conseqüência natural, os


12

equipamentos utilizados na monitoração da qualidade de energia devem ser capazes de

trabalhar com altas taxas de amostragem, com o objetivo de detectar eventos rápidos e de curta

duração e uma grande capacidade de armazenar dados nos casos de eventos de longa duração.

Estas características serão consideradas oportunamente no capítulo seguinte, onde será

apresentado o algoritmo do Detector de Eventos, que otimiza estas habilidades do algoritmo

utilizado.

2.4 Possíveis causas de alguns eventos de qualidade de energia.

Todo evento de qualidade de energia se relaciona com a operação do sistema elétrico,

bem como com condições adversas como é o caso das descargas atmosféricas. As

características de algumas cargas conectadas ao sistema de potência podem causar distúrbios

elétricos que comprometem a qualidade da energia mesmo durante a operação normal da

carga, como nos casos onde a presença de notches no sinal de tensão está relacionada com o

acionamento de cargas através de dispositivos chaveados conectados ao sistema. Este tipo de

distúrbio é uma característica intrínseca dos sistemas de acionamento, que ao resolverem um

problema, como o controle de velocidade de motores, causam “poluição” na rede elétrica que

por sua vez pode afetar o funcionamento de dispositivos sensíveis à presença de notches como

equipamentos micro-processados.

Considerando a situação apresentada acima, muitas vezes podemos ter uma falha de

operação de determinado equipamento cuja causa se encontra na operação normal de outro

equipamento, a Tabela 2.2 apresenta um resumo dos eventos mais comuns de qualidade de

energia apontados em [23] e suas prováveis causas, o conhecimento do tipo de evento causado

por determinado tipo de carga é de extrema importância para a análise de problemas de

qualidade de energia.

Tabela 2.2. Possíveis causas de alguns tipos de eventos de qualidade de energia.

Transitórios Sub-categoria Duração Possível causa

Impulsivo > 2µs Descarga atmosférica.


13

Transitórios Oscilatórios

Sub-categoria Freqüência de oscilação Possível causa

Alta freqüência > 500 KHz Eventos de chaveamento, transitório de comutação de circuitos RLC.

Média freqüência 5 – 500 KHz Transitório impulsivo, Chaveamento de banco de capacitores próximo a outros bancos já energizados.

Baixa freqüência 0,3 – 5 KHz Chaveamento de banco de capacitores.

Freqüência muito baixa < 300 Hz Ferro-ressonância, energização de transformador.

Variações de curta duração Sub-categorias Duração Possível causa

Interrupções < 1 min Faltas no sistema de potência, falhas de equipamentos ou falha de controle.

Afundamentos (sags) 2 ms – 1 min

Faltas no sistema de potência, entrada de um grande bloco de carga no sistema, interação entre a carga e a linha de alimentação (principalmente durante a partida de equipamentos) ou entre a carga e a impedância da fonte de energia.

Sobre-tensão (swells) 0,5 ciclos – 1 min Faltas no sistema de potência, saída de um grande bloco de carga ou chaveamento de um grande banco de capacitores.

Variações de longa duração Sub-categorias Duração Possível causa

Sobre-tensão > 1 min

Desligamento de cargas, variações na compensação de potência reativa no sistema, ajuste incorreto de reguladores de tensão.

Sub-tensão > 1 min

Desligamento de carga do sistema, variações na compensação de potência reativa no sistema, ajuste incorreto de reguladores de tensão, seleção incorreta de taps de transformadores, sobrecarga involuntária de linhas de transmissão.

Interrupções sustentadas > 1 min Acidentes com linhas de transmissão, falhas em transformadores ou fontes alternativas de energia.

Distorções da forma de onda Sub-categoria Possível causa

Dc offset Distúrbios geomagnéticos, entrada ou saída de uma máquina síncrona no sistema, presença de fontes de potência chaveadas no sistema.

Harmônicos Dispositivos não lineares e cargas como, computadores, acionamentos de velocidade variável, sistemas eletrônicos de equipamentos de telefonia.

Inter-harmônicos Conversores estáticos de freqüência, ciclo-conversores, motores de indução e dispositivos que operam com arco elétrico.

Notching Funcionamento normal de dispositivos chaveados de potência quando ocorre o chaveamento de uma fase para outra.


14

Ruído Dispositivos eletrônicos de potência, circuitos de controle, equipamentos que trabalham com arco elétrico e fontes chaveadas de potência.

Flutuação de tensão Qualquer carga com considerável variação de corrente, especialmente em componente reativa, como fornos a arco.

Variações na freqüência fundamental

Faltas na maior parte do sistema de transmissão, um grande bloco de carga sendo desconectado do sistema ou a saída de um grande grupo de geração do sistema.

A partir das informações contidas nas tabelas 2.1 e 2.2, é possível observar a grande

quantidade de eventos de qualidade de energia que podem ocorrer em um sistema elétrico.

Como será mostrado adiante, cada tipo de evento apresentará uma diferença da forma de onda

da componente fundamental que será responsável pela geração de um perfil de sinal particular,

que em seguida será chamado de sinal de erro. Com base neste sinal de erro, será realizada a

detecção e a classificação do evento ocorrido no sistema sob monitoração, como será

mostrado nos capítulos seguintes.

2.5 Resumo do capítulo

Este capítulo apresentou alguns dos eventos mais comuns de qualidade de energia nos

sistemas de potência atuais, preparando o leitor para os capítulos subseqüentes, onde serão

tratados os problemas de detecção e classificação dos eventos.

A detecção e a classificação de eventos de qualidade de energia facilita a identificação e

localização da fonte geradora de distúrbios e, conseqüentemente, a correção do problema no

sistema de potência, prevenindo possíveis danos a cargas ligadas ao sistema e melhorando a

qualidade de energia fornecida pelo sistema.

Capítulo 3

Algoritmo Detector de Eventos

3.1 Introdução

Neste capítulo, será feita uma descrição do Algoritmo do Detector de Eventos – (DE).

Este algoritmo é responsável pela aquisição dos dados de eventos de qualidade de energia

tratados neste trabalho. Vários conceitos utilizados pelo DE foram desenvolvidos em trabalhos

anteriores [9], [24] e serão revistos com o objetivo de proporcionar um melhor entendimento

de sua estrutura interna. A compreensão do funcionamento do DE é fundamental para sua

localização dentro de um contexto mais amplo de um sistema de detecção e classificação de

eventos de qualidade de energia com base no sinal de erro.

Inicialmente o DE terá seu funcionamento descrito de forma geral e, em seguida, será

feita uma breve descrição de suas principais estruturas internas, os conceitos empregados para

a estimação do fasor do sinal monitorado, a geração da componente senoidal fundamental, e as

estruturas de controle que utilizam ferramentas estatísticas para atualizar as variáveis estimadas

durante o processo de monitoramento e detecção dos eventos. A geração do sinal de erro e sua

utilização para a detecção dos eventos serão abordadas e, em seguida, será mostrado o

resultado final do processamento realizado pelo algoritmo DE, a janela armazenada do sinal de

erro, que será utilizada pelo processo de classificação.

Capítulo 3- Algoritmo Detector de Eventos

16

3.2 Visão geral do Algoritmo DE

O algoritmo DE é responsável pela detecção e pelo armazenamento dos dados

relativos à ocorrência de distúrbios de qualidade de energia. O sinal de erro utilizado adiante

no processo de classificação dos eventos é gerado pelo DE, desta forma, seu funcionamento

influencia diretamente no processo de classificação. A Fig. 3.1 apresenta um diagrama de blocos

simplificado do DE.

Fig. 3.1. Diagrama de blocos do DE

O bloco Evento de Qualidade de Energia representa as amostras do sinal de tensão do

sistema sob monitoração. A estrutura do Estimador de Parâmetros é responsável pela extração

das características da componente fundamental do sistema. No bloco Gerador da Componente

Fundamental, a componente fundamental do sistema é reproduzida e, em seguida, é subtraída

do sinal monitorado dando origem ao sinal de erro e(n). Na etapa de detecção de eventos, é

feita uma monitoração do comportamento estatístico da energia do sinal de erro. Através dessa

monitoração é disparado um sinal de ocorrência de evento que autoriza ou não o

armazenamento dos dados relativos ao mesmo. Os dados armazenados são uma janela do sinal

monitorado contendo o distúrbio e uma janela do sinal de erro correspondente ao distúrbio.

Existem ainda, as estruturas de controle que são responsáveis pela atualização dos

parâmetros estimados da componente fundamental utilizados pelo Gerador da Componente

Fundamental. Os detalhes dessas estruturas serão apresentados adiante.


17

3.3 Estrutura de medição de fasor

A estimação do fasor da componente fundamental do sistema elétrico sob monitoração

é feita através do Algoritmo Modulador para Medição de Fasor – AMMF [25]. Este algoritmo

é uma versão modificada do algoritmo de Fourier que busca reduzir o erro na estimação do

fasor quando ocorrem pequenos desvios na freqüência do sinal monitorado. O diagrama de

blocos da Fig. 3.2 mostra a estrutura do AMMF. O sinal y[n] representa o sinal de entrada, do

qual se deseja estimar o fasor. O conjunto dos blocos Estimador de Freqüência e Gerador de

Função Senoidal é responsável pela geração dos sinais modulantes gc[n] e gs[n]. Após a

modulação os sinais passam por filtros passa-baixa e então temos a representação do módulo e

da fase do sinal y[n] nos sinais XC1 e XS1. As demais operações levam ao cálculo da amplitude

do sinal de entrada A1[n-k], onde o índice k representa o atraso na resposta introduzido pelo

processo de filtragem.

Estimador deFreqüência

Gerador deFunção Senoidal 2

[ ]y n1[ ] cos[ ]cg n n= Ω

1[ ] [ ]sg n sen n= Ω

1cX

1sX

1[ ]A n k−1Ω

Fig. 3.2. Diagrama de blocos do AMMF.

O AMMF apresenta duas modificações em relação ao algoritmo de Fourier: a primeira

diz respeito ao fato de que a precisão do cálculo do fasor está intimamente relacionada com a

freqüência do sinal de modulação utilizado. Para que o algoritmo de Fourier funcione

corretamente é necessário que os sinais de modulação tenham exatamente a mesma freqüência

do sinal monitorado.

Na aplicação proposta, a freqüência do sinal monitorado pode oscilar em torno de 60

Hz, logo, os sinais modulantes gc[n] e gs[n] mostrados na Fig. 3.2 devem acompanhar estas

oscilações. Com este objetivo foi introduzida a estrutura do Estimador de Freqüência do sinal


18

monitorado, esta estrutura precede o Gerador de Função Senoidal que gera os sinais

modulantes e é responsável por atualizar a freqüência destes sinais sempre que houver uma

variação da freqüência de y[n].

A segunda modificação presente no AMMF é a substituição dos filtros. No algoritmo

de Fourier a freqüência do sinal é considerada constante, o que permite o uso de filtros de

média-móvel de maneira eficiente, uma vez que estes permitem a passagem da componente de

freqüência zero e apresentam uma alta rejeição às componentes harmônicas do sinal. Como o

presente estudo prevê pequenas oscilações da freqüência do sinal monitorado, observa-se que

os filtros de média-móvel não apresentam grande rejeição fora das freqüências harmônicas do

sinal para o qual foram projetados e ainda, não apresentam uma curva de resposta plana na

vizinhança da freqüência zero, características desejáveis na atual aplicação.

A solução encontrada foi o uso de filtros IIR no lugar dos filtros FIR. Estes filtros

podem ser implementados para apresentarem alta rejeição para freqüências acima da

freqüência de corte e ainda, uma curva de resposta plana na vizinhança da freqüência zero. O

filtro implementado no AMMF é um Butterworth de sétima ordem [25].

3.3.1 O Estimador de Freqüência

O Estimador de Freqüência utilizado pelo AMMF emprega basicamente um filtro notch

IIR adaptativo[26] como ferramenta para estimar a freqüência do sinal monitorado. O

funcionamento de um filtro notch visa excluir em sua saída a componente senoidal de

freqüência definida por seus coeficientes. Considerando que a freqüência do sinal de entrada

que se deseja rejeitar não é constante, torna-se necessária a realização da sintonia do filtro

alterando os valores de seus coeficientes. Esta sintonia é feita através de um algoritmo que

busca minimizar o sinal de saída do filtro. A Fig. 3.3 mostra a estrutura simplificada do filtro

notch utilizado como estimador de freqüência. O sinal de entrada y[n] passa por um filtro passa

faixa de função de transferência HPF de ganho unitário e defasamento zero na freqüência de

passagem definida por seus coeficientes. Em seguida o sinal filtrado é subtraído do sinal de

entrada y[n] dando origem ao sinal e[n]. O algoritmo de sintonia ajusta os coeficientes do filtro

de modo a minimizar o sinal e[n]. Em seguida a freqüência da componente fundamental Ω é


19

obtida em função dos coeficientes do filtro [25].

[ ]y n

Ω

[ ]e n

Fig. 3.3. Estrutura do Estimador de Freqüência.

3.3.2 O Gerador de Função Senoidal

O algoritmo DE utiliza sinais senoidais e cossenoidais para realizar a modulação do

sinal de entrada durante a estimação do fasor e também para a geração da componente

fundamental do sinal monitorado. Estes sinais são gerados pelo bloco Gerador de Função

Senoidal apresentado na Fig. 3.2. Esta estrutura é definida em [27] e tem seu equacionamento

na forma matricial mostrado na Equação (3.1).

1 1

2 2

[ 1] [ ]cos cos 1[ 1] cos 1 cos [ ]

s n s ns n s n

+ Ω Ω+⎡ ⎤ ⎡ ⎤⎡ ⎤=⎢ ⎥ ⎢ ⎥⎢ ⎥+ Ω− Ω⎣ ⎦⎣ ⎦ ⎣ ⎦

(3.1)

Na Equação (3.1), s1 e s2 representam os sinais seno e cosseno gerados na freqüência

digital Ω. O termo cosΩ utilizado pelo gerador é obtido do Estimador de Freqüência descrito

no tópico anterior. O sistema depende ainda que a amplitude dos sinais gerados seja unitária,

devido às simplificações utilizadas para que a única variável no equacionamento do gerador

seja o termo cosΩ, o sinal s2 não apresenta amplitude unitária, deste modo, é aplicado um fator

de escala na saída do gerador para que sua amplitude se torne unitária.

Na Fig. 3.4 é mostrada a ligação entre o Estimador de Freqüência e o Gerador de

Função Senoidal, onde pode ser observado um procedimento de linearização para se chegar ao

termo cosΩ que atualiza o Gerador de Função Senoidal.


20

Ω cos[ ]Ω

Ω

Gerador deFunção Senoidal

cosΩ[ ]sen nΩ

cos[ ]nΩ

Estimador deFreqüência

Fig. 3.4. Interligação entre o Estimador de Freqüência e o Gerador de Função Senoidal.

3.4 Gerador da Componente Fundamental

As estruturas apresentadas no tópico 3.3 são integradas para compor o Gerador da

Componente Fundamental. A esta nova estrutura, é adicionado um sistema de análise

estatística e controle das atualizações das variáveis que contém as características da

componente fundamental. Estas variáveis são chamadas de variáveis de ambiente. Este

controle é responsável por alterar as características da componente fundamental gerada em

resposta às alterações ocorridas no sistema sob monitoração. A Fig. 3.5 mostra a estrutura

completa do Gerador da Componente Fundamental.

[ ]y n1cos[ ]nΩ

1sen[ ]nΩ

1cX

1sX

11 1 1[ ] cos[ ]y n A n φ= Ω +

1Ω

1Ω 1cX

1sX

1Sw

2Sw

3Sw

Fig. 3.5. Diagrama esquemático do Gerador da Componente Fundamental.

Os sinais Ω1, 1cX e

1sX que representam a freqüência e as características de módulo e

fase da componente fundamental são atualizados através das chaves Sw1, Sw2 e Sw3, mostradas

na Fig. 3.5. Estas chaves são controladas pelo algoritmo de controle das atualizações das


21

variáveis de ambiente, este algoritmo será abordado adiante.

3.5 Controle da Atualização das Variáveis de Ambiente

O processo de atualização é controlado por um sistema de monitoramento estatístico

do comportamento das variáveis de ambiente. Os sinais Ω1, 1cX e

1sX , mostrados na Fig. 3.5,

são reunidos em janelas, das quais são calculados os valores de média e variância para cada um

dos parâmetros. O tamanho das janelas foi definido como um múltiplo de ciclos da

componente fundamental do sinal da rede elétrica para cada variável de ambiente. Foi

observado que janelas menores proporcionam uma melhor performance do algoritmo para

eventos de curta duração, por outro lado, para eventos de longa duração, janelas maiores são

mais estáveis. Os valores utilizados na atualização são sempre as médias das variáveis

consideradas. O algoritmo de controle das atualizações só atualiza o gerador quando a

componente fundamental estiver em regime permanente, desta forma, a variância dos

parâmetros estimados da componente fundamental deve apresentar valores abaixo de limiares

pré-definidos. A definição dos limiares de variância leva em conta a relação sinal-ruído SNR

(signal to noise ratio) do sinal da rede elétrica monitorado e o tempo levado pelo algoritmo para

se estabilizar novamente em regime permanente após a ocorrência de um distúrbio.

3.6 Obtenção do Sinal de Erro

Com o conjunto de estruturas apresentadas anteriormente é possível reproduzir a

componente fundamental do sinal monitorado da rede elétrica. Este sinal é, então, utilizado

como referência para o sinal amostrado. O sinal de erro e[n] apresentado na Fig. 3.1 é obtido a

partir da subtração da componente fundamental, gerada pelo algoritmo, do sinal monitorado.

De maneira resumida, o sistema tem um funcionamento semelhante ao de um filtro notch

sintonizado na componente fundamental do sistema elétrico monitorado. O resultado obtido é

ilustrado na Fig. 3.6.


22Te

nsão

pu

Tens

ão p

uTensão pu

Fig. 3.6. Sinal de erro obtido pelo algoritmo DE.

3.7 Detecção e armazenamento dos eventos

Após a obtenção do sinal de erro e(n), como ilustrado na Fig. 3.6, o algoritmo de

detecção de eventos processa uma análise estatística deste sinal, de modo a identificar a

ocorrência de distúrbios no sinal monitorado. Esta análise é realizada da seguinte forma,

inicialmente é calculado o valor RMS do sinal de erro. Em seguida, este sinal passa a ser

analisado por janelas, onde a média de cada janela é calculada e comparada a um limiar de

energia média do sinal de erro. Este limiar é ajustado automaticamente pelo algoritmo em

função do comportamento do sistema elétrico em regime permanente. O funcionamento

normal do sistema elétrico não causa inovações no sinal de erro, porém, os distúrbios do

sistema são efetivamente transferidos para o sinal de erro.

Sempre que ocorre uma variação da energia média do sinal de erro entre duas janelas e

esta variação é maior que o parâmetro de sensibilidade de detecção, ocorre o disparo do

sistema de armazenamento de dados. O algoritmo armazena as amostras relativas a quatro

ciclos do sinal da rede, dois ciclos são considerados antes do momento da detecção e dois

ciclos após a detecção. Este processo tem como conseqüência uma janela de dados

armazenada onde o início de todos os eventos ocorre na primeira metade da janela. De forma

semelhante, é armazenada também a janela do sinal de erro correspondente ao sinal de entrada

armazenado.


23

O resultado obtido de todo o processamento realizado pelo algoritmo DE é ilustrado

nas Fig. 3.7e Fig. 3.8, onde podemos ver as janelas armazenadas do sinal de entrada e do sinal

de erro devido à ocorrência de um evento de qualidade de energia. O DE trabalha com uma

taxa de amostragem de 15360 Hz, que leva a uma representação de um sinal monitorado de 60

Hz com 256 amostras por ciclo. Portanto, cada janela armazenada possui 1024 amostras, que

representam quatro ciclos da componente fundamental.

Fig. 3.7. Sinal de entrada e janela armazenada contendo o distúrbio.

Fig. 3.8. Sinal de erro e janela armazenada do sinal de erro.


Este capítulo apresentou de forma resumida o funcionamento do Algoritmo Detector

de Eventos - DE. Foram apresentados alguns detalhes funcionais das principais estruturas que

compõem o algoritmo, como a estimação dos parâmetros da componente fundamental e o


24

processo de atualização das variáveis de ambiente. O processo de geração da componente

fundamental foi mostrado de forma integrada com o AMMF.

O resultado principal obtido com o algoritmo DE são as janelas de dados contendo o

sinal de erro relativo à ocorrência dos eventos de qualidade de energia. Alguns aspectos

resultantes do processo utilizado para a detecção, como a presença do início do distúrbio

sempre na primeira metade da janela armazenada, serão explorados pelo processo de

classificação. Outro fator importante que foi observado é a integridade da janela de erro que é

mantida pelo bloqueio do algoritmo de atualização do gerador da componente fundamental

enquanto os dados são arquivados. Como foi observado o algoritmo DE tem papel

fundamental no processo de classificação dos eventos de qualidade de energia, uma vez que

todo o processo de classificação será baseado na análise do sinal erro por ele gerado.

Capítulo 4

Rede Neural aplicada a Classificação de Padrões

4.1 Introdução

O presente capítulo apresenta as redes neurais como uma importante ferramenta para a

classificação de padrões. Serão apresentados os conceitos básicos de redes neurais, suas

principais arquiteturas e capacidades. Com objetivo de classificar padrões, os neurônios

denominados perceptrons serão abordados como uma importante topologia de rede para este

fim. O tradicional algoritmo de retropropagação será abordado como ferramenta de

treinamento para o perceptron de múltiplas camadas. A metodologia apresentada no capítulo é

a mesma encontrada em [28], onde também podem ser encontradas mais informações sobre o

funcionamento das redes neurais.

Na abordagem proposta pelo trabalho atual, os eventos de qualidade de energia

detectados e armazenados, conforme descrito no Capítulo 3, serão apresentados a uma rede

neural para serem classificados. A descrição do processamento realizado antes da apresentação

dos sinais à rede e o desempenho obtido na classificação serão discutidos nos próximos

capítulos.

Capítulo 4- Rede Neural aplicada a Classificação de Padrões

26

4.2 Redes neurais

A redes neurais apresentam uma grande versatilidade na resolução de vários tipos de

problemas, como em sistemas de reconhecimento e compressão de voz e imagem, controle e

automação de processos, modelagem de plantas industriais, sistemas de predição de séries

temporais, desenvolvimento de produtos, análise de sinais de eletroencefalograma e

eletrocardiograma, e vários outros problemas em diversas áreas. No presente trabalho,

investiga-se a utilização de uma rede neural para realizar o reconhecimento de diferentes

padrões de sinais e possibilitar a classificação dos mesmos em diferentes classes.

4.3 Modelos de Neurônio

A unidade básica de processamento presente nas redes neurais é o neurônio, o

diagrama de blocos da Fig. 4.1 apresenta o modelo típico de um neurônio utilizado na

construção de redes neurais artificiais.

wk1

wk2

wkm

x1

x2

xm

Sinais deentrada

bk

Bias

Pesossinápticos

.

Função deativação

Saídayk

vk

Somador

Fig. 4.1. Modelo não-linear de um neurônio.

Para melhor compreensão do funcionamento de um neurônio artificial, devemos

observar cuidadosamente a nomenclatura utilizada na Fig. 4.1 e, ainda, como se dá o fluxo dos

sinais de entrada através do modelo até que seja obtida a saída do mesmo.

Os sinais de entrada xj são aplicados às entradas das sinapses j, que são conectadas ao

neurônio k, através das sinapses, os sinais de entrada xj são multiplicados pelos respectivos


27

pesos sinápticos wkj. A identificação dos pesos sinápticos (Wkj) é formada pelo número de

identificação do neurônio k e em seguida pelo índice da conexão de entrada da sinapse a qual o

peso se refere. Os pesos sinápticos wkj podem pertencer a um intervalo que contenha valores

positivos e também negativos.

Em seguida, encontramos um somador, representado pelo símbolo Σ, que é

responsável por realizar o somatório dos sinais de entrada ponderados pelos pesos sinápticos

do respectivo neurônio. Este conjunto de operações realizadas constituem um combinador

linear.

A próxima estrutura encontrada é a função de ativação do neurônio ϕ(⋅), esta função é

responsável por limitar a amplitude da saída do neurônio, de modo geral, a saída do neurônio

apresenta valores no intervalo de [0 , 1], podendo, alternativamente apresentar valores contidos

no intervalo [-1 , 1].

Uma última observação a respeito do modelo de neurônio apresentado na Fig. 4.1 é a

presença do bias bk, a função do bias, aplicado externamente, é aumentar ou diminuir a entrada

líquida da função de ativação, dependendo de seu valor ser positivo ou negativo,

respectivamente.

Matematicamente, o modelo de neurônio artificial k, apresentado na Fig. 4.1 pode ser

descrito através do par de equações (4.1) e (4.2), respectivamente.

1

m

k kj jj

u w x=

= ∑ (4.1)

e

( )k k ky u bϕ= + (4.2)

onde x1, x2, ..., xm são os sinais de entrada; wk1, wk2, ..., wkm são os pesos sinápticos do neurônio

k; uk é a saída do combinador linear correspondente aos sinais de entrada; bk é o bias; ϕ(⋅) é a


28

função de ativação e, finalmente, yk é a saída do neurônio. A utilização de um bias bk tem o

efeito de aplicar uma transformação afim à saída uk do combinador linear. Como foi mostrado

na Fig. 4.1, a utilização do bias pode ser escrita através da Equação (4.3), onde vk é definido

como o campo local induzido do neurônio k.

k k kv u b= + (4.3)

Uma outra representação para o modelo-não linear do neurônio k, apresentado na Fig.

4.1, pode ser obtida considerando-se a inclusão de uma nova sinapse com um sinal de entrada

x0, fixo em +1 e um peso sináptico wk0 igual ao bias bk. Este novo arranjo do modelo não-linear

do neurônio pode ser visto na Fig. 4.2.

. . .

. . .

Fig. 4.2. Modelo do neurônio considerando o bias com peso sináptico.

Nas equações (4.4) e (4.5), temos a formulação da nova configuração do modelo não-

linear do neurônio.

0

m

k kj jj

v w x=

= ∑ (4.4)

( )k ky vϕ= (4.5)

Podemos facilmente perceber que apesar da diferença no arranjo físico do modelo, as


29

duas representações se mantêm matematicamente equivalentes.

4.4 Tipos de Função de Ativação

A função de ativação ϕ(⋅), como foi apresentada anteriormente, tem o objetivo de

limitar o valor da saída do neurônio em função do campo local induzido v. Serão considerados,

aqui, três tipos básicos de função de ativação:

Função limiar: esta função é definida matematicamente pela Equação (4.6).

1 0

( )0 0

se vse v

ϕ≥⎧

⋅ = ⎨ <⎩ (4.6)

Esta função de ativação também é conhecida como função de Heaviside na literatura

de engenharia. A saída do neurônio k que utiliza uma função de ativação limiar apresenta a

seguinte relação:

1 00 0

kk

k

se vy

se v≥⎧

= ⎨ <⎩ (4.7)

onde vk é o campo local induzido do neurônio k: 0

m

k kj j kj

v w x b=

= +∑ .

Função linear por partes: esta função apresenta um fator de amplificação na região

linear de operação igual à unidade. Uma aproximação do comportamento deste tipo de função

é obtida considerando-se o funcionamento de um amplificador não-linear. Os dois

comportamentos possíveis são os seguintes:

• Na operação na região linear, o comportamento é de um combinador linear.

• Considerando que o fator de amplificação na região linear tenda ao infinito, a


30

função linear por partes se resume à função limiar.

A relação matemática que define a função linear por partes é a seguinte:

11, 21 1( ) , 2 2

10, 2

v

v v v

v

ϕ

⎧ ≥ +⎪⎪= + > > −⎨⎪

≤ −⎪⎩

(4.8)

Função Sigmóide: a função sigmóide é a mais empregada na construção de redes

neurais artificiais. Ela é definida como uma função estritamente crescente que apresenta um

balanceamento adequado entre o comportamento linear e não-linear. Um exemplo de função

sigmóide é a função logística, definida como:

1( )1 avv

eϕ −=

+ (4.9)

onde a é o parâmetro de inclinação da função sigmóide. No limite, quando o parâmetro de

inclinação se aproxima do infinito, a função sigmóide se resume à função limiar. Enquanto a

função limiar apresenta valores 0 ou 1, a função sigmóide assume um intervalo contínuo de

valores entre 0 e 1. Outra importante vantagem da função sigmóide é sua diferenciabilidade em

todo intervalo de resposta, característica não apresentada pela função de limiar.

Um esboço das funções de ativação apresentadas é mostrado na Fig. 4.3, onde temos

em (a) a representação da função de limiar, em (b) a representação da função linear por partes

e, finalmente, em (c) o esboço de uma função sigmóide.

Fig. 4.3. Esboço das principais funções de ativação utilizadas em redes neurais artificiais.

As funções de ativação definidas anteriormente apresentam um intervalo de resposta


31

de 0 a 1. Alternativamente pode ser interessante utilizar uma função de ativação que se estenda

de -1 a 1, estas funções devem apresentar uma forma anti-simétrica em relação à origem. Desta

forma, a função limiar pode ser definida da seguinte maneira:

1 0

( ) 0 01 0

se vse vse v

ϕ>⎧

⎪⋅ = =⎨⎪− <⎩

(4.10)

que, desta forma é conhecida como função sinal. Para a forma correspondente da função

sigmóide podemos utilizar a função tangente hiperbólica:

( ) tanh( )v vϕ = (4.11)

O fato de permitir que uma função de ativação do tipo sigmóide assuma valores

negativos, como mostrado na Equação (4.11) traz benefícios analíticos para sua utilização em

redes neurais artificiais.

4.5 Arquiteturas de rede

A maneira pela qual os neurônios apresentados na seção anterior são arranjados para

formar a rede neural artificial está intimamente ligada ao funcionamento do algoritmo de

aprendizagem utilizado para treinar a rede. De forma geral, temos três arquiteturas de rede

diferentes, a saber:

Redes com alimentação direta (feedforward) com camada única

Os neurônios em uma rede neural artificial estão organizados em camadas. A estrutura

mais simples que constitui uma rede, apresenta uma camada de entrada que aplica o sinal de

entrada sobre uma camada de neurônios de saída. O sentido do fluxo do sinal na rede é

estritamente da entrada para a camada de saída, razão pela qual esta estrutura é chamada de

rede alimentada adiante. A Fig. 4.4 mostra esta estrutura de rede. A característica de camada


32

única, parte da observação do número de camadas com neurônios que realizam

processamento. Como pode ser observado na Fig. 4.4, a camada de entrada, composta pelos

neurônios fonte, não realiza processamento, portanto, apenas a camada de saída é composta

por neurônios que realizam processamento. Caracterizando, assim, uma rede de apenas uma

camada.

Camada deentrada

(neurônios fonte)

Camada deneurônios de

saída

Fig. 4.4. Rede alimentada adiante com apenas uma camada de neurônios.

Redes alimentadas diretamente com múltiplas camadas

Esta rede difere da descrita anteriormente pela presença de uma ou mais camadas

ocultas, compostas de neurônios também chamados de neurônios ocultos. Através da adição

de camadas ocultas na estrutura da rede, esta adquire a capacidade de extrair estatísticas de

ordem elevada. Esta característica é particularmente valiosa quando o tamanho da camada de

entrada é grande.

O fluxo de informação na rede se dá a partir da camada de entrada, que recebe o vetor

de entrada e o aplica à primeira camada oculta, em seguida, os sinais de saída desta camada são

feitos sinais de entrada para a segunda camada oculta e assim sucessivamente. Por fim, o sinal

de saída da última camada (camada de saída) representa a saída global da rede em relação ao

padrão de ativação apresentado à camada de entrada.

A Fig. 4.5 apresenta uma estrutura de rede alimentada diretamente com múltiplas


33

camadas, esta rede é composta por uma camada de entrada com seis neurônios de fonte, uma

camada oculta formada por quatro neurônios e, por fim, a camada de saída, constituída de dois

neurônios.

Camada deentrada

(neurônios fonte)

Camada deneurônios de

saídaCamada deneurônios

ocultos

Fig. 4.5. Rede alimentada adiante com camada de neurônios ocultos.

Pode, ainda, ser observado na Fig. 4.5 que esta é uma estrutura de rede totalmente

conectada, considerando que cada um dos neurônios da rede se encontram conectados a todos

os neurônios da camada adjacente. Caso alguma dessas conexões sinápticas não estejam

presentes na rede, esta será considerada uma rede parcialmente conectada.

Redes Recorrentes

As redes recorrentes se diferem das redes alimentadas adiante por apresentarem pelo

menos um laço de realimentação em sua estrutura. A Fig. 4.6 ilustra uma rede recorrente bem

simples, composta apenas por uma camada de neurônios, não apresentando, portanto,

camadas escondidas. Pode ser observado nesta estrutura que a saída de cada neurônio alimenta

a entrada dos demais, desta forma, a rede não apresenta laços de auto-realimentação, onde a

saída do neurônio é realimentada em sua própria entrada.


34

Fig. 4.6. Rede recorrente sem laços de auto-realimentação e sem neurônios ocultos.

Outra classe de redes recorrentes é formada pelas estruturas que apresentam camadas

escondidas de neurônios. A Fig. 4.7 mostra este tipo de rede. Os laços de realimentação são

formados a partir dos neurônios de saída e ocultos, pode ser observada a presença de laços de

auto-realimentação na estrutura apresentada.

Z-1

Z-1

Z-1

Z-1

Entradas

Saídas

Fig. 4.7. Rede recorrente com neurônios ocultos.

As estruturas mostradas apresentam, em comum, em seus laços de realimentação,

elementos de atraso unitário ( representados por z-1 ) este fato resulta em um comportamento

dinâmico não-linear da rede, considerando que a mesma possua unidades não-lineares. A

presença de laços de realimentação, nas estruturas mostradas na Fig. 4.6 e na Fig. 4.7, tem um

impacto profundo na capacidade de aprendizagem da rede e em seu desempenho,

características estas que não serão abordadas no presente trabalho.


35

4.6 Neurônio Perceptron

O neurônio perceptron é construído em torno de uma estrutura não-linear, conforme

apresentado no início do capítulo. Este modelo de neurônio é composto por um combinador

linear, seguido de um limitador abrupto, este sistema é mostrado na Fig. 4.8. A representação

do neurônio ilustrado na Fig. 4.8 é conhecida como grafo de fluxo de sinal.

w1

w2

wm. . .

x1

x2

xm

Bias, b

vy Saída

Limitadorabrupto

Entradasv

Fig. 4.8. Grafo de fluxo de sinal do perceptron.

O nó aditivo do modelo neuronal calcula a combinação linear das entradas aplicadas às

suas sinapses e incorpora um bias aplicado externamente. A soma resultante, isto é, o campo

local induzido, é aplicado ao limitador abrupto ( função de ativação do neurônio ).

No grafo de fluxo de sinal da Fig. 4.8, os pesos sinapticos do neurônio perceptron são

representados por w1, w2, ... wm. Correspondentemente, as entradas aplicadas ao neurônio

perceptron são representadas por x1, x2, ... xm. O bias, aplicado externamente é representado

por b. Deste modelo, podemos constatar que a entrada do limitador abrupto ou o campo local

induzido do neurônio é

1

m

i ii

v w x b=

= +∑ (4.12)

O objetivo do perceptron é classificar corretamente um conjunto de entradas aplicadas

externamente x1, x2, ... xm em uma das classes C1 ou C2. A regra de decisão para a classificação é

atribuir o ponto representado pelas entradas x1, x2, ... xm à classe C1 se a saída do perceptron

for +1 e à classe C2 se a saída do perceptron for -1.


36

Podemos traçar uma mapa das regiões de decisão no espaço ℜm m dimensional

abrangido pelas m variáveis de entrada x1, x2, ..., xm. Na definição mais simples do perceptron,

existem duas regiões separadas por um hiperplano definido por

1

0m

i ii

w x b=

+ =∑ (4.13)

Imaginando um caso simples onde temos apenas duas variáveis de entrada x1 e x2, para

o qual a fronteira de decisão toma a forma de uma linha reta. Um ponto (x1, x2) que se

encontra acima da linha de fronteira é considerado pertencente à classe C1, enquanto um ponto

(x1, x2) localizado abaixo da linha de fronteira é atribuído à classe C2. Esta situação é ilustrada

na Fig. 4.9.

x1

x2

0

Classe 1

Classe 2

Fronteira de decisãow1x1+w2x2+b=0

Fig. 4.9. Hiperplano como fronteira de decisão para um problema de classificação bidimensional de duas classes.

Pode ser observado, ainda, que o efeito do bias é apenas de deslocar a fronteira de

decisão em relação à origem. Os pesos sinápticos w1, w2, ..., wm, podem ser adaptados de

iteração para iteração, para se obter a correta classificação dos padrões apresentados ao

perceptron, este processo é realizado através dos algoritmos de aprendizagem.


37

4.7 Perceptron de múltiplas camadas

O perceptron de múltiplas camadas é uma estrutura de rede composta pela camada de

entrada, uma ou mais camadas de neurônios ocultos, e a camada de saída. O sinal de entrada se

propaga adiante, através da rede, camada por camada, até alcançar a camada de saída. Esta

estrutura representa uma generalização do perceptron de camada única apresentado

anteriormente.

Os perceptrons de múltiplas camadas têm sido utilizados com sucesso para a solução

de problemas complexos. Tipicamente, o treinamento de perceptrons de múltiplas camadas é

realizado de forma supervisionada através de um algoritmo que se baseia na regra de

aprendizagem por correção de erro, este método é conhecido como algoritmo de

retropropagação de erro. A Fig. 4.10 ilustra a arquitetura de um perceptron de múltiplas

camadas com duas camadas ocultas.

. . .

. . .

. . .

Fig. 4.10. Arquitetura de um perceptron de múltiplas camadas com duas camadas ocultas.

Existem três características básicas, presentes nos perceptrons de múltiplas camadas.

• O modelo de neurônio utilizado na rede apresenta uma função de ativação não-

linear. Esta não linearidade, porém, é suave, sendo diferenciável em qualquer

ponto, ao contrário da limitação abrupta utilizada no perceptron de Rosenblatt


38

[28]. Uma forma normalmente utilizada que satisfaz a esta exigência, é a não

linearidade sigmóide, apresentada anteriormente pela Equação (4.9).

• A rede contém uma ou mais camadas de neurônios ocultos, que não pertencem

à entrada ou à saída da rede. Estas camadas são responsáveis pela extração

progressiva de características significativas do padrão de entrada, capacitando,

desta forma, a rede a aprender tarefas complexas.

• Este tipo de rede apresenta um alto grau de conectividade, determinado pelas

sinapses da mesma. Uma alteração na conectividade da rede requer uma

mudança na população das conexões sinápticas ou em seus pesos.

4.8 Algoritmo de retropropagação

Para apresentar o desenvolvimento matemático do algoritmo de retropropagação será

considerada uma rede de múltiplas camadas como a apresentada na Fig. 4.10, onde devemos

ressaltar algumas características importantes.

Primeira, a estrutura mostrada se refere a uma rede totalmente conectada. Isto significa

que cada neurônio da rede, em qualquer camada, está conectado a todos os neurônios da

camada que o precede.

Segunda, devemos considerar, ainda, que o fluxo de sinal através da rede se dá da

direita para a esquerda, caracterizando um fluxo de sinal adiante. Este sinal é chamado de sinal

funcional, o sinal funcional é o sinal (estímulo) de entrada que é aplicado à rede e que se

propaga através da mesma, camada por camada até emergir na saída da rede como sinal de

saída.

Finalmente, temos ainda o sinal de erro, este sinal se origina na saída da rede e se

propaga para trás, da direita para a esquerda, caracterizando a retropropagação do sinal de erro.

O esquema da Fig. 4.11 mostra o fluxo dos sinais funcionais e de erro na rede.


39

Fig. 4.11. Fluxo dos sinais funcionais e de erro em um perceptron de múltiplas camadas.

Os neurônios são projetados para realizarem dois cálculos: o cálculo do sinal funcional,

que aparece na saída de cada neurônio e é uma função não-linear do sinal de entrada e dos

pesos sinápticos associados ao neurônio, e o cálculo de uma estimativa do vetor gradiente que

é necessário para a retropropagação do sinal de erro através da rede.

A notação utilizada na dedução do algoritmo de retropropagação é a seguinte:

• Os índices i, j e k se referem a neurônios diferentes na rede, com os sinais se

propagando da esquerda para a direita, o neurônio j se encontra em uma

camada a direita do neurônio i, e o neurônio k se encontra em uma camada a

direita do neurônio j, quando o neurônio j é uma unidade oculta.

• Iteração n, o n-ésimo padrão de treinamento aplicado à rede.

• Símbolo ξ(n) se refere à soma instantânea dos erros quadráticos ou energia do

erro na iteração n. A média de ξ(n) para todos os valores de n produz a energia

média do erro médio ξmed.

• O símbolo ej(n) se refere ao sinal de erro na saída do neurônio j, na iteração n.

• O símbolo dj(n) se refere à resposta desejada para o neurônio j e é usada para

calcular ej(n).

• O símbolo yj(n) se refere ao sinal funcional que aparece na saída do neurônio j

na iteração n.


40

• O símbolo wji(n) representa o peso sináptico conectado a saída do neurônio i à

entrada do neurônio j, na iteração n. A correção aplicada a este peso na iteração

n é representada por ∆wji(n).

• O campo local induzido do neurônio j na iteração n é representado por vj(n);

que representa o sinal aplicado á função de ativação do neurônio j.

• A função de ativação, que descreve a relação funcional de entrada-saída da não-

linearidade associada ao neurônio j é representada por ϕj(⋅).

• O bias aplicado ao neurônio j é representado por bj; seu efeito é representado

por uma sinapse de peso wj0=bj conectada a uma entrada fixa igual a +1.

• O i-ésimo elemento do vetor (padrão) de entrada é representado por xi(n).

• O k-ésimo elemento de do vetor (padrão) de saída global é representado por

ok(n).

• O parâmetro da taxa de aprendizagem é representado por η.

• O símbolo ml representa o tamanho da camada l do perceptron de múltiplas

camadas; l= 0, 1, 2, ..., L, onde L é a profundidade da rede. Assim, m0 é o

tamanho da camada de entrada da rede, m1 é o tamanho da primeira camada

oculta da rede e mL representa o tamanho da camada de saída da rede.

Com base na notação apresentada, o algoritmo será apresentado como segue.

Considerando o neurônio j como sendo um neurônio de saída, o sinal de erro na sua

saída, na iteração n é definido por

( ) ( ) ( )j j je n d n y n= − (4.14)


41

Definimos o valor instantâneo da energia do erro para o neurônio j como 21 ( )2 je n .

Correspondentemente, o valor instantâneo ξ(n) da energia total do erro é obtido

somando-se os termos 21 ( )2 je n de todos os neurônios da camada de saída, que são os únicos

neurônios onde os sinais de erro podem ser calculados diretamente. Podemos assim escrever

21( ) ( )2 j

j Cn e nξ

∈

= ∑ (4.15)

onde o conjunto C contém todos os neurônios da camada de saída da rede. Sendo N, o

número total de padrões contidos em um conjunto de treinamento. A energia média do erro

quadrado é obtida somando-se os ξ(n) para todos os n e então normalizando em relação ao

tamanho do conjunto N, como mostrado por

1

1 ( )N

medn

nN

ξ ξ=

= ∑ (4.16)

A energia instantânea do erro ξ(n) e, conseqüentemente, a energia média do erro ξmed é

uma função de todos os parâmetros livres da rede. Para um dado conjunto de treinamento,

ξmed representa a função de custo como uma medida do desempenho de aprendizagem. O

objetivo do processo de aprendizagem é ajustar os parâmetros livres da rede de forma a

minimizar ξmed. Um método simples de treinamento consiste em atualizar os pesos de padrão

em padrão até formar uma época, isto é, uma apresentação completa do conjunto de

treinamento inteiro que está sendo processado. Os ajustes dos pesos são realizados de acordo

com os respectivos erros calculados para cada padrão apresentado à rede. A média aritmética

destas alterações individuais de pesos sobre o conjunto de treinamento é, portanto, uma

estimativa da alteração real que resultaria da modificação dos pesos baseada na minimização da

função de custo ξmed sobre o conjunto de treinamento inteiro.

Considere, então, a Fig. 4.12, que representa um neurônio j sendo alimentado por um


42

conjunto de sinais funcionais produzidos por uma camada de neurônios a sua esquerda. O

campo local induzido, produzido na entrada da função de ativação do neurônio j é, portanto

0

( ) ( ) ( )m

j ji ii

v n w n y n=

= ∑ (4.17)

onde m é o número total de entradas (excluindo o bias) aplicadas ao neurônio j. O peso

sináptico wj0 é igual ao bias aplicado ao neurônio j. Assim, o sinal funcional yj(n) que aparece na

saída do neurônio j na iteração n é

( ) ( ( ))j j jy n v nϕ= (4.18)

wj0(n)=bj(n)

wm

y0=+1

ym(n)

vj(n)ej(n)yi(n)

wji(n) . yj(n) -1

dj(n)

Neurônio j

Fig. 4.12, Grafo do fluxo de sinal em um neurônio de saída j.

O algoritmo de retropropagação aplica uma correção ∆wji(n) ao peso sináptico wji(n),

que é proporcional à derivada parcial ( ) / ( )jin w nξ∂ ∂ . De acordo com a regra da cadeia do

cálculo, podemos expressar este gradiente como:

( ) ( ) ( )( ) ( )

( ) ( ) ( ) ( ) ( )j j j

ji j j j ji

e n y n v nn nw n e n y n v n w nξ ξ ∂ ∂ ∂∂ ∂

=∂ ∂ ∂ ∂ ∂

(4.19)

A derivada parcial ( ) / ( )jin w nξ∂ ∂ representa um fator de sensibilidade, determinando a

direção de busca no espaço de pesos, para o peso sináptico wji.


43

Diferenciando ambos os lados da Equação (4.15) em relação a ej(n), temos

( ) ( )( ) j

j

n e ne nξ∂

=∂

(4.20)

Diferenciando ambos os lados da Equação (4.14) em relação a yj(n), temos

( )

1( )

j

j

e ny n∂

= −∂

(4.21)

Em seguida, diferenciando a Equação (4.18), obtemos

'( )( ( ))

( )j

j jj

y nv n

v nϕ

∂=

∂ (4.22)

onde o apóstrofo do lado direito significa diferenciação em relação ao argumento. Finalmente,

diferenciando a Equação (4.17) em relação a wji(n) produz

( )

( )( )

jj

ji

v ny n

w n∂

=∂

(4.23)

Combinando as Equações (4.20) a (4.23) na Equação (4.19) temos

'( ) ( ) ( ( )) ( )( ) j j j i

ji

n e n v n y nw nξ ϕ∂

= −∂

(4.24)

A correção ∆wji(n) aplicada ao peso wji(n)é definida por

( )

( )( )jiji n

nw nwξη ∂

∆ = −∂

(4.25)

onde η é o parâmetro da taxa de aprendizagem do algoritmo de retropropagação. O sinal


44

negativo indica uma a descida do gradiente no espaço de pesos (buscando uma direção na

mudança de peso que reduza o valor de ξ(n)).

Correspondentemente, o uso da Equação (4.24) em (4.25) leva a

( ) ( ) ( )ji j iw n n y nηδ∆ = (4.26)

onde o gradiente local δj(n) é definido por

'

( )( )( )

( ) ( )( )( ) ( ) ( )

( ) ( ( ))

jj

j j

j j j

j j j

nnv n

e n y nne n y n v n

e n v n

ξδ

ξ

ϕ

∂=∂

∂ ∂∂=∂ ∂ ∂

=

(4.27)

O gradiente local aponta para as modificações necessárias nos pesos sinápticos. De

acordo com a Equação (4.27), o gradiente local δj(n) para o neurônio de saída j é igual ao

produto do sinal de erro ej(n)correspondente para aquele neurônio pela derivada ϕ’j(vj(n)) da

função de ativação associada.

Observando as Equações (4.26) e (4.27), é fácil perceber que um fator muito

importante para o cálculo do valor do ajuste de peso ∆wji(n) é o sinal de erro ej(n) na saída do

neurônio j. Neste contexto, devemos analisar dois casos distintos:

No primeiro caso, o neurônio j é um neurônio pertencente à camada de saída da rede,

neste caso, ele recebe uma resposta desejada particular (sinal dj(n) na Fig. 4.12). Através da

Equação (4.14), podemos calcular o sinal de erro ej(n)associado a este neurônio, e finalmente,

utilizando a Equação (4.27) obtemos diretamente o gradiente local δj(n).

No segundo caso, o neurônio j é um nó oculto da rede, nesta situação, não existe

resposta desejada definida para o neurônio em questão. Correspondentemente, o sinal de erro

para um neurônio oculto deve ser determinado em termos dos sinais de erro de todos os


45

neurônios aos quais o neurônio oculto está diretamente conectado. A Fig. 4.13 mostra o

neurônio j como um nó oculto da rede conectado a um neurônio de saída k.

. . .

. . .

Fig. 4.13. Grafo do fluxo de sinal em um neurônio oculto j conectado a um neurônio de saída k.

Através da Equação (4.27) podemos redefinir o gradiente local para um neurônio

oculto j como

'

( )( )( ) ( )

( ) ( ( ))( )

jj

j j

j jj

y nny n v n

n v ny n

ξδ

ξ ϕ

∂∂=∂ ∂

∂=∂

(4.28)

Para calcular a derivada parcial ( ) / ( )jn y nξ∂ ∂ podemos proceder da seguinte forma.

Da Fig. 4.13 temos que

21( ) ( )2 k

k Cn e nξ

∈

= ∑ (4.29)

onde o neurônio k é um neurônio de saída.

Diferenciando a Equação (4.29) em relação ao sinal funcional yj(n) obtemos

( )( )( ) ( )

kk

kj j

e nn ey n y nξ ∂∂

=∂ ∂∑ (4.30)


46

utilizando a regra da cadeia para a derivada parcial ( ) / ( )k je n y n∂ ∂ e reescrevendo a Equação

(4.30) chegamos a

( ) ( )( ) ( )( ) ( ) ( )

k kk

kj k j

e n v nn e ny n v n y nξ ∂ ∂∂

=∂ ∂ ∂∑ (4.31)

Porém, observando a Fig. 4.13, notamos que

( ) ( ) ( )

( ) ( ( ))k k k

k k k

e n d n y nd n v nϕ

= −

= − (4.32)

Assim,

'( ) ( ( ))( )

kk k

k

e n v nv n

ϕ∂= −

∂ (4.33)

ainda a partir da Fig. 4.13, podemos ver que para o neurônio k o campo local induzido é

0

( ) ( ) ( )m

k kj jj

v n w n y n=

=∑ (4.34)

onde m é o número total de entradas aplicadas ao neurônio k. Diferenciando a Equação (4.34)

em relação a yj(n) temos

( ) ( )( )

kkj

j

v n w ny n∂

=∂

(4.35)

Através das equações (4.33) e (4.35) em (4.31) obtemos a derivada parcial desejada:

'( ) ( ) ( ( )) ( )( )

( ) ( )

k k k kjkj

k kjk

n e n v n w ny n

n w n

ξ ϕ

δ

∂= −

∂

= −

∑

∑ (4.36)


47

Finalmente, utilizando a Equação (4.36) em (4.28) obtemos a fórmula de

retropropagação para o gradiente local δj(n) para um neurônio oculto j como

'( ) ( ( )) ( ) ( )j j j k kjk

n v n n w nδ ϕ δ= ∑ (4.37)

O fator ' ( ( ))j jv nϕ presente no cálculo do gradiente local δj(n) mostrado na Equação

(4.37) depende apenas da função de ativação associada ao neurônio oculto j. O fator restante

envolvido no cálculo, ou seja, o somatório sobre k, depende de dois conjuntos de termos, o

primeiro conjunto, os δk(n), dependem do conhecimento dos sinais de erro ek(n) para todos os

neurônios que se encontram na camada imediatamente a direita do neurônio j e que estão

diretamente conectados a ele. O segundo conjunto de termos, os wkj(n), é formado pelos pesos

sinápticos associados a estas conexões.

Resumindo as relações derivadas para o algoritmo de retropropagação. Primeiro, a

correção aplicada ao peso sináptico conectando o neurônio i ao neurônio j ∆wij(n) é definida

pela regra delta:

( ) ( ) ( )ji j i

Correção Parâmetro da taxa Gradiente Sinal de entradade peso de aprendizagem local do neurônio j

w n n y nη δ

⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟

⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟∆ ⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠

i i (4.38)

Segundo, o gradiente local δj(n) depende da posição do neurônio j na rede:

Se o neurônio j é um nó de saída da rede, δj(n) é igual ao produto da derivada ' ( ( ))j jv nϕ pelo sinal de erro ej(n) associados ao neurônio j como pode ser visto na Equação

(4.27).

Se o neurônio j é um nó oculto da rede, δj(n) é igual ao produto da derivada ' ( ( ))j jv nϕ

pela soma ponderada dos gradientes locais calculados para os neurônios na próxima camada

oculta ou de saída que estão conectados ao neurônio j, como mostrado na Equação (4.37).


48

Taxa de Aprendizagem

O algoritmo de retropropagação fornece uma aproximação para a trajetória no espaço

de pesos calculada pelo método da descida mais íngreme. Quanto menor for o parâmetro da

taxa de aprendizagem η, menor serão as variações dos pesos sinápticos da rede, de uma

iteração para outra, e mais suave será a trajetória no espaço de pesos. Em contra partida, esta

melhoria causa uma taxa de aprendizagem lenta. Por outro lado, se fizermos o parâmetro da

taxa de aprendizagem η muito grande, para acelerar a taxa de aprendizagem, as grandes

modificações nos pesos sinápticos podem fazer com que a rede se torne instável. Um método

simples de aumentar a taxa de aprendizagem evitando a instabilidade é modificar a regra delta,

Equação (4.26), adicionando o termo de momento. Esta nova relação é conhecida como regra

delta generalizada; ela inclui a regra delta da Equação (4.26) para α=0.

( ) ( 1) ( ) ( )ji ji j iw n w n n y nα ηδ∆ = ∆ − + (4.39)

A inclusão do momento no algoritmo de retropropagação tende a acelerar a descida em

direções com declividade constante, e ainda, gera um efeito estabilizador nas direções que

oscilam em sinal. Uma outra vantagem que pode ser obtida no comportamento de

aprendizagem do algoritmo é que o termo de momento pode evitar que o processo de

aprendizagem termine em um mínimo local raso na superfície de erro.

Modos de Treinamento Seqüencial e por Lote

A apresentação completa de um conjunto de dados de treinamento é chamada de

época, como mencionado anteriormente. O processo de aprendizagem é mantido em uma base

de época em época até os pesos sinápticos e os níveis de bias se estabilizarem e o erro médio

quadrado sobre todo o conjunto de treinamento convergir para um valor mínimo. Existem

basicamente duas maneiras de se realizar a aprendizagem por retropropagação.

O modo seqüencial, padrão ou estocástico é um modo de operação onde a atualização

dos pesos sinápticos é realizada após a apresentação de cada exemplo de treinamento. Este é o

modo de apresentação para o qual o algoritmo de retropropagação foi descrito.


49

No modo de treinamento por lote, o ajuste dos pesos sinápticos é realizado apenas

após a apresentação completa de todos os exemplos de treinamento que constituem uma

época.

Do ponto de vista operacional, o modo seqüencial de treinamento é preferível em

relação ao método por lote, porque requer menos armazenamento local para cada conexão

sináptica. O fato dos dados serem apresentados à rede de maneira aleatória e o ajuste dos

pesos ser realizado de padrão em padrão torna a busca no espaço de pesos de natureza

estocástica. Este fato torna menos provável que o algoritmo fique preso em um mínimo local.

Critério de Parada

De maneira geral, não se pode demonstrar que o algoritmo de retropropagação

convergiu e não existem critérios bem definidos para encerrar sua operação. Existem, porém,

critérios particulares, baseados em propriedades únicas de um mínimo local ou global da

superfície de erro. Como os seguintes:

Considera-se que o algoritmo de retropropagação tenha convergido quando a norma euclidiana do vetor

gradiente alcançar um limiar suficientemente pequeno.

ou

Considera-se que o algoritmo de retropropagação tenha convergido quando a taxa absoluta de variação

do erro médio quadrado por época for suficientemente pequena.

Existe ainda, um outro critério de convergência muito útil e teoricamente

fundamentado. Após cada iteração de aprendizagem, a rede é testada pelo seu desempenho de

generalização. O processo de aprendizagem é interrompido quando o desempenho de

generalização da rede for considerado suficiente ou quando for observado que este

desempenho atingiu o máximo.


50


Este capítulo apresentou as redes neurais como ferramenta para a classificação de

padrões. Os conceitos básicos de funcionamento dos neurônios foram abordados, bem como

uma breve descrição de algumas funções de ativação utilizadas na modelagem dos neurônios

artificiais. Em seguida, a organização dos neurônios para a formação das redes, que podem

apresentar diferentes arquiteturas também foi considerada, observando o fluxo de sinal através

da rede.

Caminhando em direção à classificação de padrões, os perceptrons foram abordados,

partindo do perceptron de camada única até a descrição do perceptron de múltiplas camadas.

Em seguida, a derivação do importante algoritmo de retropropagação foi apresentada com o

objetivo de tornar conhecida a nomenclatura utilizada durante o treinamento do perceptron de

múltiplas camadas, e ainda, apresentar os padrões de ajuste do algoritmo como a taxa de

aprendizagem e o momento, que é introduzido na regra delta generalizada. Algumas

implicações do ajuste destes parâmetros foram apresentadas com o intuito de permitir que o

leitor adquira a sensibilidade mínima necessária para compreender o funcionamento da rede

durante o processo de treinamento com o algoritmo de retropropagação.

De um modo geral, o capítulo fez uma apresentação da ferramenta que será utilizada

nos próximos capítulos, em conjunto com o Detector de Eventos, já descrito no capítulo 3,

para a classificação dos eventos de qualidade de energia propriamente ditos.

Capítulo 5

Geração de dados

5.1 Introdução

O presente capítulo trata da modelagem dos fenômenos elétricos abordados neste

trabalho como eventos de qualidade de energia. Serão apresentadas as considerações feitas no

que diz respeito à geração dos bancos de eventos utilizados para o treinamento da rede neural.

As características reproduzidas dos eventos, bem como os intervalos de variações

previstos para as mesmas serão definidos, assim, este capítulo delimita o escopo do trabalho

em relação à distinção das classes de eventos propostos.

De maneira geral, todos os eventos analisados ocorrem de forma isolada, ou seja, é

considerada apenas a ocorrência de um distúrbio por evento de qualidade de energia a ser

classificado pelo sistema proposto. Os eventos periódicos ou de longa duração, como a

presença de notches, spikes, afundamentos de tensão e sobre-tensão são detectados pelo sistema

como a transição de um regime permanente normal de operação do sistema para um novo

regime permanente considerando a presença dos distúrbios.

Capítulo 5- Geração de dados

52

5.2 Simulação dos eventos de Qualidade de Energia

Os eventos de Qualidade de Energia utilizados durante o desenvolvimento do sistema

de classificação foram todos obtidos de forma sintética. Os eventos abordados no presente

trabalho pertencem a cinco diferentes classes, são elas: eventos oscilatórios, afundamentos

(sags), sobre-tensões (swells), spikes, e notches. A geração de cada tipo de evento considera as

características intrínsecas de cada um destes eventos apontadas na literatura, conforme foi

apresentado no Capítulo 2.

O sistema de detecção foi projetado para trabalhar a uma taxa de amostragem de 256

amostras por ciclo do sinal fundamental do sistema elétrico monitorado, este parâmetro nos

leva a trabalhar com uma freqüência de amostragem de 15360 Hz, que determina um período

de amostragem de 65,1 µs considerando que o sistema em questão é o brasileiro, que opera em

60 Hz. Portanto, todos os eventos apresentados ao sistema de detecção e classificação

contemplam estes parâmetros.

O ambiente considerado para o sistema elétrico analisado prevê uma relação sinal ruído

(SNR) de 30dB, este dado foi considerado constante e comum a todos os eventos simulados.

Com o objetivo de atingir um elevado índice de generalização no processo de classificação, as

características de cada evento foram escolhidas de forma aleatória em intervalos pré-definidos.

Dentro dos intervalos foi considerado que as características deveriam apresentar uma

distribuição uniforme, de maneira e evitar a ocorrência de um maior número de eventos com

alguma característica semelhante.

Uma representação matemática para uma grande variedade de eventos foi apresentada

em [29] e considerada como motivadora do modelo adotado para a geração dos eventos em

questão, esta relação é mostrada na Equação (5.1)

( ) ( ) ( ) ( ) ( )H T IHx n s n s n s n v n= + + + (5.1)

Nesta equação temos uma composição bem abrangente das características de um sinal

elétrico obtido em um sistema elétrico, seja ele de distribuição ou de transmissão de energia. O


53

sinal amostrado x(n) é composto por quatro parcelas que representam as componentes

harmônicas do sinal fundamental SH(n), o comportamento transitório do evento ST(n), as

componentes inter-harmônicas do sinal SIH(n), que não serão abordadas no presente trabalho, e

o ruído de fundo do sistema v(n). Todas estas parcelas podem estar ou não presentes no sinal

elétrico e ao mesmo tempo podem contribuir para a formação do evento com maior ou menor

intensidade.

De posse dessas informações podemos descrever o processo de geração de cada tipo

de evento considerado no trabalho.

Eventos transitórios oscilatórios

Para definição dos dados utilizados na geração do banco de eventos oscilatórios foram

consideradas as características apresentadas no Capítulo 2 e os perfis de onda apresentados em

[30]. De maneira usual, os eventos oscilatórios estão relacionados com o chaveamento de

bancos de capacitores e, sua freqüência de oscilação depende da capacitância do banco que

está sendo conectado ao sistema e da configuração do sistema. A amplitude do evento é

função da amplitude da componente fundamental no momento em que ocorre o chaveamento,

considerando que o banco de capacitores não possui carga inicial no momento em que é

conectado ao sistema e que não temos variação instantânea na tensão dos capacitores,

podemos observar que este fenômeno faz com que a tensão no sistema elétrico tenda a zero

rapidamente no momento do chaveamento do banco de capacitores e, em seguida, apresente

uma breve oscilação na forma de onda de tensão do sistema seguida pela extinção do distúrbio.

A freqüência de oscilação e seu tempo de duração dependem das características de impedância

do sistema.

Os distúrbios causados pelo chaveamento de capacitores em um instante de tempo t,

onde o valor da amplitude da tensão da componente fundamental do sistema é próximo de

zero, não causam grandes perturbações, sendo, portanto, descartados da análise proposta.

Foram considerados apenas os eventos que ocorrem quando o valor da amplitude do sinal

monitorado é superior a 45% de seu valor de pico. Este procedimento delimita a fase de

ocorrência dos eventos em relação à componente fundamental do sistema, como é mostrado


54

na Fig. 5.1.

Fig. 5.1 Regiões onde ocorrem os eventos oscilatórios mais severos.

Na Fig. 5.1 temos a área onde foram simulados os eventos oscilatórios. Em vermelho

temos os pontos da onda fundamental onde sua amplitude apresenta um valor maior que 45%

de seu valor de pico e desta forma causam eventos oscilatórios mais severos. O trecho da

componente fundamental, representado em azul, mostra a região onde não será considerada a

ocorrência de eventos oscilatórios. A fase de ocorrência do evento é selecionada de maneira

aleatória dentro dos intervalos considerados seguindo uma distribuição uniforme, de forma

que não existam pontos dentro dos intervalos onde seja maior a ocorrência dos eventos.

A componente oscilatória do distúrbio é modelada como uma senóide amortecida que

tem como amplitude inicial o valor da componente fundamental no momento em que ocorre o

evento. Uma constante de amortecimento é sorteada a partir de um intervalo de valores que

proporcionam uma duração do evento entre 5 e 10 ms, a distribuição da constante de

amortecimento neste intervalo segue uma distribuição uniforme, que garante que a duração

dos eventos não apresente uma tendência, que seria uma característica específica de um sistema

elétrico particular.

A freqüência de oscilação do evento também é definida de forma aleatória dentro de

um intervalo de valores com distribuição uniforme que varia de 1000 a 2500Hz.

Assim, a modelagem do evento transitório pode ser resumida na Equação (5.2).

0( )1 0 0( ) ( ) ( ( ) ) n n t

T TS n S n sen n n t e αω − −= − (5.2)

onde,


55

S1(n) é o valor da amplitude da componente fundamental na amostra n.

ωT é a freqüência angular de oscilação do evento.

α é a constante de amortecimento para o evento.

n0 é a amostra onde ocorre o início do evento e, finalmente,

t = nT, onde T é o período de amostragem.

Assim, obtemos as parcelas que irão compor o sinal aplicado ao sistema de detecção e

classificação como mostrado na Figura Fig. 5.2.

Fig. 5.2 Composição do sinal de um evento oscilatório.

Em a), temos a representação do fenômeno transitório ST(t), em seguida, em b), vemos

o sinal de ruído de fundo do sistema v(t), e no gráfico c), está representada a componente

fundamental do sistema. No gráfico d), temos a representação do sinal resultante em


56

conformidade com a Equação (5.1) que nada mais é, além da soma das parcelas anteriores.

Este é o sinal correspondente a um evento oscilatório apresentado ao sistema de detecção e

classificação de eventos.

Eventos de afundamento de tensão (sags) e sobre-tensão (swells)

Os eventos de afundamento de tensão e sobre-tensão são modelados de forma

semelhante. Observando as características destes eventos apresentadas no Capítulo 2, foi

definido que a variação da amplitude da componente fundamental do sistema elétrico sob

monitoração pode ser de 10 a 90% em relação a seu valor nominal para os eventos de

afundamento de tensão e de 110 a 180% nos eventos de sobre-tensão. O valor da variação é,

portanto, sorteado de maneira aleatória para cada evento dentro deste intervalo, considerando

que a distribuição estatística destes valores seja uniforme dentro do mesmo.

Estes eventos serão considerados eventos de duração superior a 10 ciclos do sinal

fundamental monitorado, assim, o sistema de detecção deverá apontar apenas o momento em

que ocorre a variação de amplitude no sinal monitorado como sendo a ocorrência do evento.

A transição do valor da amplitude nominal para o novo valor em virtude da ocorrência

do evento se dá de forma linear em um período considerado constante de ¼ do período do

sinal fundamental do sistema elétrico, conforme a Equação (5.3).

14

V variação da amplitudet do período da fundamental

∆=

∆ (5.3)

Considerando a Equação (5.1), temos que a formação destes eventos será composta de

apenas duas parcelas, a parcela referente ao ruído de fundo do sistema v e a componente

fundamental do sistema S1 que terá sua amplitude alterada no momento em que ocorre o

evento.

Na Fig. 5.3 temos a representação das parcelas que formam um evento de

afundamento de tensão. Em a), temos o sinal S1, que mostra a componente fundamental do

sistema que sofre uma alteração em seu valor de amplitude no momento do evento. Em


57

seguida, temos a variação da amplitude em função do tempo A(t), em b). A parcela referente

ao ruído de fundo do sistema, v, é mostrada no gráfico c) e, finalmente, temos a composição

total do sinal x, ilustrado no gráfico d).

Fig. 5.3. Composição de um evento de afundamento de tensão (sag).

O mesmo procedimento é utilizado para a geração dos eventos de sobre-tensão. Os

parâmetros relativos ao sinal de ruído e taxa de variação da amplitude da componente

fundamental ∆V/∆t, definida na Equação (5.3) são considerados os mesmos, tanto para os

eventos de afundamento de tensão como para os eventos de sobre-tensão, apenas o intervalo

de variação da amplitude é alterado, em concordância com os dados apresentados no Capítulo

2 o intervalo de variação da amplitude considerado para os eventos de sobre-tensão vai de 10 a

90% de elevação da amplitude do sinal fundamental do sistema.

A Fig. 5.4 apresenta a constituição do evento de sobre-tensão de forma semelhante à

mostrada para o evento de afundamento.


58

Fig. 5.4. Composição de um evento de sobre-tensão (swell).

Um último ponto a ser considerado na simulação destes eventos é que a fase onde eles

ocorrem em relação ao sinal da componente fundamental é também escolhida de forma

aleatória em um intervalo que vai de -π a π, com distribuição uniforme. Assim, estes eventos

podem ocorrer em qualquer ponto, ao contrário dos eventos oscilatórios, que só foram

considerados em determinados trechos da forma de onda da componente fundamental.

Normalmente, durante a ocorrência de um sag ou swell, estes são acompanhados por um

fenômeno conhecido como phase jump, que é uma variação no ângulo de fase da componente

fundamental do sistema elétrico. Este comportamento, porém, não será abordado no presente

trabalho.

Presença de spikes

O evento definido como a presença de spikes na componente fundamental do sistema

elétrico foi considerado inicialmente em [13] onde o autor emprega a Transformada S

combinada com lógica fuzzy para realizar sua classificação.


59

Este fenômeno se manifesta de forma periódica no sinal monitorado e, no presente

trabalho, é considerado que o mesmo se inicia e passa a ocorrer em regime permanente no

sistema.

A modelagem adotada do evento considera que o mesmo ocorre apenas em pontos

onde o módulo da amplitude do sinal seja superior a 60% de seu valor nominal, delimitando,

assim, a fase de ocorrência do evento em relação à componente fundamental do sistema. Da

mesma forma como foi apresentado para os eventos oscilatórios, a Fig. 5.5 mostra em

vermelho as regiões onde serão considerados os spikes, ou seja, |S1| > 60% do valor nominal

da componente fundamental, e, em azul, temos as regiões onde a presença de spikes não será

considerada.

Fig. 5.5. Regiões onde ocorrem os spikes.

Assim como nos eventos oscilatórios, a amplitude dos spikes é função do valor da

amplitude da componente fundamental no ponto onde o mesmo ocorre. Este valor é definido

como sendo 50% do valor da amplitude da componente fundamental.

A modelagem do evento é feita de forma que haja uma elevação linear do valor da

amplitude, distribuída em um intervalo de tempo considerado constante e igual a 0,65ms, que

corresponde a 10 amostras e, em seguida, uma redução também linear de mesma duração que

faz com que a amplitude da componente fundamental retorne ao seu valor nominal. Este

procedimento passa a ser repetido de maneira periódica na mesma freqüência do sinal

monitorado.

O resultado desta modelagem, bem como as parcelas que compõem o evento são

mostrados na Fig. 5.6, onde temos: em (a), a componente fundamental do sistema elétrico, em


60

(b), a amplitude dos spikes gerados, em (c), a parcela correspondente ao ruído de fundo do

sistema e, finalmente, em (d) o resultado final da modelagem do evento. A

mpl

itude

pu

Am

plitu

de p

uAm

plitu

de p

uAm

plitu

de p

u

xv

S TS 1

Fig. 5.6. Composição do evento spike.

Presença de notches

A presença de notches no sistema elétrico está relacionada com a operação normal de

cargas chaveadas, como mostrado no Capítulo 2. A modelagem deste evento é feita de forma

semelhante à adotada para os eventos oscilatórios. Os notches são modelados como fenômenos

oscilatórios de curta duração que ocorrem de maneira periódica no sistema elétrico. Mais uma

vez, a amplitude do distúrbio depende da amplitude da componente fundamental do sistema.

A duração de cada notch simulado é de 0,52 ms, que corresponde a 8 amostras do sinal gerado.

Dentro deste intervalo de tempo o evento é modelado através da Equação (5.4).

0( )1 0 0( ) 0.7 ( ) ( ( ) ) n n t

T TS n S n sen n n t e αω − −= − − (5.4)


61

Como pode ser observado, a Equação (5.4) é a mesma Equação (5.2) exceto pela

presença do termo 0,7, que tem a função de limitar a amplitude inicial do notch em 70% do

valor da amplitude do sinal do sistema no momento em que ocorre o distúrbio. Outra

diferença é o sinal negativo no valor da amplitude do evento, este sinal tem como objetivo

fazer com que o início do notch sempre seja uma variação de tensão em direção a 0, como

descrito em [1]. A freqüência angular de oscilação ωT é correspondente a uma freqüência de 3

KHz e é mantida fixa para todos os eventos gerados. A constante de amortecimento α é

definida de forma que o notch ocorra em um período de tempo de 0,52 ms.

A amostra de início do evento n0 no caso do notch é alterada de forma a gerar um efeito

periódico do evento, assim, podemos definir o número de notches por ciclo da componente

fundamental do sistema. A Fig. 5.7 ilustra um evento notch simulado onde ocorrem 6 notches por

ciclo, que normalmente é resultado da operação de conversores trifásicos.

Fig. 5.7. Composição do evento notch.


62

Na Fig. 5.7 temos as parcelas que compõem os eventos notches tratados neste trabalho.

Em a), temos o sinal da componente fundamental do sistema S1, em b) temos a representação

do evento ST ao longo do tempo, o gráfico c) mostra a parcela referente ao ruído de fundo do

sistema ,v, e, o sinal x resultante é mostrado em d).

Eventos harmônicos

Os eventos harmônicos abordados no presente trabalho são formados a partir da

escolha de forma aleatória do valor da amplitude de cada componente harmônica desde o

segundo até o sétimo harmônico. Todas as amplitudes podem variar em um intervalo que vai

de 0 a 20% do valor da componente fundamental do sistema (S1), este intervalo apresenta uma

distribuição estatística uniforme para todas as componentes.

Após a definição do valor da amplitude para cada componente harmônica é

especificado um valor de fase, também sorteado em um intervalo que vai de -π a π com

distribuição uniforme.

Todas as componentes são adicionadas ao sistema simultaneamente no momento onde

ocorre o evento n0. Durante os primeiros 0,65 ms de ocorrência do evento o valor da

amplitude de cada componente harmônica é incrementado de forma linear, partindo de 0, até

que os mesmos atinjam os valores pré-estabelecidos. Assim, após os primeiros 0,65 ms as

componentes harmônicas adicionadas ao sinal fundamental do sistema apresentarão seus

valores nominais para cada evento gerado.

A Fig. 5.8 ilustra a composição dos eventos harmônicos, na coluna à esquerda, temos a

representação das formas de onda de cada harmônico do sinal, e na coluna à direita temos a

variação de amplitude de cada componente harmônica no momento em que ocorre o evento.

Pode se observar que o sinal fundamental do sistema, S1, permanece constante durante

toda a geração do evento. Através do processo utilizado para determinar o valor de amplitude

de cada componente harmônica de forma aleatória, podemos ter uma infinidade de

combinações harmônicas (S2, S3, S4, S5, S6, S7) para formar o sinal resultante e até mesmo a


63

ausência de alguma componente cuja amplitude tenha sido definida como 0.

0.26 0.28 0.3 0.32

-1

0

1

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.320

0.5

1

1.5

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.32

-0.2

0

0.2

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

0.26 0.28 0.3 0.32-0.1

0

0.1

0.2

Ampl

itude

pu

Tempo s

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Am

plitu

de p

u

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Ampl

itude

pu

Am

plitu

de p

u

Tempo s

S 1S 2

S 3S 4

S 5S 6

S 7

Fig. 5.8. Composição dos eventos harmônicos.

Os valores das amplitudes das componentes harmônicas definidos para a composição

do evento ilustrado na Fig. 5.8 foram: S2 = 0,17 pu, S3 = 0,11 pu, S4 = 0,09 pu, S5 = 0,18 pu, S6

= 0,16 pu, e S7 = 0,12 pu. Todas estas componentes foram injetadas no sistema a partir do


64

instante t = 0,288 s.

Como foi considerado para os eventos anteriores, além de todas as parcelas referentes

a cada componente harmônica gerada para a composição do evento, ainda temos o ruído de

fundo do sistema, (v), e, finalmente, o sinal resultante, (x), da modelagem proposta para os

eventos harmônicos, que são mostrados na Fig. 5.9.

Fig. 5.9. Ruído de fundo e composição final do evento harmônico.

5.3 Formação dos bancos de dados

Ao gerar os eventos de acordo com o procedimento discutido na seção 5.2, obtém-se

um grande volume de dados para cada evento simulado. Este volume de dados é necessário

para que seja possível aplicar o sinal contendo o evento simulado ao Detector de Evento –

DE, de modo que o algoritmo seja capaz de entrar em regime de operação, após o transitório

inicial de seus filtros e, em seguida, realizar a detecção do evento e retornar ao sistema de

monitoramento do sinal em regime permanente. Desta forma, cada conjunto de dados

referente a um evento simulado é composto por um sinal que representa 4 ciclos da

componente fundamental de um sistema elétrico que opere em 60 Hz, este fato nos leva a

trabalhar com um volume de 10240 amostras de sinal para cada evento gerado.

No entanto, cada evento é aplicado ao algoritmo DE, o qual, detecta e armazena


65

janelas de dados de 1024 amostras, referentes a 4 ciclos da componente fundamental do

sistema que contém apenas o momento onde ocorre o distúrbio, conforme foi mostrado no

Capítulo 3. Assim, após a geração e detecção dos eventos, temos como resultado duas janelas

de dados que serão armazenadas para serem utilizadas pela etapa seguinte do processo de

classificação, uma janela contendo o próprio sinal monitorado e uma janela que contém o sinal

de erro referente ao momento onde ocorre o distúrbio, conforme foi mostrado no Capítulo 3.

A Fig. 5.10 ilustra um conjunto típico de pares de janelas produzidas pela detecção dos vários

tipos de eventos apresentados anteriormente.

Fig. 5.10. Janelas de dados armazenadas pelo Detector de Eventos – DE.


66

Na Fig. 5.10 temos, em azul, as janelas dos sinais simulados e detectados pelo

algoritmo DE que contêm os quatro ciclos da componente fundamental no momento em que

ocorre o evento. Em vermelho, temos as janelas armazenadas com o sinal de erro dos

respectivos eventos. Estas janelas são o resultado da detecção dos seguintes eventos:

oscilatórios em a), afundamento de tensão em b), sobre-tensão em c), spikes em d), notches em e)

e, finalmente, harmônicos em f).

Inicialmente, para cada tipo de evento considerado foram realizadas 500 detecções, que

geraram um banco de dados contendo 500 janelas de sinal monitorado e 500 janelas com os

respectivos sinais de erro para cada tipo de evento. Estes dados foram armazenados e, como

será visto adiante, serão utilizados no processo de treinamento da rede neural que realizará a

classificação dos eventos.


Este capítulo apresentou a forma como foram modelados e gerados os eventos de

qualidade de energia que serão utilizados no processo de treinamento da rede neural

empregada na classificação dos eventos propostos. Aspectos importantes da modelagem dos

eventos foram definidos, como nos casos onde os eventos ocorrem apenas em determinados

intervalos de amplitude da componente fundamental.

As características de modelagem dos eventos delimitam o escopo do trabalho no que

se refere à capacidade de realizar a classificação dos eventos de qualidade de energia. No

estágio atual, o trabalho se propõe a reconhecer os eventos apresentados, porém, qualquer

outro tipo de evento pode ser modelado, com maior ou menor fidelidade ao comportamento

real do distúrbio elétrico relacionado e ser aplicado ao sistema.

De maneira geral, como será visto posteriormente, o resultado principal produzido pela

etapa de detecção dos eventos são as janelas de erro, que serão efetivamente empregadas no

processo de classificação.

Capítulo 6

Sistema de Classificação

6.1 Introdução

Neste capítulo será apresentada a técnica proposta para realizar a classificação dos

eventos de qualidade de energia com base no sinal de erro obtido do processo de detecção dos

eventos. Um dos objetivos do presente trabalho é avaliar a capacidade do sinal de erro, obtido

com o algoritmo DE de levar consigo informações que possam ser relevantes em um sistema

de classificação de eventos baseado em rede neural. Serão discutidas, também, algumas

características do sinal de erro, que se revelaram como sendo facilitadoras do pré-

processamento utilizado em conjunto com o classificador neural. A Fig. 6.1 mostra um

diagrama de blocos que ilustra o fluxo de sinal através do sistema de detecção e classificação de

eventos de qualidade de energia.

Fig. 6.1. Fluxo de sinal no sistema de detecção e classificação de eventos.

Em especial, o presente capítulo trata dos blocos de Pré-processamento e Classificador

Neural, assim como das conexões entre estes blocos e os seus antecedentes.

Capítulo 6- Sistema de Classificação

68

6.2 O pré-processamento

Como foi mostrado anteriormente, temos duas janelas de dados armazenadas para cada

evento detectado. Cada uma destas janelas apresenta suas próprias características, portanto,

devemos considerar qual das janelas melhor se ajusta ao processo de classificação proposto,

assim, temos duas condições a analisar.

Janelas de dados do sinal monitorado

As janelas de dados do sinal monitorado, conforme foram apresentadas no capítulo

anterior, trazem consigo uma grande quantidade de informações que podem ser utilizadas

tanto para a classificação como para a análise do evento ocorrido. É fácil perceber que a janela

de sinal monitorado contém uma parcela de energia referente ao sinal da componente

fundamental do sistema monitorado 60 Hz, este fato faz com que a energia relativa ao

distúrbio propriamente dito em alguns casos não seja uma parcela significativa da energia total

do sinal contido na janela. Assim, acredita-se que a capacidade de extrair detalhes sobre o

evento ocorrido a partir da janela do sinal monitorado utilizando-se um classificador neural é

prejudicada. Um outro fato muito importante para a utilização do classificador neural é o

alinhamento dos eventos. Nas janelas de sinal monitorado este alinhamento não é facilmente

obtido, o que compromete o desempenho da rede neural.

Janelas de sinal de erro

Seguindo a proposta inicial do trabalho, que seria investigar a viabilidade de se

classificar os eventos de qualidade de energia com base no sinal de erro obtido do algoritmo

DE, podemos observar que a energia contida na janela do sinal de erro armazenado é referente

ao próprio evento mais a parcela do ruído de fundo do sistema. Desta forma, a maior parte da

energia contida na janela normalmente se refere ao próprio distúrbio, ao contrário da janela do

sinal monitorado. Outro aspecto importante sobre a janela do sinal de erro é a facilidade para

se obter o alinhamento dos eventos a serem aplicados à rede neural. Estas características fazem

da janela do sinal de erro armazenado uma opção interessante para realizar a classificação do

evento através do classificador neural.


69

Partindo da janela de sinal de erro armazenada, a próxima etapa no processo de

classificação é o alinhamento dos eventos. O alinhamento dos eventos tem como objetivo

fazer com que todos os eventos apresentados à rede neural tenham seu início no mesmo ponto

da janela. Como pode ser observado na Fig. 5.10, devido às características de funcionamento

do algoritmo DE, todos os eventos detectados apresentam seu início na primeira metade da

janela armazenada, mas este fato não é suficiente para o propósito desejado.

O processo de alinhamento é feito submetendo-se a janela de erro a um filtro média

móvel de ordem 10 e, logo em seguida, comparando a saída do filtro a um limiar pré

estabelecido. O primeiro ponto onde o módulo da amostra de saída do filtro é maior que o

valor do limiar estabelecido fica caracterizado como o início do evento dentro da janela. A Fig.

6.2 ilustra o método de detecção do início do evento dentro da janela de erro.

Fig. 6.2 Processo de identificação do início do evento.

Na Fig. 6.2-a, temos uma janela típica de sinal de erro armazenada em virtude da

ocorrência de um evento oscilatório. Na Fig. 6.2-b temos a representação da janela após o

processo de filtragem, em vermelho estão representados os limites de detecção do início do

evento. O limite de detecção do início é determinado de forma empírica considerando a

amplitude do ruído de fundo adotado durante a simulação, a amplitude dos eventos e o


70

número de coeficientes do filtro utilizado. Para os eventos simulados o valor do limite de

detecção foi de 0,05 pu.

No exemplo ilustrado na Fig. 6.2 o início do evento é detectado na amostra número

355, que tem um valor de -0,0507, conforme destacado na figura.

Após a identificação do índice da amostra onde o evento se inicia o passo seguinte é o

truncamento da janela, este procedimento é realizado com o objetivo de reduzir a quantidade

de informação redundante que possa estar contida na janela armazenada. O truncamento

ocorre 512 amostras após o início do evento. Este truncamento é mostrado na Fig. 6.3.

Fig. 6.3. Truncamento da janela de erro.

Na Fig. 6.3-a temos a região destacada pelo processo de truncamento realizado na

janela e, na Fig. 6.3-b podemos observar a nova janela obtida, formada por 512 amostras da

janela original. Estas 512 amostras representam 2 ciclos do sinal do sistema monitorado, em

especial, o sinal de erro exatamente no início do distúrbio.

Após o truncamento da janela, ainda temos 512 amostras que contém as características

referentes ao evento detectado. Este ainda é um número elevado de amostras para ser aplicado


71

ao classificador neural, demandando uma rede complexa e a elevada complexidade

computacional para realizar a classificação.

A alternativa adotada para reduzir ainda mais o número de amostras do sinal de erro a

ser apresentado ao classificador foi a realização de uma sub-amostragem da janela de 512

amostras obtida após o processo de truncamento.

Ainda que a sub-amostragem da janela implique em um comprometimento das

características de freqüência do sinal original, introduzindo aliasing ao mesmo, é observado que,

para o objetivo de realizar a classificação do evento ocorrido, este procedimento não prejudica

a capacidade da rede neural de extrair características dos eventos e, conseqüentemente, sua

habilidade de diferenciar os tipos de eventos abordados no presente trabalho.

Uma análise experimental de alguns possíveis fatores de sub-amostragem apontou para

um fator de sub-amostragem 8, que apresentou uma boa relação entre o esforço

computacional da rede utilizada e seu desempenho na classificação. Assim, após o truncamento

da janela do sinal de erro em um janela menor, contendo 512 amostras, esta é sub-amostrada

por um fator 8, resultando em uma janela de 64 amostras do sinal de erro, que efetivamente

representa as características de dois ciclos do sinal monitorado a partir do momento onde

ocorre o início do distúrbio.

Com o objetivo de garantir que a amplitude do sinal contido em cada janela esteja

dentro de um mesmo intervalo de valores para todos os eventos detectados, a janela de sinal de

erro, que será aplicada à rede, passa por um processo de normalização da amplitude, que faz

com que o módulo do valor máximo do sinal contido nas janelas de qualquer tipo de evento

seja igual a 1. Matematicamente a normalização é expressa por:

max

( )( ) =ne ne ne

(6.1)

onde,


72

( )ne n é o sinal normalizado, ( )e n é o sinal de erro após o alinhamento e o

truncamento da janela do sinal de erro e,

( )max0,1... 1

( )maxn L

e e n= −

= (6.2)

O perfil das janelas obtidas por este processo para cada tipo de evento analisado é

mostrado na Fig. 6.4. Em (a) temos a janela referente a um evento oscilatório, em (b) e em (c)

temos as janelas correspondentes aos eventos de sub-tensão e sobre-tensão, em (d) está a

janela produzida pela detecção de um evento spike e, finalmente, em e) e f) estão representadas

as janelas relativas aos eventos notch e harmônicos respectivamente.

Fig. 6.4. Perfil das janelas apresentadas à rede neural.

Podemos observar na Fig. 6.4 que os eventos de sobre-tensão (sag) e sub-tensão (swell)

produzem janelas semelhantes para o classificador neural. Este fato aumenta a dificuldade para

a rede neural distinguir entre estas duas classes de eventos.

Considerando que os dois tipos de eventos têm natureza semelhante, inicialmente,


73

ambos serão considerados como pertencentes à mesma classe. Desta forma, o classificador

neural terá a função de reconhecer cinco classes de eventos: eventos oscilatórios, eventos de

sobre-tensão ou sub-tensão (sag/swell), spikes, notches e presença de harmônicos.

6.3 O Classificador Neural

De posse das informações apresentadas anteriormente, resta definir a estrutura do

classificador neural utilizado no sistema proposto. As janelas mostradas na Fig. 6.4 são tratadas

como o sinal de entrada de uma rede neural perceptron multicamadas com uma camada oculta

e uma camada de saída que realiza a classificação do evento ocorrido. Na Fig. 6.5 temos um

diagrama de blocos que ilustra o fluxo de sinal através do classificador neural.

Fig. 6.5. Diagrama de blocos do fluxo de sinal através do classificador neural.

O sinal de entrada do perceptron é obtido das janelas do sinal de erro pré-processado.

Como foi mostrado anteriormente, estas janelas são compostas de 64 amostras, que formam a

camada de entrada (neurônios fonte) do perceptron.

A camada oculta da rede tem seu número de neurônios definido de forma

experimental durante o processo de treinamento, conforme será mostrado adiante e,

finalmente, a camada de saída é composta de um neurônio para cada classe de evento. Cada


74

neurônio da camada de saída será responsável pela identificação de uma classe de evento.

A função de ativação ϕ(⋅) empregada pelos neurônios, tanto na camada de entrada

como na camada de saída é a tangente sigmóide, que tem um intervalo de resposta entre -1 e 1.

A rede é, ainda, totalmente conectada, o que significa que todos os neurônios de uma camada

possuem sinapses que os conectam a todos os neurônios da camada seguinte. Outra

característica importante é que a estrutura empregada não possui laços de realimentação, ou

seja, é uma rede alimentada adiante (feedforward).

6.3.1 Treinamento da rede neural

O treinamento da rede MLP é realizado com base no algoritmo de retropropagação

apresentado no Capítulo 4. Para realizar o treinamento, foi criado um banco de dados com

eventos modelados de acordo com o procedimento introduzido no Capítulo 5. Este banco é

composto de 100 eventos pertencentes a cada uma das 5 classes analisadas: oscilatórios, sub-

tensão (sag) ou sobre-tensão (swell), spikes, notches e presença de harmônicos. Este conjunto de

eventos foi dividido em dois grupos com finalidades distintas, o grupo de treinamento,

composto de 60 eventos de cada classe foi utilizado como padrão de treinamento para a rede,

enquanto o segundo grupo, chamado de grupo de teste, formado pelos 40 eventos restantes de

cada classe, foi utilizado para avaliar a característica de generalização da rede após a

apresentação de um determinado número de épocas de treinamento.

Os padrões de saída utilizados no treinamento foram definidos de forma que o vetor

de saída da rede apresentasse o valor +1 apenas no neurônio que representa a classe do evento

aplicado à rede e os demais neurônios da camada de saída indicassem o valor -1. Assim, temos

os padrões de saída conforme apresentados na Tabela 6.1.


75

Tabela 6.1 - Padrões de Saída

Padrões de Saída Evento Correspondente [+1 -1 -1 -1 -1]T Oscilatório [-1 +1 -1 -1 -1]T Sub-tensão ou sobre-tensão[-1 -1 +1 -1 -1]T Spikes [-1 -1 -1 +1 -1]T Notches [-1 -1 -1 -1 +1]T Harmônicos

Com base no vetor de saída da rede, é realizado um processo de decisão para se obter a

classe a qual pertence o evento aplicado à rede. Considerando que os valores obtidos nos

neurônios da camada de saída da rede podem variar de -1 a +1, é adotado como resposta da

rede o maior valor encontrado no vetor de saída, onde cada linha do vetor de saída representa

uma classe de eventos.

Assim, a decisão é feita com base na Equação (6.3).

max( )i = o (6.3)

onde, o é o vetor de saída da rede e i representa o índice da linha que contém o valor máximo

de o. A Tabela 6.2 representa o evento classificado em função de i.

Tabela 6.2 - Eventos Classificados em função de i

Eventos Classificados i

( Eq. 6.3)Oscilatório 1 Sub-tensão ou sobre-tensão 2 Spikes 3 Notches 4 Harmônicos 5

A ferramenta utilizada para o treinamento da rede é baseada no algoritmo de

retropropagação e considera o gradiente descendente com momento para atualizar os pesos

sinápticos e os valores de bias da rede como será visto adiante.

Considerando a regra delta, apresentada no Capítulo 4, na Equação (4.25), e por


76

conveniência reescrita aqui:

( )( )( )nw n =

w nξη ∂

∆ −∂

(6.4)

onde η é o parâmetro da taxa de aprendizagem do algoritmo de retropropagação. O sinal

negativo indica a descida do gradiente no espaço de pesos (buscando uma direção na mudança

de peso que reduza o valor de ξ(n)). Lembrando, ainda, que ξ(n) é a energia total do erro,

conforme descrito no Capítulo 4. Temos, simplesmente, a atualização dos valores dos pesos e

bias da rede através do algoritmo de retropropagação seguindo apenas o gradiente descendente.

Para promover o treinamento da rede considerando também o momento, a equação

que fornece a atualização dos valores de bias e pesos é alterada para:

( )( ) ( 1) (1 )( )

ξη ∂∆ ⋅∆ − + −

∂nw n = m w n m

w n (6.5)

onde, além das variáveis definidas para a Regra Delta, temos a constante de momento m e o

termo ∆w(n-1) que representa o último ajuste realizado nos pesos sinápticos. Ainda que esta

expressão esteja definida para se obter os ajustes dos valores dos pesos sinápticos da rede (w),

esta é derivada de forma idêntica para os ajustes dos valores de bias.

A inclusão do termo de momento no algoritmo de retropropagação conforme

mostrado na Equação (6.5) prevê uma formação do valor de ajuste dos pesos e bias composta

de dois termos, um referente ao gradiente descendente e outro referente ao momento

considerado. O valor da constante de momento m é definido no intervalo de 0 a 1. Ao

especificarmos uma constante de momento m igual a 0, temos a atualização dos valores dos

pesos e bias simplesmente através do termo referente ao gradiente. Quando o valor da

constante de momento é definido como 1, temos a atualização dos valores dos pesos e bias

igual à última atualização realizada.

A contribuição da constante de momento no algoritmo de retropropagação, é fazer


77

com que a atualização dos pesos e bias não seja feita apenas em função do gradiente, mas

considere também a tendência da atualização realizada na interação anterior. Agindo como um

filtro passa baixa, o momento faz com que a rede não responda a pequenas variações na

superfície de erro, evitando, assim, que o treinamento fique preso a um mínimo local na

superfície de erro.

Inicialmente, quando a rede é criada, os valores dos pesos w e dos bias de cada camada

são inicializados pelo método de Nguyen-Widrow, que gera valores iniciais de pesos e bias de

maneira que as regiões ativas dos neurônios sejam distribuídas de forma uniforme através do

espaço de entrada da rede. Este método de inicialização dos valores dos pesos e bias da rede

diminui a perda de neurônios no processo de treinamento, já que todos os neurônios estão no

espaço de entrada da rede, e ainda, acelera o processo de treinamento, considerando que cada

área do espaço de entrada possui neurônios em suas regiões ativas.

A princípio, o critério de parada utilizado durante a fase de treinamento da rede

considera apenas o número de épocas de treinamento aplicadas à rede. O objetivo desta fase

do processo é definir o número de neurônios da camada intermediária da rede. O critério de

avaliação de desempenho é baseado na análise da capacidade de generalização da rede

apresentada sobre o grupo de eventos de teste para cada classe.

Ao fim de cada conjunto de épocas aplicado à rede durante o treinamento, a eficiência

da classificação sobre o conjunto de treinamento e a capacidade de generalização da rede sobre

o grupo de teste, são calculados como a eficiência específica para cada classe e a eficiência

global da rede na classificação.

A eficiência global da classificação é obtida por meio da média da eficiência alcançada

em cada classe, a eficiência global (efglobal) em porcentagem fica, então, definida como:

1

1 100N

global nn

ef efN =

= ⋅∑ (6.6)

onde N é o número total de classes reconhecidas pela rede e efn é a eficiência alcançada para

cada classe de eventos n. Os valores de eficiência de classificação para cada classe (efn) é obtido


78

pela Equação (6.7).

cn

T

nefn

= (6.7)

onde, nc representa o número de eventos corretamente classificados pela rede e nT o número

total de eventos da mesma classe aplicados à rede.

Lembrando que a cada inicialização da rede, novos valores são definidos para os pesos

e bias da mesma, este procedimento influencia diretamente no desempenho alcançada por cada

rede após o treinamento. Para termos uma visão mais precisa do desempenho de uma rede

com determinado número de neurônios em sua camada intermediaria é necessário repetir o

processo de treinamento para um número significativo de redes com a mesma arquitetura e

inicializadas diferentemente para obtermos um desempenho médio das redes com uma mesma

característica. Este foi o procedimento utilizado para definir o número de neurônios da camada

intermediária da rede, como será descrito a seguir.

1ª Aproximação – reconhecimento de 4 classes de eventos

O processo conforme descrito anteriormente foi aplicado inicialmente, a uma rede

destinada à classificação de 4 tipos de eventos. Durante o processo de definição do número de

neurônios o algoritmo de treinamento é utilizado com os seguintes parâmetros de

configuração:

• Número de neurônios da camada de entrada (nós fonte) = 64

• Número de neurônios da camada intermediária = variável

• Número de neurônios da camada de saída = 4

• Função de ativação de todos os neurônios que realizam processamento na rede

= tangente sigmóide.

• Termo de momento m constante = 0,5

• Número de épocas por treinamento = 10

• Número de treinamentos realizados por rede = 200


79

• Número de redes inicializadas e treinadas = 40

• Índices das classes classificadas no vetor de saída da rede: i=1 Eventos

oscilatórios, i=2 Sub-tensão e sobre-tensão, i=3 Spikes, i=4 Notches

Aplicando a metodologia proposta, são obtidos os valores médios de desempenho das

redes, que irão apontar um número razoável de neurônios que seja capaz de desempenhar a

tarefa de classificação dos eventos com uma eficiência satisfatória.

A Fig. 6.6 mostra a evolução média da capacidade da rede em reconhecer os padrões

pertencentes ao grupo de treinamento durante o processo de treinamento

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

OscilatorioSag / Swell

SpikeNotch

(a)5

neurônios

(b)6

neurônios

(c)7

neurônios

(d)8

neurônios

(e)9

neurônios

(f)10

neurônios

(j)14

neurônios

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

(g)11

neurônios

(h)12

neurônios

(i)13

neurônios

(k)15

neurônios

Legenda

Número de treinamentos realizados

Fig. 6.6 Evolução do reconhecimento dos padrões do conjunto de dados de treinamento em [%] em

função do número de treinamentos realizados e do número de neurônios da camada intermediária.

Cada gráfico apresenta a média obtida entre as 40 redes inicializadas com valores de

pesos e bias distintos e treinadas obedecendo aos mesmos critérios. Apenas o número de

neurônios da camada intermediária é alterado de gráfico para gráfico.


80

Ao fim dos duzentos treinamentos realizados, é possível observar que as redes que

possuem 10 neurônios na camada intermediária, Fig. 6.6 (f), alcançaram uma maior

homogeneidade de desempenho entre as classes consideradas, este é um fato importante que

mostra que o treinamento foi eficaz para todas as classes, ou seja, a habilidade da rede em

reconhecer as classes foi adquirida para todas as classes, ao contrário do que pode ser

observado nas redes que utilizaram 13 neurônios em suas camadas intermediárias, Fig. 6.6 (i),

onde a classe de eventos notch permaneceu saturada em um nível de eficiência menor em

relação às demais classes. A Fig. 6.7 mostra a evolução média da capacidade da rede em

reconhecer os padrões pertencentes ao grupo de teste durante o processo de treinamento.

OscilatorioSag / Swell

SpikeNotch

(a)5

neurônios

(b)6

neurônios

(c)7

neurônios

(d)8

neurônios

(e)9

neurônios

(f)10

neurônios

(j)14

neurônios

(g)11

neurônios

(h)12

neurônios

(i)13

neurônios

(k)15

neurônios

Legenda

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

Fig. 6.7. Evolução da generalização da rede em [%], observada no grupo de teste em função do número

de treinamentos realizados e do número de neurônios da camada intermediária.

Este processo avalia o desempenho da generalização da rede. Cada gráfico apresenta a

média obtida entre as 40 redes inicializadas com valores de pesos e bias distintos e treinadas

obedecendo aos mesmos critérios. Apenas o número de neurônios da camada intermediária é


81

alterado de gráfico para gráfico

Mais uma vez, as redes com 10 neurônios na camada intermediária, Fig. 6.7 (f),

apresentaram um melhor desempenho no que diz respeito à pequena diferença obtida entre as

eficiências atingidas para cada uma das 4 classes. Este fato revela uma capacidade de

generalização uniforme para todas as classes observadas, ao contrário do que pode ser

observado para as redes com 15 neurônios na camada intermediária, cujo resultado é

apresentado na Fig. 6.7 (k), onde, o desempenho de generalização obtido para a classe notch foi

inferior ao encontrado para as demais classes.

Um resumo do estudo do desempenho das redes para classificação de 4 classes é

apresentado na Fig. 6.8.

Fig. 6.8. Desempenho médio global de classificação em função do número de neurônios da camada

intermediária.


82

No gráfico (a) temos a média de identificação correta alcançada para cada classe no

grupo de treinamento, em (b) está representado o valor médio de identificação correta

alcançado no grupo de teste, e, finalmente, em (c) temos a média dos resultados apresentados

em (b), que mostram a capacidade de generalização adquirida pela rede. Todos estes resultados

são mostrados em função do número de neurônios da camada intermediária.

A partir da avaliação dos dados apresentados na Fig. 6.8 podemos observar que as

redes com 10 neurônios na camada intermediária apresentaram o maior índice médio de

generalização (Fig. 6.8 (c)) e a melhor distribuição da capacidade de generalização entre as

classes (Fig. 6.8 (b)). Sendo, portanto, a opção escolhida para implementação do classificador

neural para 4 classes.

A inclusão da classe de eventos harmônicos no método de classificação eleva a

complexidade do processo, desta forma é necessário estimar novamente o número de

neurônios da camada intermediária que vai apresentar uma eficiência satisfatória no

reconhecimento de 5 tipos de eventos. A mesma metodologia utilizada para definir o número

de neurônios da camada intermediária para o reconhecimento de 4 classes é utilizada para o

reconhecimento de 5 classes, conforme será apresentado a seguir.

2ª Aproximação – reconhecimento de 5 classes de eventos.

Durante o processo de definição do número de neurônios da camada intermediária

para a classificação de 5 tipos de eventos, temos os seguintes parâmetros de configuração do

algoritmo de treinamento:

• Número de neurônios da camada de entrada (nós fonte) = 64

• Número de neurônios da camada intermediária = variável

• Número de neurônios da camada de saída = 5

• Função de ativação de todos os neurônios que realizam processamento na rede

= tangente sigmóide.

• Termo de momento m constante = 0,5

• Número de épocas por treinamento = 10


83

• Número de treinamentos realizados por rede = 200

• Número de redes inicializadas e treinadas = 40

Índices das classes classificadas no vetor de saída da rede: i=1 Eventos oscilatórios, i=2

Sub-tensão e sobre-tensão, i=3 Spikes, i=4 Notches, i=5 Harmônicos.

Novamente, aplicando a metodologia proposta, são obtidos os valores médios de

desempenho das redes, que irão apontar um número razoável de neurônios que seja capaz de

desempenhar a tarefa de classificação dos eventos com uma eficiência satisfatória.

A Fig. 6.9 mostra a evolução média da capacidade da rede em reconhecer os padrões

pertencentes ao grupo de treinamento durante o processo de treinamento conforme foi

apresentado para o caso de reconhecimento de 4 classes, porém, agora com a inclusão da

classe harmônicos.

(a)10

neurônios

(b)11

neurônios

(c)12

neurônios

(d)13

neurônios

(e)14

neurônios

(f)15

neurônios

(j)19

neurônios

(g)16

neurônios

(h)17

neurônios

(i)18

neurônios

(k)20

neurônios

Legenda


0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

OscilatorioSag / SwellSpike

NotchHarmonico

Fig. 6.9. Evolução do reconhecimento dos padrões do conjunto de dados de treinamento em [%] em

função do número de treinamentos realizados e do número de neurônios da camada intermediária.


84

Pode ser observado na Fig. 6.9 que, com a inclusão de mais uma classe de evento no

processo de classificação, no intervalo de 10 a 20 neurônios na camada intermediária da rede, a

estrutura que apresentou a maior capacidade de reconhecer os eventos que compunham o

grupo de treinamento foram as redes compostas por 19 neurônios na camada intermediária. O

resultado obtido por esta configuração para cada classe de eventos pode ser observado na Fig.

6.9 (j). Mais uma vez é importante observar o comportamento homogêneo da evolução do

treinamento para todas as classes, diferentemente do ocorrido com as estruturas compostas de

15 ou 17 neurônios na camada intermediária, Fig. 6.9 (f) e Fig. 6.9 (g) respectivamente, onde a

classe de evento notch apresentou um índice inferior de reconhecimento do evento no grupo de

treinamento em relação às demais classes.

Na Fig. 6.10 temos a representação da evolução da capacidade de generalização das

redes avaliadas sobre o conjunto de dados de teste.

(a)10

neurônios

(b)11

neurônios

(c)12

neurônios

(d)13

neurônios

(e)14

neurônios

(f)15

neurônios

(j)19

neurônios

(g)16

neurônios

(h)17

neurônios

(i)18

neurônios

(k)20

neurônios

Legenda


OscilatorioSag / SwellSpike

NotchHarmonico

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

0 20 40 60 80 100 120 140 160 180 2000

50

100

Fig. 6.10. Evolução da generalização da rede em [%], observada no grupo de teste, em função do

número de treinamentos realizados e do número de neurônios da camada intermediária.


85

É possível notar que as estruturas que atingiram os maiores níveis de generalização

foram as compostas por 18 e 19 neurônios na camada intermediária, Fig. 6.10 (i) e Fig. 6.10 (j)

respectivamente, ainda nestas estruturas observamos uma boa distribuição da capacidade de

generalização entre as diferentes classes.

A seguir, temos novamente um resumo do estudo de desempenho das redes, agora

para a classificação de 5 eventos distintos, estes dados são mostrados na Fig. 6.11. No gráfico

(a) temos a média de identificação correta alcançada para cada classe no grupo de treinamento,

em (b) está representado o valor médio de identificação correta alcançado no grupo de teste, e,

finalmente, em (c) temos a média dos resultados apresentados em (b), que mostram a

capacidade de generalização adquirida pela rede. Todos estes resultados são mostrados em

função do número de neurônios da camada intermediária.

Número de neurônios na camada intermediária

%

%

% Media das classes

Grupo de treinamento (a)

Grupo de teste (b)

Média final do grupo de teste (c)

10 12 14 16 18 2060

70

80

90

100

10 12 14 16 18 2060

70

80

90

100OscilatorioSag / SwellSpikeNotchHarmonico

10 12 14 16 18 2080

85

90

95

100

105

OscilatorioSag / SwellSpikeNotchHarmonico

Fig. 6.11. Desempenho médio global de classificação em função do número de neurônios da camada

intermediária.


86

Através da observação da Fig. 6.11 podemos notar nos gráficos (c) e (d) que, apesar das

estruturas compostas de 18 neurônios na camada intermediária apresentarem uma

característica de generalização bem distribuída entre as classes, a média desta característica para

as redes compostas de 19 neurônios na camada intermediária é sensivelmente superior à

daquelas que foram treinadas com 18 neurônios na camada intermediária. Sendo, então, a

estrutura composta de 19 neurônios a utilizada na implementação do classificador de 5 classes.

Os resultados finais do processo de decisão do número de neurônios na camada

intermediária da rede destinada ao reconhecimento de 4 classes de eventos são mostrados na

Tabela 6.3, estes dados são correspondentes aos apresentados na Fig. 6.8.

Tabela 6.3. Percentual de acerto médio das redes em função do número de neurônios da camada intermediária para reconhecimento de 4 classes de eventos.

Grupo de treinamento Evento Número de neurônios

5 6 7 8 9 10 11 12 13 14 15 Oscilatório 99,7 98,3 100,0 99,6 100,0 100,0 100,0 100,0 100,0 100,0 100,0Sag/Swell 92,2 89,5 91,9 94,3 89,6 99,6 94,6 99,7 97,0 99,8 99,8 Spike 93,2 87,8 95,5 90,5 85,5 97,3 95,5 97,8 93,3 95,0 91,0 Notch 81,0 86,0 84,0 88,0 92,0 92,0 90,0 87,0 81,0 90,0 80,0

Grupo de teste (Generalização ) Oscilatório 96,8 95,2 99,0 98,6 99,4 99,8 100,0 100,0 100,0 100,0 100,0Sag/Swell 91,8 89,5 91,9 94,5 90,1 100,0 94,8 100,0 97,6 100,0 100,0Spike 88,3 85,6 94,5 89,9 84,5 96,8 95,6 97,4 93,6 94,9 91,6 Notch 80,2 83,4 82,9 85,8 90,5 90,5 88,1 85,5 78,4 88,1 78,1 Generalização Média 89,3 88,4 92,1 92,2 91,1 96,8 94,6 95,7 92,4 95,8 92,4

A inclusão de uma quinta classe no processo de classificação aumenta

consideravelmente a complexidade do sistema, para se manter o mesmo nível de eficiência

alcançado para o reconhecimento de 4 classes foi necessário alterar a arquitetura da rede,

aumentando-se o número de neurônios da camada intermediária. Um resumo dos resultados

obtidos durante o processo de definição da quantidade de neurônios da camada intermediária

da rede é mostrado na Tabela 6.4. Estes dados são correspondentes ao mostrados nos gráficos

da Fig. 6.11.


87

Tabela 6.4. Percentual de acerto médio das redes em função do número de neurônios da camada intermediária para reconhecimento de 5 classes de eventos.

Grupo de treinamento Evento Número de neurônios

10 11 12 13 14 15 16 17 18 19 20 Oscilatório 98,1 98,2 100,0 98,3 100,0 98,5 100,0 100,0 95,0 100,0 100,0Sag/Swell 89,0 89,3 94,0 89,3 89,1 96,9 92,0 94,6 92,1 92,0 89,5 Spike 83,8 79,3 82,8 86,0 79,3 88,3 78,8 78,7 85,0 88,2 83,3 Notch 80,0 77,0 77,0 80,0 83,0 75,0 75,0 74,0 88,0 90,0 82,0 Harmônicos 98,1 98,8 99,3 99,7 99,7 99,8 99,8 99,9 99,9 99,6 99,7

Grupo de teste (Generalização ) Oscilatório 97,0 96,2 99,0 96,2 99,7 96,9 99,8 100,0 94,5 99,6 99,7 Sag/Swell 90,1 90,4 94,7 89,8 90,2 97,6 92,6 94,8 92,8 92,6 90,3 Spike 84,5 80,2 82,4 86,4 80,4 88,2 79,7 79,5 83,9 88,9 84,0 Notch 76,3 73,6 73,6 76,3 80,7 71,2 71,2 69,1 85,7 88,1 78,6 Harmônicos 80,6 83,6 85,3 87,4 86,5 87,7 86,2 87,8 88,4 87,9 87,3 Generalização Média 85,7 84,8 87,0 87,2 87,5 88,3 85,9 86,2 89,1 91,4 88,0

Após a definição do número de neurônios da camada intermediária da rede inicia-se

um processo de aprimoramento do treinamento para a obtenção da rede que será utilizada no

classificador, este processo é descrito a seguir.

Aprimoramento do treinamento da rede neural

Com a definição do número de neurônios que será empregado na camada intermediária

da rede, temos todos os dados necessários sobre a arquitetura da rede a ser utilizada. O

treinamento da rede será conduzido agora com o intuito de elevar a eficiência de classificação

da mesma.

O procedimento empregado durante o treinamento da rede, que será efetivamente

utilizada no algoritmo de detecção e classificação de eventos, utiliza um critério de parada

diferente do utilizado para determinar o número de neurônios da camada intermediária da

rede.

O processo anterior de treinamento tinha como critério de parada o número de épocas

de treinamento aplicadas à rede, ao fim do treinamento era avaliada a eficiência de cada rede


88

em relação ao número de neurônios que possuía na camada intermediária. Depois de definida a

arquitetura da rede, o processo de treinamento visa encontrar a melhor configuração de valores

de pesos e bias para alcançar a maior eficiência na classificação. Assim, o critério de parada do

processo de treinamento neste estágio do desenvolvimento da rede é feito com base na

eficiência global de generalização obtida.

Para que o processo de treinamento seja interrompido, foi adotado que:

98%globalef > (6.8)

onde, efglobal foi definida em (6.6).

Assim, quando a eficiência global é atingida, o processo de treinamento é

interrompido. Ao fim do processo de treinamento os pesos sinápticos e os valores de bias estão

definidos e não serão mais alterados.

6.3.2 Esforço computacional no classificador

De posse dos parâmetros internos da rede, é interessante estimar o esforço

computacional necessário para a realização da classificação através da rede neural.

O processamento realizado na primeira camada de neurônios pode ser representado

matematicamente de forma matricial como a seguir:

1 1 1 1 1( )ϕ= +iO W P B (6.9)

onde O1, é a saída da primeira camada de neurônios, ϕ1 é a função de ativação utilizada pelos

neurônios da primeira camada oculta da rede. A matriz W1 contém os pesos sinápticos que

conectam todos os nós de entrada aos neurônio da camada 1. O vetor P1 representa o padrão

de entrada aplicado à rede, e tem um comprimento i e, finalmente, B1 é o vetor de bias para a

camada 1. De onde podemos compor a Equação (6.10)


89

1 1 1 111 12 1 111 1 1 121 22 2 22

1 1

1 1 1 11 2

...

...

...

ϕ

⎛ ⎞⎡ ⎤ ⎡ ⎤⎡ ⎤⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥= +⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦ ⎣ ⎦⎝ ⎠

i

i

i

j j ji ji

w w w bpw w w bp

O

w w w bp

(6.10)

lembrando que para a primeira camada temos j = número de neurônios da camada

intermediária e i = 64 (comprimento do vetor de entrada), portanto, o vetor de saída da

primeira camada que realiza processamento O1 será um vetor de comprimento j.

Para a camada de saída da rede temos o seguinte equacionamento:

2 2 2 1 2( )ϕ= +iO W O B (6.11)

onde O1, é a saída da camada intermediária, ϕ2 é a função de ativação dos neurônios, W2 é a

matriz dos pesos sinápticos e B2 é o vetor de bias da camada de saída da rede.

Esta equação pode ser apresentada na forma matricial como:

2 2 2 2111 12 1 112 2 2 2121 22 2 22

2 2

2 2 2 211 2

...

...

...

ϕ

⎛ ⎞⎡ ⎤ ⎡ ⎤⎡ ⎤⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥= +⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦ ⎣ ⎦⎝ ⎠

i

i

i

j j ji ji

w w w bow w w bo

O

w w w bo

(6.12)

Considerando que as dimensões da camada de saída da rede dependem do número de

classes, 4 ou 5, o índice j, que define as dimensões da matriz de pesos e do vetor de bias da

segunda camada também pode ser 4 ou 5. Já o índice i, é igual ao número de neurônios da

camada intermediária da rede.

Assim, observando as Equações (6.10) e (6.12), podemos avaliar o esforço

computacional por camada através da Equação


90

( 1)ϕ

= ⋅= − ⋅ + = ⋅=

Nm L ENa E L L L EN L

(6.13)

onde, Nm, Na e Nϕ são, respectivamente, o número de multiplicações, de adições e de vezes

que é necessário calcular ou obter de uma tabela o valor da função de ativação dos neurônios

da camada em questão. L e E representam o número de neurônios da camada e o número de

amostras na entrada da camada respectivamente. Temos então, os seguintes casos:

1º ) Reconhecimento de 4 classes

Neste caso, considerando a arquitetura da rede proposta: entrada de 64 amostras, 10

neurônios na camada intermediária e 4 na camada de saída temos:

Tabela 6.5 Esforço computacional para o reconhecimento de 4 classes de eventos.

Operação 1ª camada 2ª camada Total Multiplicação 640 40 680 Adição 640 40 680 Função 10 4 14

2º ) Reconhecimento de 5 classes

Para esta situação, temos: 64 amostras, 19 neurônios na camada intermediária e 5 na

camada de saída, assim:

Tabela 6.6. Esforço computacional para o reconhecimento de 5 classes de eventos.


Pode-se observar que o esforço computacional necessário para obter o

reconhecimento das cinco classes (eventos oscilatórios, sub-tensão e sobre-tensão, spikes,

notches e harmônicos), é consideravelmente maior que aquele obtido para o reconhecimento de

4 classes. Este aumento considerável foi devido ao aumento significativo do número de


91

neurônios na camada escondida.

Estes dados devem ser levados em consideração no momento de avaliar a

implementação do sistema de classificação em tempo real, onde a complexidade do

processamento realizado é fator crítico na escolha do hardware a ser utilizado. Por exemplo, se

mantivéssemos o número de neurônios na camada escondida em 10, como no caso de quatro

classes, sacrificando um pouco o desempenho em benefício da redução do esforço

computacional, teríamos o esforço computacional conforme mostrado na Tabela 6.7.

Tabela 6.7. Esforço computacional para o reconhecimento de 5 classes de eventos

com 10 Neurônios na Camada intermediária.



Este capítulo apresentou a forma como é realizado o pré-processamento da janela que

contém o sinal de erro obtido do algoritmo DE, foram definidas várias características do

processo de classificação como o tamanho das janelas utilizadas em cada etapa e a facilidade de

se obter o alinhamento dos eventos através da janela de sinal de erro.

O treinamento da rede neural empregada no classificador mostra que, mesmo depois

de um processo de sub-amostragem realizado durante o pré-processamento da janela do sinal

de erro a rede ainda é capaz de extrair informações suficientes das janelas para diferenciar as

classes de eventos abordadas. Este procedimento não seria justificado caso houvesse a

necessidade de recompor o sinal obtido, uma vez que perderíamos informações importantes

para a reconstrução do sinal inicial.

O perceptron de múltiplas camadas MLP se mostrou uma arquitetura eficiente na

tarefa de reconhecer os padrões de cada classe de evento abordada. O processo de definição

do número de neurônios da camada intermediária com base no resultado médio de eficiência


92

obtido para um grupo de 40 redes que apresentam a mesma arquitetura e são inicializadas com

valores de pesos e bias diferentes trouxe bons resultados, considerando que a versão final da

rede obtida alcançou uma eficiência global superior a 98% tanto para o reconhecimento de 4

classes como também para o de 5 classes.

Por fim, a análise do esforço computacional do método proposto mostrou que com a

inclusão de mais classes no sistema de classificação, mostrou-se necessário, na metodologia

adotada, aumentar consideravelmente o número de neurônios na camada intermediária,

aumentando de forma expressiva o esforço computacional necessário para a identificação das

classes. Este fato é muito importante para a análise do emprego do método em sistemas que

operem em tempo real.

No próximo capítulo apresentaremos os resultados obtidos a partir da metodologia

proposta.

Capítulo 7

Resultados

7.1 Introdução

Este capítulo apresenta os resultados obtidos através da técnica de detecção e

classificação de eventos de qualidade de energia apresentada nos capítulos anteriores. Em

particular, os resultados do processo de classificação dos eventos são mostrados como

resultado principal do presente trabalho.

Os dados apresentados têm como objetivo comprovar a eficiência do método

desenvolvido para reconhecimento dos padrões de sinais de erro que são obtidos com o

Algoritmo de Detecção de Eventos – DE. Este método, discutido no Capítulo 6, consiste na

metodologia empregada no condicionamento da janela que contém o sinal de erro e na forma

como foi realizado o treinamento da rede neural empregada no classificador.

A análise dos resultados será feita sobre eventos gerados de forma aleatória, conforme

descrito no Capítulo 5, e, ainda, considerando os classificadores destinados ao reconhecimento

de 4 e 5 classes de eventos.

Capítulo 7- Resultados

94

7.2 Eventos simulados

Após a definição da arquitetura da rede, a mesma foi treinada visando-se obter uma

eficiência global maior que 98% no conjunto de eventos utilizado para avaliar a capacidade de

generalização da rede durante o processo de treinamento, conforme descrito no capítulo

anterior. Como este conjunto de dados é relativamente pequeno em relação às inúmeras

variações que podem ocorrer nas características dos eventos, o sistema de classificação é

submetido a um conjunto maior de eventos simulados de todas as classes para certificação da

capacidade de generalização do classificador.

O conjunto de dados apresentado à rede é composto de 200 eventos pertencentes a

cada classe estudada. Estes eventos foram gerados a partir da seleção aleatória das

características de cada um, seguindo o mesmo procedimento descrito no Capítulo 5.

Este procedimento foi realizado para as duas configurações de rede analisadas e os

resultados obtidos foram os seguintes:

Rede destinada à identificação de 4 classes de eventos

Relembrando os índices do vetor de saída da rede e as classes de representadas por

cada um deles para a rede de identificação de 4 classes temos:

Max(O) = o1 → Evento oscilatório.

Max(O) = o2 → Evento de sub-tensão ou sobre-tensão sag/swell.

Max(O) = o3 → Evento spike.

Max(O) = o4 → Evento notch.

A Fig. 7.1 mostra os valores obtidos no vetor de saída da rede para os 200 eventos

oscilatórios apresentados à mesma. No gráfico (a) temos os valores do elemento o1 do vetor de

saída da rede que representa a classe de eventos oscilatórios. Como foi mostrado

anteriormente, o valor de o1 deve ser o maior valor no intervalo de -1 a 1 entre os elementos


95

do vetor de saída da rede para que a classificação seja considerada como evento oscilatório.

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

Fig. 7.1. Respostas da rede aos eventos oscilatórios.

Podemos observar uma pequena dispersão nos valores obtidos em o1 e o4, enquanto os

resultados obtidos para o2 e o3 tenderam de uma forma mais homogênea para valores

próximos de -1. Este fato aponta para uma maior possibilidade da rede classificar um evento

oscilatório de forma equivocada como um evento notch. O resultado da classificação pode ser

visto na Tabela 7.1.

Tabela 7.1. Reconhecimento dos eventos oscilatórios.

Eventos % Evento classificados classificada

Oscilatório 199 99,5 Sag / Swell 0 0 Spike 0 0 Notch 1 0,5

Os resultados apresentados na Tabela 7.1 mostram que a rede obteve um índice de

99,5% de acerto na classificação de eventos oscilatórios, confirmando a eficácia do


96

treinamento.

O mesmo procedimento é realizado para a classe de eventos sag/swell, de onde

obtemos o perfil de valores de resposta na saída da rede mostrado na Fig. 7.2.

0

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.2. Respostas da rede aos eventos sag/swell.

Onde podemos notar, nos gráficos (a) e (b), que alguns eventos sag/swell são

visivelmente confundidos pela rede com eventos oscilatórios.

Na Tabela 7.2 temos o resultado da classificação dos eventos sag/swell. Onde se

confirma a classificação incorreta de 10 eventos sag/swell como eventos oscilatórios.

Tabela 7.2. Reconhecimento dos eventos sag/swell.


Oscilatório 10 5,0 Sag / Swell 190 95,0 Spike 0 0 Notch 0 0


97

Seguindo com o procedimento para os eventos spike, temos o perfil de respostas

mostrado na Fig. 7.3

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento200

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180

-1

0

1

Fig. 7.3. Respostas da rede aos eventos spike.

Esta classe de eventos, de maneira geral, não apresenta grandes dificuldades para sua

classificação. A Tabela 7.3 apresenta o resultado final da classificação dos eventos spike.

Tabela 7.3. Reconhecimento dos eventos spike.


Oscilatório 1 0,5 Sag / Swell 0 0 Spike 199 99,5 Notch 0 0

Finalmente, temos a avaliação do desempenho da rede na classificação dos eventos

notches, os valores obtidos no vetor de saída (O) da rede para os 200 eventos notches aplicados

em sua entrada são apresentados na Fig. 7.4.


98

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento0

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.4. Respostas da rede aos eventos notches.

Assim como o ocorrido para a classe de eventos spike, a classificação dos eventos

notches não representa uma tarefa difícil para o classificador neural. Os resultados mostrados na

Fig. 7.4 estão resumidos na Tabela 7.4.

Tabela 7.4. Reconhecimento dos eventos notches.


Oscilatório 1 0,5 Sag / Swell 0 0 Spike 0 0 Notch 199 99,5

Considerando que a metodologia proposta busca uma eficiência global mínima de 98%

no treinamento final da rede utilizada no classificador, devemos também avaliar a eficiência

global alcançada no universo de 800 eventos apresentados à rede durante a avaliação de sua

performance. O resultado desta avaliação é mostrado na Tabela 7.5.


99

Tabela 7.5. Eficiência global alcançada pela rede

para classificação de 4 classes.

Eventos classificados Evento

corretamente (%)Oscilatório 99,5 Sag / Swell 95,0 Spike 99,5 Notch 99,5 Eficiência global 98,37

Como pode ser observado na Tabela 7.5, a eficiência global alcançada durante o

processo de treinamento, se manteve na comprovação do desempenho do classificador.

Rede destinada à identificação de 5classes de eventos

O mesmo procedimento adotado para a avaliação do desempenho da rede destinada à

classificação de 4 classes de eventos é aplicado à rede utilizada para classificação de 5 eventos.

O vetor de saída da rede agora apresenta mais uma linha (elemento o5), que corresponde ao

evento harmônico. A distribuição da identificação das classes no vetor de saída (O) da rede

para o reconhecimento de 5 classes de eventos é mostrado abaixo:

Max(O) = o1 → Evento oscilatório.

Max(O) = o2 → Evento de sub-tensão ou sobre-tensão sag/swell.

Max(O) = o3 → Evento spike.

Max(O) = o4 → Evento notch.

Max(O) = o5 → Evento harmônico.

Os valores obtidos no vetor de saída da rede serão apresentados para cada grupo de

eventos de mesma classe apresentados à rede conforme foi mostrado anteriormente para a

rede destinada ao reconhecimento de 4 classes de eventos.

A Fig. 7.5 mostra os valores obtidos no vetor de saída da rede em resposta à


100

apresentação de 200 eventos oscilatórios à rede.

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

O5

0

(e)

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.5. Resposta da rede aos eventos oscilatórios.

O resumo dos dados mostrados na Fig. 7.5 é apresentado na Tabela 7.6. Onde pode-se

observar que o classificador foi capaz de classificar corretamente 100% dos eventos

oscilatórios apresentados ao sistema.

Tabela 7.6. Reconhecimento dos eventos oscilatórios.


Oscilatório 200 100 Sag / Swell 0 0 Spike 0 0 Notch 0 0 Harmônico 0 0


101

Na Fig. 7.6 temos o resultado da classificação do grupo de eventos de sobre-tensão e

sub-tensão. Onde podemos notar que a identificação desta classe de eventos não oferece

grande dificuldade para o classificador neural.

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

O5

0

(e)

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.6. Resposta da rede aos eventos sag/swell.

A Tabela 7.7 confirma a classificação correta dos eventos sag/swell apresentados à rede,

que alcançou uma eficiência na classificação de 99,5%.

Tabela 7.7. Reconhecimento dos eventos sag/swell.


Oscilatório 1 0,5 Sag / Swell 199 99,5 Spike 0 0 Notch 0 0 Harmônico 0 0


102

Na Fig. 7.7 é mostrado o resultado obtido para a classe de eventos spike.

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

O5

0

(e)

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.7. Resposta da rede aos eventos spikes.

Um resumo dos resultados mostrados na Fig. 7.7 é apresentado na Tabela 7.8, onde

podemos observar que a classe de eventos spikes também não apresenta grandes dificuldades

para ser identificada entre as demais classes de eventos estudadas.

Tabela 7.8. Reconhecimento dos eventos spikes.


Oscilatório 0 0 Sag / Swell 1 0,5 Spike 198 99,0 Notch 0 0 Harmônico 1 0,5


103

A seguir, na Fig. 7.8, temos os resultados referentes à classe de eventos notches.

Fig. 7.8. Resposta da rede aos eventos notches.

A Tabela 7.9 apresenta o resumo dos resultados mostrados na Fig. 7.8, estes resultados

confirmam o bom desempenho do classificador no reconhecimento dos eventos notches.

Tabela 7.9. Reconhecimento dos eventos notches.


Oscilatório 1 0,5 Sag / Swell 0 0 Spike 0 0 Notch 199 99,5 Harmônico 0 0

Por fim, na Fig. 7.9 são apresentados os resultados obtidos para a classe de eventos


104

harmônicos, onde podemos perceber uma maior dispersão dos valores obtidos para as classes

de eventos oscilatórios e harmônicos. Este fato faz com que a identificação dos eventos

harmônicos não seja tão evidente como foi a identificação dos eventos notches, mostrada na Fig.

7.8.

(a)

(b)

(c)

(d)

O1

O2

O3

O4

Índice do evento

O5

0

(e)

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

0 20 40 60 80 100 120 140 160 180 200

-1

0

1

20 40 60 80 100 120 140 160 180 200

-1

0

1

Fig. 7.9. Resposta da rede aos eventos harmônicos.

A Tabela 7.10 mostra o resultado final da classificação dos eventos harmônicos,

evidenciando os erros de classificação relacionados com a classe de eventos oscilatórios.

Tabela 7.10. Reconhecimento dos eventos harmônicos.


Oscilatório 9 4,5 Sag / Swell 0 0 Spike 0 0 Notch 0 0 Harmônico 191 95,5


105

A avaliação da eficiência global da rede destinada à classificação de 5 classes de eventos

está resumida na Tabela 7.11.

Tabela 7.11. Eficiência global alcançada pela rede

para classificação de 5 classes.

Eventos classificados Evento

corretamente (%)Oscilatório 100 Sag / Swell 99,5 Spike 99,0 Notch 99,5 Harmônicos 95,5 Eficiência global 98,7

7.3 Dado real

Apesar do treinamento da rede neural ter se desenvolvido totalmente embasado em

eventos gerados através de simulações conforme mostrado no Capítulo 5, podemos observar

que a rede se mostra capaz de reconhecer padrões reais que se assemelham aos utilizados

durante o treinamento.

Na Fig. 7.10, temos um evento real obtido a partir de analisador de qualidade de

energia e que foi submetido ao sistema de detecção e classificação de eventos proposto. A Fig.

7.10 (a) mostra a parte do sinal que contém o evento detectado pelo algoritmo com o destaque

das respectivas janelas de dados armazenadas pelo sistema 1 e 2. Em seguida, na Fig. 7.10 (b) e

na Fig. 7.10 (c), temos a representação das janelas destacadas em (a). Podemos observar que o

sistema realizou duas detecções e, conseqüentemente, foram feitas duas classificações

diferentes a partir das janelas do sinal de erro obtidas.

Este caso foi aplicado ao classificador destinado ao reconhecimento de 5 classes, de

onde obtivemos a classificação dos eventos como sendo, na primeira janela um evento sag/swell

e na segunda janela um evento harmônico

Os resultados obtidos na saída da rede estão dispostos na Tabela 7.12, onde temos em


106

negrito os maiores valores encontrados, que definem a classificação dos eventos como sag/swell

e harmônico respectivamente.

Fig. 7.10. Classificação de um evento real.

Tabela 7.12. Classificação de evento real.

Classe de evento Janela 1 Janela 2 Oscilatório -0,9857 -0,9930 Sag / Swell 0,9585 -0,9968 Spike -0,9833 -0,6591 Notch -0,9656 -0,9376 Harmônicos -0,9767 0,1248


Este capítulo mostrou o desempenho alcançado pelas duas arquiteturas de rede

abordadas nos capítulos anteriores, a primeira, destinada ao reconhecimento de 4 classes e a

segunda, destinada ao reconhecimento de 5 classes de eventos de qualidade de energia.


107

Os resultados obtidos através de eventos simulados mostram que a rede para

reconhecimento de 4 classes manteve sua eficiência global em 98,37%, valor este, que confirma

a eficiência do método de treinamento realizado, ainda que com poucos eventos utilizados

durante o treinamento. Uma vez que o objetivo do treinamento era atingir uma eficiência

global superior a 98% de classificação correta dos eventos aplicados à rede. Estes resultados

comprovam os apresentados em [31], onde a metodologia utilizada foi apresentada.

A rede destinada a reconhecer 5 classes de eventos apresentou uma eficiência global da

ordem de 98,7%, na classificação correta dos eventos aplicados a ela. De maneira geral, a classe

de eventos harmônicos apresenta a mais diversa variedade de padrões possíveis para os sinais

de erro que são utilizados pelo processo de classificação, este fato faz com que o

reconhecimento desta classe seja dificultado, a ponto de termos de acrescentar 9 neurônios à

camada intermediária da rede para atingir uma eficiência maior que 98% de classificação

correta da mesma durante o treinamento.

Na avaliação dos dados reais, percebemos que a rede destinada a reconhecer 5 classes

de eventos é capaz de determinar a classe de eventos que apresentam características diferentes

das encontradas nos eventos obtidos a partir de simulação. Esta capacidade mostra que a

característica de generalização da rede se mantém para pequenos desvios dos modelos

empregados. Outro aspecto a ser observado é a possibilidade de se realizar o treinamento de

redes destinadas à classificação de eventos reais de qualidade de energia com base em eventos

simulados.

Capítulo 8

Conclusões

O presente trabalho teve como objetivo principal investigar a possibilidade e a

viabilidade de se realizar a classificação de eventos de qualidade de energia com base no sinal

de erro, definido como a diferença entre o sinal monitorado do sistema elétrico e a

componente fundamental deste sistema.

Uma breve revisão sobre algumas das ferramentas empregadas atualmente na análise da

Qualidade da Energia foi apresentada no início do trabalho com o objetivo de situar a

proposta deste estudo no contexto atual das pesquisas desenvolvidas na área. É percebido na

literatura que trata do assunto que a proposta de se realizar a classificação dos eventos de

qualidade de energia com base no sinal de erro é uma metodologia que vem apresentando bons

resultados.

A apresentação dos principais fenômenos elétricos que contribuem para a baixa

qualidade da energia disponível nos sistemas de potência atuais realizada no Capítulo 2, mostra

a vasta diversidade de distúrbios presentes nos sistemas e confirma a necessidade de

desenvolvimento de pesquisas que possam aumentar o conhecimento a respeito dos

fenômenos elétricos para que seus efeitos, tanto do ponto de vista técnico como do ponto de

vista econômico, possam ser minimizados.

O desenvolvimento do algoritmo Detector de Eventos – DE, realizado em trabalhos

Capítulo 8- Conclusões

109

anteriores possibilitou o avanço dos estudos no sentido de oferecer o sinal de erro, necessário

à realização da classificação dos eventos segundo a metodologia apresentada.

Dentre várias possibilidades de ferramentas para a realização do reconhecimento de

padrões, a opção pela rede neural se mostrou satisfatória dentro do desempenho obtido na

classificação dos eventos. A escolha da estrutura e do tipo de algoritmo empregado durante o

treinamento visou a redução da complexidade computacional e elevado desempenho no

reconhecimento de padrões.

Uma dificuldade encontrada durante o desenvolvimento do trabalho foi a falta de

dados e informações confiáveis a respeito de eventos de qualidade de energia, assim sendo, a

direção seguida foi a de desenvolver modelos para a reprodução de distúrbios semelhantes para

que fosse possível estabelecer uma determinada classe de eventos e, posteriormente, gerar um

número suficiente de eventos para criar um banco de dados necessário ao desenvolvimento do

treinamento do classificador neural.

A utilização da janela de erro como fonte de dados para o classificador neural apontou

para uma importante característica da mesma durante o pré-processamento, a facilidade de se

obter o alinhamento dos eventos na janela de dados utilizada como entrada da rede. Este

mesmo alinhamento não seria conseguido de forma trivial se fossem utilizadas as janelas

armazenadas do sinal monitorado no momento em que ocorre o evento. Esta foi a primeira

vantagem evidenciada na utilização da janela de sinal de erro. Outra observação relacionada ao

emprego da janela de erro no processo de classificação diz respeito à energia do sinal

armazenado na janela. A energia contida na janela do sinal de erro está intimamente

relacionada com a natureza do evento, enquanto a janela que contém o sinal monitorado

apresenta uma parcela de energia relativa à componente fundamental do sistema que, de

maneira geral, não agrega informações no que tange a identificação do evento.

O processo de treinamento do classificador neural, desenvolvido com base no

algoritmo de retropropagação, se mostrou eficiente, alcançando valores de eficiência global

superiores a 98% de classificação correta dos eventos do grupo de teste durante o treinamento.

Este desempenho se confirmou para um universo de 200 eventos de cada classe para as redes


110

destinadas a reconhecer 4 e 5 classes de eventos.

Um outro ponto importante a respeito das redes para o reconhecimento de 4 e 5

classes é o aumento da complexidade computacional observado, o número de neurônios na

camada oculta da rede passa de 10 para 19 para que seja mantido o desempenho. É importante

lembrar que este fato pode ser limitante no momento da especificação de um equipamento de

hardware para a implementação do classificador em tempo real. Por outro lado, podemos

sacrificar o desempenho da rede reduzindo o número de neurônios da camada intermediária

com o objetivo de reduzir a complexidade computacional.

Os resultados obtidos através de eventos modelados mostram que a metodologia

proposta desde a detecção até a classificação do evento é capaz de alcançar seus objetivos com

boa eficiência. A análise de um caso real mostrou que o classificador, mesmo sendo treinado

com eventos simulados, adquiriu uma habilidade de generalização suficiente para reconhecer

eventos reais que sejam semelhantes aos apresentados ao classificador durante o processo de

treinamento, ainda que estes apresentem outros eventos de menor intensidade distribuídos na

janela de dados analisada.

Espera-se que, com a disponibilidade de um banco de dados formado apenas por

eventos reais o treinamento do classificador possa ser feito com base nesses dados, o que deve

proporcionar um maior grau de reconhecimento de eventos relacionados com o sistema sob

monitoração. Assim sendo, em condições práticas, uma vez determinado o sistema no qual o

classificador irá operar, o primeiro passo a ser dado é a formação do banco de dados com os

eventos freqüentemente encontrados no sistema. De posse desses dados será possível ajustar o

classificador às necessidades do sistema sob monitoração e, conseqüentemente obter melhores

resultados de classificação.

8.1 Sugestões para trabalhos futuros

No decorrer do presente trabalho, foram identificadas várias possibilidades de

desenvolvimento de novos projetos relacionados com a metodologia fundamentada no estudo


111

dos eventos de qualidade de energia com base no sinal de erro, algumas dessas estão

relacionadas abaixo:

• Implementação do sistema de Detecção de Eventos em plataforma DSP, com o

objetivo de gerar bancos de dados.

• Aprofundar os estudos relativos às redes neurais e outras ferramentas destinadas ao

reconhecimento de padrões que possam apresentar melhores resultados na

classificação dos eventos de qualidade de energia.

• Analisar a implementação da mesma metodologia, porém, trabalhando com

sistema trifásico, onde o sinal de erro seria função do sinal monitorado

simultaneamente nas três fases do sistema.

• Buscar a fundamentação teórica para a questão da energia referente ao distúrbio

elétrico do ponto de vista da janela de erro e da janela de sinal.

• Avaliar o desempenho de classificação de redes treinadas a partir de eventos

simulados no reconhecimento de eventos reais.

• Implementação do sistema integrado DE - classificador em plataforma DSP

visando a operação em tempo real.

Referências

[1] R. C. Dugan, M. F. McGranaghan, and H. W. Beaty, Electrical Power Systems Quality, McGraw-Hill 1996.

[2] J. Arrillaga, M. H. J. Bollen, and N. R. Waston, “Power Quality Following Deregulation,” Proceedings of the IEEE, vol. 88, no 2, Fevereiro, 2000, pág. 246 – 261.

[3] R. Flores, “Signal Processing Tools for Power Quality Event Classification,” Technical Report no 477L, Department of Signals and Systems, Department of Electric Power Engineering, Chalmers University of Technology, Novembro, 2003.

[4] Toivonen, W. and Morsky, J., "Digital Multirate Algorithms for Measurement of Voltage, Current, Power and Flicker", IEEE Tansactions on Power Delivery, vol. 10, no. 1, pág. 116-126, Janeiro 1995.

[5] Diniz, P. S. R., Silva, E. A. B. and Netto, S. L, "Processamento Digital de Sinais: Projeto e Análise de Sistemas", Bookman, 2004.

[6] S.Santoso, W. M. Grady, E. J. Powers, J. Lamoree, and S. C. Bhatt, Member, “Characterization of Distribution Power Quality Events with Fourier and Wavelet Transforms,” Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 247 – 254.

[7] M. V. Ribeiro, S. M. Deckmann, J. M. T. Romano, “Adaptative Filtering, Wavelet and Lapped Transforms for Power Quality Problem Detection and Identification,” IEEE 2003.

[8] Haykin, Simon, "Adaptative Filter Theory", Prentice Hall Information, Third Edition, 1996.

[9] C. A. Duque, M. V. Ribeiro, H. A. C. Braga, S. Q. Almeida, “Compressão de Dados para Análise de Qualidade de Energia Elétrica Utilizando Transformada Wavelet e Filtros de Kalman,” SBA2000 – Autimatic Brazilian Congress, Florianópolis, SC, Brasil, Setembro 2000.

[10] O. Poisson, P. Rioual and M. Meunier, “Detection and Measurement of Power Quality Disturbances Using Wavelet Transform,” IEEE Transactions on Power Delivery, vol. 15, no 3, Julho 2000, pág. 1039 – 1044.

[11] A. M. Gaouda, M. M. A. Salama, M. R. Sultan, A. Y. Chikhani “Power Quality Detection Using Wavelet Multiresolution Signal Decomposition,” IEEE Transactions on Power Delivery, vol. 14, no 4, Outubro 1999, pág. 1469 – 1476.

[12] A. M. Gaouda, M. M. A. Salama, M. R. Sultan, “Automated Recognition System for Classifying and Quantifying the Electric Power Quality,” 1998 IEEE.

Referências

113

[13] M. V. Chilukuri, and P. K. Dash, “Multiresolution S-Transform-Based Fuzzy Recognition System for Power Quality Events,” IEEE Transactions on Power Delivery, vol. 19, no 1, Janeiro 2004, pág. 323 – 330.

[14] S. Santoso, E. J. Powers, W. M. Grady, and A. C. Persons, “ Power Quality Disturbance Waveform Recognition Using Wavelet-Based Neural Classifier – Part 1: Theoretical Foundation” IEEE Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 222 – 228.

[15] S. Santoso, E. J. Powers, W. M. Grady, and A. C. Persons, “ Power Quality Disturbance Waveform Recognition Using Wavelet-Based Neural Classifier – Part 2: Application” IEEE Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 229 – 235.

[16] Stockwell, R. G., Mansinha, L. and Lowe, R. P., "Localization of the complex spectrum: The S-transform", IEEE Trans. Signal Processing, vol. 144, pág. 998-1001, Abril 1996.

[17] J. Meeuwsen and W. Kling, “The influence of different network structures on power supply reliability,” in Proc. Quality of Power Supply, ETG-Conf., Novembro, 1997, pág. 9–14

[18] R. Billington and R. N. Allan, Reliability Assessment of Large Electric Power Systems. Norwell, MA: Kluwer, 1988.

[19] IEEE Recommended Practice for Monitoring Electric Power Quality, IEEE Standard 1159–1995, 1995.

[20] G. T. Heydt, Electric Power Quality. West Lafayette, IN: Stars in a Circle, 1991.

[21] J. Arrillaga, D. A. Bradley, and P. S. Bodger, Power System Harmonics. London, U.K.: Wiley, 1985.

[22] J. Arrillaga, B. C. Smith, N. R. Watson, and A. R. Wood, Power System Harmonic Analysis. London, U.K.: Wiley, 1997.

[23] M. S. Azam, F. Tu, K. R. Pattipati, and R. Karanam “A Dependency Model-Based Approach for Identifying and Evaluating Power Quality Problems,” IEEE Transactions on Power Delivery, vol. 19, no 3, Julho 2004, pág. 1154 – 1165.

[24] F. R. Ramos, M. V. Ribeiro, J. M. T. Romano, Sênior, IEEE and C. A. Duque, Member, IEEE, “On Signal Processing Approach for Event Detection and Compression Applied to Power Quality Evaluation” ICHQP2002, Rio de Janeiro, RJ, Brasil – 2002.

[25] F. R. Ramos “Algoritmo de Pré-Compactação”, Dissertação de Mestrado, Faculdade de Engenharia Elétrica, Universidade Federal de Juiz de Fora, Juiz de Fora, MG, 2003.

[26] Kwan, T. and Martin, K., "Adaptive Detection and Enhancement of Multiple Sinusoids Using a Cascade IIR Filter", IEEE Trans. on Circuits and Systems, vol. 36, no. 7, pág. 937-947, Julho 1989.

[27] S. K. Mitra, Digital Signal Processing – A Computer Based Approach, Mc Graw-Hill 1998.

Referências

114

[28] S. Haykin, Redes Neurais, Princípio e Prática, Bookman, 2001.

[29] Frederico R. Ramos, Carlos A. Duque, Moisés V. Ribeiro, Jacques Szczupak, “Power Quality Event Detection based on the Principle of Divide to Conquer and Innovation Concept”. IEEE Transactions on Power Delivery.

[30] Handbook of Power Signatures, Dranetz – BMI 1998.

[31] Rogério M. Trindade, Carlos A. Duque, Member, IEEE, Moisés V. Ribeiro, Student Member, IEEE , and Augusto S. Cerqueira “Digital System for Detection and Classification of Electrical Events” – International Symposium on Circuits and Systems ISCAS – Kobe, Japão, 2005.

Sistema Digital de Detecção e Classificação de Eventos de ...

Documents

Transcript of Sistema Digital de Detecção e Classificação de Eventos de ...