Sistema Digital de Detecção e Classificação de Eventos de ...
Transcript of Sistema Digital de Detecção e Classificação de Eventos de ...
Sistema Digital de Detecção e Classificação de Eventos de
Qualidade de Energia
Por
Rogério Marques Trindade
Dissertação apresentada ao Curso de Mestrado em Engenharia Elétrica da Faculdade de Engenharia da Universidade Federal de Juiz de Fora, como requisito para obtenção do título de Mestre em Engenharia Elétrica.
Orientadores:
Prof. Augusto Santiago Cerqueira, D.Sc. Prof. Carlos Augusto Duque, D.Sc.
Juiz de Fora Agosto de 2005
Abstract
Power quality events are related to deviations on the steady state regime of the power
systems. These deviations can be found on the voltage and current waveforms, although this
work focuses on the events related to the voltage waveforms.
Several events are related to the voltage waveform such as notches, harmonics, sags,
swells, faults, flickers, spikes, switching transitories, etc. The occurrence of such events on the
power system could cause bad functioning of electronic equipments, protection systems,
interference on communication systems, etc. The duration of such events could range from 50
ns for an impulse up to several minutes to an overvoltage or undervoltage for example. In such
way, the energy analyzers generate very long data files when monitoring power quality events,
resulting in problems to save and analyze the data.
In this work, a digital system was developed to detect, classify and store the power
quality events related to the voltage waveform. The detection is based on the error signal,
which is defined as the difference between the power system voltage signal and the
fundamental sinusoidal component generated by the algorithm itself, using the amplitude,
frequency and phase estimated from the monitored voltage waveform.
The event classification is performed over the error signal window, which is generated
by the detection algorithm. This is a new approach to solve the classification problem of
power quality events. To perform the classification, the events are aligned by the beginning,
down-sampled and presented to a feed forward neural network.
The results obtained from numerical simulations show the good performance and
flexibility of the proposed, as it could be easily trained on-line, and therefore tuned for the
particular behavior of the power system where the monitoring system is installed.
Resumo
Entende-se como evento de qualidade de energia qualquer falha ou desvio das
condições desejadas de funcionamento do sistema elétrico em regime permanente. De maneira
geral, os eventos de qualidade de energia se manifestam como deformidades nas formas de
onda de tensão e corrente, entretanto neste trabalho o foco são os eventos relacionados com a
forma de onda de tensão.
Considerando a forma de onda de tensão, podemos encontrar vários tipos de eventos
como notches, presença de harmônicos, faltas, sobre-tensão(swell), afundamentos(sag), flickers,
impulsos(spikes), transitórios de chaveamento, etc. A presença desses fenômenos indesejáveis
no sistema elétrico pode causar mau funcionamento de equipamentos eletrônicos, sistemas de
proteção, interferência em sistemas de comunicação, etc. Estes eventos podem ter duração de
50ns em transitórios impulsivos até vários minutos em afundamentos de tensão. Desta forma,
quando monitorados por analisadores de energia, geram arquivos de dados de grande extensão
que, além de serem difíceis de armazenar, trazem muitas vezes informações desnecessárias para
a avaliação da qualidade de energia.
Neste trabalho, foi desenvolvido um sistema capaz de detectar, armazenar em mídia
digital e classificar eventos de qualidade de energia. A detecção é feita a partir da monitoração
do sinal de erro definido como a diferença entre o sinal de tensão obtido da rede elétrica e a
componente senoidal fundamental gerada pelo próprio algoritmo com valores de amplitude,
freqüência e fase estimados a partir da tensão monitorada.
A classificação do evento é feita com base no sinal de erro obtido pelo algoritmo de
detecção proposto. A mesma janela de erro armazenada, referente ao evento detectado, é,
então, utilizada para classificação do mesmo. Esta é uma inovação importante proposta no
trabalho. A estrutura empregada realiza um processo de alinhamento dos distúrbios na janela
de erro e, em seguida uma sub-amostragem, com o objetivo de reduzir seu número de
amostras e, posteriormente, a aplica como entrada de uma Rede Neural que, devidamente
treinada, se mostra capaz de diferenciar e classificar alguns tipos de eventos.
Resultados obtidos a partir de simulações do algoritmo têm mostrado que a utilização
da janela de erro para a classificação de eventos é viável, e ainda, apresenta maior versatilidade
durante o processo de treinamento da rede em relação à janela de sinal monitorado.
Publicações
• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, ”Digital System for Detection and Classification of Electrical Events, ”IEEE International Symposium on Circuits and Systems, Kobe, Japan, 2005.
• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, “Sistema Digital de Detecção e Classificação de Eventos de Qualidade de Energia”, Revista IEEE América Latina, 2005 (em fase de revisão)
• S. Cerqueira, C. A. Duque, R. M. Trindade, M. V. Ribeiro, "Redes Neurais na Classificação de Eventos de Qualidade de Energia Elétrica: uma Abordagem Comparativa", VI – Seminário Brasileiro de Qualidade de Energia Elétrica, agosto 2005, Belém, PA.
Agradecimentos
Gostaria de registrar algumas palavras de reconhecimento pelo apoio recebido durante
o desenvolvimento do presente trabalho. Em primeiro lugar, é importante lembrar que Deus
está sempre ao lado de todos nós, nos conduzindo e nos proporcionando vencer desafios cada
vez maiores, desafios estes, que nada mais são além da realização da própria vida.
A presença da família sempre contribuiu de forma decisiva na realização de grandes
projetos. Aos meus pais, Elazir e Roberto, fontes inesgotáveis de entusiasmo e otimismo,
deixo meu reconhecimento pelo apoio e dedicação recebidos durante a realização de mais este
importante passo em minha vida. De meu irmão, Roberto, tenho que reconhecer a grande
motivação recebida, sempre lembrando que o sucesso é fruto exclusivo do nosso próprio
esforço e dedicação. Uma pessoa muito importante e sempre presente é Renata, acredito que
seu apoio e paciência foram fundamentais para realização deste trabalho.
Aos amigos e professores com os quais tive o privilégio de trabalhar, ressalto meu
reconhecimento e a certeza de ter constituído grandes amizades que serão sempre lembradas.
Índice
Capítulo 1 – Ferramentas de Análise da Qualidade da Energia Elétrica ............................... 1
1.1 Introdução..................................................................................................................... 1
1.2 Técnicas utilizadas no estudo de fenômenos de qualidade de energia ......................... 2
1.3 Valor RMS (Root Mean Square) .................................................................................. 3
1.4 Transformada de Fourier (Fast Fourier Transform FFT) ............................................ 4
1.5 Banco de filtros e filtros adaptativos ............................................................................ 4
1.6 Filtros Kalman .............................................................................................................. 5
1.7 Wavelet......................................................................................................................... 5
1.8 Sistemas de reconhecimento de padrões ...................................................................... 6
1.9 Resumo do Capítulo ..................................................................................................... 7
Capítulo 2 – Distúrbios de Qualidade de Energia .................................................................. 8
2.1 Introdução..................................................................................................................... 8
2.2 Definição dos eventos mais comuns de qualidade de energia...................................... 9
2.3 Características dos Eventos de Qualidade de Energia................................................ 10
2.4 Possíveis causas de alguns eventos de qualidade de energia...................................... 12
2.5 Resumo do Capítulo ................................................................................................... 14
Capítulo 3 – Algoritmo Detector de Eventos ....................................................................... 15
3.1 Introdução................................................................................................................... 15
3.2 Visão geral do Algoritmo DE..................................................................................... 16
3.3 Estrutura de medição de fasor .................................................................................... 17
3.3.1 O Estimador de Freqüência ................................................................................. 18 3.3.2 O Gerador de Função Senoidal............................................................................ 19
3.4 Gerador da Componente Fundamental ....................................................................... 20
3.5 Controle da Atualização das Variáveis de Ambiente ................................................. 21
3.6 Obtenção do Sinal de Erro.......................................................................................... 21
3.7 Detecção e armazenamento dos eventos .................................................................... 22
3.8 Resumo do Capítulo ................................................................................................... 23
Capítulo 4 – Rede Neural Aplicada à Classificação de Padrões .......................................... 25
4.1 Introdução................................................................................................................... 25
4.2 Redes neurais.............................................................................................................. 26
4.3 Modelos de Neurônio ................................................................................................. 26
4.4 Tipos de Função de Ativação ..................................................................................... 29
4.5 Arquiteturas de rede.................................................................................................... 31
4.6 Neurônio Perceptron................................................................................................... 35
4.7 Perceptron de múltiplas camadas ............................................................................... 37
4.8 Algoritmo de retropropagação.................................................................................... 38
4.9 Resumo do Capítulo ................................................................................................... 50
Capítulo 5 – Geração de Dados ............................................................................................ 51
5.1 Introdução................................................................................................................... 51
5.2 Simulação dos eventos de Qualidade de Energia ....................................................... 52
5.3 Formação dos bancos de dados .................................................................................. 64
5.4 Resumo do Capítulo ................................................................................................... 66
Capítulo 6 – Sistema de Classificação.................................................................................. 67
6.1 Introdução................................................................................................................... 67
6.2 O pré-processamento .................................................................................................. 68
6.3 O Classificador Neural ............................................................................................... 73
6.3.1 Treinamento da rede neural ................................................................................. 74 6.3.2 Esforço computacional no classificador .............................................................. 88
6.4 Resumo do Capítulo ................................................................................................... 91
Capítulo 7 – Resultados........................................................................................................ 93
7.1 Introdução................................................................................................................... 93
7.2 Eventos simulados ...................................................................................................... 94
7.3 Dado real................................................................................................................... 105
7.4 Resumo do Capítulo ................................................................................................. 106
Capítulo 8 – Conclusões ..................................................................................................... 108
8.1 Sugestões para trabalhos futuros .............................................................................. 110
Referências ......................................................................................................................... 112
Capítulo 1
Ferramentas de Análise da Qualidade da Energia Elétrica
1.1 Introdução
O tema qualidade de energia tem se tornado um assunto de extrema importância no
mercado atual de energia elétrica. Dentre vários motivos, podemos ressaltar os seguintes: (1) a
falta de padrões definidos para estabelecer índices capazes de estimar de forma consistente a
qualidade da energia fornecida pelas concessionárias, (2) o desenvolvimento e a utilização cada
vez maior de equipamentos como inversores e conversores para acionamento de cargas de
potências cada vez mais elevadas, (3) a proliferação de sistemas micro-processados bastante
sensíveis às perturbações do sistema elétrico e, ainda, (4) a crescente interligação entre
processos produtivos no ambiente industrial [1]. Considerando as condições atuais de
funcionamento dos sistemas de potência, podemos considerar ainda, duas características
importantes, diretamente relacionadas com a qualidade da energia: a capacidade do sistema de
operar cargas sem comprometer o funcionamento das mesmas, mantendo níveis de qualidade
da tensão fornecida nos pontos comuns de acoplamento e a habilidade das cargas de operarem
sem causar distúrbios no sistema, comprometendo assim sua eficiência. Esta segunda
característica está intimamente ligada a forma de onda de corrente absorvida pela carga [2].
Estes aspectos levantados como motivadores das discussões sobre qualidade de energia
tornam a preocupação com a confiabilidade e o bom funcionamento do sistema elétrico um
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
2
compromisso não apenas das concessionárias, mas também dos consumidores.
Entende-se como evento de qualidade de energia qualquer falha ou desvio das
condições desejadas de funcionamento do sistema elétrico em regime permanente. De maneira
geral, os eventos de qualidade de energia se manifestam como deformidades nas formas de
onda de tensão causadas por desvios das condições normais de funcionamento do sistema em
regime permanente. Considerando a forma de onda de tensão, podemos encontrar vários tipos
de eventos como notches, presença de harmônicos, faltas, sobre-tensão (swell), afundamentos
(sag), flickers, impulsos, spikes, transitórios de chaveamento, etc. As características destes eventos
serão abordadas no Capítulo 2, onde será feita uma análise geral das principais características e
das possíveis causas dos eventos mais comuns de qualidade de energia. No Capítulo atual, será
apresentada uma breve revisão sobre algumas ferramentas importantes no processamento
digital de sinais que são empregadas na detecção e classificação de eventos de qualidade de
energia.
1.2 Técnicas utilizadas no estudo de fenômenos de qualidade de energia
Com o objetivo de detectar e classificar eventos de qualidade de energia, várias técnicas
de processamento digital de sinais são usualmente empregadas. Recursos como DFT
(Transformada Discreta de Fourier), DWT (Discrete Wavelet Transform), e outros, são
utilizados para extrair características intrínsecas de cada tipo de evento. Com base nestas
características é feita a classificação do evento por meio de Redes Neurais, Lógica Fuzzy ou
qualquer outro método capaz de classificar padrões [3]. Todos esses processamentos são
realizados, de maneira geral, sobre o sinal da rede armazenado que contém o evento a ser
classificado. Considerando que o sinal de tensão monitorado apresenta parâmetros que podem
variar com o tempo, podemos representar o sinal no tempo discreto através da Equação (1.1)
( ) ( ) [ ( ) ( )]s n A n sen n nω φ= + (1.1)
onde,
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
3
A(n) é a amplitude do sinal de tensão em função do tempo, ω é a freqüência angular do sinal,
que é função da freqüência fundamental do sistema monitorado, e, finalmente, o índice n
denota o tempo discreto.
1.3 Valor RMS (Root Mean Square)
Uma aproximação da amplitude do sinal descrito pela Equação (1.1) pode ser
facilmente encontrada através do cálculo de seu valor rms [4], que é obtido utilizando a
Equação (1.2). Que pode ser calculada em um intervalo de tempo de um ou meio ciclo da
componente fundamental do sistema, este intervalo é definido pelo comprimento da janela de
dados considerada (N).
2
1
1( ) ( )N
rmsi
s n N s n iN =
+ = +∑ (1.2)
O cálculo do valor rms, devido a sua extrema simplicidade, que garante uma alta
velocidade de processamento e a mínima necessidade de memória do sistema, é uma das
ferramentas de processamento digital de sinais mais utilizadas para a estimação do valor da
amplitude de um sinal de interesse. Suas limitações se encontram no fato de que a precisão do
valor rms estimado depende do comprimento da janela de dados. Em sinais suaves, uma janela
de comprimento de um ciclo apresenta resultados mais precisos em relação a outra janela de
comprimento de apenas meio ciclo da componente fundamental, a conseqüência direta do uso
de uma janela de comprimento maior é a diminuição da resolução no tempo do valor
estimado. Outro aspecto importante que deve ser levado em consideração a respeito da
estimação do valor rms é que esta técnica não distingue a componente fundamental de
componentes harmônicas ou de ruído presente no sistema, por conseqüência, a precisão da
estimativa do valor da amplitude do sinal dependerá diretamente da presença de harmônicos e
de ruído no sinal.
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
4
1.4 Transformada de Fourier (Fast Fourier Transform FFT)
Outra ferramenta muito utilizada no processamento digital de sinais com o objetivo de
se estimar a amplitude e a fase da componente fundamental de um sinal é a Transformada
Discreta de Fourier (DFT) [5]. Esta ferramenta pode extrair características dos espectros dos
eventos de qualidade de energia que são suficientes para sua classificação, como foi mostrado
em [4]. A Transformada Discreta de Fourier leva a representação de um sinal no domínio do
tempo para o domínio da freqüência. A equação básica que descreve a DFT é a seguinte:
1
0
1( ) ( ) k
Nj n
nS k s n e
Nω
−−
=
= ∑ (1.3)
onde S(k) é a DFT calculada nas freqüências ωk, N é o comprimento da janela onde
2k
kNπω ⎧ ⎫=⎨ ⎬
⎩ ⎭ define um conjunto fixo e igualmente espaçado de freqüências para 0 ≤ k ≤ N - 1.
A Transformada Rápida de Fourier (FFT) é uma implementação eficiente do algoritmo
da DFT onde sua velocidade, resultado de um número menor de operações, é considerada
uma importante vantagem. Com esta ferramenta é possível obter uma estimação da amplitude
da componente fundamental e dos harmônicos com razoável precisão. A boa performance da
FFT é observada na estimação de amplitude e fase de sinais estacionários, o mesmo não ocorre
quando o sinal sofre mudanças repentinas em suas características como, por exemplo, em
transitórios e afundamentos rápidos. Em alguns casos o resultado da estimação pode ser
melhorado através do processo de janelamento, por exemplo, utilizando janelas de Hanning,
Hamming, Kaiser ou filtros passa-baixas ou passa-alta.[5]. Outra desvantagem da FFT é que
sua resolução em freqüência depende do comprimento da janela de dados(N), quanto maior a
janela de dados, maior será a resolução em freqüência.
1.5 Banco de filtros e filtros adaptativos
Filtros são utilizados normalmente para extrair sinais em determinada faixa de
freqüência, por exemplo, passa-baixa, passa-alta e passa faixa. Uma aplicação interessante de
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
5
filtro adaptativo é apresentada em [7]. Os bancos de filtros são implementações compactas de
filtros simples. Este tipo de implementação é utilizado para estudar em detalhes uma faixa
específica do espectro de freqüência do sinal. Esta técnica é útil para detectar variações rápidas
na forma de onda ou estimar as componentes do sinal em uma faixa específica de freqüências,
por exemplo, o conteúdo harmônico entre 500 e 1000 Hz, possivelmente resultado do
chaveamento de um banco de capacitores no sistema.
1.6 Filtros Kalman
Outra técnica conhecida é a chamada filtro Kalman [8]. Esta técnica é definida como
um modelo de espaço de estados e pode ser utilizada para rastrear a amplitude e o ângulo de
fase das componentes fundamental e harmônicas em tempo real. Uma aplicação desta
ferramenta pode ser encontrada em [7],[9].
1.7 Transformada Wavelet
Esta técnica é utilizada para decompor o sinal em diferentes faixas de freqüências e
estudar suas características separadamente. Atualmente, é uma das ferramentas mais
empregadas na análise de fenômenos de qualidade de energia, como pode ser visto em [10],
[11] e [12]. O desempenho da Wavelet [5] se mostra melhor em sinais não periódicos que
contém componentes impulsivas de curta duração, situação comum em sistemas elétricos de
potência. Vários tipos de Wavelets têm sido utilizados para identificar eventos de qualidade de
energia, algumas delas são: Daubechies, Dyadic, Coiflets, Morlet e Symlets. Estes tipos de
Wavelets têm se mostrado mais adequados ao estudo de distúrbios de qualidade de energia,
ainda que o tipo de Wavelet deva ser escolhido em função do tipo de evento a ser analisado, o
que acaba resultando em uma redução da generalização das técnicas que empregam esta
ferramenta em determinadas situações.
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
6
1.8 Sistemas de reconhecimento de padrões
Ainda que a Wavelet apresente alguma limitação em sua capacidade de generalização, a
grande maioria das técnicas de classificação de eventos de qualidade de energia empregam esta
ferramenta, uma vez que podemos assumir que a energia contida nas componentes diferentes
da componente fundamental de um sinal depende do tipo de evento ocorrido. A Fig. 1.1
mostra um sistema típico de classificação de eventos de qualidade de energia.
Fig. 1.1. Sistema simplificado de um classificador de eventos de qualidade de energia.
O sistema apresentado na Fig. 1.1 mostra as três fases do processo de classificação:
• Pré-processamento: O pré-processamento é responsável pela aquisição e a preparação
dos dados para a sua utilização nas etapas posteriores. Na fase de pré-processamento
temos a sub-amostragem dos dados, a normalização, e a identificação do início e fim
do evento, entre outras operações.
• Extração de características: Este bloco é encarregado de obter informações capazes de
diferenciar alguns dos vários tipos de eventos que podem ocorrer no sistema. Estas
características podem ser obtidas por qualquer uma das ferramentas mostradas
anteriormente. De maneira geral, a ferramenta mais empregada atualmente para esta
função tem sido a Transformada Wavelet, onde os níveis de decomposição dos sinais
revelam diferentes componentes em função do tipo de evento.
• Classificação: a classificação dos eventos é feita através de ferramentas capazes de
reconhecer diferentes padrões de entrada, neste horizonte surgem as propostas dos
classificadores bayessianos, lineares e não lineares, lógica fuzzy [13], redes neurais [14]-
[15] , etc.
Capítulo 1- Ferramentas de Análise da Qualidade da Energia Elétrica
7
• O sistema de classificação adotado no presente trabalho emprega uma rede neural
como ferramenta principal para reconhecimento de padrões, os detalhes sobre a
utilização da rede serão apresentados oportunamente.
Uma proposta inovadora deste trabalho é realizar a classificação com base no sinal de
erro, que será definido no capítulo 3, obtido pelo algoritmo de detecção. A mesma janela de
sinal de erro armazenada, referente ao evento detectado, será, então, utilizada para sua
classificação.
1.9 Resumo do Capítulo
Este capítulo apresentou uma relação de algumas das ferramentas de processamento
digital de sinais mais utilizadas na análise da qualidade da energia elétrica. Existem ainda, outras
ferramentas como a transformada S [16] e tantas outras que vêm ganhando a atenção de
muitos pesquisadores da área. Com o conhecimento das técnicas apresentadas o leitor
perceberá, ao longo do trabalho, a inovação proposta em termos de realizar a classificação dos
eventos de qualidade de energia através do sinal de erro.
O capítulo 2 faz uma breve revisão dos principais eventos de qualidade de energia e
suas possíveis causas. Em seguida, será apresentado o algoritmo de detecção de eventos, onde
será gerado o sinal de erro que será utilizado para a classificação dos eventos. No capítulo 4 a
questão do uso da rede neural como classificador de padrões será retomada.
Capítulo 2
Distúrbios de Qualidade de Energia
2.1 Introdução
Este capítulo apresenta, de forma geral, alguns dos principais tipos de distúrbios,
ligados à “qualidade de energia”, que podem ocorrer em sistemas elétricos. Estes distúrbios
podem ser encontrados tanto em sistemas de transmissão como de distribuição de energia.
Cada tipo de distúrbio apresenta características próprias e, por isso, pode causar diferentes
falhas nos equipamentos conectados a rede elétrica, estas características são, ainda, uma
importante referência para o processo de classificação do distúrbio.
O termo “qualidade de energia”, em seu sentido amplo, deve ser interpretado como
qualidade de serviço, englobando três aspectos: confiabilidade, qualidade de energia oferecida e
provisão de informação [17]. Uma definição mais restrita está relacionada à habilidade do
sistema elétrico de operar cargas sem danificá-las e a habilidade de cargas operarem no sistema
sem perturbar ou reduzir a eficiência do sistema elétrico. A esta definição restrita que
estaremos nos referindo daqui por diante.
Contrastando com o termo confiabilidade [18], eventos típicos em qualidade de energia
dizem respeito a: a) eventos de curta duração, como afundamentos ou sobre-tensões que
durem poucos ciclos até alguns segundos causados por faltas em alimentadores ou pelo
ligamento de grandes cargas; b) eventos que durem menos de um ciclo, tais como transientes
Capítulo 2- Distúrbios de Qualidade de Energia
9
causados pelo chaveamento de capacitores, descargas elétricas, etc.; c) eventos de longas
durações como Harmônicos e flickers [19]-[22].
Características importantes para a classificação dos eventos de qualidade de energia
serão apresentadas neste capítulo, como a duração do evento, espectro harmônico do evento,
suas possíveis causas e os possíveis danos causados às cargas sujeitas a estes distúrbios.
2.2 Definição dos eventos mais comuns de qualidade de energia
Existe uma grande variedade de fenômenos elétricos que são considerados como
distúrbios de qualidade de energia quando presentes em sistemas de potência. As principais
características destes tipos de distúrbios serão apresentadas na Tabela 2.1 Um breve resumo das
definições dos distúrbios mais comuns apresentados em [1] é mostrado a seguir.
Transitórios
O termo transitório é empregado para caracterizar a ocorrência de um evento de curta
duração no sistema elétrico. Normalmente os fenômenos transitórios de interesse para a
qualidade de energia são impulsivos ou oscilatórios, como será visto adiante. Este termo
também é utilizado como referência ao tempo levado pelo sistema para restabelecer seu
funcionamento em regime permanente após uma alteração planejada em sua configuração de
funcionamento.
Variações de tensão de curta duração
As variações de tensão de curta duração são caracterizadas pela elevação (swell), ou
redução (sag) da amplitude da tensão no sistema durante um curto intervalo de tempo. A
redução da amplitude da tensão a valores inferiores a 0,1 pu (por unidade) caracteriza uma
interrupção momentânea do sistema. Os limites de tempo de ocorrência e os intervalos de
variação da amplitude da tensão para estes eventos são mostrados na Tabela 2.1.
Capítulo 2- Distúrbios de Qualidade de Energia
10
Variações de tensão de longa duração
As variações de tensão de longa duração são caracterizadas pela alteração do valor
RMS da tensão na freqüência fundamental do sistema por um período maior que 1 minuto.
Estas variações podem ser positivas, caracterizando uma sobre-tensão, ou negativas,
ocasionando uma sub-tensão.
Deformação da forma de onda de tensão
As distorções das formas de onda de tensão são definidas como desvios da forma
senoidal da tensão na freqüência fundamental do sistema. Estas distorções se apresentam em
regime permanente no sistema e são causadas, em sua grande maioria, pela presença de tensão
de offset, harmônicos, inter-harmônicos, notches e ruídos no sistema elétrico.
2.3 Características dos Eventos de Qualidade de Energia
As principais características observadas em eventos de qualidade de energia são: 1)
tempo de duração do distúrbio, 2) espectro harmônico e 3) variação na amplitude do sinal de
tensão observado no sistema elétrico. Os eventos de qualidade de energia podem ser divididos
em categorias e subcategorias de acordo com suas características [1]. A Tabela 2.1 apresenta
alguns tipos de eventos e suas principais características.
Tabela 2.1 Características de alguns distúrbios de qualidade de energia.
Categoria Conteúdo espectral Duração típica Amplitude típica Transitórios
Transitórios Impulsivos
Tempo de subida entre 5 ns e 1 ms < 1 ms
Transitórios Oscilatórios Até 5 MHz 5 µs – 50 ms 0 – 8 pu
Variações de curta duração Sag (afundamento) 0,5 ciclo – 1 min. 0,1 – 0,9 pu
Capítulo 2- Distúrbios de Qualidade de Energia
11
Swell (sobre-tensão) 0,5 ciclo – 1 min. 1,1 – 1,8 pu Interrupção < 1 min. < 0,1 pu
Variações de longa duração Sub-tensão > 1 min. 0,8 – 0,9 pu
Sobre-tensão > 1 min. 1,1 – 1,2 pu Interrupção sustentada > 1 min. 0,0 pu
Distorções da forma de onda Dc offset Regime permanente 0 – 0,1%
Harmônicos 0 – 100º harmônico Regime permanente 0 – 20% Inter harmônicos 0 – 6 KHz Regime permanente 0 – 2%
Notching Regime permanente Ruído Toda banda Regime permanente 0 – 1%
Outros distúrbios Desbalanceamento de
tensão Regime permanente 0,5 – 2%
Flutuação de tensão (flicker) < 25 Hz Intermitente 0,1 – 7%
Variações na freqüência
fundamental < 10 s
Algumas categorias mostradas na Tabela 2.1 ainda podem ser subdivididas em sub-
categorias menores, considerando como item de subdivisão alguma característica do evento em
questão. Os eventos transitórios oscilatórios, por exemplo, podem ser subdivididos
considerando a freqüência de oscilação como característica de distinção entre as sub-categorias
da seguinte forma: eventos oscilatórios de baixa freqüência (< 5 KHz), média freqüência (5 –
500 KHz) e alta freqüência (0,5 – 5 MHz). Do mesmo modo, o tempo de duração dos eventos
pode ser utilizado para subdividir as variações de tensão de curta duração (interrupção, sag e
swell) em sub-categorias de eventos instantâneos (0,5 ciclos – 30 ciclos), eventos momentâneos
(30 ciclos – 3 s) e temporários (3 s – 1 minuto).
Como pode ser observado na Tabela 2.1, os eventos de qualidade de energia
apresentam um amplo espectro de freqüência e tempo de duração em sua composição, desde
eventos de ocorrência lenta, como nas flutuações de tensão (flicker), até eventos transitórios
rápidos, com duração da ordem de microssegundos. Como conseqüência natural, os
Capítulo 2- Distúrbios de Qualidade de Energia
12
equipamentos utilizados na monitoração da qualidade de energia devem ser capazes de
trabalhar com altas taxas de amostragem, com o objetivo de detectar eventos rápidos e de curta
duração e uma grande capacidade de armazenar dados nos casos de eventos de longa duração.
Estas características serão consideradas oportunamente no capítulo seguinte, onde será
apresentado o algoritmo do Detector de Eventos, que otimiza estas habilidades do algoritmo
utilizado.
2.4 Possíveis causas de alguns eventos de qualidade de energia.
Todo evento de qualidade de energia se relaciona com a operação do sistema elétrico,
bem como com condições adversas como é o caso das descargas atmosféricas. As
características de algumas cargas conectadas ao sistema de potência podem causar distúrbios
elétricos que comprometem a qualidade da energia mesmo durante a operação normal da
carga, como nos casos onde a presença de notches no sinal de tensão está relacionada com o
acionamento de cargas através de dispositivos chaveados conectados ao sistema. Este tipo de
distúrbio é uma característica intrínseca dos sistemas de acionamento, que ao resolverem um
problema, como o controle de velocidade de motores, causam “poluição” na rede elétrica que
por sua vez pode afetar o funcionamento de dispositivos sensíveis à presença de notches como
equipamentos micro-processados.
Considerando a situação apresentada acima, muitas vezes podemos ter uma falha de
operação de determinado equipamento cuja causa se encontra na operação normal de outro
equipamento, a Tabela 2.2 apresenta um resumo dos eventos mais comuns de qualidade de
energia apontados em [23] e suas prováveis causas, o conhecimento do tipo de evento causado
por determinado tipo de carga é de extrema importância para a análise de problemas de
qualidade de energia.
Tabela 2.2. Possíveis causas de alguns tipos de eventos de qualidade de energia.
Transitórios Sub-categoria Duração Possível causa
Impulsivo > 2µs Descarga atmosférica.
Capítulo 2- Distúrbios de Qualidade de Energia
13
Transitórios Oscilatórios
Sub-categoria Freqüência de oscilação Possível causa
Alta freqüência > 500 KHz Eventos de chaveamento, transitório de comutação de circuitos RLC.
Média freqüência 5 – 500 KHz Transitório impulsivo, Chaveamento de banco de capacitores próximo a outros bancos já energizados.
Baixa freqüência 0,3 – 5 KHz Chaveamento de banco de capacitores.
Freqüência muito baixa < 300 Hz Ferro-ressonância, energização de transformador.
Variações de curta duração Sub-categorias Duração Possível causa
Interrupções < 1 min Faltas no sistema de potência, falhas de equipamentos ou falha de controle.
Afundamentos (sags) 2 ms – 1 min
Faltas no sistema de potência, entrada de um grande bloco de carga no sistema, interação entre a carga e a linha de alimentação (principalmente durante a partida de equipamentos) ou entre a carga e a impedância da fonte de energia.
Sobre-tensão (swells) 0,5 ciclos – 1 min Faltas no sistema de potência, saída de um grande bloco de carga ou chaveamento de um grande banco de capacitores.
Variações de longa duração Sub-categorias Duração Possível causa
Sobre-tensão > 1 min
Desligamento de cargas, variações na compensação de potência reativa no sistema, ajuste incorreto de reguladores de tensão.
Sub-tensão > 1 min
Desligamento de carga do sistema, variações na compensação de potência reativa no sistema, ajuste incorreto de reguladores de tensão, seleção incorreta de taps de transformadores, sobrecarga involuntária de linhas de transmissão.
Interrupções sustentadas > 1 min Acidentes com linhas de transmissão, falhas em transformadores ou fontes alternativas de energia.
Distorções da forma de onda Sub-categoria Possível causa
Dc offset Distúrbios geomagnéticos, entrada ou saída de uma máquina síncrona no sistema, presença de fontes de potência chaveadas no sistema.
Harmônicos Dispositivos não lineares e cargas como, computadores, acionamentos de velocidade variável, sistemas eletrônicos de equipamentos de telefonia.
Inter-harmônicos Conversores estáticos de freqüência, ciclo-conversores, motores de indução e dispositivos que operam com arco elétrico.
Notching Funcionamento normal de dispositivos chaveados de potência quando ocorre o chaveamento de uma fase para outra.
Capítulo 2- Distúrbios de Qualidade de Energia
14
Ruído Dispositivos eletrônicos de potência, circuitos de controle, equipamentos que trabalham com arco elétrico e fontes chaveadas de potência.
Flutuação de tensão Qualquer carga com considerável variação de corrente, especialmente em componente reativa, como fornos a arco.
Variações na freqüência fundamental
Faltas na maior parte do sistema de transmissão, um grande bloco de carga sendo desconectado do sistema ou a saída de um grande grupo de geração do sistema.
A partir das informações contidas nas tabelas 2.1 e 2.2, é possível observar a grande
quantidade de eventos de qualidade de energia que podem ocorrer em um sistema elétrico.
Como será mostrado adiante, cada tipo de evento apresentará uma diferença da forma de onda
da componente fundamental que será responsável pela geração de um perfil de sinal particular,
que em seguida será chamado de sinal de erro. Com base neste sinal de erro, será realizada a
detecção e a classificação do evento ocorrido no sistema sob monitoração, como será
mostrado nos capítulos seguintes.
2.5 Resumo do capítulo
Este capítulo apresentou alguns dos eventos mais comuns de qualidade de energia nos
sistemas de potência atuais, preparando o leitor para os capítulos subseqüentes, onde serão
tratados os problemas de detecção e classificação dos eventos.
A detecção e a classificação de eventos de qualidade de energia facilita a identificação e
localização da fonte geradora de distúrbios e, conseqüentemente, a correção do problema no
sistema de potência, prevenindo possíveis danos a cargas ligadas ao sistema e melhorando a
qualidade de energia fornecida pelo sistema.
Capítulo 3
Algoritmo Detector de Eventos
3.1 Introdução
Neste capítulo, será feita uma descrição do Algoritmo do Detector de Eventos – (DE).
Este algoritmo é responsável pela aquisição dos dados de eventos de qualidade de energia
tratados neste trabalho. Vários conceitos utilizados pelo DE foram desenvolvidos em trabalhos
anteriores [9], [24] e serão revistos com o objetivo de proporcionar um melhor entendimento
de sua estrutura interna. A compreensão do funcionamento do DE é fundamental para sua
localização dentro de um contexto mais amplo de um sistema de detecção e classificação de
eventos de qualidade de energia com base no sinal de erro.
Inicialmente o DE terá seu funcionamento descrito de forma geral e, em seguida, será
feita uma breve descrição de suas principais estruturas internas, os conceitos empregados para
a estimação do fasor do sinal monitorado, a geração da componente senoidal fundamental, e as
estruturas de controle que utilizam ferramentas estatísticas para atualizar as variáveis estimadas
durante o processo de monitoramento e detecção dos eventos. A geração do sinal de erro e sua
utilização para a detecção dos eventos serão abordadas e, em seguida, será mostrado o
resultado final do processamento realizado pelo algoritmo DE, a janela armazenada do sinal de
erro, que será utilizada pelo processo de classificação.
Capítulo 3- Algoritmo Detector de Eventos
16
3.2 Visão geral do Algoritmo DE
O algoritmo DE é responsável pela detecção e pelo armazenamento dos dados
relativos à ocorrência de distúrbios de qualidade de energia. O sinal de erro utilizado adiante
no processo de classificação dos eventos é gerado pelo DE, desta forma, seu funcionamento
influencia diretamente no processo de classificação. A Fig. 3.1 apresenta um diagrama de blocos
simplificado do DE.
Fig. 3.1. Diagrama de blocos do DE
O bloco Evento de Qualidade de Energia representa as amostras do sinal de tensão do
sistema sob monitoração. A estrutura do Estimador de Parâmetros é responsável pela extração
das características da componente fundamental do sistema. No bloco Gerador da Componente
Fundamental, a componente fundamental do sistema é reproduzida e, em seguida, é subtraída
do sinal monitorado dando origem ao sinal de erro e(n). Na etapa de detecção de eventos, é
feita uma monitoração do comportamento estatístico da energia do sinal de erro. Através dessa
monitoração é disparado um sinal de ocorrência de evento que autoriza ou não o
armazenamento dos dados relativos ao mesmo. Os dados armazenados são uma janela do sinal
monitorado contendo o distúrbio e uma janela do sinal de erro correspondente ao distúrbio.
Existem ainda, as estruturas de controle que são responsáveis pela atualização dos
parâmetros estimados da componente fundamental utilizados pelo Gerador da Componente
Fundamental. Os detalhes dessas estruturas serão apresentados adiante.
Capítulo 3- Algoritmo Detector de Eventos
17
3.3 Estrutura de medição de fasor
A estimação do fasor da componente fundamental do sistema elétrico sob monitoração
é feita através do Algoritmo Modulador para Medição de Fasor – AMMF [25]. Este algoritmo
é uma versão modificada do algoritmo de Fourier que busca reduzir o erro na estimação do
fasor quando ocorrem pequenos desvios na freqüência do sinal monitorado. O diagrama de
blocos da Fig. 3.2 mostra a estrutura do AMMF. O sinal y[n] representa o sinal de entrada, do
qual se deseja estimar o fasor. O conjunto dos blocos Estimador de Freqüência e Gerador de
Função Senoidal é responsável pela geração dos sinais modulantes gc[n] e gs[n]. Após a
modulação os sinais passam por filtros passa-baixa e então temos a representação do módulo e
da fase do sinal y[n] nos sinais XC1 e XS1. As demais operações levam ao cálculo da amplitude
do sinal de entrada A1[n-k], onde o índice k representa o atraso na resposta introduzido pelo
processo de filtragem.
Estimador deFreqüência
Gerador deFunção Senoidal 2
[ ]y n1[ ] cos[ ]cg n n= Ω
1[ ] [ ]sg n sen n= Ω
1cX
1sX
1[ ]A n k−1Ω
Fig. 3.2. Diagrama de blocos do AMMF.
O AMMF apresenta duas modificações em relação ao algoritmo de Fourier: a primeira
diz respeito ao fato de que a precisão do cálculo do fasor está intimamente relacionada com a
freqüência do sinal de modulação utilizado. Para que o algoritmo de Fourier funcione
corretamente é necessário que os sinais de modulação tenham exatamente a mesma freqüência
do sinal monitorado.
Na aplicação proposta, a freqüência do sinal monitorado pode oscilar em torno de 60
Hz, logo, os sinais modulantes gc[n] e gs[n] mostrados na Fig. 3.2 devem acompanhar estas
oscilações. Com este objetivo foi introduzida a estrutura do Estimador de Freqüência do sinal
Capítulo 3- Algoritmo Detector de Eventos
18
monitorado, esta estrutura precede o Gerador de Função Senoidal que gera os sinais
modulantes e é responsável por atualizar a freqüência destes sinais sempre que houver uma
variação da freqüência de y[n].
A segunda modificação presente no AMMF é a substituição dos filtros. No algoritmo
de Fourier a freqüência do sinal é considerada constante, o que permite o uso de filtros de
média-móvel de maneira eficiente, uma vez que estes permitem a passagem da componente de
freqüência zero e apresentam uma alta rejeição às componentes harmônicas do sinal. Como o
presente estudo prevê pequenas oscilações da freqüência do sinal monitorado, observa-se que
os filtros de média-móvel não apresentam grande rejeição fora das freqüências harmônicas do
sinal para o qual foram projetados e ainda, não apresentam uma curva de resposta plana na
vizinhança da freqüência zero, características desejáveis na atual aplicação.
A solução encontrada foi o uso de filtros IIR no lugar dos filtros FIR. Estes filtros
podem ser implementados para apresentarem alta rejeição para freqüências acima da
freqüência de corte e ainda, uma curva de resposta plana na vizinhança da freqüência zero. O
filtro implementado no AMMF é um Butterworth de sétima ordem [25].
3.3.1 O Estimador de Freqüência
O Estimador de Freqüência utilizado pelo AMMF emprega basicamente um filtro notch
IIR adaptativo[26] como ferramenta para estimar a freqüência do sinal monitorado. O
funcionamento de um filtro notch visa excluir em sua saída a componente senoidal de
freqüência definida por seus coeficientes. Considerando que a freqüência do sinal de entrada
que se deseja rejeitar não é constante, torna-se necessária a realização da sintonia do filtro
alterando os valores de seus coeficientes. Esta sintonia é feita através de um algoritmo que
busca minimizar o sinal de saída do filtro. A Fig. 3.3 mostra a estrutura simplificada do filtro
notch utilizado como estimador de freqüência. O sinal de entrada y[n] passa por um filtro passa
faixa de função de transferência HPF de ganho unitário e defasamento zero na freqüência de
passagem definida por seus coeficientes. Em seguida o sinal filtrado é subtraído do sinal de
entrada y[n] dando origem ao sinal e[n]. O algoritmo de sintonia ajusta os coeficientes do filtro
de modo a minimizar o sinal e[n]. Em seguida a freqüência da componente fundamental Ω é
Capítulo 3- Algoritmo Detector de Eventos
19
obtida em função dos coeficientes do filtro [25].
[ ]y n
Ω
[ ]e n
Fig. 3.3. Estrutura do Estimador de Freqüência.
3.3.2 O Gerador de Função Senoidal
O algoritmo DE utiliza sinais senoidais e cossenoidais para realizar a modulação do
sinal de entrada durante a estimação do fasor e também para a geração da componente
fundamental do sinal monitorado. Estes sinais são gerados pelo bloco Gerador de Função
Senoidal apresentado na Fig. 3.2. Esta estrutura é definida em [27] e tem seu equacionamento
na forma matricial mostrado na Equação (3.1).
1 1
2 2
[ 1] [ ]cos cos 1[ 1] cos 1 cos [ ]
s n s ns n s n
+ Ω Ω+⎡ ⎤ ⎡ ⎤⎡ ⎤=⎢ ⎥ ⎢ ⎥⎢ ⎥+ Ω− Ω⎣ ⎦⎣ ⎦ ⎣ ⎦
(3.1)
Na Equação (3.1), s1 e s2 representam os sinais seno e cosseno gerados na freqüência
digital Ω. O termo cosΩ utilizado pelo gerador é obtido do Estimador de Freqüência descrito
no tópico anterior. O sistema depende ainda que a amplitude dos sinais gerados seja unitária,
devido às simplificações utilizadas para que a única variável no equacionamento do gerador
seja o termo cosΩ, o sinal s2 não apresenta amplitude unitária, deste modo, é aplicado um fator
de escala na saída do gerador para que sua amplitude se torne unitária.
Na Fig. 3.4 é mostrada a ligação entre o Estimador de Freqüência e o Gerador de
Função Senoidal, onde pode ser observado um procedimento de linearização para se chegar ao
termo cosΩ que atualiza o Gerador de Função Senoidal.
Capítulo 3- Algoritmo Detector de Eventos
20
Ω cos[ ]Ω
Ω
Gerador deFunção Senoidal
cosΩ[ ]sen nΩ
cos[ ]nΩ
Estimador deFreqüência
Fig. 3.4. Interligação entre o Estimador de Freqüência e o Gerador de Função Senoidal.
3.4 Gerador da Componente Fundamental
As estruturas apresentadas no tópico 3.3 são integradas para compor o Gerador da
Componente Fundamental. A esta nova estrutura, é adicionado um sistema de análise
estatística e controle das atualizações das variáveis que contém as características da
componente fundamental. Estas variáveis são chamadas de variáveis de ambiente. Este
controle é responsável por alterar as características da componente fundamental gerada em
resposta às alterações ocorridas no sistema sob monitoração. A Fig. 3.5 mostra a estrutura
completa do Gerador da Componente Fundamental.
[ ]y n1cos[ ]nΩ
1sen[ ]nΩ
1cX
1sX
11 1 1[ ] cos[ ]y n A n φ= Ω +
1Ω
1Ω 1cX
1sX
1Sw
2Sw
3Sw
Fig. 3.5. Diagrama esquemático do Gerador da Componente Fundamental.
Os sinais Ω1, 1cX e
1sX que representam a freqüência e as características de módulo e
fase da componente fundamental são atualizados através das chaves Sw1, Sw2 e Sw3, mostradas
na Fig. 3.5. Estas chaves são controladas pelo algoritmo de controle das atualizações das
Capítulo 3- Algoritmo Detector de Eventos
21
variáveis de ambiente, este algoritmo será abordado adiante.
3.5 Controle da Atualização das Variáveis de Ambiente
O processo de atualização é controlado por um sistema de monitoramento estatístico
do comportamento das variáveis de ambiente. Os sinais Ω1, 1cX e
1sX , mostrados na Fig. 3.5,
são reunidos em janelas, das quais são calculados os valores de média e variância para cada um
dos parâmetros. O tamanho das janelas foi definido como um múltiplo de ciclos da
componente fundamental do sinal da rede elétrica para cada variável de ambiente. Foi
observado que janelas menores proporcionam uma melhor performance do algoritmo para
eventos de curta duração, por outro lado, para eventos de longa duração, janelas maiores são
mais estáveis. Os valores utilizados na atualização são sempre as médias das variáveis
consideradas. O algoritmo de controle das atualizações só atualiza o gerador quando a
componente fundamental estiver em regime permanente, desta forma, a variância dos
parâmetros estimados da componente fundamental deve apresentar valores abaixo de limiares
pré-definidos. A definição dos limiares de variância leva em conta a relação sinal-ruído SNR
(signal to noise ratio) do sinal da rede elétrica monitorado e o tempo levado pelo algoritmo para
se estabilizar novamente em regime permanente após a ocorrência de um distúrbio.
3.6 Obtenção do Sinal de Erro
Com o conjunto de estruturas apresentadas anteriormente é possível reproduzir a
componente fundamental do sinal monitorado da rede elétrica. Este sinal é, então, utilizado
como referência para o sinal amostrado. O sinal de erro e[n] apresentado na Fig. 3.1 é obtido a
partir da subtração da componente fundamental, gerada pelo algoritmo, do sinal monitorado.
De maneira resumida, o sistema tem um funcionamento semelhante ao de um filtro notch
sintonizado na componente fundamental do sistema elétrico monitorado. O resultado obtido é
ilustrado na Fig. 3.6.
Capítulo 3- Algoritmo Detector de Eventos
22Te
nsão
pu
Tens
ão p
uTensão pu
Fig. 3.6. Sinal de erro obtido pelo algoritmo DE.
3.7 Detecção e armazenamento dos eventos
Após a obtenção do sinal de erro e(n), como ilustrado na Fig. 3.6, o algoritmo de
detecção de eventos processa uma análise estatística deste sinal, de modo a identificar a
ocorrência de distúrbios no sinal monitorado. Esta análise é realizada da seguinte forma,
inicialmente é calculado o valor RMS do sinal de erro. Em seguida, este sinal passa a ser
analisado por janelas, onde a média de cada janela é calculada e comparada a um limiar de
energia média do sinal de erro. Este limiar é ajustado automaticamente pelo algoritmo em
função do comportamento do sistema elétrico em regime permanente. O funcionamento
normal do sistema elétrico não causa inovações no sinal de erro, porém, os distúrbios do
sistema são efetivamente transferidos para o sinal de erro.
Sempre que ocorre uma variação da energia média do sinal de erro entre duas janelas e
esta variação é maior que o parâmetro de sensibilidade de detecção, ocorre o disparo do
sistema de armazenamento de dados. O algoritmo armazena as amostras relativas a quatro
ciclos do sinal da rede, dois ciclos são considerados antes do momento da detecção e dois
ciclos após a detecção. Este processo tem como conseqüência uma janela de dados
armazenada onde o início de todos os eventos ocorre na primeira metade da janela. De forma
semelhante, é armazenada também a janela do sinal de erro correspondente ao sinal de entrada
armazenado.
Capítulo 3- Algoritmo Detector de Eventos
23
O resultado obtido de todo o processamento realizado pelo algoritmo DE é ilustrado
nas Fig. 3.7e Fig. 3.8, onde podemos ver as janelas armazenadas do sinal de entrada e do sinal
de erro devido à ocorrência de um evento de qualidade de energia. O DE trabalha com uma
taxa de amostragem de 15360 Hz, que leva a uma representação de um sinal monitorado de 60
Hz com 256 amostras por ciclo. Portanto, cada janela armazenada possui 1024 amostras, que
representam quatro ciclos da componente fundamental.
Fig. 3.7. Sinal de entrada e janela armazenada contendo o distúrbio.
Fig. 3.8. Sinal de erro e janela armazenada do sinal de erro.
3.8 Resumo do Capítulo
Este capítulo apresentou de forma resumida o funcionamento do Algoritmo Detector
de Eventos - DE. Foram apresentados alguns detalhes funcionais das principais estruturas que
compõem o algoritmo, como a estimação dos parâmetros da componente fundamental e o
Capítulo 3- Algoritmo Detector de Eventos
24
processo de atualização das variáveis de ambiente. O processo de geração da componente
fundamental foi mostrado de forma integrada com o AMMF.
O resultado principal obtido com o algoritmo DE são as janelas de dados contendo o
sinal de erro relativo à ocorrência dos eventos de qualidade de energia. Alguns aspectos
resultantes do processo utilizado para a detecção, como a presença do início do distúrbio
sempre na primeira metade da janela armazenada, serão explorados pelo processo de
classificação. Outro fator importante que foi observado é a integridade da janela de erro que é
mantida pelo bloqueio do algoritmo de atualização do gerador da componente fundamental
enquanto os dados são arquivados. Como foi observado o algoritmo DE tem papel
fundamental no processo de classificação dos eventos de qualidade de energia, uma vez que
todo o processo de classificação será baseado na análise do sinal erro por ele gerado.
Capítulo 4
Rede Neural aplicada a Classificação de Padrões
4.1 Introdução
O presente capítulo apresenta as redes neurais como uma importante ferramenta para a
classificação de padrões. Serão apresentados os conceitos básicos de redes neurais, suas
principais arquiteturas e capacidades. Com objetivo de classificar padrões, os neurônios
denominados perceptrons serão abordados como uma importante topologia de rede para este
fim. O tradicional algoritmo de retropropagação será abordado como ferramenta de
treinamento para o perceptron de múltiplas camadas. A metodologia apresentada no capítulo é
a mesma encontrada em [28], onde também podem ser encontradas mais informações sobre o
funcionamento das redes neurais.
Na abordagem proposta pelo trabalho atual, os eventos de qualidade de energia
detectados e armazenados, conforme descrito no Capítulo 3, serão apresentados a uma rede
neural para serem classificados. A descrição do processamento realizado antes da apresentação
dos sinais à rede e o desempenho obtido na classificação serão discutidos nos próximos
capítulos.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
26
4.2 Redes neurais
A redes neurais apresentam uma grande versatilidade na resolução de vários tipos de
problemas, como em sistemas de reconhecimento e compressão de voz e imagem, controle e
automação de processos, modelagem de plantas industriais, sistemas de predição de séries
temporais, desenvolvimento de produtos, análise de sinais de eletroencefalograma e
eletrocardiograma, e vários outros problemas em diversas áreas. No presente trabalho,
investiga-se a utilização de uma rede neural para realizar o reconhecimento de diferentes
padrões de sinais e possibilitar a classificação dos mesmos em diferentes classes.
4.3 Modelos de Neurônio
A unidade básica de processamento presente nas redes neurais é o neurônio, o
diagrama de blocos da Fig. 4.1 apresenta o modelo típico de um neurônio utilizado na
construção de redes neurais artificiais.
wk1
wk2
wkm
x1
x2
xm
Sinais deentrada
bk
Bias
Pesossinápticos
.
Função deativação
Saídayk
vk
Somador
Fig. 4.1. Modelo não-linear de um neurônio.
Para melhor compreensão do funcionamento de um neurônio artificial, devemos
observar cuidadosamente a nomenclatura utilizada na Fig. 4.1 e, ainda, como se dá o fluxo dos
sinais de entrada através do modelo até que seja obtida a saída do mesmo.
Os sinais de entrada xj são aplicados às entradas das sinapses j, que são conectadas ao
neurônio k, através das sinapses, os sinais de entrada xj são multiplicados pelos respectivos
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
27
pesos sinápticos wkj. A identificação dos pesos sinápticos (Wkj) é formada pelo número de
identificação do neurônio k e em seguida pelo índice da conexão de entrada da sinapse a qual o
peso se refere. Os pesos sinápticos wkj podem pertencer a um intervalo que contenha valores
positivos e também negativos.
Em seguida, encontramos um somador, representado pelo símbolo Σ, que é
responsável por realizar o somatório dos sinais de entrada ponderados pelos pesos sinápticos
do respectivo neurônio. Este conjunto de operações realizadas constituem um combinador
linear.
A próxima estrutura encontrada é a função de ativação do neurônio ϕ(⋅), esta função é
responsável por limitar a amplitude da saída do neurônio, de modo geral, a saída do neurônio
apresenta valores no intervalo de [0 , 1], podendo, alternativamente apresentar valores contidos
no intervalo [-1 , 1].
Uma última observação a respeito do modelo de neurônio apresentado na Fig. 4.1 é a
presença do bias bk, a função do bias, aplicado externamente, é aumentar ou diminuir a entrada
líquida da função de ativação, dependendo de seu valor ser positivo ou negativo,
respectivamente.
Matematicamente, o modelo de neurônio artificial k, apresentado na Fig. 4.1 pode ser
descrito através do par de equações (4.1) e (4.2), respectivamente.
1
m
k kj jj
u w x=
= ∑ (4.1)
e
( )k k ky u bϕ= + (4.2)
onde x1, x2, ..., xm são os sinais de entrada; wk1, wk2, ..., wkm são os pesos sinápticos do neurônio
k; uk é a saída do combinador linear correspondente aos sinais de entrada; bk é o bias; ϕ(⋅) é a
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
28
função de ativação e, finalmente, yk é a saída do neurônio. A utilização de um bias bk tem o
efeito de aplicar uma transformação afim à saída uk do combinador linear. Como foi mostrado
na Fig. 4.1, a utilização do bias pode ser escrita através da Equação (4.3), onde vk é definido
como o campo local induzido do neurônio k.
k k kv u b= + (4.3)
Uma outra representação para o modelo-não linear do neurônio k, apresentado na Fig.
4.1, pode ser obtida considerando-se a inclusão de uma nova sinapse com um sinal de entrada
x0, fixo em +1 e um peso sináptico wk0 igual ao bias bk. Este novo arranjo do modelo não-linear
do neurônio pode ser visto na Fig. 4.2.
. . .
. . .
Fig. 4.2. Modelo do neurônio considerando o bias com peso sináptico.
Nas equações (4.4) e (4.5), temos a formulação da nova configuração do modelo não-
linear do neurônio.
0
m
k kj jj
v w x=
= ∑ (4.4)
( )k ky vϕ= (4.5)
Podemos facilmente perceber que apesar da diferença no arranjo físico do modelo, as
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
29
duas representações se mantêm matematicamente equivalentes.
4.4 Tipos de Função de Ativação
A função de ativação ϕ(⋅), como foi apresentada anteriormente, tem o objetivo de
limitar o valor da saída do neurônio em função do campo local induzido v. Serão considerados,
aqui, três tipos básicos de função de ativação:
Função limiar: esta função é definida matematicamente pela Equação (4.6).
1 0
( )0 0
se vse v
ϕ≥⎧
⋅ = ⎨ <⎩ (4.6)
Esta função de ativação também é conhecida como função de Heaviside na literatura
de engenharia. A saída do neurônio k que utiliza uma função de ativação limiar apresenta a
seguinte relação:
1 00 0
kk
k
se vy
se v≥⎧
= ⎨ <⎩ (4.7)
onde vk é o campo local induzido do neurônio k: 0
m
k kj j kj
v w x b=
= +∑ .
Função linear por partes: esta função apresenta um fator de amplificação na região
linear de operação igual à unidade. Uma aproximação do comportamento deste tipo de função
é obtida considerando-se o funcionamento de um amplificador não-linear. Os dois
comportamentos possíveis são os seguintes:
• Na operação na região linear, o comportamento é de um combinador linear.
• Considerando que o fator de amplificação na região linear tenda ao infinito, a
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
30
função linear por partes se resume à função limiar.
A relação matemática que define a função linear por partes é a seguinte:
11, 21 1( ) , 2 2
10, 2
v
v v v
v
ϕ
⎧ ≥ +⎪⎪= + > > −⎨⎪
≤ −⎪⎩
(4.8)
Função Sigmóide: a função sigmóide é a mais empregada na construção de redes
neurais artificiais. Ela é definida como uma função estritamente crescente que apresenta um
balanceamento adequado entre o comportamento linear e não-linear. Um exemplo de função
sigmóide é a função logística, definida como:
1( )1 avv
eϕ −=
+ (4.9)
onde a é o parâmetro de inclinação da função sigmóide. No limite, quando o parâmetro de
inclinação se aproxima do infinito, a função sigmóide se resume à função limiar. Enquanto a
função limiar apresenta valores 0 ou 1, a função sigmóide assume um intervalo contínuo de
valores entre 0 e 1. Outra importante vantagem da função sigmóide é sua diferenciabilidade em
todo intervalo de resposta, característica não apresentada pela função de limiar.
Um esboço das funções de ativação apresentadas é mostrado na Fig. 4.3, onde temos
em (a) a representação da função de limiar, em (b) a representação da função linear por partes
e, finalmente, em (c) o esboço de uma função sigmóide.
Fig. 4.3. Esboço das principais funções de ativação utilizadas em redes neurais artificiais.
As funções de ativação definidas anteriormente apresentam um intervalo de resposta
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
31
de 0 a 1. Alternativamente pode ser interessante utilizar uma função de ativação que se estenda
de -1 a 1, estas funções devem apresentar uma forma anti-simétrica em relação à origem. Desta
forma, a função limiar pode ser definida da seguinte maneira:
1 0
( ) 0 01 0
se vse vse v
ϕ>⎧
⎪⋅ = =⎨⎪− <⎩
(4.10)
que, desta forma é conhecida como função sinal. Para a forma correspondente da função
sigmóide podemos utilizar a função tangente hiperbólica:
( ) tanh( )v vϕ = (4.11)
O fato de permitir que uma função de ativação do tipo sigmóide assuma valores
negativos, como mostrado na Equação (4.11) traz benefícios analíticos para sua utilização em
redes neurais artificiais.
4.5 Arquiteturas de rede
A maneira pela qual os neurônios apresentados na seção anterior são arranjados para
formar a rede neural artificial está intimamente ligada ao funcionamento do algoritmo de
aprendizagem utilizado para treinar a rede. De forma geral, temos três arquiteturas de rede
diferentes, a saber:
Redes com alimentação direta (feedforward) com camada única
Os neurônios em uma rede neural artificial estão organizados em camadas. A estrutura
mais simples que constitui uma rede, apresenta uma camada de entrada que aplica o sinal de
entrada sobre uma camada de neurônios de saída. O sentido do fluxo do sinal na rede é
estritamente da entrada para a camada de saída, razão pela qual esta estrutura é chamada de
rede alimentada adiante. A Fig. 4.4 mostra esta estrutura de rede. A característica de camada
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
32
única, parte da observação do número de camadas com neurônios que realizam
processamento. Como pode ser observado na Fig. 4.4, a camada de entrada, composta pelos
neurônios fonte, não realiza processamento, portanto, apenas a camada de saída é composta
por neurônios que realizam processamento. Caracterizando, assim, uma rede de apenas uma
camada.
Camada deentrada
(neurônios fonte)
Camada deneurônios de
saída
Fig. 4.4. Rede alimentada adiante com apenas uma camada de neurônios.
Redes alimentadas diretamente com múltiplas camadas
Esta rede difere da descrita anteriormente pela presença de uma ou mais camadas
ocultas, compostas de neurônios também chamados de neurônios ocultos. Através da adição
de camadas ocultas na estrutura da rede, esta adquire a capacidade de extrair estatísticas de
ordem elevada. Esta característica é particularmente valiosa quando o tamanho da camada de
entrada é grande.
O fluxo de informação na rede se dá a partir da camada de entrada, que recebe o vetor
de entrada e o aplica à primeira camada oculta, em seguida, os sinais de saída desta camada são
feitos sinais de entrada para a segunda camada oculta e assim sucessivamente. Por fim, o sinal
de saída da última camada (camada de saída) representa a saída global da rede em relação ao
padrão de ativação apresentado à camada de entrada.
A Fig. 4.5 apresenta uma estrutura de rede alimentada diretamente com múltiplas
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
33
camadas, esta rede é composta por uma camada de entrada com seis neurônios de fonte, uma
camada oculta formada por quatro neurônios e, por fim, a camada de saída, constituída de dois
neurônios.
Camada deentrada
(neurônios fonte)
Camada deneurônios de
saídaCamada deneurônios
ocultos
Fig. 4.5. Rede alimentada adiante com camada de neurônios ocultos.
Pode, ainda, ser observado na Fig. 4.5 que esta é uma estrutura de rede totalmente
conectada, considerando que cada um dos neurônios da rede se encontram conectados a todos
os neurônios da camada adjacente. Caso alguma dessas conexões sinápticas não estejam
presentes na rede, esta será considerada uma rede parcialmente conectada.
Redes Recorrentes
As redes recorrentes se diferem das redes alimentadas adiante por apresentarem pelo
menos um laço de realimentação em sua estrutura. A Fig. 4.6 ilustra uma rede recorrente bem
simples, composta apenas por uma camada de neurônios, não apresentando, portanto,
camadas escondidas. Pode ser observado nesta estrutura que a saída de cada neurônio alimenta
a entrada dos demais, desta forma, a rede não apresenta laços de auto-realimentação, onde a
saída do neurônio é realimentada em sua própria entrada.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
34
Fig. 4.6. Rede recorrente sem laços de auto-realimentação e sem neurônios ocultos.
Outra classe de redes recorrentes é formada pelas estruturas que apresentam camadas
escondidas de neurônios. A Fig. 4.7 mostra este tipo de rede. Os laços de realimentação são
formados a partir dos neurônios de saída e ocultos, pode ser observada a presença de laços de
auto-realimentação na estrutura apresentada.
Z-1
Z-1
Z-1
Z-1
Entradas
Saídas
Fig. 4.7. Rede recorrente com neurônios ocultos.
As estruturas mostradas apresentam, em comum, em seus laços de realimentação,
elementos de atraso unitário ( representados por z-1 ) este fato resulta em um comportamento
dinâmico não-linear da rede, considerando que a mesma possua unidades não-lineares. A
presença de laços de realimentação, nas estruturas mostradas na Fig. 4.6 e na Fig. 4.7, tem um
impacto profundo na capacidade de aprendizagem da rede e em seu desempenho,
características estas que não serão abordadas no presente trabalho.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
35
4.6 Neurônio Perceptron
O neurônio perceptron é construído em torno de uma estrutura não-linear, conforme
apresentado no início do capítulo. Este modelo de neurônio é composto por um combinador
linear, seguido de um limitador abrupto, este sistema é mostrado na Fig. 4.8. A representação
do neurônio ilustrado na Fig. 4.8 é conhecida como grafo de fluxo de sinal.
w1
w2
wm. . .
x1
x2
xm
Bias, b
vy Saída
Limitadorabrupto
Entradasv
Fig. 4.8. Grafo de fluxo de sinal do perceptron.
O nó aditivo do modelo neuronal calcula a combinação linear das entradas aplicadas às
suas sinapses e incorpora um bias aplicado externamente. A soma resultante, isto é, o campo
local induzido, é aplicado ao limitador abrupto ( função de ativação do neurônio ).
No grafo de fluxo de sinal da Fig. 4.8, os pesos sinapticos do neurônio perceptron são
representados por w1, w2, ... wm. Correspondentemente, as entradas aplicadas ao neurônio
perceptron são representadas por x1, x2, ... xm. O bias, aplicado externamente é representado
por b. Deste modelo, podemos constatar que a entrada do limitador abrupto ou o campo local
induzido do neurônio é
1
m
i ii
v w x b=
= +∑ (4.12)
O objetivo do perceptron é classificar corretamente um conjunto de entradas aplicadas
externamente x1, x2, ... xm em uma das classes C1 ou C2. A regra de decisão para a classificação é
atribuir o ponto representado pelas entradas x1, x2, ... xm à classe C1 se a saída do perceptron
for +1 e à classe C2 se a saída do perceptron for -1.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
36
Podemos traçar uma mapa das regiões de decisão no espaço ℜm m dimensional
abrangido pelas m variáveis de entrada x1, x2, ..., xm. Na definição mais simples do perceptron,
existem duas regiões separadas por um hiperplano definido por
1
0m
i ii
w x b=
+ =∑ (4.13)
Imaginando um caso simples onde temos apenas duas variáveis de entrada x1 e x2, para
o qual a fronteira de decisão toma a forma de uma linha reta. Um ponto (x1, x2) que se
encontra acima da linha de fronteira é considerado pertencente à classe C1, enquanto um ponto
(x1, x2) localizado abaixo da linha de fronteira é atribuído à classe C2. Esta situação é ilustrada
na Fig. 4.9.
x1
x2
0
Classe 1
Classe 2
Fronteira de decisãow1x1+w2x2+b=0
Fig. 4.9. Hiperplano como fronteira de decisão para um problema de classificação bidimensional de duas classes.
Pode ser observado, ainda, que o efeito do bias é apenas de deslocar a fronteira de
decisão em relação à origem. Os pesos sinápticos w1, w2, ..., wm, podem ser adaptados de
iteração para iteração, para se obter a correta classificação dos padrões apresentados ao
perceptron, este processo é realizado através dos algoritmos de aprendizagem.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
37
4.7 Perceptron de múltiplas camadas
O perceptron de múltiplas camadas é uma estrutura de rede composta pela camada de
entrada, uma ou mais camadas de neurônios ocultos, e a camada de saída. O sinal de entrada se
propaga adiante, através da rede, camada por camada, até alcançar a camada de saída. Esta
estrutura representa uma generalização do perceptron de camada única apresentado
anteriormente.
Os perceptrons de múltiplas camadas têm sido utilizados com sucesso para a solução
de problemas complexos. Tipicamente, o treinamento de perceptrons de múltiplas camadas é
realizado de forma supervisionada através de um algoritmo que se baseia na regra de
aprendizagem por correção de erro, este método é conhecido como algoritmo de
retropropagação de erro. A Fig. 4.10 ilustra a arquitetura de um perceptron de múltiplas
camadas com duas camadas ocultas.
. . .
. . .
. . .
Fig. 4.10. Arquitetura de um perceptron de múltiplas camadas com duas camadas ocultas.
Existem três características básicas, presentes nos perceptrons de múltiplas camadas.
• O modelo de neurônio utilizado na rede apresenta uma função de ativação não-
linear. Esta não linearidade, porém, é suave, sendo diferenciável em qualquer
ponto, ao contrário da limitação abrupta utilizada no perceptron de Rosenblatt
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
38
[28]. Uma forma normalmente utilizada que satisfaz a esta exigência, é a não
linearidade sigmóide, apresentada anteriormente pela Equação (4.9).
• A rede contém uma ou mais camadas de neurônios ocultos, que não pertencem
à entrada ou à saída da rede. Estas camadas são responsáveis pela extração
progressiva de características significativas do padrão de entrada, capacitando,
desta forma, a rede a aprender tarefas complexas.
• Este tipo de rede apresenta um alto grau de conectividade, determinado pelas
sinapses da mesma. Uma alteração na conectividade da rede requer uma
mudança na população das conexões sinápticas ou em seus pesos.
4.8 Algoritmo de retropropagação
Para apresentar o desenvolvimento matemático do algoritmo de retropropagação será
considerada uma rede de múltiplas camadas como a apresentada na Fig. 4.10, onde devemos
ressaltar algumas características importantes.
Primeira, a estrutura mostrada se refere a uma rede totalmente conectada. Isto significa
que cada neurônio da rede, em qualquer camada, está conectado a todos os neurônios da
camada que o precede.
Segunda, devemos considerar, ainda, que o fluxo de sinal através da rede se dá da
direita para a esquerda, caracterizando um fluxo de sinal adiante. Este sinal é chamado de sinal
funcional, o sinal funcional é o sinal (estímulo) de entrada que é aplicado à rede e que se
propaga através da mesma, camada por camada até emergir na saída da rede como sinal de
saída.
Finalmente, temos ainda o sinal de erro, este sinal se origina na saída da rede e se
propaga para trás, da direita para a esquerda, caracterizando a retropropagação do sinal de erro.
O esquema da Fig. 4.11 mostra o fluxo dos sinais funcionais e de erro na rede.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
39
Fig. 4.11. Fluxo dos sinais funcionais e de erro em um perceptron de múltiplas camadas.
Os neurônios são projetados para realizarem dois cálculos: o cálculo do sinal funcional,
que aparece na saída de cada neurônio e é uma função não-linear do sinal de entrada e dos
pesos sinápticos associados ao neurônio, e o cálculo de uma estimativa do vetor gradiente que
é necessário para a retropropagação do sinal de erro através da rede.
A notação utilizada na dedução do algoritmo de retropropagação é a seguinte:
• Os índices i, j e k se referem a neurônios diferentes na rede, com os sinais se
propagando da esquerda para a direita, o neurônio j se encontra em uma
camada a direita do neurônio i, e o neurônio k se encontra em uma camada a
direita do neurônio j, quando o neurônio j é uma unidade oculta.
• Iteração n, o n-ésimo padrão de treinamento aplicado à rede.
• Símbolo ξ(n) se refere à soma instantânea dos erros quadráticos ou energia do
erro na iteração n. A média de ξ(n) para todos os valores de n produz a energia
média do erro médio ξmed.
• O símbolo ej(n) se refere ao sinal de erro na saída do neurônio j, na iteração n.
• O símbolo dj(n) se refere à resposta desejada para o neurônio j e é usada para
calcular ej(n).
• O símbolo yj(n) se refere ao sinal funcional que aparece na saída do neurônio j
na iteração n.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
40
• O símbolo wji(n) representa o peso sináptico conectado a saída do neurônio i à
entrada do neurônio j, na iteração n. A correção aplicada a este peso na iteração
n é representada por ∆wji(n).
• O campo local induzido do neurônio j na iteração n é representado por vj(n);
que representa o sinal aplicado á função de ativação do neurônio j.
• A função de ativação, que descreve a relação funcional de entrada-saída da não-
linearidade associada ao neurônio j é representada por ϕj(⋅).
• O bias aplicado ao neurônio j é representado por bj; seu efeito é representado
por uma sinapse de peso wj0=bj conectada a uma entrada fixa igual a +1.
• O i-ésimo elemento do vetor (padrão) de entrada é representado por xi(n).
• O k-ésimo elemento de do vetor (padrão) de saída global é representado por
ok(n).
• O parâmetro da taxa de aprendizagem é representado por η.
• O símbolo ml representa o tamanho da camada l do perceptron de múltiplas
camadas; l= 0, 1, 2, ..., L, onde L é a profundidade da rede. Assim, m0 é o
tamanho da camada de entrada da rede, m1 é o tamanho da primeira camada
oculta da rede e mL representa o tamanho da camada de saída da rede.
Com base na notação apresentada, o algoritmo será apresentado como segue.
Considerando o neurônio j como sendo um neurônio de saída, o sinal de erro na sua
saída, na iteração n é definido por
( ) ( ) ( )j j je n d n y n= − (4.14)
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
41
Definimos o valor instantâneo da energia do erro para o neurônio j como 21 ( )2 je n .
Correspondentemente, o valor instantâneo ξ(n) da energia total do erro é obtido
somando-se os termos 21 ( )2 je n de todos os neurônios da camada de saída, que são os únicos
neurônios onde os sinais de erro podem ser calculados diretamente. Podemos assim escrever
21( ) ( )2 j
j Cn e nξ
∈
= ∑ (4.15)
onde o conjunto C contém todos os neurônios da camada de saída da rede. Sendo N, o
número total de padrões contidos em um conjunto de treinamento. A energia média do erro
quadrado é obtida somando-se os ξ(n) para todos os n e então normalizando em relação ao
tamanho do conjunto N, como mostrado por
1
1 ( )N
medn
nN
ξ ξ=
= ∑ (4.16)
A energia instantânea do erro ξ(n) e, conseqüentemente, a energia média do erro ξmed é
uma função de todos os parâmetros livres da rede. Para um dado conjunto de treinamento,
ξmed representa a função de custo como uma medida do desempenho de aprendizagem. O
objetivo do processo de aprendizagem é ajustar os parâmetros livres da rede de forma a
minimizar ξmed. Um método simples de treinamento consiste em atualizar os pesos de padrão
em padrão até formar uma época, isto é, uma apresentação completa do conjunto de
treinamento inteiro que está sendo processado. Os ajustes dos pesos são realizados de acordo
com os respectivos erros calculados para cada padrão apresentado à rede. A média aritmética
destas alterações individuais de pesos sobre o conjunto de treinamento é, portanto, uma
estimativa da alteração real que resultaria da modificação dos pesos baseada na minimização da
função de custo ξmed sobre o conjunto de treinamento inteiro.
Considere, então, a Fig. 4.12, que representa um neurônio j sendo alimentado por um
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
42
conjunto de sinais funcionais produzidos por uma camada de neurônios a sua esquerda. O
campo local induzido, produzido na entrada da função de ativação do neurônio j é, portanto
0
( ) ( ) ( )m
j ji ii
v n w n y n=
= ∑ (4.17)
onde m é o número total de entradas (excluindo o bias) aplicadas ao neurônio j. O peso
sináptico wj0 é igual ao bias aplicado ao neurônio j. Assim, o sinal funcional yj(n) que aparece na
saída do neurônio j na iteração n é
( ) ( ( ))j j jy n v nϕ= (4.18)
wj0(n)=bj(n)
wm
y0=+1
ym(n)
vj(n)ej(n)yi(n)
wji(n) . yj(n) -1
dj(n)
Neurônio j
Fig. 4.12, Grafo do fluxo de sinal em um neurônio de saída j.
O algoritmo de retropropagação aplica uma correção ∆wji(n) ao peso sináptico wji(n),
que é proporcional à derivada parcial ( ) / ( )jin w nξ∂ ∂ . De acordo com a regra da cadeia do
cálculo, podemos expressar este gradiente como:
( ) ( ) ( )( ) ( )
( ) ( ) ( ) ( ) ( )j j j
ji j j j ji
e n y n v nn nw n e n y n v n w nξ ξ ∂ ∂ ∂∂ ∂
=∂ ∂ ∂ ∂ ∂
(4.19)
A derivada parcial ( ) / ( )jin w nξ∂ ∂ representa um fator de sensibilidade, determinando a
direção de busca no espaço de pesos, para o peso sináptico wji.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
43
Diferenciando ambos os lados da Equação (4.15) em relação a ej(n), temos
( ) ( )( ) j
j
n e ne nξ∂
=∂
(4.20)
Diferenciando ambos os lados da Equação (4.14) em relação a yj(n), temos
( )
1( )
j
j
e ny n∂
= −∂
(4.21)
Em seguida, diferenciando a Equação (4.18), obtemos
'( )( ( ))
( )j
j jj
y nv n
v nϕ
∂=
∂ (4.22)
onde o apóstrofo do lado direito significa diferenciação em relação ao argumento. Finalmente,
diferenciando a Equação (4.17) em relação a wji(n) produz
( )
( )( )
jj
ji
v ny n
w n∂
=∂
(4.23)
Combinando as Equações (4.20) a (4.23) na Equação (4.19) temos
'( ) ( ) ( ( )) ( )( ) j j j i
ji
n e n v n y nw nξ ϕ∂
= −∂
(4.24)
A correção ∆wji(n) aplicada ao peso wji(n)é definida por
( )
( )( )jiji n
nw nwξη ∂
∆ = −∂
(4.25)
onde η é o parâmetro da taxa de aprendizagem do algoritmo de retropropagação. O sinal
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
44
negativo indica uma a descida do gradiente no espaço de pesos (buscando uma direção na
mudança de peso que reduza o valor de ξ(n)).
Correspondentemente, o uso da Equação (4.24) em (4.25) leva a
( ) ( ) ( )ji j iw n n y nηδ∆ = (4.26)
onde o gradiente local δj(n) é definido por
'
( )( )( )
( ) ( )( )( ) ( ) ( )
( ) ( ( ))
jj
j j
j j j
j j j
nnv n
e n y nne n y n v n
e n v n
ξδ
ξ
ϕ
∂=∂
∂ ∂∂=∂ ∂ ∂
=
(4.27)
O gradiente local aponta para as modificações necessárias nos pesos sinápticos. De
acordo com a Equação (4.27), o gradiente local δj(n) para o neurônio de saída j é igual ao
produto do sinal de erro ej(n)correspondente para aquele neurônio pela derivada ϕ’j(vj(n)) da
função de ativação associada.
Observando as Equações (4.26) e (4.27), é fácil perceber que um fator muito
importante para o cálculo do valor do ajuste de peso ∆wji(n) é o sinal de erro ej(n) na saída do
neurônio j. Neste contexto, devemos analisar dois casos distintos:
No primeiro caso, o neurônio j é um neurônio pertencente à camada de saída da rede,
neste caso, ele recebe uma resposta desejada particular (sinal dj(n) na Fig. 4.12). Através da
Equação (4.14), podemos calcular o sinal de erro ej(n)associado a este neurônio, e finalmente,
utilizando a Equação (4.27) obtemos diretamente o gradiente local δj(n).
No segundo caso, o neurônio j é um nó oculto da rede, nesta situação, não existe
resposta desejada definida para o neurônio em questão. Correspondentemente, o sinal de erro
para um neurônio oculto deve ser determinado em termos dos sinais de erro de todos os
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
45
neurônios aos quais o neurônio oculto está diretamente conectado. A Fig. 4.13 mostra o
neurônio j como um nó oculto da rede conectado a um neurônio de saída k.
. . .
. . .
Fig. 4.13. Grafo do fluxo de sinal em um neurônio oculto j conectado a um neurônio de saída k.
Através da Equação (4.27) podemos redefinir o gradiente local para um neurônio
oculto j como
'
( )( )( ) ( )
( ) ( ( ))( )
jj
j j
j jj
y nny n v n
n v ny n
ξδ
ξ ϕ
∂∂=∂ ∂
∂=∂
(4.28)
Para calcular a derivada parcial ( ) / ( )jn y nξ∂ ∂ podemos proceder da seguinte forma.
Da Fig. 4.13 temos que
21( ) ( )2 k
k Cn e nξ
∈
= ∑ (4.29)
onde o neurônio k é um neurônio de saída.
Diferenciando a Equação (4.29) em relação ao sinal funcional yj(n) obtemos
( )( )( ) ( )
kk
kj j
e nn ey n y nξ ∂∂
=∂ ∂∑ (4.30)
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
46
utilizando a regra da cadeia para a derivada parcial ( ) / ( )k je n y n∂ ∂ e reescrevendo a Equação
(4.30) chegamos a
( ) ( )( ) ( )( ) ( ) ( )
k kk
kj k j
e n v nn e ny n v n y nξ ∂ ∂∂
=∂ ∂ ∂∑ (4.31)
Porém, observando a Fig. 4.13, notamos que
( ) ( ) ( )
( ) ( ( ))k k k
k k k
e n d n y nd n v nϕ
= −
= − (4.32)
Assim,
'( ) ( ( ))( )
kk k
k
e n v nv n
ϕ∂= −
∂ (4.33)
ainda a partir da Fig. 4.13, podemos ver que para o neurônio k o campo local induzido é
0
( ) ( ) ( )m
k kj jj
v n w n y n=
=∑ (4.34)
onde m é o número total de entradas aplicadas ao neurônio k. Diferenciando a Equação (4.34)
em relação a yj(n) temos
( ) ( )( )
kkj
j
v n w ny n∂
=∂
(4.35)
Através das equações (4.33) e (4.35) em (4.31) obtemos a derivada parcial desejada:
'( ) ( ) ( ( )) ( )( )
( ) ( )
k k k kjkj
k kjk
n e n v n w ny n
n w n
ξ ϕ
δ
∂= −
∂
= −
∑
∑ (4.36)
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
47
Finalmente, utilizando a Equação (4.36) em (4.28) obtemos a fórmula de
retropropagação para o gradiente local δj(n) para um neurônio oculto j como
'( ) ( ( )) ( ) ( )j j j k kjk
n v n n w nδ ϕ δ= ∑ (4.37)
O fator ' ( ( ))j jv nϕ presente no cálculo do gradiente local δj(n) mostrado na Equação
(4.37) depende apenas da função de ativação associada ao neurônio oculto j. O fator restante
envolvido no cálculo, ou seja, o somatório sobre k, depende de dois conjuntos de termos, o
primeiro conjunto, os δk(n), dependem do conhecimento dos sinais de erro ek(n) para todos os
neurônios que se encontram na camada imediatamente a direita do neurônio j e que estão
diretamente conectados a ele. O segundo conjunto de termos, os wkj(n), é formado pelos pesos
sinápticos associados a estas conexões.
Resumindo as relações derivadas para o algoritmo de retropropagação. Primeiro, a
correção aplicada ao peso sináptico conectando o neurônio i ao neurônio j ∆wij(n) é definida
pela regra delta:
( ) ( ) ( )ji j i
Correção Parâmetro da taxa Gradiente Sinal de entradade peso de aprendizagem local do neurônio j
w n n y nη δ
⎛ ⎞ ⎛ ⎞⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟=⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟
⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟∆ ⎝ ⎠ ⎝ ⎠⎝ ⎠ ⎝ ⎠
i i (4.38)
Segundo, o gradiente local δj(n) depende da posição do neurônio j na rede:
Se o neurônio j é um nó de saída da rede, δj(n) é igual ao produto da derivada ' ( ( ))j jv nϕ pelo sinal de erro ej(n) associados ao neurônio j como pode ser visto na Equação
(4.27).
Se o neurônio j é um nó oculto da rede, δj(n) é igual ao produto da derivada ' ( ( ))j jv nϕ
pela soma ponderada dos gradientes locais calculados para os neurônios na próxima camada
oculta ou de saída que estão conectados ao neurônio j, como mostrado na Equação (4.37).
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
48
Taxa de Aprendizagem
O algoritmo de retropropagação fornece uma aproximação para a trajetória no espaço
de pesos calculada pelo método da descida mais íngreme. Quanto menor for o parâmetro da
taxa de aprendizagem η, menor serão as variações dos pesos sinápticos da rede, de uma
iteração para outra, e mais suave será a trajetória no espaço de pesos. Em contra partida, esta
melhoria causa uma taxa de aprendizagem lenta. Por outro lado, se fizermos o parâmetro da
taxa de aprendizagem η muito grande, para acelerar a taxa de aprendizagem, as grandes
modificações nos pesos sinápticos podem fazer com que a rede se torne instável. Um método
simples de aumentar a taxa de aprendizagem evitando a instabilidade é modificar a regra delta,
Equação (4.26), adicionando o termo de momento. Esta nova relação é conhecida como regra
delta generalizada; ela inclui a regra delta da Equação (4.26) para α=0.
( ) ( 1) ( ) ( )ji ji j iw n w n n y nα ηδ∆ = ∆ − + (4.39)
A inclusão do momento no algoritmo de retropropagação tende a acelerar a descida em
direções com declividade constante, e ainda, gera um efeito estabilizador nas direções que
oscilam em sinal. Uma outra vantagem que pode ser obtida no comportamento de
aprendizagem do algoritmo é que o termo de momento pode evitar que o processo de
aprendizagem termine em um mínimo local raso na superfície de erro.
Modos de Treinamento Seqüencial e por Lote
A apresentação completa de um conjunto de dados de treinamento é chamada de
época, como mencionado anteriormente. O processo de aprendizagem é mantido em uma base
de época em época até os pesos sinápticos e os níveis de bias se estabilizarem e o erro médio
quadrado sobre todo o conjunto de treinamento convergir para um valor mínimo. Existem
basicamente duas maneiras de se realizar a aprendizagem por retropropagação.
O modo seqüencial, padrão ou estocástico é um modo de operação onde a atualização
dos pesos sinápticos é realizada após a apresentação de cada exemplo de treinamento. Este é o
modo de apresentação para o qual o algoritmo de retropropagação foi descrito.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
49
No modo de treinamento por lote, o ajuste dos pesos sinápticos é realizado apenas
após a apresentação completa de todos os exemplos de treinamento que constituem uma
época.
Do ponto de vista operacional, o modo seqüencial de treinamento é preferível em
relação ao método por lote, porque requer menos armazenamento local para cada conexão
sináptica. O fato dos dados serem apresentados à rede de maneira aleatória e o ajuste dos
pesos ser realizado de padrão em padrão torna a busca no espaço de pesos de natureza
estocástica. Este fato torna menos provável que o algoritmo fique preso em um mínimo local.
Critério de Parada
De maneira geral, não se pode demonstrar que o algoritmo de retropropagação
convergiu e não existem critérios bem definidos para encerrar sua operação. Existem, porém,
critérios particulares, baseados em propriedades únicas de um mínimo local ou global da
superfície de erro. Como os seguintes:
Considera-se que o algoritmo de retropropagação tenha convergido quando a norma euclidiana do vetor
gradiente alcançar um limiar suficientemente pequeno.
ou
Considera-se que o algoritmo de retropropagação tenha convergido quando a taxa absoluta de variação
do erro médio quadrado por época for suficientemente pequena.
Existe ainda, um outro critério de convergência muito útil e teoricamente
fundamentado. Após cada iteração de aprendizagem, a rede é testada pelo seu desempenho de
generalização. O processo de aprendizagem é interrompido quando o desempenho de
generalização da rede for considerado suficiente ou quando for observado que este
desempenho atingiu o máximo.
Capítulo 4- Rede Neural aplicada a Classificação de Padrões
50
4.9 Resumo do capítulo
Este capítulo apresentou as redes neurais como ferramenta para a classificação de
padrões. Os conceitos básicos de funcionamento dos neurônios foram abordados, bem como
uma breve descrição de algumas funções de ativação utilizadas na modelagem dos neurônios
artificiais. Em seguida, a organização dos neurônios para a formação das redes, que podem
apresentar diferentes arquiteturas também foi considerada, observando o fluxo de sinal através
da rede.
Caminhando em direção à classificação de padrões, os perceptrons foram abordados,
partindo do perceptron de camada única até a descrição do perceptron de múltiplas camadas.
Em seguida, a derivação do importante algoritmo de retropropagação foi apresentada com o
objetivo de tornar conhecida a nomenclatura utilizada durante o treinamento do perceptron de
múltiplas camadas, e ainda, apresentar os padrões de ajuste do algoritmo como a taxa de
aprendizagem e o momento, que é introduzido na regra delta generalizada. Algumas
implicações do ajuste destes parâmetros foram apresentadas com o intuito de permitir que o
leitor adquira a sensibilidade mínima necessária para compreender o funcionamento da rede
durante o processo de treinamento com o algoritmo de retropropagação.
De um modo geral, o capítulo fez uma apresentação da ferramenta que será utilizada
nos próximos capítulos, em conjunto com o Detector de Eventos, já descrito no capítulo 3,
para a classificação dos eventos de qualidade de energia propriamente ditos.
Capítulo 5
Geração de dados
5.1 Introdução
O presente capítulo trata da modelagem dos fenômenos elétricos abordados neste
trabalho como eventos de qualidade de energia. Serão apresentadas as considerações feitas no
que diz respeito à geração dos bancos de eventos utilizados para o treinamento da rede neural.
As características reproduzidas dos eventos, bem como os intervalos de variações
previstos para as mesmas serão definidos, assim, este capítulo delimita o escopo do trabalho
em relação à distinção das classes de eventos propostos.
De maneira geral, todos os eventos analisados ocorrem de forma isolada, ou seja, é
considerada apenas a ocorrência de um distúrbio por evento de qualidade de energia a ser
classificado pelo sistema proposto. Os eventos periódicos ou de longa duração, como a
presença de notches, spikes, afundamentos de tensão e sobre-tensão são detectados pelo sistema
como a transição de um regime permanente normal de operação do sistema para um novo
regime permanente considerando a presença dos distúrbios.
Capítulo 5- Geração de dados
52
5.2 Simulação dos eventos de Qualidade de Energia
Os eventos de Qualidade de Energia utilizados durante o desenvolvimento do sistema
de classificação foram todos obtidos de forma sintética. Os eventos abordados no presente
trabalho pertencem a cinco diferentes classes, são elas: eventos oscilatórios, afundamentos
(sags), sobre-tensões (swells), spikes, e notches. A geração de cada tipo de evento considera as
características intrínsecas de cada um destes eventos apontadas na literatura, conforme foi
apresentado no Capítulo 2.
O sistema de detecção foi projetado para trabalhar a uma taxa de amostragem de 256
amostras por ciclo do sinal fundamental do sistema elétrico monitorado, este parâmetro nos
leva a trabalhar com uma freqüência de amostragem de 15360 Hz, que determina um período
de amostragem de 65,1 µs considerando que o sistema em questão é o brasileiro, que opera em
60 Hz. Portanto, todos os eventos apresentados ao sistema de detecção e classificação
contemplam estes parâmetros.
O ambiente considerado para o sistema elétrico analisado prevê uma relação sinal ruído
(SNR) de 30dB, este dado foi considerado constante e comum a todos os eventos simulados.
Com o objetivo de atingir um elevado índice de generalização no processo de classificação, as
características de cada evento foram escolhidas de forma aleatória em intervalos pré-definidos.
Dentro dos intervalos foi considerado que as características deveriam apresentar uma
distribuição uniforme, de maneira e evitar a ocorrência de um maior número de eventos com
alguma característica semelhante.
Uma representação matemática para uma grande variedade de eventos foi apresentada
em [29] e considerada como motivadora do modelo adotado para a geração dos eventos em
questão, esta relação é mostrada na Equação (5.1)
( ) ( ) ( ) ( ) ( )H T IHx n s n s n s n v n= + + + (5.1)
Nesta equação temos uma composição bem abrangente das características de um sinal
elétrico obtido em um sistema elétrico, seja ele de distribuição ou de transmissão de energia. O
Capítulo 5- Geração de dados
53
sinal amostrado x(n) é composto por quatro parcelas que representam as componentes
harmônicas do sinal fundamental SH(n), o comportamento transitório do evento ST(n), as
componentes inter-harmônicas do sinal SIH(n), que não serão abordadas no presente trabalho, e
o ruído de fundo do sistema v(n). Todas estas parcelas podem estar ou não presentes no sinal
elétrico e ao mesmo tempo podem contribuir para a formação do evento com maior ou menor
intensidade.
De posse dessas informações podemos descrever o processo de geração de cada tipo
de evento considerado no trabalho.
Eventos transitórios oscilatórios
Para definição dos dados utilizados na geração do banco de eventos oscilatórios foram
consideradas as características apresentadas no Capítulo 2 e os perfis de onda apresentados em
[30]. De maneira usual, os eventos oscilatórios estão relacionados com o chaveamento de
bancos de capacitores e, sua freqüência de oscilação depende da capacitância do banco que
está sendo conectado ao sistema e da configuração do sistema. A amplitude do evento é
função da amplitude da componente fundamental no momento em que ocorre o chaveamento,
considerando que o banco de capacitores não possui carga inicial no momento em que é
conectado ao sistema e que não temos variação instantânea na tensão dos capacitores,
podemos observar que este fenômeno faz com que a tensão no sistema elétrico tenda a zero
rapidamente no momento do chaveamento do banco de capacitores e, em seguida, apresente
uma breve oscilação na forma de onda de tensão do sistema seguida pela extinção do distúrbio.
A freqüência de oscilação e seu tempo de duração dependem das características de impedância
do sistema.
Os distúrbios causados pelo chaveamento de capacitores em um instante de tempo t,
onde o valor da amplitude da tensão da componente fundamental do sistema é próximo de
zero, não causam grandes perturbações, sendo, portanto, descartados da análise proposta.
Foram considerados apenas os eventos que ocorrem quando o valor da amplitude do sinal
monitorado é superior a 45% de seu valor de pico. Este procedimento delimita a fase de
ocorrência dos eventos em relação à componente fundamental do sistema, como é mostrado
Capítulo 5- Geração de dados
54
na Fig. 5.1.
Fig. 5.1 Regiões onde ocorrem os eventos oscilatórios mais severos.
Na Fig. 5.1 temos a área onde foram simulados os eventos oscilatórios. Em vermelho
temos os pontos da onda fundamental onde sua amplitude apresenta um valor maior que 45%
de seu valor de pico e desta forma causam eventos oscilatórios mais severos. O trecho da
componente fundamental, representado em azul, mostra a região onde não será considerada a
ocorrência de eventos oscilatórios. A fase de ocorrência do evento é selecionada de maneira
aleatória dentro dos intervalos considerados seguindo uma distribuição uniforme, de forma
que não existam pontos dentro dos intervalos onde seja maior a ocorrência dos eventos.
A componente oscilatória do distúrbio é modelada como uma senóide amortecida que
tem como amplitude inicial o valor da componente fundamental no momento em que ocorre o
evento. Uma constante de amortecimento é sorteada a partir de um intervalo de valores que
proporcionam uma duração do evento entre 5 e 10 ms, a distribuição da constante de
amortecimento neste intervalo segue uma distribuição uniforme, que garante que a duração
dos eventos não apresente uma tendência, que seria uma característica específica de um sistema
elétrico particular.
A freqüência de oscilação do evento também é definida de forma aleatória dentro de
um intervalo de valores com distribuição uniforme que varia de 1000 a 2500Hz.
Assim, a modelagem do evento transitório pode ser resumida na Equação (5.2).
0( )1 0 0( ) ( ) ( ( ) ) n n t
T TS n S n sen n n t e αω − −= − (5.2)
onde,
Capítulo 5- Geração de dados
55
S1(n) é o valor da amplitude da componente fundamental na amostra n.
ωT é a freqüência angular de oscilação do evento.
α é a constante de amortecimento para o evento.
n0 é a amostra onde ocorre o início do evento e, finalmente,
t = nT, onde T é o período de amostragem.
Assim, obtemos as parcelas que irão compor o sinal aplicado ao sistema de detecção e
classificação como mostrado na Figura Fig. 5.2.
Fig. 5.2 Composição do sinal de um evento oscilatório.
Em a), temos a representação do fenômeno transitório ST(t), em seguida, em b), vemos
o sinal de ruído de fundo do sistema v(t), e no gráfico c), está representada a componente
fundamental do sistema. No gráfico d), temos a representação do sinal resultante em
Capítulo 5- Geração de dados
56
conformidade com a Equação (5.1) que nada mais é, além da soma das parcelas anteriores.
Este é o sinal correspondente a um evento oscilatório apresentado ao sistema de detecção e
classificação de eventos.
Eventos de afundamento de tensão (sags) e sobre-tensão (swells)
Os eventos de afundamento de tensão e sobre-tensão são modelados de forma
semelhante. Observando as características destes eventos apresentadas no Capítulo 2, foi
definido que a variação da amplitude da componente fundamental do sistema elétrico sob
monitoração pode ser de 10 a 90% em relação a seu valor nominal para os eventos de
afundamento de tensão e de 110 a 180% nos eventos de sobre-tensão. O valor da variação é,
portanto, sorteado de maneira aleatória para cada evento dentro deste intervalo, considerando
que a distribuição estatística destes valores seja uniforme dentro do mesmo.
Estes eventos serão considerados eventos de duração superior a 10 ciclos do sinal
fundamental monitorado, assim, o sistema de detecção deverá apontar apenas o momento em
que ocorre a variação de amplitude no sinal monitorado como sendo a ocorrência do evento.
A transição do valor da amplitude nominal para o novo valor em virtude da ocorrência
do evento se dá de forma linear em um período considerado constante de ¼ do período do
sinal fundamental do sistema elétrico, conforme a Equação (5.3).
14
V variação da amplitudet do período da fundamental
∆=
∆ (5.3)
Considerando a Equação (5.1), temos que a formação destes eventos será composta de
apenas duas parcelas, a parcela referente ao ruído de fundo do sistema v e a componente
fundamental do sistema S1 que terá sua amplitude alterada no momento em que ocorre o
evento.
Na Fig. 5.3 temos a representação das parcelas que formam um evento de
afundamento de tensão. Em a), temos o sinal S1, que mostra a componente fundamental do
sistema que sofre uma alteração em seu valor de amplitude no momento do evento. Em
Capítulo 5- Geração de dados
57
seguida, temos a variação da amplitude em função do tempo A(t), em b). A parcela referente
ao ruído de fundo do sistema, v, é mostrada no gráfico c) e, finalmente, temos a composição
total do sinal x, ilustrado no gráfico d).
Fig. 5.3. Composição de um evento de afundamento de tensão (sag).
O mesmo procedimento é utilizado para a geração dos eventos de sobre-tensão. Os
parâmetros relativos ao sinal de ruído e taxa de variação da amplitude da componente
fundamental ∆V/∆t, definida na Equação (5.3) são considerados os mesmos, tanto para os
eventos de afundamento de tensão como para os eventos de sobre-tensão, apenas o intervalo
de variação da amplitude é alterado, em concordância com os dados apresentados no Capítulo
2 o intervalo de variação da amplitude considerado para os eventos de sobre-tensão vai de 10 a
90% de elevação da amplitude do sinal fundamental do sistema.
A Fig. 5.4 apresenta a constituição do evento de sobre-tensão de forma semelhante à
mostrada para o evento de afundamento.
Capítulo 5- Geração de dados
58
Fig. 5.4. Composição de um evento de sobre-tensão (swell).
Um último ponto a ser considerado na simulação destes eventos é que a fase onde eles
ocorrem em relação ao sinal da componente fundamental é também escolhida de forma
aleatória em um intervalo que vai de -π a π, com distribuição uniforme. Assim, estes eventos
podem ocorrer em qualquer ponto, ao contrário dos eventos oscilatórios, que só foram
considerados em determinados trechos da forma de onda da componente fundamental.
Normalmente, durante a ocorrência de um sag ou swell, estes são acompanhados por um
fenômeno conhecido como phase jump, que é uma variação no ângulo de fase da componente
fundamental do sistema elétrico. Este comportamento, porém, não será abordado no presente
trabalho.
Presença de spikes
O evento definido como a presença de spikes na componente fundamental do sistema
elétrico foi considerado inicialmente em [13] onde o autor emprega a Transformada S
combinada com lógica fuzzy para realizar sua classificação.
Capítulo 5- Geração de dados
59
Este fenômeno se manifesta de forma periódica no sinal monitorado e, no presente
trabalho, é considerado que o mesmo se inicia e passa a ocorrer em regime permanente no
sistema.
A modelagem adotada do evento considera que o mesmo ocorre apenas em pontos
onde o módulo da amplitude do sinal seja superior a 60% de seu valor nominal, delimitando,
assim, a fase de ocorrência do evento em relação à componente fundamental do sistema. Da
mesma forma como foi apresentado para os eventos oscilatórios, a Fig. 5.5 mostra em
vermelho as regiões onde serão considerados os spikes, ou seja, |S1| > 60% do valor nominal
da componente fundamental, e, em azul, temos as regiões onde a presença de spikes não será
considerada.
Fig. 5.5. Regiões onde ocorrem os spikes.
Assim como nos eventos oscilatórios, a amplitude dos spikes é função do valor da
amplitude da componente fundamental no ponto onde o mesmo ocorre. Este valor é definido
como sendo 50% do valor da amplitude da componente fundamental.
A modelagem do evento é feita de forma que haja uma elevação linear do valor da
amplitude, distribuída em um intervalo de tempo considerado constante e igual a 0,65ms, que
corresponde a 10 amostras e, em seguida, uma redução também linear de mesma duração que
faz com que a amplitude da componente fundamental retorne ao seu valor nominal. Este
procedimento passa a ser repetido de maneira periódica na mesma freqüência do sinal
monitorado.
O resultado desta modelagem, bem como as parcelas que compõem o evento são
mostrados na Fig. 5.6, onde temos: em (a), a componente fundamental do sistema elétrico, em
Capítulo 5- Geração de dados
60
(b), a amplitude dos spikes gerados, em (c), a parcela correspondente ao ruído de fundo do
sistema e, finalmente, em (d) o resultado final da modelagem do evento. A
mpl
itude
pu
Am
plitu
de p
uAm
plitu
de p
uAm
plitu
de p
u
xv
S TS 1
Fig. 5.6. Composição do evento spike.
Presença de notches
A presença de notches no sistema elétrico está relacionada com a operação normal de
cargas chaveadas, como mostrado no Capítulo 2. A modelagem deste evento é feita de forma
semelhante à adotada para os eventos oscilatórios. Os notches são modelados como fenômenos
oscilatórios de curta duração que ocorrem de maneira periódica no sistema elétrico. Mais uma
vez, a amplitude do distúrbio depende da amplitude da componente fundamental do sistema.
A duração de cada notch simulado é de 0,52 ms, que corresponde a 8 amostras do sinal gerado.
Dentro deste intervalo de tempo o evento é modelado através da Equação (5.4).
0( )1 0 0( ) 0.7 ( ) ( ( ) ) n n t
T TS n S n sen n n t e αω − −= − − (5.4)
Capítulo 5- Geração de dados
61
Como pode ser observado, a Equação (5.4) é a mesma Equação (5.2) exceto pela
presença do termo 0,7, que tem a função de limitar a amplitude inicial do notch em 70% do
valor da amplitude do sinal do sistema no momento em que ocorre o distúrbio. Outra
diferença é o sinal negativo no valor da amplitude do evento, este sinal tem como objetivo
fazer com que o início do notch sempre seja uma variação de tensão em direção a 0, como
descrito em [1]. A freqüência angular de oscilação ωT é correspondente a uma freqüência de 3
KHz e é mantida fixa para todos os eventos gerados. A constante de amortecimento α é
definida de forma que o notch ocorra em um período de tempo de 0,52 ms.
A amostra de início do evento n0 no caso do notch é alterada de forma a gerar um efeito
periódico do evento, assim, podemos definir o número de notches por ciclo da componente
fundamental do sistema. A Fig. 5.7 ilustra um evento notch simulado onde ocorrem 6 notches por
ciclo, que normalmente é resultado da operação de conversores trifásicos.
Fig. 5.7. Composição do evento notch.
Capítulo 5- Geração de dados
62
Na Fig. 5.7 temos as parcelas que compõem os eventos notches tratados neste trabalho.
Em a), temos o sinal da componente fundamental do sistema S1, em b) temos a representação
do evento ST ao longo do tempo, o gráfico c) mostra a parcela referente ao ruído de fundo do
sistema ,v, e, o sinal x resultante é mostrado em d).
Eventos harmônicos
Os eventos harmônicos abordados no presente trabalho são formados a partir da
escolha de forma aleatória do valor da amplitude de cada componente harmônica desde o
segundo até o sétimo harmônico. Todas as amplitudes podem variar em um intervalo que vai
de 0 a 20% do valor da componente fundamental do sistema (S1), este intervalo apresenta uma
distribuição estatística uniforme para todas as componentes.
Após a definição do valor da amplitude para cada componente harmônica é
especificado um valor de fase, também sorteado em um intervalo que vai de -π a π com
distribuição uniforme.
Todas as componentes são adicionadas ao sistema simultaneamente no momento onde
ocorre o evento n0. Durante os primeiros 0,65 ms de ocorrência do evento o valor da
amplitude de cada componente harmônica é incrementado de forma linear, partindo de 0, até
que os mesmos atinjam os valores pré-estabelecidos. Assim, após os primeiros 0,65 ms as
componentes harmônicas adicionadas ao sinal fundamental do sistema apresentarão seus
valores nominais para cada evento gerado.
A Fig. 5.8 ilustra a composição dos eventos harmônicos, na coluna à esquerda, temos a
representação das formas de onda de cada harmônico do sinal, e na coluna à direita temos a
variação de amplitude de cada componente harmônica no momento em que ocorre o evento.
Pode se observar que o sinal fundamental do sistema, S1, permanece constante durante
toda a geração do evento. Através do processo utilizado para determinar o valor de amplitude
de cada componente harmônica de forma aleatória, podemos ter uma infinidade de
combinações harmônicas (S2, S3, S4, S5, S6, S7) para formar o sinal resultante e até mesmo a
Capítulo 5- Geração de dados
63
ausência de alguma componente cuja amplitude tenha sido definida como 0.
0.26 0.28 0.3 0.32
-1
0
1
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.320
0.5
1
1.5
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.32
-0.2
0
0.2
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
0.26 0.28 0.3 0.32-0.1
0
0.1
0.2
Ampl
itude
pu
Tempo s
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Am
plitu
de p
u
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Ampl
itude
pu
Am
plitu
de p
u
Tempo s
S 1S 2
S 3S 4
S 5S 6
S 7
Fig. 5.8. Composição dos eventos harmônicos.
Os valores das amplitudes das componentes harmônicas definidos para a composição
do evento ilustrado na Fig. 5.8 foram: S2 = 0,17 pu, S3 = 0,11 pu, S4 = 0,09 pu, S5 = 0,18 pu, S6
= 0,16 pu, e S7 = 0,12 pu. Todas estas componentes foram injetadas no sistema a partir do
Capítulo 5- Geração de dados
64
instante t = 0,288 s.
Como foi considerado para os eventos anteriores, além de todas as parcelas referentes
a cada componente harmônica gerada para a composição do evento, ainda temos o ruído de
fundo do sistema, (v), e, finalmente, o sinal resultante, (x), da modelagem proposta para os
eventos harmônicos, que são mostrados na Fig. 5.9.
Fig. 5.9. Ruído de fundo e composição final do evento harmônico.
5.3 Formação dos bancos de dados
Ao gerar os eventos de acordo com o procedimento discutido na seção 5.2, obtém-se
um grande volume de dados para cada evento simulado. Este volume de dados é necessário
para que seja possível aplicar o sinal contendo o evento simulado ao Detector de Evento –
DE, de modo que o algoritmo seja capaz de entrar em regime de operação, após o transitório
inicial de seus filtros e, em seguida, realizar a detecção do evento e retornar ao sistema de
monitoramento do sinal em regime permanente. Desta forma, cada conjunto de dados
referente a um evento simulado é composto por um sinal que representa 4 ciclos da
componente fundamental de um sistema elétrico que opere em 60 Hz, este fato nos leva a
trabalhar com um volume de 10240 amostras de sinal para cada evento gerado.
No entanto, cada evento é aplicado ao algoritmo DE, o qual, detecta e armazena
Capítulo 5- Geração de dados
65
janelas de dados de 1024 amostras, referentes a 4 ciclos da componente fundamental do
sistema que contém apenas o momento onde ocorre o distúrbio, conforme foi mostrado no
Capítulo 3. Assim, após a geração e detecção dos eventos, temos como resultado duas janelas
de dados que serão armazenadas para serem utilizadas pela etapa seguinte do processo de
classificação, uma janela contendo o próprio sinal monitorado e uma janela que contém o sinal
de erro referente ao momento onde ocorre o distúrbio, conforme foi mostrado no Capítulo 3.
A Fig. 5.10 ilustra um conjunto típico de pares de janelas produzidas pela detecção dos vários
tipos de eventos apresentados anteriormente.
Fig. 5.10. Janelas de dados armazenadas pelo Detector de Eventos – DE.
Capítulo 5- Geração de dados
66
Na Fig. 5.10 temos, em azul, as janelas dos sinais simulados e detectados pelo
algoritmo DE que contêm os quatro ciclos da componente fundamental no momento em que
ocorre o evento. Em vermelho, temos as janelas armazenadas com o sinal de erro dos
respectivos eventos. Estas janelas são o resultado da detecção dos seguintes eventos:
oscilatórios em a), afundamento de tensão em b), sobre-tensão em c), spikes em d), notches em e)
e, finalmente, harmônicos em f).
Inicialmente, para cada tipo de evento considerado foram realizadas 500 detecções, que
geraram um banco de dados contendo 500 janelas de sinal monitorado e 500 janelas com os
respectivos sinais de erro para cada tipo de evento. Estes dados foram armazenados e, como
será visto adiante, serão utilizados no processo de treinamento da rede neural que realizará a
classificação dos eventos.
5.4 Resumo do Capítulo
Este capítulo apresentou a forma como foram modelados e gerados os eventos de
qualidade de energia que serão utilizados no processo de treinamento da rede neural
empregada na classificação dos eventos propostos. Aspectos importantes da modelagem dos
eventos foram definidos, como nos casos onde os eventos ocorrem apenas em determinados
intervalos de amplitude da componente fundamental.
As características de modelagem dos eventos delimitam o escopo do trabalho no que
se refere à capacidade de realizar a classificação dos eventos de qualidade de energia. No
estágio atual, o trabalho se propõe a reconhecer os eventos apresentados, porém, qualquer
outro tipo de evento pode ser modelado, com maior ou menor fidelidade ao comportamento
real do distúrbio elétrico relacionado e ser aplicado ao sistema.
De maneira geral, como será visto posteriormente, o resultado principal produzido pela
etapa de detecção dos eventos são as janelas de erro, que serão efetivamente empregadas no
processo de classificação.
Capítulo 6
Sistema de Classificação
6.1 Introdução
Neste capítulo será apresentada a técnica proposta para realizar a classificação dos
eventos de qualidade de energia com base no sinal de erro obtido do processo de detecção dos
eventos. Um dos objetivos do presente trabalho é avaliar a capacidade do sinal de erro, obtido
com o algoritmo DE de levar consigo informações que possam ser relevantes em um sistema
de classificação de eventos baseado em rede neural. Serão discutidas, também, algumas
características do sinal de erro, que se revelaram como sendo facilitadoras do pré-
processamento utilizado em conjunto com o classificador neural. A Fig. 6.1 mostra um
diagrama de blocos que ilustra o fluxo de sinal através do sistema de detecção e classificação de
eventos de qualidade de energia.
Fig. 6.1. Fluxo de sinal no sistema de detecção e classificação de eventos.
Em especial, o presente capítulo trata dos blocos de Pré-processamento e Classificador
Neural, assim como das conexões entre estes blocos e os seus antecedentes.
Capítulo 6- Sistema de Classificação
68
6.2 O pré-processamento
Como foi mostrado anteriormente, temos duas janelas de dados armazenadas para cada
evento detectado. Cada uma destas janelas apresenta suas próprias características, portanto,
devemos considerar qual das janelas melhor se ajusta ao processo de classificação proposto,
assim, temos duas condições a analisar.
Janelas de dados do sinal monitorado
As janelas de dados do sinal monitorado, conforme foram apresentadas no capítulo
anterior, trazem consigo uma grande quantidade de informações que podem ser utilizadas
tanto para a classificação como para a análise do evento ocorrido. É fácil perceber que a janela
de sinal monitorado contém uma parcela de energia referente ao sinal da componente
fundamental do sistema monitorado 60 Hz, este fato faz com que a energia relativa ao
distúrbio propriamente dito em alguns casos não seja uma parcela significativa da energia total
do sinal contido na janela. Assim, acredita-se que a capacidade de extrair detalhes sobre o
evento ocorrido a partir da janela do sinal monitorado utilizando-se um classificador neural é
prejudicada. Um outro fato muito importante para a utilização do classificador neural é o
alinhamento dos eventos. Nas janelas de sinal monitorado este alinhamento não é facilmente
obtido, o que compromete o desempenho da rede neural.
Janelas de sinal de erro
Seguindo a proposta inicial do trabalho, que seria investigar a viabilidade de se
classificar os eventos de qualidade de energia com base no sinal de erro obtido do algoritmo
DE, podemos observar que a energia contida na janela do sinal de erro armazenado é referente
ao próprio evento mais a parcela do ruído de fundo do sistema. Desta forma, a maior parte da
energia contida na janela normalmente se refere ao próprio distúrbio, ao contrário da janela do
sinal monitorado. Outro aspecto importante sobre a janela do sinal de erro é a facilidade para
se obter o alinhamento dos eventos a serem aplicados à rede neural. Estas características fazem
da janela do sinal de erro armazenado uma opção interessante para realizar a classificação do
evento através do classificador neural.
Capítulo 6- Sistema de Classificação
69
Partindo da janela de sinal de erro armazenada, a próxima etapa no processo de
classificação é o alinhamento dos eventos. O alinhamento dos eventos tem como objetivo
fazer com que todos os eventos apresentados à rede neural tenham seu início no mesmo ponto
da janela. Como pode ser observado na Fig. 5.10, devido às características de funcionamento
do algoritmo DE, todos os eventos detectados apresentam seu início na primeira metade da
janela armazenada, mas este fato não é suficiente para o propósito desejado.
O processo de alinhamento é feito submetendo-se a janela de erro a um filtro média
móvel de ordem 10 e, logo em seguida, comparando a saída do filtro a um limiar pré
estabelecido. O primeiro ponto onde o módulo da amostra de saída do filtro é maior que o
valor do limiar estabelecido fica caracterizado como o início do evento dentro da janela. A Fig.
6.2 ilustra o método de detecção do início do evento dentro da janela de erro.
Fig. 6.2 Processo de identificação do início do evento.
Na Fig. 6.2-a, temos uma janela típica de sinal de erro armazenada em virtude da
ocorrência de um evento oscilatório. Na Fig. 6.2-b temos a representação da janela após o
processo de filtragem, em vermelho estão representados os limites de detecção do início do
evento. O limite de detecção do início é determinado de forma empírica considerando a
amplitude do ruído de fundo adotado durante a simulação, a amplitude dos eventos e o
Capítulo 6- Sistema de Classificação
70
número de coeficientes do filtro utilizado. Para os eventos simulados o valor do limite de
detecção foi de 0,05 pu.
No exemplo ilustrado na Fig. 6.2 o início do evento é detectado na amostra número
355, que tem um valor de -0,0507, conforme destacado na figura.
Após a identificação do índice da amostra onde o evento se inicia o passo seguinte é o
truncamento da janela, este procedimento é realizado com o objetivo de reduzir a quantidade
de informação redundante que possa estar contida na janela armazenada. O truncamento
ocorre 512 amostras após o início do evento. Este truncamento é mostrado na Fig. 6.3.
Fig. 6.3. Truncamento da janela de erro.
Na Fig. 6.3-a temos a região destacada pelo processo de truncamento realizado na
janela e, na Fig. 6.3-b podemos observar a nova janela obtida, formada por 512 amostras da
janela original. Estas 512 amostras representam 2 ciclos do sinal do sistema monitorado, em
especial, o sinal de erro exatamente no início do distúrbio.
Após o truncamento da janela, ainda temos 512 amostras que contém as características
referentes ao evento detectado. Este ainda é um número elevado de amostras para ser aplicado
Capítulo 6- Sistema de Classificação
71
ao classificador neural, demandando uma rede complexa e a elevada complexidade
computacional para realizar a classificação.
A alternativa adotada para reduzir ainda mais o número de amostras do sinal de erro a
ser apresentado ao classificador foi a realização de uma sub-amostragem da janela de 512
amostras obtida após o processo de truncamento.
Ainda que a sub-amostragem da janela implique em um comprometimento das
características de freqüência do sinal original, introduzindo aliasing ao mesmo, é observado que,
para o objetivo de realizar a classificação do evento ocorrido, este procedimento não prejudica
a capacidade da rede neural de extrair características dos eventos e, conseqüentemente, sua
habilidade de diferenciar os tipos de eventos abordados no presente trabalho.
Uma análise experimental de alguns possíveis fatores de sub-amostragem apontou para
um fator de sub-amostragem 8, que apresentou uma boa relação entre o esforço
computacional da rede utilizada e seu desempenho na classificação. Assim, após o truncamento
da janela do sinal de erro em um janela menor, contendo 512 amostras, esta é sub-amostrada
por um fator 8, resultando em uma janela de 64 amostras do sinal de erro, que efetivamente
representa as características de dois ciclos do sinal monitorado a partir do momento onde
ocorre o início do distúrbio.
Com o objetivo de garantir que a amplitude do sinal contido em cada janela esteja
dentro de um mesmo intervalo de valores para todos os eventos detectados, a janela de sinal de
erro, que será aplicada à rede, passa por um processo de normalização da amplitude, que faz
com que o módulo do valor máximo do sinal contido nas janelas de qualquer tipo de evento
seja igual a 1. Matematicamente a normalização é expressa por:
max
( )( ) =ne ne ne
(6.1)
onde,
Capítulo 6- Sistema de Classificação
72
( )ne n é o sinal normalizado, ( )e n é o sinal de erro após o alinhamento e o
truncamento da janela do sinal de erro e,
( )max0,1... 1
( )maxn L
e e n= −
= (6.2)
O perfil das janelas obtidas por este processo para cada tipo de evento analisado é
mostrado na Fig. 6.4. Em (a) temos a janela referente a um evento oscilatório, em (b) e em (c)
temos as janelas correspondentes aos eventos de sub-tensão e sobre-tensão, em (d) está a
janela produzida pela detecção de um evento spike e, finalmente, em e) e f) estão representadas
as janelas relativas aos eventos notch e harmônicos respectivamente.
Fig. 6.4. Perfil das janelas apresentadas à rede neural.
Podemos observar na Fig. 6.4 que os eventos de sobre-tensão (sag) e sub-tensão (swell)
produzem janelas semelhantes para o classificador neural. Este fato aumenta a dificuldade para
a rede neural distinguir entre estas duas classes de eventos.
Considerando que os dois tipos de eventos têm natureza semelhante, inicialmente,
Capítulo 6- Sistema de Classificação
73
ambos serão considerados como pertencentes à mesma classe. Desta forma, o classificador
neural terá a função de reconhecer cinco classes de eventos: eventos oscilatórios, eventos de
sobre-tensão ou sub-tensão (sag/swell), spikes, notches e presença de harmônicos.
6.3 O Classificador Neural
De posse das informações apresentadas anteriormente, resta definir a estrutura do
classificador neural utilizado no sistema proposto. As janelas mostradas na Fig. 6.4 são tratadas
como o sinal de entrada de uma rede neural perceptron multicamadas com uma camada oculta
e uma camada de saída que realiza a classificação do evento ocorrido. Na Fig. 6.5 temos um
diagrama de blocos que ilustra o fluxo de sinal através do classificador neural.
Fig. 6.5. Diagrama de blocos do fluxo de sinal através do classificador neural.
O sinal de entrada do perceptron é obtido das janelas do sinal de erro pré-processado.
Como foi mostrado anteriormente, estas janelas são compostas de 64 amostras, que formam a
camada de entrada (neurônios fonte) do perceptron.
A camada oculta da rede tem seu número de neurônios definido de forma
experimental durante o processo de treinamento, conforme será mostrado adiante e,
finalmente, a camada de saída é composta de um neurônio para cada classe de evento. Cada
Capítulo 6- Sistema de Classificação
74
neurônio da camada de saída será responsável pela identificação de uma classe de evento.
A função de ativação ϕ(⋅) empregada pelos neurônios, tanto na camada de entrada
como na camada de saída é a tangente sigmóide, que tem um intervalo de resposta entre -1 e 1.
A rede é, ainda, totalmente conectada, o que significa que todos os neurônios de uma camada
possuem sinapses que os conectam a todos os neurônios da camada seguinte. Outra
característica importante é que a estrutura empregada não possui laços de realimentação, ou
seja, é uma rede alimentada adiante (feedforward).
6.3.1 Treinamento da rede neural
O treinamento da rede MLP é realizado com base no algoritmo de retropropagação
apresentado no Capítulo 4. Para realizar o treinamento, foi criado um banco de dados com
eventos modelados de acordo com o procedimento introduzido no Capítulo 5. Este banco é
composto de 100 eventos pertencentes a cada uma das 5 classes analisadas: oscilatórios, sub-
tensão (sag) ou sobre-tensão (swell), spikes, notches e presença de harmônicos. Este conjunto de
eventos foi dividido em dois grupos com finalidades distintas, o grupo de treinamento,
composto de 60 eventos de cada classe foi utilizado como padrão de treinamento para a rede,
enquanto o segundo grupo, chamado de grupo de teste, formado pelos 40 eventos restantes de
cada classe, foi utilizado para avaliar a característica de generalização da rede após a
apresentação de um determinado número de épocas de treinamento.
Os padrões de saída utilizados no treinamento foram definidos de forma que o vetor
de saída da rede apresentasse o valor +1 apenas no neurônio que representa a classe do evento
aplicado à rede e os demais neurônios da camada de saída indicassem o valor -1. Assim, temos
os padrões de saída conforme apresentados na Tabela 6.1.
Capítulo 6- Sistema de Classificação
75
Tabela 6.1 - Padrões de Saída
Padrões de Saída Evento Correspondente [+1 -1 -1 -1 -1]T Oscilatório [-1 +1 -1 -1 -1]T Sub-tensão ou sobre-tensão[-1 -1 +1 -1 -1]T Spikes [-1 -1 -1 +1 -1]T Notches [-1 -1 -1 -1 +1]T Harmônicos
Com base no vetor de saída da rede, é realizado um processo de decisão para se obter a
classe a qual pertence o evento aplicado à rede. Considerando que os valores obtidos nos
neurônios da camada de saída da rede podem variar de -1 a +1, é adotado como resposta da
rede o maior valor encontrado no vetor de saída, onde cada linha do vetor de saída representa
uma classe de eventos.
Assim, a decisão é feita com base na Equação (6.3).
max( )i = o (6.3)
onde, o é o vetor de saída da rede e i representa o índice da linha que contém o valor máximo
de o. A Tabela 6.2 representa o evento classificado em função de i.
Tabela 6.2 - Eventos Classificados em função de i
Eventos Classificados i
( Eq. 6.3)Oscilatório 1 Sub-tensão ou sobre-tensão 2 Spikes 3 Notches 4 Harmônicos 5
A ferramenta utilizada para o treinamento da rede é baseada no algoritmo de
retropropagação e considera o gradiente descendente com momento para atualizar os pesos
sinápticos e os valores de bias da rede como será visto adiante.
Considerando a regra delta, apresentada no Capítulo 4, na Equação (4.25), e por
Capítulo 6- Sistema de Classificação
76
conveniência reescrita aqui:
( )( )( )nw n =
w nξη ∂
∆ −∂
(6.4)
onde η é o parâmetro da taxa de aprendizagem do algoritmo de retropropagação. O sinal
negativo indica a descida do gradiente no espaço de pesos (buscando uma direção na mudança
de peso que reduza o valor de ξ(n)). Lembrando, ainda, que ξ(n) é a energia total do erro,
conforme descrito no Capítulo 4. Temos, simplesmente, a atualização dos valores dos pesos e
bias da rede através do algoritmo de retropropagação seguindo apenas o gradiente descendente.
Para promover o treinamento da rede considerando também o momento, a equação
que fornece a atualização dos valores de bias e pesos é alterada para:
( )( ) ( 1) (1 )( )
ξη ∂∆ ⋅∆ − + −
∂nw n = m w n m
w n (6.5)
onde, além das variáveis definidas para a Regra Delta, temos a constante de momento m e o
termo ∆w(n-1) que representa o último ajuste realizado nos pesos sinápticos. Ainda que esta
expressão esteja definida para se obter os ajustes dos valores dos pesos sinápticos da rede (w),
esta é derivada de forma idêntica para os ajustes dos valores de bias.
A inclusão do termo de momento no algoritmo de retropropagação conforme
mostrado na Equação (6.5) prevê uma formação do valor de ajuste dos pesos e bias composta
de dois termos, um referente ao gradiente descendente e outro referente ao momento
considerado. O valor da constante de momento m é definido no intervalo de 0 a 1. Ao
especificarmos uma constante de momento m igual a 0, temos a atualização dos valores dos
pesos e bias simplesmente através do termo referente ao gradiente. Quando o valor da
constante de momento é definido como 1, temos a atualização dos valores dos pesos e bias
igual à última atualização realizada.
A contribuição da constante de momento no algoritmo de retropropagação, é fazer
Capítulo 6- Sistema de Classificação
77
com que a atualização dos pesos e bias não seja feita apenas em função do gradiente, mas
considere também a tendência da atualização realizada na interação anterior. Agindo como um
filtro passa baixa, o momento faz com que a rede não responda a pequenas variações na
superfície de erro, evitando, assim, que o treinamento fique preso a um mínimo local na
superfície de erro.
Inicialmente, quando a rede é criada, os valores dos pesos w e dos bias de cada camada
são inicializados pelo método de Nguyen-Widrow, que gera valores iniciais de pesos e bias de
maneira que as regiões ativas dos neurônios sejam distribuídas de forma uniforme através do
espaço de entrada da rede. Este método de inicialização dos valores dos pesos e bias da rede
diminui a perda de neurônios no processo de treinamento, já que todos os neurônios estão no
espaço de entrada da rede, e ainda, acelera o processo de treinamento, considerando que cada
área do espaço de entrada possui neurônios em suas regiões ativas.
A princípio, o critério de parada utilizado durante a fase de treinamento da rede
considera apenas o número de épocas de treinamento aplicadas à rede. O objetivo desta fase
do processo é definir o número de neurônios da camada intermediária da rede. O critério de
avaliação de desempenho é baseado na análise da capacidade de generalização da rede
apresentada sobre o grupo de eventos de teste para cada classe.
Ao fim de cada conjunto de épocas aplicado à rede durante o treinamento, a eficiência
da classificação sobre o conjunto de treinamento e a capacidade de generalização da rede sobre
o grupo de teste, são calculados como a eficiência específica para cada classe e a eficiência
global da rede na classificação.
A eficiência global da classificação é obtida por meio da média da eficiência alcançada
em cada classe, a eficiência global (efglobal) em porcentagem fica, então, definida como:
1
1 100N
global nn
ef efN =
= ⋅∑ (6.6)
onde N é o número total de classes reconhecidas pela rede e efn é a eficiência alcançada para
cada classe de eventos n. Os valores de eficiência de classificação para cada classe (efn) é obtido
Capítulo 6- Sistema de Classificação
78
pela Equação (6.7).
cn
T
nefn
= (6.7)
onde, nc representa o número de eventos corretamente classificados pela rede e nT o número
total de eventos da mesma classe aplicados à rede.
Lembrando que a cada inicialização da rede, novos valores são definidos para os pesos
e bias da mesma, este procedimento influencia diretamente no desempenho alcançada por cada
rede após o treinamento. Para termos uma visão mais precisa do desempenho de uma rede
com determinado número de neurônios em sua camada intermediaria é necessário repetir o
processo de treinamento para um número significativo de redes com a mesma arquitetura e
inicializadas diferentemente para obtermos um desempenho médio das redes com uma mesma
característica. Este foi o procedimento utilizado para definir o número de neurônios da camada
intermediária da rede, como será descrito a seguir.
1ª Aproximação – reconhecimento de 4 classes de eventos
O processo conforme descrito anteriormente foi aplicado inicialmente, a uma rede
destinada à classificação de 4 tipos de eventos. Durante o processo de definição do número de
neurônios o algoritmo de treinamento é utilizado com os seguintes parâmetros de
configuração:
• Número de neurônios da camada de entrada (nós fonte) = 64
• Número de neurônios da camada intermediária = variável
• Número de neurônios da camada de saída = 4
• Função de ativação de todos os neurônios que realizam processamento na rede
= tangente sigmóide.
• Termo de momento m constante = 0,5
• Número de épocas por treinamento = 10
• Número de treinamentos realizados por rede = 200
Capítulo 6- Sistema de Classificação
79
• Número de redes inicializadas e treinadas = 40
• Índices das classes classificadas no vetor de saída da rede: i=1 Eventos
oscilatórios, i=2 Sub-tensão e sobre-tensão, i=3 Spikes, i=4 Notches
Aplicando a metodologia proposta, são obtidos os valores médios de desempenho das
redes, que irão apontar um número razoável de neurônios que seja capaz de desempenhar a
tarefa de classificação dos eventos com uma eficiência satisfatória.
A Fig. 6.6 mostra a evolução média da capacidade da rede em reconhecer os padrões
pertencentes ao grupo de treinamento durante o processo de treinamento
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
OscilatorioSag / Swell
SpikeNotch
(a)5
neurônios
(b)6
neurônios
(c)7
neurônios
(d)8
neurônios
(e)9
neurônios
(f)10
neurônios
(j)14
neurônios
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
(g)11
neurônios
(h)12
neurônios
(i)13
neurônios
(k)15
neurônios
Legenda
Número de treinamentos realizados
Fig. 6.6 Evolução do reconhecimento dos padrões do conjunto de dados de treinamento em [%] em
função do número de treinamentos realizados e do número de neurônios da camada intermediária.
Cada gráfico apresenta a média obtida entre as 40 redes inicializadas com valores de
pesos e bias distintos e treinadas obedecendo aos mesmos critérios. Apenas o número de
neurônios da camada intermediária é alterado de gráfico para gráfico.
Capítulo 6- Sistema de Classificação
80
Ao fim dos duzentos treinamentos realizados, é possível observar que as redes que
possuem 10 neurônios na camada intermediária, Fig. 6.6 (f), alcançaram uma maior
homogeneidade de desempenho entre as classes consideradas, este é um fato importante que
mostra que o treinamento foi eficaz para todas as classes, ou seja, a habilidade da rede em
reconhecer as classes foi adquirida para todas as classes, ao contrário do que pode ser
observado nas redes que utilizaram 13 neurônios em suas camadas intermediárias, Fig. 6.6 (i),
onde a classe de eventos notch permaneceu saturada em um nível de eficiência menor em
relação às demais classes. A Fig. 6.7 mostra a evolução média da capacidade da rede em
reconhecer os padrões pertencentes ao grupo de teste durante o processo de treinamento.
OscilatorioSag / Swell
SpikeNotch
(a)5
neurônios
(b)6
neurônios
(c)7
neurônios
(d)8
neurônios
(e)9
neurônios
(f)10
neurônios
(j)14
neurônios
(g)11
neurônios
(h)12
neurônios
(i)13
neurônios
(k)15
neurônios
Legenda
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
Fig. 6.7. Evolução da generalização da rede em [%], observada no grupo de teste em função do número
de treinamentos realizados e do número de neurônios da camada intermediária.
Este processo avalia o desempenho da generalização da rede. Cada gráfico apresenta a
média obtida entre as 40 redes inicializadas com valores de pesos e bias distintos e treinadas
obedecendo aos mesmos critérios. Apenas o número de neurônios da camada intermediária é
Capítulo 6- Sistema de Classificação
81
alterado de gráfico para gráfico
Mais uma vez, as redes com 10 neurônios na camada intermediária, Fig. 6.7 (f),
apresentaram um melhor desempenho no que diz respeito à pequena diferença obtida entre as
eficiências atingidas para cada uma das 4 classes. Este fato revela uma capacidade de
generalização uniforme para todas as classes observadas, ao contrário do que pode ser
observado para as redes com 15 neurônios na camada intermediária, cujo resultado é
apresentado na Fig. 6.7 (k), onde, o desempenho de generalização obtido para a classe notch foi
inferior ao encontrado para as demais classes.
Um resumo do estudo do desempenho das redes para classificação de 4 classes é
apresentado na Fig. 6.8.
Fig. 6.8. Desempenho médio global de classificação em função do número de neurônios da camada
intermediária.
Capítulo 6- Sistema de Classificação
82
No gráfico (a) temos a média de identificação correta alcançada para cada classe no
grupo de treinamento, em (b) está representado o valor médio de identificação correta
alcançado no grupo de teste, e, finalmente, em (c) temos a média dos resultados apresentados
em (b), que mostram a capacidade de generalização adquirida pela rede. Todos estes resultados
são mostrados em função do número de neurônios da camada intermediária.
A partir da avaliação dos dados apresentados na Fig. 6.8 podemos observar que as
redes com 10 neurônios na camada intermediária apresentaram o maior índice médio de
generalização (Fig. 6.8 (c)) e a melhor distribuição da capacidade de generalização entre as
classes (Fig. 6.8 (b)). Sendo, portanto, a opção escolhida para implementação do classificador
neural para 4 classes.
A inclusão da classe de eventos harmônicos no método de classificação eleva a
complexidade do processo, desta forma é necessário estimar novamente o número de
neurônios da camada intermediária que vai apresentar uma eficiência satisfatória no
reconhecimento de 5 tipos de eventos. A mesma metodologia utilizada para definir o número
de neurônios da camada intermediária para o reconhecimento de 4 classes é utilizada para o
reconhecimento de 5 classes, conforme será apresentado a seguir.
2ª Aproximação – reconhecimento de 5 classes de eventos.
Durante o processo de definição do número de neurônios da camada intermediária
para a classificação de 5 tipos de eventos, temos os seguintes parâmetros de configuração do
algoritmo de treinamento:
• Número de neurônios da camada de entrada (nós fonte) = 64
• Número de neurônios da camada intermediária = variável
• Número de neurônios da camada de saída = 5
• Função de ativação de todos os neurônios que realizam processamento na rede
= tangente sigmóide.
• Termo de momento m constante = 0,5
• Número de épocas por treinamento = 10
Capítulo 6- Sistema de Classificação
83
• Número de treinamentos realizados por rede = 200
• Número de redes inicializadas e treinadas = 40
Índices das classes classificadas no vetor de saída da rede: i=1 Eventos oscilatórios, i=2
Sub-tensão e sobre-tensão, i=3 Spikes, i=4 Notches, i=5 Harmônicos.
Novamente, aplicando a metodologia proposta, são obtidos os valores médios de
desempenho das redes, que irão apontar um número razoável de neurônios que seja capaz de
desempenhar a tarefa de classificação dos eventos com uma eficiência satisfatória.
A Fig. 6.9 mostra a evolução média da capacidade da rede em reconhecer os padrões
pertencentes ao grupo de treinamento durante o processo de treinamento conforme foi
apresentado para o caso de reconhecimento de 4 classes, porém, agora com a inclusão da
classe harmônicos.
(a)10
neurônios
(b)11
neurônios
(c)12
neurônios
(d)13
neurônios
(e)14
neurônios
(f)15
neurônios
(j)19
neurônios
(g)16
neurônios
(h)17
neurônios
(i)18
neurônios
(k)20
neurônios
Legenda
Número de treinamentos realizados
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
OscilatorioSag / SwellSpike
NotchHarmonico
Fig. 6.9. Evolução do reconhecimento dos padrões do conjunto de dados de treinamento em [%] em
função do número de treinamentos realizados e do número de neurônios da camada intermediária.
Capítulo 6- Sistema de Classificação
84
Pode ser observado na Fig. 6.9 que, com a inclusão de mais uma classe de evento no
processo de classificação, no intervalo de 10 a 20 neurônios na camada intermediária da rede, a
estrutura que apresentou a maior capacidade de reconhecer os eventos que compunham o
grupo de treinamento foram as redes compostas por 19 neurônios na camada intermediária. O
resultado obtido por esta configuração para cada classe de eventos pode ser observado na Fig.
6.9 (j). Mais uma vez é importante observar o comportamento homogêneo da evolução do
treinamento para todas as classes, diferentemente do ocorrido com as estruturas compostas de
15 ou 17 neurônios na camada intermediária, Fig. 6.9 (f) e Fig. 6.9 (g) respectivamente, onde a
classe de evento notch apresentou um índice inferior de reconhecimento do evento no grupo de
treinamento em relação às demais classes.
Na Fig. 6.10 temos a representação da evolução da capacidade de generalização das
redes avaliadas sobre o conjunto de dados de teste.
(a)10
neurônios
(b)11
neurônios
(c)12
neurônios
(d)13
neurônios
(e)14
neurônios
(f)15
neurônios
(j)19
neurônios
(g)16
neurônios
(h)17
neurônios
(i)18
neurônios
(k)20
neurônios
Legenda
Número de treinamentos realizados
OscilatorioSag / SwellSpike
NotchHarmonico
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
0 20 40 60 80 100 120 140 160 180 2000
50
100
Fig. 6.10. Evolução da generalização da rede em [%], observada no grupo de teste, em função do
número de treinamentos realizados e do número de neurônios da camada intermediária.
Capítulo 6- Sistema de Classificação
85
É possível notar que as estruturas que atingiram os maiores níveis de generalização
foram as compostas por 18 e 19 neurônios na camada intermediária, Fig. 6.10 (i) e Fig. 6.10 (j)
respectivamente, ainda nestas estruturas observamos uma boa distribuição da capacidade de
generalização entre as diferentes classes.
A seguir, temos novamente um resumo do estudo de desempenho das redes, agora
para a classificação de 5 eventos distintos, estes dados são mostrados na Fig. 6.11. No gráfico
(a) temos a média de identificação correta alcançada para cada classe no grupo de treinamento,
em (b) está representado o valor médio de identificação correta alcançado no grupo de teste, e,
finalmente, em (c) temos a média dos resultados apresentados em (b), que mostram a
capacidade de generalização adquirida pela rede. Todos estes resultados são mostrados em
função do número de neurônios da camada intermediária.
Número de neurônios na camada intermediária
%
%
% Media das classes
Grupo de treinamento (a)
Grupo de teste (b)
Média final do grupo de teste (c)
10 12 14 16 18 2060
70
80
90
100
10 12 14 16 18 2060
70
80
90
100OscilatorioSag / SwellSpikeNotchHarmonico
10 12 14 16 18 2080
85
90
95
100
105
OscilatorioSag / SwellSpikeNotchHarmonico
Fig. 6.11. Desempenho médio global de classificação em função do número de neurônios da camada
intermediária.
Capítulo 6- Sistema de Classificação
86
Através da observação da Fig. 6.11 podemos notar nos gráficos (c) e (d) que, apesar das
estruturas compostas de 18 neurônios na camada intermediária apresentarem uma
característica de generalização bem distribuída entre as classes, a média desta característica para
as redes compostas de 19 neurônios na camada intermediária é sensivelmente superior à
daquelas que foram treinadas com 18 neurônios na camada intermediária. Sendo, então, a
estrutura composta de 19 neurônios a utilizada na implementação do classificador de 5 classes.
Os resultados finais do processo de decisão do número de neurônios na camada
intermediária da rede destinada ao reconhecimento de 4 classes de eventos são mostrados na
Tabela 6.3, estes dados são correspondentes aos apresentados na Fig. 6.8.
Tabela 6.3. Percentual de acerto médio das redes em função do número de neurônios da camada intermediária para reconhecimento de 4 classes de eventos.
Grupo de treinamento Evento Número de neurônios
5 6 7 8 9 10 11 12 13 14 15 Oscilatório 99,7 98,3 100,0 99,6 100,0 100,0 100,0 100,0 100,0 100,0 100,0Sag/Swell 92,2 89,5 91,9 94,3 89,6 99,6 94,6 99,7 97,0 99,8 99,8 Spike 93,2 87,8 95,5 90,5 85,5 97,3 95,5 97,8 93,3 95,0 91,0 Notch 81,0 86,0 84,0 88,0 92,0 92,0 90,0 87,0 81,0 90,0 80,0
Grupo de teste (Generalização ) Oscilatório 96,8 95,2 99,0 98,6 99,4 99,8 100,0 100,0 100,0 100,0 100,0Sag/Swell 91,8 89,5 91,9 94,5 90,1 100,0 94,8 100,0 97,6 100,0 100,0Spike 88,3 85,6 94,5 89,9 84,5 96,8 95,6 97,4 93,6 94,9 91,6 Notch 80,2 83,4 82,9 85,8 90,5 90,5 88,1 85,5 78,4 88,1 78,1 Generalização Média 89,3 88,4 92,1 92,2 91,1 96,8 94,6 95,7 92,4 95,8 92,4
A inclusão de uma quinta classe no processo de classificação aumenta
consideravelmente a complexidade do sistema, para se manter o mesmo nível de eficiência
alcançado para o reconhecimento de 4 classes foi necessário alterar a arquitetura da rede,
aumentando-se o número de neurônios da camada intermediária. Um resumo dos resultados
obtidos durante o processo de definição da quantidade de neurônios da camada intermediária
da rede é mostrado na Tabela 6.4. Estes dados são correspondentes ao mostrados nos gráficos
da Fig. 6.11.
Capítulo 6- Sistema de Classificação
87
Tabela 6.4. Percentual de acerto médio das redes em função do número de neurônios da camada intermediária para reconhecimento de 5 classes de eventos.
Grupo de treinamento Evento Número de neurônios
10 11 12 13 14 15 16 17 18 19 20 Oscilatório 98,1 98,2 100,0 98,3 100,0 98,5 100,0 100,0 95,0 100,0 100,0Sag/Swell 89,0 89,3 94,0 89,3 89,1 96,9 92,0 94,6 92,1 92,0 89,5 Spike 83,8 79,3 82,8 86,0 79,3 88,3 78,8 78,7 85,0 88,2 83,3 Notch 80,0 77,0 77,0 80,0 83,0 75,0 75,0 74,0 88,0 90,0 82,0 Harmônicos 98,1 98,8 99,3 99,7 99,7 99,8 99,8 99,9 99,9 99,6 99,7
Grupo de teste (Generalização ) Oscilatório 97,0 96,2 99,0 96,2 99,7 96,9 99,8 100,0 94,5 99,6 99,7 Sag/Swell 90,1 90,4 94,7 89,8 90,2 97,6 92,6 94,8 92,8 92,6 90,3 Spike 84,5 80,2 82,4 86,4 80,4 88,2 79,7 79,5 83,9 88,9 84,0 Notch 76,3 73,6 73,6 76,3 80,7 71,2 71,2 69,1 85,7 88,1 78,6 Harmônicos 80,6 83,6 85,3 87,4 86,5 87,7 86,2 87,8 88,4 87,9 87,3 Generalização Média 85,7 84,8 87,0 87,2 87,5 88,3 85,9 86,2 89,1 91,4 88,0
Após a definição do número de neurônios da camada intermediária da rede inicia-se
um processo de aprimoramento do treinamento para a obtenção da rede que será utilizada no
classificador, este processo é descrito a seguir.
Aprimoramento do treinamento da rede neural
Com a definição do número de neurônios que será empregado na camada intermediária
da rede, temos todos os dados necessários sobre a arquitetura da rede a ser utilizada. O
treinamento da rede será conduzido agora com o intuito de elevar a eficiência de classificação
da mesma.
O procedimento empregado durante o treinamento da rede, que será efetivamente
utilizada no algoritmo de detecção e classificação de eventos, utiliza um critério de parada
diferente do utilizado para determinar o número de neurônios da camada intermediária da
rede.
O processo anterior de treinamento tinha como critério de parada o número de épocas
de treinamento aplicadas à rede, ao fim do treinamento era avaliada a eficiência de cada rede
Capítulo 6- Sistema de Classificação
88
em relação ao número de neurônios que possuía na camada intermediária. Depois de definida a
arquitetura da rede, o processo de treinamento visa encontrar a melhor configuração de valores
de pesos e bias para alcançar a maior eficiência na classificação. Assim, o critério de parada do
processo de treinamento neste estágio do desenvolvimento da rede é feito com base na
eficiência global de generalização obtida.
Para que o processo de treinamento seja interrompido, foi adotado que:
98%globalef > (6.8)
onde, efglobal foi definida em (6.6).
Assim, quando a eficiência global é atingida, o processo de treinamento é
interrompido. Ao fim do processo de treinamento os pesos sinápticos e os valores de bias estão
definidos e não serão mais alterados.
6.3.2 Esforço computacional no classificador
De posse dos parâmetros internos da rede, é interessante estimar o esforço
computacional necessário para a realização da classificação através da rede neural.
O processamento realizado na primeira camada de neurônios pode ser representado
matematicamente de forma matricial como a seguir:
1 1 1 1 1( )ϕ= +iO W P B (6.9)
onde O1, é a saída da primeira camada de neurônios, ϕ1 é a função de ativação utilizada pelos
neurônios da primeira camada oculta da rede. A matriz W1 contém os pesos sinápticos que
conectam todos os nós de entrada aos neurônio da camada 1. O vetor P1 representa o padrão
de entrada aplicado à rede, e tem um comprimento i e, finalmente, B1 é o vetor de bias para a
camada 1. De onde podemos compor a Equação (6.10)
Capítulo 6- Sistema de Classificação
89
1 1 1 111 12 1 111 1 1 121 22 2 22
1 1
1 1 1 11 2
...
...
...
ϕ
⎛ ⎞⎡ ⎤ ⎡ ⎤⎡ ⎤⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥= +⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦ ⎣ ⎦⎝ ⎠
i
i
i
j j ji ji
w w w bpw w w bp
O
w w w bp
(6.10)
lembrando que para a primeira camada temos j = número de neurônios da camada
intermediária e i = 64 (comprimento do vetor de entrada), portanto, o vetor de saída da
primeira camada que realiza processamento O1 será um vetor de comprimento j.
Para a camada de saída da rede temos o seguinte equacionamento:
2 2 2 1 2( )ϕ= +iO W O B (6.11)
onde O1, é a saída da camada intermediária, ϕ2 é a função de ativação dos neurônios, W2 é a
matriz dos pesos sinápticos e B2 é o vetor de bias da camada de saída da rede.
Esta equação pode ser apresentada na forma matricial como:
2 2 2 2111 12 1 112 2 2 2121 22 2 22
2 2
2 2 2 211 2
...
...
...
ϕ
⎛ ⎞⎡ ⎤ ⎡ ⎤⎡ ⎤⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥= +⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥ ⎢ ⎥⎢ ⎥⎜ ⎟⎢ ⎥⎢ ⎥ ⎢ ⎥⎣ ⎦⎣ ⎦ ⎣ ⎦⎝ ⎠
i
i
i
j j ji ji
w w w bow w w bo
O
w w w bo
(6.12)
Considerando que as dimensões da camada de saída da rede dependem do número de
classes, 4 ou 5, o índice j, que define as dimensões da matriz de pesos e do vetor de bias da
segunda camada também pode ser 4 ou 5. Já o índice i, é igual ao número de neurônios da
camada intermediária da rede.
Assim, observando as Equações (6.10) e (6.12), podemos avaliar o esforço
computacional por camada através da Equação
Capítulo 6- Sistema de Classificação
90
( 1)ϕ
= ⋅= − ⋅ + = ⋅=
Nm L ENa E L L L EN L
(6.13)
onde, Nm, Na e Nϕ são, respectivamente, o número de multiplicações, de adições e de vezes
que é necessário calcular ou obter de uma tabela o valor da função de ativação dos neurônios
da camada em questão. L e E representam o número de neurônios da camada e o número de
amostras na entrada da camada respectivamente. Temos então, os seguintes casos:
1º ) Reconhecimento de 4 classes
Neste caso, considerando a arquitetura da rede proposta: entrada de 64 amostras, 10
neurônios na camada intermediária e 4 na camada de saída temos:
Tabela 6.5 Esforço computacional para o reconhecimento de 4 classes de eventos.
Operação 1ª camada 2ª camada Total Multiplicação 640 40 680 Adição 640 40 680 Função 10 4 14
2º ) Reconhecimento de 5 classes
Para esta situação, temos: 64 amostras, 19 neurônios na camada intermediária e 5 na
camada de saída, assim:
Tabela 6.6. Esforço computacional para o reconhecimento de 5 classes de eventos.
Operação 1ª camada 2ª camada Total Multiplicação 1216 95 1311 Adição 1216 95 1311 Função 19 5 24
Pode-se observar que o esforço computacional necessário para obter o
reconhecimento das cinco classes (eventos oscilatórios, sub-tensão e sobre-tensão, spikes,
notches e harmônicos), é consideravelmente maior que aquele obtido para o reconhecimento de
4 classes. Este aumento considerável foi devido ao aumento significativo do número de
Capítulo 6- Sistema de Classificação
91
neurônios na camada escondida.
Estes dados devem ser levados em consideração no momento de avaliar a
implementação do sistema de classificação em tempo real, onde a complexidade do
processamento realizado é fator crítico na escolha do hardware a ser utilizado. Por exemplo, se
mantivéssemos o número de neurônios na camada escondida em 10, como no caso de quatro
classes, sacrificando um pouco o desempenho em benefício da redução do esforço
computacional, teríamos o esforço computacional conforme mostrado na Tabela 6.7.
Tabela 6.7. Esforço computacional para o reconhecimento de 5 classes de eventos
com 10 Neurônios na Camada intermediária.
Operação 1ª camada 2ª camada Total Multiplicação 640 50 690 Adição 640 50 690 Função 10 5 15
6.4 Resumo do capítulo
Este capítulo apresentou a forma como é realizado o pré-processamento da janela que
contém o sinal de erro obtido do algoritmo DE, foram definidas várias características do
processo de classificação como o tamanho das janelas utilizadas em cada etapa e a facilidade de
se obter o alinhamento dos eventos através da janela de sinal de erro.
O treinamento da rede neural empregada no classificador mostra que, mesmo depois
de um processo de sub-amostragem realizado durante o pré-processamento da janela do sinal
de erro a rede ainda é capaz de extrair informações suficientes das janelas para diferenciar as
classes de eventos abordadas. Este procedimento não seria justificado caso houvesse a
necessidade de recompor o sinal obtido, uma vez que perderíamos informações importantes
para a reconstrução do sinal inicial.
O perceptron de múltiplas camadas MLP se mostrou uma arquitetura eficiente na
tarefa de reconhecer os padrões de cada classe de evento abordada. O processo de definição
do número de neurônios da camada intermediária com base no resultado médio de eficiência
Capítulo 6- Sistema de Classificação
92
obtido para um grupo de 40 redes que apresentam a mesma arquitetura e são inicializadas com
valores de pesos e bias diferentes trouxe bons resultados, considerando que a versão final da
rede obtida alcançou uma eficiência global superior a 98% tanto para o reconhecimento de 4
classes como também para o de 5 classes.
Por fim, a análise do esforço computacional do método proposto mostrou que com a
inclusão de mais classes no sistema de classificação, mostrou-se necessário, na metodologia
adotada, aumentar consideravelmente o número de neurônios na camada intermediária,
aumentando de forma expressiva o esforço computacional necessário para a identificação das
classes. Este fato é muito importante para a análise do emprego do método em sistemas que
operem em tempo real.
No próximo capítulo apresentaremos os resultados obtidos a partir da metodologia
proposta.
Capítulo 7
Resultados
7.1 Introdução
Este capítulo apresenta os resultados obtidos através da técnica de detecção e
classificação de eventos de qualidade de energia apresentada nos capítulos anteriores. Em
particular, os resultados do processo de classificação dos eventos são mostrados como
resultado principal do presente trabalho.
Os dados apresentados têm como objetivo comprovar a eficiência do método
desenvolvido para reconhecimento dos padrões de sinais de erro que são obtidos com o
Algoritmo de Detecção de Eventos – DE. Este método, discutido no Capítulo 6, consiste na
metodologia empregada no condicionamento da janela que contém o sinal de erro e na forma
como foi realizado o treinamento da rede neural empregada no classificador.
A análise dos resultados será feita sobre eventos gerados de forma aleatória, conforme
descrito no Capítulo 5, e, ainda, considerando os classificadores destinados ao reconhecimento
de 4 e 5 classes de eventos.
Capítulo 7- Resultados
94
7.2 Eventos simulados
Após a definição da arquitetura da rede, a mesma foi treinada visando-se obter uma
eficiência global maior que 98% no conjunto de eventos utilizado para avaliar a capacidade de
generalização da rede durante o processo de treinamento, conforme descrito no capítulo
anterior. Como este conjunto de dados é relativamente pequeno em relação às inúmeras
variações que podem ocorrer nas características dos eventos, o sistema de classificação é
submetido a um conjunto maior de eventos simulados de todas as classes para certificação da
capacidade de generalização do classificador.
O conjunto de dados apresentado à rede é composto de 200 eventos pertencentes a
cada classe estudada. Estes eventos foram gerados a partir da seleção aleatória das
características de cada um, seguindo o mesmo procedimento descrito no Capítulo 5.
Este procedimento foi realizado para as duas configurações de rede analisadas e os
resultados obtidos foram os seguintes:
Rede destinada à identificação de 4 classes de eventos
Relembrando os índices do vetor de saída da rede e as classes de representadas por
cada um deles para a rede de identificação de 4 classes temos:
Max(O) = o1 → Evento oscilatório.
Max(O) = o2 → Evento de sub-tensão ou sobre-tensão sag/swell.
Max(O) = o3 → Evento spike.
Max(O) = o4 → Evento notch.
A Fig. 7.1 mostra os valores obtidos no vetor de saída da rede para os 200 eventos
oscilatórios apresentados à mesma. No gráfico (a) temos os valores do elemento o1 do vetor de
saída da rede que representa a classe de eventos oscilatórios. Como foi mostrado
anteriormente, o valor de o1 deve ser o maior valor no intervalo de -1 a 1 entre os elementos
Capítulo 7- Resultados
95
do vetor de saída da rede para que a classificação seja considerada como evento oscilatório.
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
Fig. 7.1. Respostas da rede aos eventos oscilatórios.
Podemos observar uma pequena dispersão nos valores obtidos em o1 e o4, enquanto os
resultados obtidos para o2 e o3 tenderam de uma forma mais homogênea para valores
próximos de -1. Este fato aponta para uma maior possibilidade da rede classificar um evento
oscilatório de forma equivocada como um evento notch. O resultado da classificação pode ser
visto na Tabela 7.1.
Tabela 7.1. Reconhecimento dos eventos oscilatórios.
Eventos % Evento classificados classificada
Oscilatório 199 99,5 Sag / Swell 0 0 Spike 0 0 Notch 1 0,5
Os resultados apresentados na Tabela 7.1 mostram que a rede obteve um índice de
99,5% de acerto na classificação de eventos oscilatórios, confirmando a eficácia do
Capítulo 7- Resultados
96
treinamento.
O mesmo procedimento é realizado para a classe de eventos sag/swell, de onde
obtemos o perfil de valores de resposta na saída da rede mostrado na Fig. 7.2.
0
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.2. Respostas da rede aos eventos sag/swell.
Onde podemos notar, nos gráficos (a) e (b), que alguns eventos sag/swell são
visivelmente confundidos pela rede com eventos oscilatórios.
Na Tabela 7.2 temos o resultado da classificação dos eventos sag/swell. Onde se
confirma a classificação incorreta de 10 eventos sag/swell como eventos oscilatórios.
Tabela 7.2. Reconhecimento dos eventos sag/swell.
Eventos % Evento classificados classificada
Oscilatório 10 5,0 Sag / Swell 190 95,0 Spike 0 0 Notch 0 0
Capítulo 7- Resultados
97
Seguindo com o procedimento para os eventos spike, temos o perfil de respostas
mostrado na Fig. 7.3
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento200
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180
-1
0
1
Fig. 7.3. Respostas da rede aos eventos spike.
Esta classe de eventos, de maneira geral, não apresenta grandes dificuldades para sua
classificação. A Tabela 7.3 apresenta o resultado final da classificação dos eventos spike.
Tabela 7.3. Reconhecimento dos eventos spike.
Eventos % Evento classificados classificada
Oscilatório 1 0,5 Sag / Swell 0 0 Spike 199 99,5 Notch 0 0
Finalmente, temos a avaliação do desempenho da rede na classificação dos eventos
notches, os valores obtidos no vetor de saída (O) da rede para os 200 eventos notches aplicados
em sua entrada são apresentados na Fig. 7.4.
Capítulo 7- Resultados
98
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento0
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.4. Respostas da rede aos eventos notches.
Assim como o ocorrido para a classe de eventos spike, a classificação dos eventos
notches não representa uma tarefa difícil para o classificador neural. Os resultados mostrados na
Fig. 7.4 estão resumidos na Tabela 7.4.
Tabela 7.4. Reconhecimento dos eventos notches.
Eventos % Evento classificados classificada
Oscilatório 1 0,5 Sag / Swell 0 0 Spike 0 0 Notch 199 99,5
Considerando que a metodologia proposta busca uma eficiência global mínima de 98%
no treinamento final da rede utilizada no classificador, devemos também avaliar a eficiência
global alcançada no universo de 800 eventos apresentados à rede durante a avaliação de sua
performance. O resultado desta avaliação é mostrado na Tabela 7.5.
Capítulo 7- Resultados
99
Tabela 7.5. Eficiência global alcançada pela rede
para classificação de 4 classes.
Eventos classificados Evento
corretamente (%)Oscilatório 99,5 Sag / Swell 95,0 Spike 99,5 Notch 99,5 Eficiência global 98,37
Como pode ser observado na Tabela 7.5, a eficiência global alcançada durante o
processo de treinamento, se manteve na comprovação do desempenho do classificador.
Rede destinada à identificação de 5classes de eventos
O mesmo procedimento adotado para a avaliação do desempenho da rede destinada à
classificação de 4 classes de eventos é aplicado à rede utilizada para classificação de 5 eventos.
O vetor de saída da rede agora apresenta mais uma linha (elemento o5), que corresponde ao
evento harmônico. A distribuição da identificação das classes no vetor de saída (O) da rede
para o reconhecimento de 5 classes de eventos é mostrado abaixo:
Max(O) = o1 → Evento oscilatório.
Max(O) = o2 → Evento de sub-tensão ou sobre-tensão sag/swell.
Max(O) = o3 → Evento spike.
Max(O) = o4 → Evento notch.
Max(O) = o5 → Evento harmônico.
Os valores obtidos no vetor de saída da rede serão apresentados para cada grupo de
eventos de mesma classe apresentados à rede conforme foi mostrado anteriormente para a
rede destinada ao reconhecimento de 4 classes de eventos.
A Fig. 7.5 mostra os valores obtidos no vetor de saída da rede em resposta à
Capítulo 7- Resultados
100
apresentação de 200 eventos oscilatórios à rede.
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
O5
0
(e)
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.5. Resposta da rede aos eventos oscilatórios.
O resumo dos dados mostrados na Fig. 7.5 é apresentado na Tabela 7.6. Onde pode-se
observar que o classificador foi capaz de classificar corretamente 100% dos eventos
oscilatórios apresentados ao sistema.
Tabela 7.6. Reconhecimento dos eventos oscilatórios.
Eventos % Evento classificados classificada
Oscilatório 200 100 Sag / Swell 0 0 Spike 0 0 Notch 0 0 Harmônico 0 0
Capítulo 7- Resultados
101
Na Fig. 7.6 temos o resultado da classificação do grupo de eventos de sobre-tensão e
sub-tensão. Onde podemos notar que a identificação desta classe de eventos não oferece
grande dificuldade para o classificador neural.
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
O5
0
(e)
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.6. Resposta da rede aos eventos sag/swell.
A Tabela 7.7 confirma a classificação correta dos eventos sag/swell apresentados à rede,
que alcançou uma eficiência na classificação de 99,5%.
Tabela 7.7. Reconhecimento dos eventos sag/swell.
Eventos % Evento classificados classificada
Oscilatório 1 0,5 Sag / Swell 199 99,5 Spike 0 0 Notch 0 0 Harmônico 0 0
Capítulo 7- Resultados
102
Na Fig. 7.7 é mostrado o resultado obtido para a classe de eventos spike.
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
O5
0
(e)
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.7. Resposta da rede aos eventos spikes.
Um resumo dos resultados mostrados na Fig. 7.7 é apresentado na Tabela 7.8, onde
podemos observar que a classe de eventos spikes também não apresenta grandes dificuldades
para ser identificada entre as demais classes de eventos estudadas.
Tabela 7.8. Reconhecimento dos eventos spikes.
Eventos % Evento classificados classificada
Oscilatório 0 0 Sag / Swell 1 0,5 Spike 198 99,0 Notch 0 0 Harmônico 1 0,5
Capítulo 7- Resultados
103
A seguir, na Fig. 7.8, temos os resultados referentes à classe de eventos notches.
Fig. 7.8. Resposta da rede aos eventos notches.
A Tabela 7.9 apresenta o resumo dos resultados mostrados na Fig. 7.8, estes resultados
confirmam o bom desempenho do classificador no reconhecimento dos eventos notches.
Tabela 7.9. Reconhecimento dos eventos notches.
Eventos % Evento classificados classificada
Oscilatório 1 0,5 Sag / Swell 0 0 Spike 0 0 Notch 199 99,5 Harmônico 0 0
Por fim, na Fig. 7.9 são apresentados os resultados obtidos para a classe de eventos
Capítulo 7- Resultados
104
harmônicos, onde podemos perceber uma maior dispersão dos valores obtidos para as classes
de eventos oscilatórios e harmônicos. Este fato faz com que a identificação dos eventos
harmônicos não seja tão evidente como foi a identificação dos eventos notches, mostrada na Fig.
7.8.
(a)
(b)
(c)
(d)
O1
O2
O3
O4
Índice do evento
O5
0
(e)
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
0 20 40 60 80 100 120 140 160 180 200
-1
0
1
20 40 60 80 100 120 140 160 180 200
-1
0
1
Fig. 7.9. Resposta da rede aos eventos harmônicos.
A Tabela 7.10 mostra o resultado final da classificação dos eventos harmônicos,
evidenciando os erros de classificação relacionados com a classe de eventos oscilatórios.
Tabela 7.10. Reconhecimento dos eventos harmônicos.
Eventos % Evento classificados classificada
Oscilatório 9 4,5 Sag / Swell 0 0 Spike 0 0 Notch 0 0 Harmônico 191 95,5
Capítulo 7- Resultados
105
A avaliação da eficiência global da rede destinada à classificação de 5 classes de eventos
está resumida na Tabela 7.11.
Tabela 7.11. Eficiência global alcançada pela rede
para classificação de 5 classes.
Eventos classificados Evento
corretamente (%)Oscilatório 100 Sag / Swell 99,5 Spike 99,0 Notch 99,5 Harmônicos 95,5 Eficiência global 98,7
7.3 Dado real
Apesar do treinamento da rede neural ter se desenvolvido totalmente embasado em
eventos gerados através de simulações conforme mostrado no Capítulo 5, podemos observar
que a rede se mostra capaz de reconhecer padrões reais que se assemelham aos utilizados
durante o treinamento.
Na Fig. 7.10, temos um evento real obtido a partir de analisador de qualidade de
energia e que foi submetido ao sistema de detecção e classificação de eventos proposto. A Fig.
7.10 (a) mostra a parte do sinal que contém o evento detectado pelo algoritmo com o destaque
das respectivas janelas de dados armazenadas pelo sistema 1 e 2. Em seguida, na Fig. 7.10 (b) e
na Fig. 7.10 (c), temos a representação das janelas destacadas em (a). Podemos observar que o
sistema realizou duas detecções e, conseqüentemente, foram feitas duas classificações
diferentes a partir das janelas do sinal de erro obtidas.
Este caso foi aplicado ao classificador destinado ao reconhecimento de 5 classes, de
onde obtivemos a classificação dos eventos como sendo, na primeira janela um evento sag/swell
e na segunda janela um evento harmônico
Os resultados obtidos na saída da rede estão dispostos na Tabela 7.12, onde temos em
Capítulo 7- Resultados
106
negrito os maiores valores encontrados, que definem a classificação dos eventos como sag/swell
e harmônico respectivamente.
Fig. 7.10. Classificação de um evento real.
Tabela 7.12. Classificação de evento real.
Classe de evento Janela 1 Janela 2 Oscilatório -0,9857 -0,9930 Sag / Swell 0,9585 -0,9968 Spike -0,9833 -0,6591 Notch -0,9656 -0,9376 Harmônicos -0,9767 0,1248
7.4 Resumo do capítulo
Este capítulo mostrou o desempenho alcançado pelas duas arquiteturas de rede
abordadas nos capítulos anteriores, a primeira, destinada ao reconhecimento de 4 classes e a
segunda, destinada ao reconhecimento de 5 classes de eventos de qualidade de energia.
Capítulo 7- Resultados
107
Os resultados obtidos através de eventos simulados mostram que a rede para
reconhecimento de 4 classes manteve sua eficiência global em 98,37%, valor este, que confirma
a eficiência do método de treinamento realizado, ainda que com poucos eventos utilizados
durante o treinamento. Uma vez que o objetivo do treinamento era atingir uma eficiência
global superior a 98% de classificação correta dos eventos aplicados à rede. Estes resultados
comprovam os apresentados em [31], onde a metodologia utilizada foi apresentada.
A rede destinada a reconhecer 5 classes de eventos apresentou uma eficiência global da
ordem de 98,7%, na classificação correta dos eventos aplicados a ela. De maneira geral, a classe
de eventos harmônicos apresenta a mais diversa variedade de padrões possíveis para os sinais
de erro que são utilizados pelo processo de classificação, este fato faz com que o
reconhecimento desta classe seja dificultado, a ponto de termos de acrescentar 9 neurônios à
camada intermediária da rede para atingir uma eficiência maior que 98% de classificação
correta da mesma durante o treinamento.
Na avaliação dos dados reais, percebemos que a rede destinada a reconhecer 5 classes
de eventos é capaz de determinar a classe de eventos que apresentam características diferentes
das encontradas nos eventos obtidos a partir de simulação. Esta capacidade mostra que a
característica de generalização da rede se mantém para pequenos desvios dos modelos
empregados. Outro aspecto a ser observado é a possibilidade de se realizar o treinamento de
redes destinadas à classificação de eventos reais de qualidade de energia com base em eventos
simulados.
Capítulo 8
Conclusões
O presente trabalho teve como objetivo principal investigar a possibilidade e a
viabilidade de se realizar a classificação de eventos de qualidade de energia com base no sinal
de erro, definido como a diferença entre o sinal monitorado do sistema elétrico e a
componente fundamental deste sistema.
Uma breve revisão sobre algumas das ferramentas empregadas atualmente na análise da
Qualidade da Energia foi apresentada no início do trabalho com o objetivo de situar a
proposta deste estudo no contexto atual das pesquisas desenvolvidas na área. É percebido na
literatura que trata do assunto que a proposta de se realizar a classificação dos eventos de
qualidade de energia com base no sinal de erro é uma metodologia que vem apresentando bons
resultados.
A apresentação dos principais fenômenos elétricos que contribuem para a baixa
qualidade da energia disponível nos sistemas de potência atuais realizada no Capítulo 2, mostra
a vasta diversidade de distúrbios presentes nos sistemas e confirma a necessidade de
desenvolvimento de pesquisas que possam aumentar o conhecimento a respeito dos
fenômenos elétricos para que seus efeitos, tanto do ponto de vista técnico como do ponto de
vista econômico, possam ser minimizados.
O desenvolvimento do algoritmo Detector de Eventos – DE, realizado em trabalhos
Capítulo 8- Conclusões
109
anteriores possibilitou o avanço dos estudos no sentido de oferecer o sinal de erro, necessário
à realização da classificação dos eventos segundo a metodologia apresentada.
Dentre várias possibilidades de ferramentas para a realização do reconhecimento de
padrões, a opção pela rede neural se mostrou satisfatória dentro do desempenho obtido na
classificação dos eventos. A escolha da estrutura e do tipo de algoritmo empregado durante o
treinamento visou a redução da complexidade computacional e elevado desempenho no
reconhecimento de padrões.
Uma dificuldade encontrada durante o desenvolvimento do trabalho foi a falta de
dados e informações confiáveis a respeito de eventos de qualidade de energia, assim sendo, a
direção seguida foi a de desenvolver modelos para a reprodução de distúrbios semelhantes para
que fosse possível estabelecer uma determinada classe de eventos e, posteriormente, gerar um
número suficiente de eventos para criar um banco de dados necessário ao desenvolvimento do
treinamento do classificador neural.
A utilização da janela de erro como fonte de dados para o classificador neural apontou
para uma importante característica da mesma durante o pré-processamento, a facilidade de se
obter o alinhamento dos eventos na janela de dados utilizada como entrada da rede. Este
mesmo alinhamento não seria conseguido de forma trivial se fossem utilizadas as janelas
armazenadas do sinal monitorado no momento em que ocorre o evento. Esta foi a primeira
vantagem evidenciada na utilização da janela de sinal de erro. Outra observação relacionada ao
emprego da janela de erro no processo de classificação diz respeito à energia do sinal
armazenado na janela. A energia contida na janela do sinal de erro está intimamente
relacionada com a natureza do evento, enquanto a janela que contém o sinal monitorado
apresenta uma parcela de energia relativa à componente fundamental do sistema que, de
maneira geral, não agrega informações no que tange a identificação do evento.
O processo de treinamento do classificador neural, desenvolvido com base no
algoritmo de retropropagação, se mostrou eficiente, alcançando valores de eficiência global
superiores a 98% de classificação correta dos eventos do grupo de teste durante o treinamento.
Este desempenho se confirmou para um universo de 200 eventos de cada classe para as redes
Capítulo 8- Conclusões
110
destinadas a reconhecer 4 e 5 classes de eventos.
Um outro ponto importante a respeito das redes para o reconhecimento de 4 e 5
classes é o aumento da complexidade computacional observado, o número de neurônios na
camada oculta da rede passa de 10 para 19 para que seja mantido o desempenho. É importante
lembrar que este fato pode ser limitante no momento da especificação de um equipamento de
hardware para a implementação do classificador em tempo real. Por outro lado, podemos
sacrificar o desempenho da rede reduzindo o número de neurônios da camada intermediária
com o objetivo de reduzir a complexidade computacional.
Os resultados obtidos através de eventos modelados mostram que a metodologia
proposta desde a detecção até a classificação do evento é capaz de alcançar seus objetivos com
boa eficiência. A análise de um caso real mostrou que o classificador, mesmo sendo treinado
com eventos simulados, adquiriu uma habilidade de generalização suficiente para reconhecer
eventos reais que sejam semelhantes aos apresentados ao classificador durante o processo de
treinamento, ainda que estes apresentem outros eventos de menor intensidade distribuídos na
janela de dados analisada.
Espera-se que, com a disponibilidade de um banco de dados formado apenas por
eventos reais o treinamento do classificador possa ser feito com base nesses dados, o que deve
proporcionar um maior grau de reconhecimento de eventos relacionados com o sistema sob
monitoração. Assim sendo, em condições práticas, uma vez determinado o sistema no qual o
classificador irá operar, o primeiro passo a ser dado é a formação do banco de dados com os
eventos freqüentemente encontrados no sistema. De posse desses dados será possível ajustar o
classificador às necessidades do sistema sob monitoração e, conseqüentemente obter melhores
resultados de classificação.
8.1 Sugestões para trabalhos futuros
No decorrer do presente trabalho, foram identificadas várias possibilidades de
desenvolvimento de novos projetos relacionados com a metodologia fundamentada no estudo
Capítulo 8- Conclusões
111
dos eventos de qualidade de energia com base no sinal de erro, algumas dessas estão
relacionadas abaixo:
• Implementação do sistema de Detecção de Eventos em plataforma DSP, com o
objetivo de gerar bancos de dados.
• Aprofundar os estudos relativos às redes neurais e outras ferramentas destinadas ao
reconhecimento de padrões que possam apresentar melhores resultados na
classificação dos eventos de qualidade de energia.
• Analisar a implementação da mesma metodologia, porém, trabalhando com
sistema trifásico, onde o sinal de erro seria função do sinal monitorado
simultaneamente nas três fases do sistema.
• Buscar a fundamentação teórica para a questão da energia referente ao distúrbio
elétrico do ponto de vista da janela de erro e da janela de sinal.
• Avaliar o desempenho de classificação de redes treinadas a partir de eventos
simulados no reconhecimento de eventos reais.
• Implementação do sistema integrado DE - classificador em plataforma DSP
visando a operação em tempo real.
Referências
[1] R. C. Dugan, M. F. McGranaghan, and H. W. Beaty, Electrical Power Systems Quality, McGraw-Hill 1996.
[2] J. Arrillaga, M. H. J. Bollen, and N. R. Waston, “Power Quality Following Deregulation,” Proceedings of the IEEE, vol. 88, no 2, Fevereiro, 2000, pág. 246 – 261.
[3] R. Flores, “Signal Processing Tools for Power Quality Event Classification,” Technical Report no 477L, Department of Signals and Systems, Department of Electric Power Engineering, Chalmers University of Technology, Novembro, 2003.
[4] Toivonen, W. and Morsky, J., "Digital Multirate Algorithms for Measurement of Voltage, Current, Power and Flicker", IEEE Tansactions on Power Delivery, vol. 10, no. 1, pág. 116-126, Janeiro 1995.
[5] Diniz, P. S. R., Silva, E. A. B. and Netto, S. L, "Processamento Digital de Sinais: Projeto e Análise de Sistemas", Bookman, 2004.
[6] S.Santoso, W. M. Grady, E. J. Powers, J. Lamoree, and S. C. Bhatt, Member, “Characterization of Distribution Power Quality Events with Fourier and Wavelet Transforms,” Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 247 – 254.
[7] M. V. Ribeiro, S. M. Deckmann, J. M. T. Romano, “Adaptative Filtering, Wavelet and Lapped Transforms for Power Quality Problem Detection and Identification,” IEEE 2003.
[8] Haykin, Simon, "Adaptative Filter Theory", Prentice Hall Information, Third Edition, 1996.
[9] C. A. Duque, M. V. Ribeiro, H. A. C. Braga, S. Q. Almeida, “Compressão de Dados para Análise de Qualidade de Energia Elétrica Utilizando Transformada Wavelet e Filtros de Kalman,” SBA2000 – Autimatic Brazilian Congress, Florianópolis, SC, Brasil, Setembro 2000.
[10] O. Poisson, P. Rioual and M. Meunier, “Detection and Measurement of Power Quality Disturbances Using Wavelet Transform,” IEEE Transactions on Power Delivery, vol. 15, no 3, Julho 2000, pág. 1039 – 1044.
[11] A. M. Gaouda, M. M. A. Salama, M. R. Sultan, A. Y. Chikhani “Power Quality Detection Using Wavelet Multiresolution Signal Decomposition,” IEEE Transactions on Power Delivery, vol. 14, no 4, Outubro 1999, pág. 1469 – 1476.
[12] A. M. Gaouda, M. M. A. Salama, M. R. Sultan, “Automated Recognition System for Classifying and Quantifying the Electric Power Quality,” 1998 IEEE.
Referências
113
[13] M. V. Chilukuri, and P. K. Dash, “Multiresolution S-Transform-Based Fuzzy Recognition System for Power Quality Events,” IEEE Transactions on Power Delivery, vol. 19, no 1, Janeiro 2004, pág. 323 – 330.
[14] S. Santoso, E. J. Powers, W. M. Grady, and A. C. Persons, “ Power Quality Disturbance Waveform Recognition Using Wavelet-Based Neural Classifier – Part 1: Theoretical Foundation” IEEE Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 222 – 228.
[15] S. Santoso, E. J. Powers, W. M. Grady, and A. C. Persons, “ Power Quality Disturbance Waveform Recognition Using Wavelet-Based Neural Classifier – Part 2: Application” IEEE Transactions on Power Delivery, vol. 15, no 1, Janeiro 2000, pág. 229 – 235.
[16] Stockwell, R. G., Mansinha, L. and Lowe, R. P., "Localization of the complex spectrum: The S-transform", IEEE Trans. Signal Processing, vol. 144, pág. 998-1001, Abril 1996.
[17] J. Meeuwsen and W. Kling, “The influence of different network structures on power supply reliability,” in Proc. Quality of Power Supply, ETG-Conf., Novembro, 1997, pág. 9–14
[18] R. Billington and R. N. Allan, Reliability Assessment of Large Electric Power Systems. Norwell, MA: Kluwer, 1988.
[19] IEEE Recommended Practice for Monitoring Electric Power Quality, IEEE Standard 1159–1995, 1995.
[20] G. T. Heydt, Electric Power Quality. West Lafayette, IN: Stars in a Circle, 1991.
[21] J. Arrillaga, D. A. Bradley, and P. S. Bodger, Power System Harmonics. London, U.K.: Wiley, 1985.
[22] J. Arrillaga, B. C. Smith, N. R. Watson, and A. R. Wood, Power System Harmonic Analysis. London, U.K.: Wiley, 1997.
[23] M. S. Azam, F. Tu, K. R. Pattipati, and R. Karanam “A Dependency Model-Based Approach for Identifying and Evaluating Power Quality Problems,” IEEE Transactions on Power Delivery, vol. 19, no 3, Julho 2004, pág. 1154 – 1165.
[24] F. R. Ramos, M. V. Ribeiro, J. M. T. Romano, Sênior, IEEE and C. A. Duque, Member, IEEE, “On Signal Processing Approach for Event Detection and Compression Applied to Power Quality Evaluation” ICHQP2002, Rio de Janeiro, RJ, Brasil – 2002.
[25] F. R. Ramos “Algoritmo de Pré-Compactação”, Dissertação de Mestrado, Faculdade de Engenharia Elétrica, Universidade Federal de Juiz de Fora, Juiz de Fora, MG, 2003.
[26] Kwan, T. and Martin, K., "Adaptive Detection and Enhancement of Multiple Sinusoids Using a Cascade IIR Filter", IEEE Trans. on Circuits and Systems, vol. 36, no. 7, pág. 937-947, Julho 1989.
[27] S. K. Mitra, Digital Signal Processing – A Computer Based Approach, Mc Graw-Hill 1998.
Referências
114
[28] S. Haykin, Redes Neurais, Princípio e Prática, Bookman, 2001.
[29] Frederico R. Ramos, Carlos A. Duque, Moisés V. Ribeiro, Jacques Szczupak, “Power Quality Event Detection based on the Principle of Divide to Conquer and Innovation Concept”. IEEE Transactions on Power Delivery.
[30] Handbook of Power Signatures, Dranetz – BMI 1998.
[31] Rogério M. Trindade, Carlos A. Duque, Member, IEEE, Moisés V. Ribeiro, Student Member, IEEE , and Augusto S. Cerqueira “Digital System for Detection and Classification of Electrical Events” – International Symposium on Circuits and Systems ISCAS – Kobe, Japão, 2005.