ESTUDOOMPARATIVO C ENTRE SVM E RNA NO … · defeito de pista externa em rolamentos, como...

ESTUDO COMPARATIVO ENTRE SVM E RNA NO RECONHECIMENTO DE DEFEITO EM ROLAMENTOS DE MOTORES DE INDUÇÃO TRIFÁSICOS

RODRIGO HENRIQUE CUNHA PALÁCIOS, IVAN NUNES DA SILVA, WAGNER FONTES GODOY

Departamento de Engenharia Elétrica, Escola de Engenharia de São Carlos, Laboratório de Automação Inteli-

gente de Processos e Sistemas, Universidade de São Paulo, São Carlos, São Paulo

Email: [email protected], [email protected], [email protected]

ALESSANDRO GOEDTEL, WYLLIAM SALVIANO GONGORA, TIAGO DRUMMOND LOPES

Departamento de Engenharia Elétrica, Centro Integrado de Pesquisa em Controle e Automação, Universidade

Tecnológica Federal do Paraná, Cornélio Procópio, Paraná

Email: [email protected], [email protected], [email protected]

Abstract – One of the most important elements of electromechanical power conversion in industrial processes, the three phase

induction motor is constantly subject of research aiming to reduce maintenance rates and also unscheduled downtime in the pro-

cess. Great part of the defects in these motors occurs in the bearing. Hence, the use of intelligent systems capable of predicting

faults in electric motors has been widely addressed. Thus, the purpose of this work is to present a comparative implementation

study of SVM (Support Vector Machine) and ANN (Artificial Neural Network) as pattern classifiers, to identify bearing outside

lane fault, by using current and voltage signals in the time domain to determine the accuracy rate and processing time. Experi-mental results are presented to validate the proposal.

Keywords – Three-Phase Induction Motors, Pattern Recognition, Intelligent Systems, SVM, ANN

Resumo – Um dos mais importantes elementos de conversão eletromecânica de energia nos processos industriais, o motor de in-

dução trifásico é constantemente alvo de pesquisas para diminuir as taxas de manutenções e paradas não programadas no proces-

so. Grande parte dos defeitos em motores ocorre em rolamentos. A utilização de sistemas inteligentes capazes de predizer os de-

feitos nos motores elétricos tem sido amplamente abordada nesse sentido. Assim, a proposta desse trabalho consiste em apresen-

tar um estudo comparativo de aplicação entre SVM (Support Vector Machine) e RNA (Rede Neural Artificial) para identificar

defeito de pista externa em rolamentos, como classificadores de padrões, utilizando dados de corrente e tensão de motores de in-

dução trifásicos, no domínio do tempo, para determinar a taxa de acurácia e tempos de processamento. Resultados experimentais

são apresentados para validar a proposta.

Palavras-chave – Motores de Indução Trifásicos, Reconhecimento de Padrões, Sistemas Inteligentes, SVM, RNA.

1 Introdução

O motor de indução trifásico (MIT) é amplamen-

te empregado em ambientes industriais e cada vez

mais as empresas estão preocupadas em obter o

maior proveito dos seus motores. Assim, buscam-se

soluções que possam maximizar a eficiência energé-

tica e reduzir os custos com manutenções, bem com

as paradas não programadas em suas linhas de pro-

dução.

Muitas técnicas podem ser empregadas para de-

tecção de defeitos, como por exemplo, a manuten-

ção preditiva. Esta metodologia permite avaliar as condições reais de operação da máquina utilizando

dados coletados diretamente do equipamento.

Alguns indícios podem ser percebidos quando

um motor começa a apresentar defeitos como: mu-

danças nos sinais associados às vibrações mecâni-

cas, variação na temperatura de operação, ruídos

audíveis e alterações no campo eletromagnético,

dentre outros. Assim, a análise dos referidos indícios

auxiliam na detecção de defeitos quando estão ainda

em fase de evolução. Desta forma, o engenheiro de

manutenção pode planejar uma ação corretiva e

minimizar os impactos no processo produtivo (A-raújo et al., 2010).

Os sistemas inteligentes baseados em Redes Neurais Artificiais (RNA), Lógica Fuzzy (LF) e

Sistemas Híbridos (SH) estão sendo empregados na

identificação e resolução de diversos problemas

relacionados ao controle e acionamento de máquinas

elétricas. Estas estratégias são capazes de classificar

e determinar a origem de defeitos ainda em evolu-

ção (Santos et al., 2011; Sayouti et al., 2011; Ghate

and Dudul, 2009; Seera, 2012).

Um exemplo do uso de sistemas inteligentes é o

ambiente WEKA (Waikato Environment for Kno-

wledge Analysis) (Hall et al., 2009), criado pela Universidade de Waikato, Nova Zelândia, que pos-

sui vários algoritmos implementados que ajudam na

resolução de problemas envolvendo classificação,

mineração de dados e sistemas de aprendizagem.

Neste trabalho, o WEKA é usado como uma fer-

ramenta para reconhecer defeitos em rolamentos de

motores de indução trifásicos baseados nos métodos

de classificação SVM (Support Vector Machine) e

RNA (Rede Neural Artificial), com análise dos

sinais de corrente (I) e tensão (V) no domínio do

tempo.

Os dados de entrada para os algoritmos de a-prendizagem são constituídos de medições do sinal

de tensão e corrente em meio ciclo de onda. Estes

sinais são discretizados e normalizados, em ensaios

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

3013

de 50 pontos para cada valor das tensões Va, Vb, Vc

e 50 pontos para os valores das correntes Ia, Ib, Ic. A

saída consiste num valor binário para indicar os

defeitos no rolamento ou condição normal de fun-

cionamento do MIT. Assim, é possível analisar a

taxa de acurácia dos algoritmos de aprendizagem e

reconhecer um padrão para prever a condição de possíveis defeitos dos rolamentos dos motores.

Este trabalho está dividido da seguinte forma: na

Seção 2, são discutidos alguns aspectos relacionados

às Falhas em MITs. Na Seção 3, as principais carac-

terísticas de SVM e RNA são apresentadas. Na

Seção 4, a metodologia da preparação dos dados e

uso de laboratório são demonstrados. Na Seção 5,

são apresentados os resultados experimentais. En-

fim, na Seção 6, são realizadas as conclusões do

trabalho.

2 Falhas no MIT

O monitoramento das condições de operação de

um MIT em uma indústria é uma tarefa muito im-

portante e possibilita o diagnóstico de defeitos e

previsão das suas condições de operação. Esse tema

tem atraído a atenção de vários pesquisadores duran-

te os últimos anos. Tal fato se deve à considerável

influência dos motores sobre a continuidade opera-

cional dos processos industriais (Bellini et al., 2008). A detecção e o correto diagnóstico precoce

dos defeitos incipientes permitem minimizar a ocor-

rência de danos ao processo, aumento da disponibi-

lidade dos equipamentos e consequente manutenção

dos resultados financeiros.

Os motores elétricos estão sujeitos a vários tipos

de defeitos, que podem ser divididos em dois grupos

distintos: defeitos elétricos e defeitos mecânicos

(Bellini et al., 2008). A Tabela 1 apresenta a classi-

ficação dos principais tipos de defeitos em MIT.

Tabela 1. Principais tipos de defeitos em MIT

Defeitos Elétricos Defeitos Mecânicos

Enrolamento de estator Desgaste de acoplamento

Enrolamento de rotor Desalinhamento

Barras quebradas Excentricidade

Anéis quebrados Rolamento

Conexões

Dos defeitos citados na literatura, estima-se que os rolamentos são responsáveis por aproximadamen-

te 40% das paradas indesejadas dos MIT (Kowalski

and Kowalska., 2003).

O escopo deste trabalho aborda somente os de-

feitos relativos à pista externa de rolamentos. De

acordo com Araújo et. al. (2010), a deterioração de

rolamentos também pode ocorrer em função das

correntes de modo comum que circulam pelos mes-

mos devido à carga eletrostática induzida no eixo do

motor. Outro fator refere-se às pulsações de conju-

gado causadas pela existência de harmônicos de

baixa ordem na alimentação ou relativas a possíveis

barras quebradas. Na Figura 1 é apresentado um

gráfico comparativo entre os diversos tipos de fa-

lhas, conforme os estudos encomendados pelas

agências IEEE (Institute of Electrical and Electro-nics Engineers) e EPRI (Electric Power Research

Institute).

Figura 1. Percentual de ocorrência de falhas em MIT

Métodos tradicionais consideram o monitora-

mento da temperatura e vibração dos rolamentos,

visando estimar suas condições de operação. No

entanto, o custo de sensores para monitoramento de

vibrações, associados aos dispositivos de processa-

mento de sinais, restringem sua utilização em má-

quinas de pequeno porte. Contudo, métodos alterna-

tivos, baseados em inteligência computacional, estão cada vez mais sendo pesquisados para a identifica-

ção de defeitos em MIT.

3 Aspectos sobre SVM e RNA

Os agentes classificadores são métodos compu-

tacionais supervisionados que têm por objetivo criar

um modelo que prevê a classe de um determinado

conjunto de dados baseando-se em conjunto de

dados pré-estabelecidos (Serasiya and Chaudhary, 2012).

Neste trabalho, são utilizados RNA com a ar-

quitetura PMC (Perceptron de Múltiplas Camadas)

e SVM, a fim de verificar a acurácia dos modelos e

os respectivos tempos de construção e validação do

modelo.

3.1 SVM

SVM são sistemas de aprendizagem de máquina

treinados com um algoritmo de otimização matemá-

tica e que implementam um limite derivado da teo-

ria de aprendizagem estatística. Essa estratégia de

aprendizagem foi desenvolvida por Vladmir Vapnik

(Vapnik, 1999).

O treinamento de SVM envolve a otimização de

uma função quadrática convexa, que é um problema

1900ral1900ral1900ral1900ral1900ral1900ral1900ral1900ral1900ral1900ral IEEE

EPRI


3014

de otimização matemática e envolve poucos parâ-

metros livres que precisam ser ajustados pelo usuá-

rio e não há uma dependência, pelos menos de uma

forma explícita, na dimensão do espaço de entrada

do problema, isso sugere que o SVM pode ser útil

em problemas com um grande número de entradas,

conforme se pode observar no trabalho proposto. Essa técnica pode ser aplicada ao reconheci-

mento de padrões (estimar funções indicadores),

regressão (estimar funções de valores reais) e extra-

ção de características. O processo decisório em

problemas de reconhecimento de padrões pode ser

realizado através de funções que dividem o espaço

de características em regiões. Uma das formas de

fazer esta separação é por meio de hiperplanos.

A ideia inicial básica do SVM é mapear os da-

dos de entrada em um espaço de características por

meio de um mapa não linear. No espaço de caracte-rísticas, a função de decisão linear é construída.

Assumindo um conjunto de dados S onde

�� ∈ ��(� = 1, … , �). (1)

Cada ponto �� pertence a duas classes e é dado um

rótulo �� ∈ {1, −1}. Dado uma função não linear

∅(∙) para mapear os dados de amostra, a partir do

espaço ��, as características espaço F. Então o

hiperplano (� ∙ ∅(�)) + � separa os dados, de acor-

do com a Equação (2),

�(�) = ��[� ∙ ∅(�) + �], (2)

onde � é o vetor ortogonal ao hiperplano e � é o

deslocamento do hiperplano a partir da origem.

O hiperplano tenderá a uma separação, com o

menor erro de generalização. Para maximizar a

margem da tarefa tem-se a Equação (3),

��(�) = ! (� ∙ �), (3)

sujeito a Equação (2). Na Figura 2 são ilustrados os

hiperplanos de suporte e o hiperplano ótimo repre-

sentando a separação de amostras em duas classes

distintas.

Usando o método dos multiplicadores de La-

grange, este problema de otimização pode ser con-

vertido conforme apresentado na Equação (4),

" = ! (� ∙ �) − ∑ $�%�& (��(� ∙ '(��) + �) − 1), (4)

onde $�são os multiplicadores Lagrangeanos. As

derivadas de � e � são dadas pelas seguintes Equa-

ções (5) e (6),

()(* = ∑ ��$�%�& = 0 (5)

()(, = � − ∑ ��$�'(��)%�& = 0. (6)

Substituindo as Equações (5) e (6) na Equação (4),

tem-se,

" = ∑ $�%�& − 12∑ $�$.��/%�,.& 0'(��) ∙ '1�.23. (7)

Este deve ser maximizado com respeito ao $� sujeito à restrição seguinte,

4 $� ≥ 0∑ ��$� = 0%�&

6 . (8)

Figura 2. Hiperplano de separação ótimo na linha amarela centra-

lizada com seus hiperplanos de suporte em linha tracejada.

Quando a máxima margem do hiperplano é en-

contrada, apenas os pontos que se encontram mais

próximo do hiperplano tem $� ≥ 0 e estes pontos são chamados de vetores de suporte e todos os ou-

tros pontos têm $� = 0. Isto significa que a repre-

sentação do hiperplano é dada apenas pelos pontos

mais próximos a ele e que são os padrões mais sig-

nificativos dos dados. A função de decisão resultan-

te é dada pela Equação (9),

� = ��7∑ ��∈89 $�:1'(��) ∙ '(�)2 + �:;, (9)

onde $�: é a solução da restrição do problema de

maximização, �: é o deslocamento do hiperplano a

partir da origem após a solução da restrição do pro-

blema e SV representa os índices dos vetores de

suporte. A Equação (9) também pode ser escrita conforme a Equação (10),

� = ��7∑ $�:��<(�� , �) + �%�& ;. (10)

No caso, em que os dados de treinamento não

podem ser linearmente separados, variáveis de folga

não negativos ℵ� são introduzidos em condições de

desigualdade e a soma das variáveis de folga multi-

plicado pelo parâmetro ? é adicionada na função

objetivo. Isto corresponde a adição da fronteira

superior ? com o elemento $. A otimização do

problema é realizada conforme demonstrada na

Equação (11),

min"C = ! ‖�‖! + ? ∑ ℵ�%�& . (11)


3015

A Equação (11) pode ser transformada de acordo

com a Equação (12),

maxG(α) =∑ α� − !

%�& ∑ α�α.y�y.<(x� , x.)%�,.&

�. J. 4∑ α�� = 0α� ≥ 0%�& 0 ≤ α� ≤ ? 6 . (12)

3.1 RNA

Os sistemas baseados em RNA possuem eleva-

das taxas de computação por utilizarem um número

elevado de elementos processadores simples massi-

vamente conectados. Em resumo, as RNA's podem

ser caracterizadas como modelos computacionais,

com propriedades particulares, cujas principais

características são definidas como segue: (i) capaci-

dade intrínseca de operação em paralelo; (ii) não há a necessidade de conhecimento a priori de eventuais

modelos matemáticos que descrevem o comporta-

mento de determinada aplicação; (iii) sistemas inspi-

rados no cérebro humano; (iv) habilidade de apren-

der a partir da experiência.

As redes PMC possuem os mesmos princípios

proposto por Rosenblatt (1958), com a diferenciação

que apresentam uma ou mais camadas intermediá-

rias, conhecidas como camadas escondidas. A estru-

tura apresentada na Figura 3 é proposta em uma

grande diversidade de aplicações e pode ser utiliza-

da como aproximador universal de função, classifi-cação de padrões, identificação de sistemas, otimi-

zação, controle de processos entre outros (Haykin,

2001). Também se define que seu treinamento é

realizado de forma supervisionada, fazendo com que

a rede ajuste seus pesos para melhor atender os

objetivos da aplicação.

Figura 3. Arquitetura da rede neural artificial PMC (Silva, Spatti

e Flauzino, 2010)

Para um melhor entendimento do principio de

funcionamento envolvido com o algoritmo backpro-

pagation, faz-se necessário definir diversas variá-

veis e parâmetros auxiliares que norteiam a deriva-

ção do algoritmo, como segue:

- WMN(O)

são matrizes de pesos cujos elementos

denotam o valor do peso sináptico conectando ao j-

ésimo neurônio da camada (L) ao i-ésimo neurônio

da camada (L-1).

- IMN(O)são vetores cujo os elementos denotam a

entrada ponderada em relação ao j-ésimo neurônio

da camada L, os quais são definidos pela Equações

(11), (12) e (13),

IM( ) =∑ WMN( )QN&R . xN ↔ IM( ) (11)

=WM,T( ). xR +WM,

( ). x +⋯+WM,Q( ). xQ

IM(!) = ∑ WMN(!)QN&R . YN( ) ↔ IM(!) (12)

=WM,T(!). YR( ) +WM,

(!). Y ( ) +⋯+WM,Q (!) . YQ ( )

IM(W) = ∑ WMN(W)QN&R . YN(!) ↔ IM(W) (13)

=WM,T(W). YR(!) +WM,

(W). Y (!) +⋯+WM,Q!(W) . YQ!(!)

-YM(O)são vetores cujo os elementos denotam a

saída do j-ésimo neurônio em relação a camada L,

os quais são definidos pelas Equações (14), (15) e (16) que seguem,

YM( ) = g(IM( )) (14)

YM(!) = g(IM(!)) (15)

YM(W) = g1IM(W)2, (16)

onde g representa uma função de ativação que deve

ser contínua e diferenciável em todo o seu domínio.

A partir da Figura 3, observa-se que os nós da camada de entrada da rede fornecem as informações

(vetores de entrada), as quais constituem os sinais de

entrada, que são aplicados aos neurônios da segunda

camada (1ª camada neural). Os sinais de saída da

segunda camada são utilizados como entradas para a

terceira camada (2ª camada neural). Finalmente, o

conjunto de sinais de saída apresentados pelos neu-

rônios da camada de saída reflete a resposta final da

rede em relação ao vetor de entrada fornecido pelos

nós fontes da primeira camada. O treinamento ou

processo de aprendizagem de uma rede neural artifi-cial consiste em ajustar os pesos sinápticos (matriz

de pesos W) de forma que a aplicação de um con-

junto de entradas produza um conjunto de saídas

desejadas. O treinamento supervisionado das RNA

que formam a rede Perceptron utilizadas neste traba-

lho é baseado no algoritmo de aprendizagem back-

propagation (Haykin, S., 2009). As funções Erro

Quadrático (E(k)) e Erro Quadrático Médio (EM)

são utilizadas como critérios de desempenho e de

parada do processo de treinamento.

4 Aquisição e Tratamento dos Dados

Para o caso em estudo neste trabalho, as tensões

e correntes foram medidas em um MIT de 1 CV do


3016

fabricante WEG. Este motor foi utilizado em labora-

tório, em perfeitas condições de operação. Para

determinação de defeito, foram criadas defeitos na

pista externa do rolamento para a aquisição dos

dados de tensão e corrente. A Figura 4 ilustra o

defeito criado em laboratório. As falhas de ranhuras

presentes na pista externa ou interna do rolamento são ocasionadas pelo escorregamento da esfera na

pista, por choque mecânico no eixo do motor ou

rolamento ou mesmo montagem incorreta da peça

no mancal do eixo. Este tipo de falha ocasiona um

ponto específico de defeito na pista do rolamento.

Para isso, foi realizada em laboratório a desmonta-

gem do rolamento e a inserção da ranhura por meio

da mini retífica de alta rotação.

Figura 4. Falha localizada de ranhuras na pista externa

A Figura 5 ilustra o método de aquisição e tra-

tamento dos dados utilizados neste trabalho. Os

dados para treinamento e validação do MIT de 1

CV, em condições normais de funcionamento e com

o rolamento defeituoso, foram adquiridos através de

ensaios na bancada experimental apresentada na

Figura 6. Esta bancada tem como característica

monitorar as grandezas de tensão, corrente, vibra-

ção, torque e velocidade de um MIT. As placas de condicionamento de sinais dos sensores Hall ampli-

ficam as tensões de fase e correntes de linha que são

repassadas às entradas analógicas da placa de aqui-

sição de dados.

Conforme observada na Figura 6, esta bancada

dispõe de um MIT acoplado a um gerador de corren-

te contínua que faz a imposição de torque no eixo da

máquina. Nos detalhes da Figura 6, são mostrados

os variadores de tensão independentes por fase para

desbalanço de tensões (Goedtel, 2007). O motor

empregado nos experimentos realizados em labora-tório é da marca WEG modelo Dahlander 12 pontas

com potência de 1 CV, tendo como rotação 1700

rpm para uma alimentação em 220V senoidal em

60Hz. O rolamento em análise foi o NSK 6204 com

8 esferas e a coleta do sinal da corrente de estator

utilizou uma taxa de 25000 amostras por segundo.

Figura 5. Método de aquisição dos dados

Por meio da interface de comunicação com um computador, provida pela DAQ, as informações de

sinais são recebidas e armazenadas por meio do

software Matlab®. A DAQ utilizada neste processo

é da National Instruments™ modelo USB 6221, a

qual dispõe de 16 entradas analógicas e permite a

comunicação simplificada com o computador por

meio de cabo USB.

Figura 6. Bancada experimental do laboratório

A bancada conta ainda com um torquímetro de

dupla faixa de atuação com sensor de velocidade

integrado. O dispositivo da marca Kistler, modelo

4503A50W, permite a leitura de sinais analógicos

ou digitais até 50 Nm e 7000 rpm .

A rotina de comunicação da placa com o compu-

tador utiliza a interface da plataforma Matlab®.

Assim, todos os dados das grandezas são lidos e

armazenados em forma de planilhas eletrônicas.

Para obter a classificação quanto ao funciona-

mento adequado do rolamento, foram amostrados os

sinais das correntes e tensões trifásicas dos MITs em análise. Para tanto, foram separados os dados para

as construções dos modelos inteligentes, conforme


3017

observado na Tabela 2. Salienta-se que as amostras

são sinais dos MITs em regime permanente, adqui-

ridas em ensaios na bancada experimental, com

conjugado de carga variando de 0,5 a 6 Nm e com

16 combinações de desequilíbrio de tensão entre as

fases, considerando o limite máximo de ±10%. Do

total de 224 amostras utilizadas neste trabalho, 112 amostras estavam em condições de defeitos no ro-

lamento do motor e 112 amostras são relativos aos

sinais do motor em condições normais de funciona-

mento.

Os dados de entrada utilizados para este traba-

lho são os sinais no domínio do tempo de correntes

(Ia,b,c) e tensões (Va,b,c) de uma máquina trifásica.

Assim, faz-se necessário a montagem de um vetor

coluna com os pontos de tensões e correntes de cada

fase do sistema coletado, subsequentes um do outro.

A Tabela 3 apresenta a estrutura de uma amostra, para a composição de cada amostra, considera-se 50

pontos para cada valor Va, Vb, Vc e 50 pontos para

cada valor de corrente Ia, Ib, Ic, correspondentes a

um semiciclo de onda no domínio do tempo, con-

forme ilustrado na Figura 7. A última coluna da

matriz representa a classe do problema (0 para mo-

tor sem defeito no rolamento e 1 para motor com

defeito).

Tabela 2. Divisão das amostras dos motores para tratamento,

treinamento e validação

Motores 1 CV

Amostras Treinamento 157

Validação 67

Total 224

Foi gerado um script em Matlab® para separa-

ção dos dados de treinamento do algoritmo classifi-

cador e da sua validação. O conjunto de dados de

treinamento compreende de 70% do conjunto de

casos disponíveis sendo que os restantes 30% são

utilizados para validação.

Tabela 3. Estrutura dos dados utilizados por amostra tratada

Va Vb Vc Ia Ib Ic Saída 1x50 1x50 1x50 1x50 1x50 1x50 0/1

O script separa no conjunto de treinamento os

casos em que ocorre os máximos e mínimos de

tensões e correntes a fim de garantir que todo o

domínio de operação seja abrangido pelos métodos

classificadores. Os demais casos são sorteados alea-toriamente para compor o arquivo de treinamento. A

separação dos dados é necessária para obter um

arquivo de treinamento e um arquivo de validação,

conforme observado na Tabela 2, que são utilizados

pela plataforma WEKA.

Após os dados serem tratados pelo Matlab® o

script desenvolvido gera um arquivo “.arff”, no qual

é especificamente formatado como entrada de dados

para a execução dos algoritmos no WEKA, confor-

me quantidade de amostras demonstradas na Tabela

2. Para as duas ferramentas de classificação de pa-

drões utilizadas neste trabalho, aplicou-se o mesmo

conjunto de dados para treinamento e validação.

Figura 7. Sinal Discretizado

5 Resultados Experimentais

O WEKA (Waikato Environment for Knowled-

ge Analysis) é um sistema de mineração de dados

desenvolvido na Universidade de Waikato. É um

ambiente de aprendizagem com muitos algoritmos

de aprendizado. Os classificadores de padrões apre-

sentados na Seção 3 são utilizados neste trabalho por meio do WEKA. Este trabalho visa investigar,

baseado na problemática do assunto, qual dos méto-

dos inteligentes se comportará melhor para a neces-

sidade de resolução do problema em termos acurácia

e tempo computacional.

Para a execução das estratégias propostas neste

trabalho, foram efetuadas algumas configurações

específicas para o treinamento e validação, de acor-

do com as Tabelas 5 e 6. Na Tabela 4, o parâmetro

Epsilon é relativo à taxa de erro de arrendondamen-

to, a função kernel está relacionada à função núcleo do SVM, neste trabalho é utilizada a função Poly-

nomial Kernel (Shashua, 2009). O parâmetro tole-

rância está relacionado ao limite de erro aceitável.

Tabela 4. Parâmetros de configuração do SVM

Parâmetros Valores

Epsilon 1.0E-12

Função kernel Polynomial Kernel

Parâmetro de Tolerância 0,001

Os parâmetros de configuração da RNA (PMC)

estão dispostos na Tabela 5. A arquitetura e as con-figurações, para este trabalho, foram determinadas

de forma empírica.

Na Tabela 6 e na Figura 8 é mostrado o tempo

de execução dos algoritmos, tanto na construção dos

modelos quanto na execução da validação, o tempo

apurado é mostrado em segundos. Pode-se observar

que nos casos estudados, o algoritmo que obteve

uma execução mais rápida foi o SVM, com 0,03

segundos, na validação dos dados amostrados e 7,89

segundos na construção do modelo. A RNA de-

monstrou demasiado tempo computacional na cons-trução do modelo, com 211,61 segundos e obteve

uma taxa de validação inferior ao SVM com 0,41

segundos.


3018

Tabela 5. Parâmetros de configuração da RNA

Parâmetros Valores

Camadas ocultas 1

Função de ativação das

camadas intermediárias Tangente Hiperbólica

Função de ativação da

camada de saída Linear

Número de entradas 300

Neurônios da camada oculta 150

Neurônios da camada de

saída 1

Taxa de aprendizado 0,3

Termo momentun 0,2

Número de épocas 500

Tabela 6. Tempo de execução dos algoritmos

Algoritmo Tempo de

construção do modelo

Tempo necessário

para a validação

RNA 211,61 0,41

SVM 7,89 0,03

Na Tabela 7 e na Figura 9 são apresentados a

taxa de acurácia dos algoritmos e alguns índices

estatísticos. Neste estudo, foram obtidos resultados

promissores, baseados nas 67 amostras validadas. A

RNA apresentou a melhor acurácia com 98,50 %, ou

seja, 66 amostras foram corretamente classificadas.

O algoritmo SVM, apesar de apresentar os melhores tempos computacionais, demonstrou uma acurácia

de 95,52 %, ou seja, 64 amostras foram corretamen-

te classificadas.

Tabela 7. Acurácia e estatística dos algoritmos

Algoritmo Acurácia % Estatística

Kappa

Erro Absoluto

Médio

RNA 98,50 0,9713 0.0092

SVM 95,52 0,9210 0.0311

Um índice importante na análise dos resultados

está relacionado à estatística Kappa, que é uma

medida de concordância interobservador e mede o grau de concordância além do que seria esperado tão

somente pelo acaso (Landis e Koch, 1977). Esta

medida de concordância tem como valor máximo o

“1”. Este valor “1” representa total concordância e

os valores próximos e até abaixo de “0”, indicam

nenhuma concordância, conforme apresentado na

Tabela 8 (Landis e Koch, 1977). Neste caso, ambos

os algoritmos apresentaram ótima concordância com

os resultados obtidos nas validações. Em relação ao

erro absoluto médio, as estratégias baseadas em

RNA e SVM apresentaram baixos índices com res-

pectivamente 0,0092 e 0,0311.

Tabela 8. Tabela para interpretação da estatística Kappa

Valores de Kappa Interpretação

<0 Nenhuma concordância

0 – 0,19 Pobre concordância

0,20 – 0,39 Fraca concordância

0,40 – 0,59 Moderada concordância

0,60 – 0,79 Substancial concordância

0,80 – 1,00 Perfeita concordância

Figura 8. Gráfico comparativo do tempo de construção e valida-

ção dos algoritmos avaliados

Figura 9. Gráfico comparativo da acurácia entre os algoritmos

avaliados

6 Conclusão

Por meio da análise dos resultados obtidos pe-

los algoritmos na plataforma WEKA, pode-se ob-

servar que estes se mostraram promissores para

determinação de defeitos em rolamentos a partir de

dados de corrente e tensão dos motores de indução

trifásicos no domínio do tempo.

A RNA possui a melhor relação de tempo de

execução e acurácia, a qual obteve uma taxa de acerto de 98,50 %, embora exija um maior custo

computacional em relação ao algoritmo SVM. Con-

tudo, dependendo do tipo de aplicação e necessidade

de resposta em menor tempo, pode-se optar pela

utilização do SVM. Entretanto, ambos os algoritmos

se mostraram eficientes na validação.

O diagnóstico correto e precoce de defeitos inci-

pientes em motores, através das estratégias testadas

neste trabalho, permite minimizar a ocorrência de

danos ao processo. Com isso, ocorre o aumento da

disponibilidade dos equipamentos e a possível redu-ção de custos com manutenção.

Agradecimentos

Os autores agradecem as contribuições do CNPq

(Processo 552269/2011-5) e FAPESP (Processo

2011/17610-0) pelo apoio financeiro para o desen-

volvimento desta pesquisa.

0

50

100

150

200

250

RNA SVM

Tempo de

construção do

modelo

Tempo

necessário

para o teste

97,0

97,50

98,0

98,50

99,0

99,50

RNA SVM


3019

Referências Bibliográficas

Araújo, R. S., Rodrigues, R., Paula, H. e Baccarini,

L. (2010). Desgaste prematuro e falhas recorrentes

dos rolamentos de um MIT: Estudo de caso, Indus-

tryApplications (INDUSCON), 9th IEEE/IAS Inter-

nationalConferenceon, pp. 1-6.

Bellini, A., Filippetti, F., Tassoni, C., Capolino, G.

A. (2008). Advances in diagnostic techniques for

induction machines. IEEE Transactions on Industri-

al Eletronics, vol. 55, nº 12, pp. 4109-4126.

Ghate, V., Dudul, S. (2009). Fault diagnosis of three

phase induction motor using neural network tech-

niques, Emerging Trends in Engineering and Tech-

nology (ICETET), 2nd International Conference on,

pp. 922-928.

Goedtel, A. (2007). Estimador Neural de Velocidade

para Motores de Indução Trifásico. 159 p. Tese

(Doutorado) — Escola de Engenharia de São Carlos

- Universidade de São Paulo, São Carlos-SP.

Haykin, S. (2009). Neural Networks and Learnig

Machines. Prentice Hall.

Hall, Mark; Frank, Eibe; Holmes, Geoffrey;

Pfahringer, Bernhard; Reutemann, Peter; Witten, Ian

H. (2009). The WEKA Data Mining Software: An

Update; SIGKDD Explorations, Volume 11, Issue 1.

Kowalski, C. T. e Orlowska-Kowalska, T. (2003).

Neural networks application for induction motor faults diagnosis, Mathematics and Computers in

Simulation 63(3-5): pp. 435-448.

Landis, J. Richard e Koch, Gary G. (1977). The

Measurement of Observer Agreement for Categori-

cal Data, International Biometric Society,

Vol. 33, N. 1, pp. 159-174.

Rosenblatt, F. (1958). The perceptron: A probabilis-

tic model for information storage and organization

in the brain, Phisicological Review 65(3): 386-408.

Santos, T. H., Goedtel, A., Silva, S. e Suetake, M.

(2011). A neural speed estimator in threephase in-

duction motors powered by a driver with scalar

control, Power Electronics Conference (COBEP),

Brazilian, pp. 44-49.

Sayouti, Y., Abbou, A., Akherraz, M. e Mahmoudi,

H. (2011). Sensor less low speed control with

annmras for direct torque controlled induction motor

drive, Power Engineering, Energy and Electrical

Drives (POWERENG), International Conference on, pp. 1-5.

Seera, M., Lim, C. P., Ishak, D. e Singh, H. (2012).

Fault detection and diagnosis of induction motors

using motor current signature analysis and a hybrid

fmm - cart model, Neural Networks and Learning

Systems, IEEE Transactions on 23(1): pp. 97-108.

Serasiya, S. D., Chaudhary, N. (2012). Simulation

of Various Classifications Results using WEKA.

International Journal of Recent Technology and Engineering (IJRTE), vol. 1, nº13, pp. 1-4.

Shashua, Amnon (2009). Introduction to Machine

Learning: Class Notes 67577, Corr, vol.

abs/0904.3664.

Silva, I. N., Spatti, D. H. e Flauzino, R. A. (2010).

Redes Neurais Artificiais para engenharia e ciências

aplicadas, 1ª edição, São Paulo: Artliber.

Vapnik VN (1995) The Nature of Statistical Learn-ing Theory. Springer-Verlag New York, Inc., New

York, NY, USA


3020

ESTUDOOMPARATIVO C ENTRE SVM E RNA NO … · defeito de pista externa em rolamentos, como...

Documents

Transcript of ESTUDOOMPARATIVO C ENTRE SVM E RNA NO … · defeito de pista externa em rolamentos, como...