CLAGTEE2009 - Aplicação de Extração de Regras Para Análise de Transformadores de Potência

THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 1

Abstract--As redes neurais artificiais representam modelos

computacionais eficientes que são amplamente utilizados para

resolver problemas de difícil solução em Inteligência Artificial.

A maior dificuldade associada à utilização de redes neurais

artificiais se deve ao fato das mesmas serem, também,

consideradas “caixas-pretas”, devido à dificuldade de se obter

conhecimento sobre o comportamento da rede neural. Este

trabalho apresenta um breve histórico dos métodos de extração

de conhecimento, sendo detalhado um método de extração de

regras que estabelece uma relação de igualdade entre certas

classes de redes neurais e sistemas baseados em regras fuzzy,

com modificações que permitem a obtenção de regras coerentes

com o domínio das variáveis do problema. O método de extração

de regras de conhecimento é aplicado para a identificação de

faltas incipientes em transformadores de potência, utilização

dados de gases dissolvidos no óleo do transformador.

Index Terms-- Diagnóstico de faltas em transformadores,

Extração de regras de conhecimento, Redes neurais artificiais,

Sistemas baseados em lógica fuzzy.

I. INTRODUÇÃO

edes Neurais Artificiais (RNAs) são muito utilizadas

para resolver problemas complexos de Inteligência

Artificial e de engenharia, e são conhecidas por sua

característica de paralelismo. Entretanto, são consideradas

também como “caixas-pretas”, pois determinar o porquê de

uma solução particular obtida de uma RNA é uma tarefa

difícil.

Sistemas baseados em Regras Fuzzy (SRFs) representam

uma ferramenta poderosa para resolver problemas de controle

(controlador fuzzy) e para modelar conhecimento.

Pesquisas para a extração de conhecimento de RNAs vêm

crescendo em importância. Neste trabalho é apresentado um

breve histórico dos métodos para a obtenção de regras de

conhecimento.

Neste trabalho é apresentada a obtenção de regras, mais

fáceis de serem analisadas, a partir de uma RNA projetada

para classificar faltas incipientes em um transformador de

potência, utilizando informações dos gases dissolvidos no

M. A. B. Amora, O. M. Almeida, A. P. S. Braga, F. R. Barbosa, e S. S. Lima

são filiados ao Departamento de Engenharia Elétrica da Universidade Federal do

Ceará, Caixa Postal 6001 - Campus do Pici- Bloco 705 - 60.455-760 Fortaleza -

CE - Brasil. E-mails: {marcio,fabio,sergio,arthurp,otacilio}@dee.ufc.br.

L. A. C. Lisboa trabalha na Companhia Hidro Elétrica do São Francisco

(CHESF), Rua Delmiro Gouveia, 333 - Bongi, 50761-901, Recife, PE. E-

mail:[email protected].

óleo isolante do transformador. Nesta aplicação, será utilizado

o método proposto em [1] de igualdade entre alguns tipos de

RNAs e SRFs, permitindo representar o conhecimento de

uma RNA como sentenças fuzzy, mais fáceis de serem

interpretadas.

Para garantir um maior grau de compreensão das regras

obtidas é aplicada uma modificação proposta em [2] para a

obtenção de regras fuzzy coerentes.

Na seção 2 é apresentada uma análise sobre os métodos de

extração de informações. Comentários gerais sobre RNAs e

SRFs são apresentados nas seções 3 e 4, respectivamente. A

igualdade entre SRFs e RNAs é discutida na seção 5. A

obtenção de proposições fuzzy coerentes e a utilização do

operador lógico fuzzy u

n são abordadas na seção 6. A

interpretação dos valores de bias obtidos da RNA é discutida

na seção 7. Na seção 8 é apresentado o problema de

identificação de faltas incipientes em transformadores,

utilizando o método de extração de regras. Finalmente, as

conclusões do artigo são apresentadas na seção 9.

II. TÉCNICAS DE EXTRAÇÃO DE CONHECIMENTO

A. Representação do Conhecimento

Diversas formas de representação do conhecimento foram

empregadas pelas técnicas de aprendizado em RNAs. Um

sumário é apresentado a seguir [3].

Regras convencionais: Representa uma expressão em duas

partes. A primeira parte contém os antecedentes e a segunda

parte a conseqüência, ou seja, a conclusão se os antecedentes

são verdadeiros. A forma dessas regras será:

SE ( x1 ≤ t1 ) E ... E ( xp ≥ tp ) ENTÃO C;

onde xi são variáveis contínuas, ti são variáveis reais e C é

uma classe designando um conceito. Note que as variáveis

discretas são um caso especial das variáveis contínuas.

Regras M de N: São regras similares as regras

convencionais, entretanto uma regra M de N é equivalente a

um conjunto de regras convencionais:

SE M de ( x1 ≥ t1 ) E ... E ( xN ≤ tN ) SÃO

VERDADE ENTÃO C;

Regras oblíquas: São regras da forma:

EExcxccSE nn ...0... 111101

Aplicação de Extração de Regras para Análise

de Transformadores de Potência

M. A. B. Amora, O. M. Almeida, A. P. S. Braga, F. R. Barbosa, S. S. Lima, L. A. C. Lisboa

R


CENTÃOxcxcc nnmmm 0...110

sendo que xi representa um neurônio de entrada e cij são

número reais. Em comparação com as regras convencionais,

as regra oblíquas são mais difíceis de entender, entretanto

permitem criar uma borda de separação não paralela no

espaço de entrada.

Regras fuzzy: Essas regras utilizam funções de pertinência

para lidar com verdades parciais, atuando de maneira

diferente da lógica Boolena que aceita apenas situações de

Verdade total ou Falso total. As regras fuzzy apresentam a

forma:

SE ( x1 é f1 ) E ... E ( xp é fp ) ENTÃO C;

onde fi e C são definidos como conjuntos fuzzy, com

designação lingüística.

Autômatos de Estado Finito: Apresenta um processador

central de capacidade finita e é baseado no conceito de estado.

São muito utilizados em programas que analisam e geram

regras gramaticais para linguagens.

B. Taxionomia dos Algoritmos de Extração de Regras

Nesta seção é utilizada a taxionomia apresentada por [4]

que utiliza três critérios para classificação dos algoritmos de

extração de regras: escopo de uso, dependência com o método

de solução tipo “caixa-preta”, e formato das regras extraídas.

Em relação ao critério de uso, os algoritmos podem ser de

regressão ou de classificação. Existem alguns algoritmos que

podem ser aplicados para os dois casos, como por exemplo, o

G-REX [4].

Em relação ao segundo critério, um algoritmo é

considerado independente, se o mesmo for totalmente

independente do modelo tipo “caixa-preta” adotado (RNA,

máquinas de vetor suporte, e outros). Os algoritmos que usam

informações do método tipo “caixa-preta” utilizado, são

denominados métodos dependentes.

Em relação ao formato das regras extraídas, os métodos

podem ser classificados em preditivos e descritivos. Os

algoritmos preditivos realizam extração de regras que

permitem ao especialista fazer uma fácil predição para cada

possível observação a partir do espaço de entradas. Caso essa

análise não possa ser feita diretamente, os algoritmos são

denominados como apenas descritivos.

Na Tabela 1 é apresentada a classificação para alguns

algoritmos de extração de conhecimento.

TABELA 1

TAXIONOMIA DE ALGUNS MÉTODOS DE EXTRAÇÃO DE REGRAS Classificação Regressão Classificação Regressão

PreditivosCART, C4.5,

TREPAN [7], G-

REX [8], BIO-

RE [9]

ITER, G-

REX [8],

CART, ANN-

DT [14]

Barakat [15],

Fung [16],

FERNN [17],

NeuroLinear

[18], RE-RX [19]

REFANN

[22], RN2

[23]

Descritivos

STARE [10],

RAFNE [11],

GEX [12], BUR

[13]

SVM [20], VIA

[21], Castro et

al. [2]

III. REDES NEURAIS ARTIFICIAIS

As RNAs são constituídas, basicamente, por dois elementos

físicos: conexões e nós de processamento (neurônios

artificiais). Existem ainda outros componentes (não-físicos)

das redes neurais, tais como: os padrões e os algoritmos de

treinamento. Os padrões são os dados que servirão para o

treinamento, validação e teste da rede.

Na Fig. 1 é apresentado um exemplo de uma RNA do tipo

feedforward com uma única camada escondida, além das

camadas de entrada e de saída. Onde existem n neurônios (x1,

..., xn) na camada de entrada, h neurônios escondidos (z1, ...,

zh), e m neurônios na camada de saída (y1, ..., ym). Sendo wij o

peso da conexão entre um neurônio xi da camada de entrada e

um neurônio zj, e jk o peso da conexão entre o neurônio zj e o

neurônio yk. Nessa rede são considerados, também, j

valores de bias para os neurônios zj da camada escondida, e

k bias para os neurônios yk de saída.

Fig. 1. RNA feedforward [6].

As funções de ativação dessa rede exemplo são gA e fA,

respectivamente, para os neurônios da camada escondida e

para os neurônios da camada de saída. Essas funções são,

usualmente, contínuas, não decrescentes e não-lineares.

A RNA vai representar uma função de rede que:

;: mnF mn yyxxF ,...,,..., 11

com:

k

h

j

jkjAk zgy 1

(1)

j

n

i

ijiAj wxfz 1

(2)

Em [5] é demonstrado que uma RNA com apenas uma

camada escondida tem a capacidade de aproximar qualquer

função, com determinada precisão, independente de sua

complexidade. Portanto, podemos obter com sucesso a

reprodução do comportamento de um sistema físico desde que

tenhamos um conjunto suficiente, em termos quantitativos e


qualitativos, de amostras para o processo de treinamento da

rede neural.

Entretanto, muitos pesquisadores apresentam criticas a

utilização de RNAs, devido às mesmas apresentarem um

comportamento qualificado como de “caixas-pretas”. Pois as

redes não apresentam uma explicação satisfatória para o seu

comportamento.

IV. SISTEMAS BASEADOS EM REGRAS FUZZY

A lógica fuzzy suporta os modos de raciocínio que são

aproximados, ao invés de exatos, sendo baseada na teoria dos

conjuntos nebulosos. Nesta lógica, o raciocínio exato

corresponde a um caso limite do raciocínio aproximado,

sendo interpretado como um processo de composição

nebulosa.

O desenvolvimento da teoria dos conjuntos nebulosos,

assim como a própria lógica fuzzy, introduziu uma classe de

objetos na qual a transição entre a pertinência e a não-

pertinência se dá de forma gradual ao invés de abrupta. Isso

permitiu a utilização de SRFs em aplicações que vão desde o

controle de processos complexos até o reconhecimento de

padrões.

Nas SRFs o conhecimento é representado utilizando

expressões lingüísticas relacionadas com valores numéricos,

e, portanto, mais acessíveis ao entendimento humano e mais

fáceis de serem interpretadas.

Como indicado na Fig. 2, um SRF é composto de quatro

partes: fuzzificação, base de conhecimento, máquina de

inferência, e defuzzificação.

Fig. 2. Diagrama de blocos de um SRF [6].

O processo de fuzzificação converte valores reais em

valores fuzzy, definidos por conjuntos fuzzy. As funções que

definem os intervalos das variáveis lingüísticas são

representadas na base de dados, junto com as regras fuzzy. A

máquina de inferência calcula a saída fuzzy. A defuzzificação

transformar o valor de saída fuzzy do sistema em um valor

numérico real.

As regras fuzzy apresentam a seguinte forma:

Ri: SE x1 é A1i E x2 é A2i E ... E xn é Ani

ENTÃO y é Bi (3)

onde x1,..., xn são as entradas, y é a saída, e A1i,.., An

i e Bi são

variáveis lingüísticas.

Os Sistemas Fuzzy Aditivos (SFAs) apresentam regras com

a seguinte expressão, denominadas regras do tipo Takagi-

Sugeno-Kang (TSK):

Rjk: SE x1 é Ajk1 E x2 é Ajk

2 E ...E xn é Ajkn

ENTÃO yk é pjk (x1, ..., xn) (4)

sendo pjk (x1, ..., xn) uma função linear das entradas.

Considerando um sistema com n entradas, m saídas, e

regras fuzzy do tipo multi-entradas e saída simples (MISO –

Multiinput Single Output) com lk entradas de regras para a

saída k. Então yk é calculado da seguinte maneira:

kl

j

njkjkk xxpvy1

1,..., (5)

onde vjk representa o valor de ativação (peso) da regra j para a

saída k.

V. EQUIVALÊNCIA ENTRE RNAS E SRFS

Quando as funções de ativação em uma RNA são

contínuas, a função de rede calculada será contínua. Então

uma RNA pode ser aproximada por um SRF, e vice-versa [1].

A equivalência ente RNAs e SRFs já foi estudada por

diversos autores no passado. Muitos desses estudos

estabelecem essa equivalência através de processos de

aproximação. Entretanto, para que essa equivalência ocorra

com um elevado grau de precisão, é necessário um número

elevado de regras para um SRF aproximar uma RNA.

No entanto, em [1] é demonstrado que um SFA pode

representar a mesma função de uma RNA com um número

finito de regras e igualdade nos resultados matemáticos. A

seguir será apresentada uma breve demonstração do método,

baseada na referência.

Considerando uma rede neural de três camadas do tipo

feedforward com uma função de ativação logística nos

neurônios da camada escondida e função identidade para os

neurônios da camada de saída. Então existe um SFA que

calcula a mesma função da rede neural [1].

Para descrever um sistema fuzzy é necessária apenas a base

de regras. Empregando regras do tipo Takagi-Sugeno-Kang

(TSK), para cada par de neurônios entre as camadas

escondida e de saída, (zj e yk), é acrescentada a regra:

jkk

n

i

jijijk yENTÃOAéwxSER 1

:

(6)

sendo A um valor fuzzy em , onde a função de pertinência

é simplesmente a função de ativação fA dos neurônios da

camada escondida.

Como o sistema fuzzy é aditivo, o disparo da regra Rjk, vjk,

será dado por

j

n

i

iji wxA 1

, e a saída do sistema é um

vetor com os componentes dados por:

jkj

n

i

iji

h

j

k wxAy

11

(7)

Através de (6) e (7), pode ser facilmente checado que a

saída yk do SFA é exatamente a mesma obtida com uma RNA.


Neste desenvolvimento, foram utilizadas simples regras do

tipo “SE z é A ENTÃO y = v” onde v e z são novas

variáveis obtidas por uma mudança de variável nas n

entradas. Também, os conjuntos fuzzy A podem ser

entendidos como “maior que aproximadamente r”, onde r é

um número real positivo obtido de um valor de corte pré-

estabelecido. Desde que as funções logísticas podem variar de

0 até 1, assintoticamente, é usual na literatura considerar os

valores (níveis) 0,1 e 0,9 para total ausência de ativação e

total ativação, respectivamente, conforme ilustrado na Fig. 3.

Fig. 3. Função de pertinência para “aproximadamente maior que 2,2” [2].

As regras obtidas podem ainda serem alteradas para

permitir uma interpretação mais fácil. Para isso, podemos

proceder à decomposição das premissas das regras, que

podem ser reescritas:

Rjk: SE x1 é Ajk1 x2 é Ajk

2 ... xn é Ajkn

ENTÃO yk = jk (8)

com sendo um conectivo lógico e Ajki sendo novos valores

de conjunto fuzzy obtidos de A, dos pesos wij e dos valores de

bias j.

VI. PROPOSIÇÕES FUZZY COERENTES

O método descrito na seção anterior permite a obtenção de

regras fuzzy a partir de uma RNA treinada, entretanto muitas

vezes essas regras não vão estar no domínio das variáveis de

entrada, dificultando a interpretação das mesmas. De modo a

resolver este problema foi utilizada neste trabalho a

metodologia para modificação das regras fuzzy descrita em

[2], que permite a obtenção de novas regras fuzzy de acordo

com o domínio das varáveis de entrada do problema

analisado.

O método descrito em [2] consiste na mudança dos

intervalos de definição das variáveis fuzzy do problema. Este

método utiliza um novo operador lógico na ligação das

premissas das regras fuzzy obtidas da RNA. Este novo

operador apresenta uma série de propriedades, descritas em

[2], úteis a finalidade de obter conhecimento de regras fuzzy

adquiridas de uma RNA. O operador é definido por:

1111

11

1...1...

...,...,

11

11

u

n

uu

n

u

u

n

u

n

u

n

aaaa

aaaa (9)

Considerando uma RNA multicamada com uma única

camada escondida, como ilustrado na Fig. 1. Também,

adotando que alguns pesos wij são positivos e outros

negativos, de modo, sem perda de generalização, que: wij < 0

para 1 i p e wij > 0 para p i n. O procedimento para

transformar as regras fuzzy para o domínio das variáveis de

entrada do problema consistirá dos seguintes passos:

1) Transformar os domínios das variáveis de entrada.

Para obter regras fuzzy com um mesmo operador u

n ,

um valor comum de u deve ser utilizado para todas as

transformações. Portanto, este passo consiste dos

cálculos:

2

1,1,min0

hjniwij , e

0

4

u .

Esses parâmetros serão utilizados na função T(x) =

u.x e no operador u

n .

2) Para cada neurônio de saída yk, uma regra fuzzy “R0k:

Se VERDADE então yk = k” é acrescentada à base

de regras.

3) Para cada par de neurônios das camadas escondida e

de saída (zj, yk), a seguinte regra é acrescentada:

Rjk: Se –T(x1. w1j+0) não é maior que

aproximadamente 2,2 u

n 1 ... –T(xp. wpj+0) não é

maior que aproximadamente 2,2 u

n 1 T(x(p+1). w(p+1)j

- 0) é maior que aproximadamente 2,2 u

n 1 ... T(xn.

wnj - 0) é maior que aproximadamente 2,2 u

n 1 j

Então yk = jk .

Onde:

a) –T(xi.wij+0) não é maior que aproximadamente 2,2

xi não é maior que aproximadamente (2,2+u.0)/(-

u.wij) = 6,2/(-u.wij)=λij , e não é maior que

aproximadamente λij(x)=fA((6,2/ λij).x-4).

b) T(xi.wij-0) é maior que aproximadamente 2,2 xi é

maior que aproximadamente (2,2+u.0)/(u. wij) =

6,2/(u. wij)=λij , e não é maior que

aproximadamente λij(x)=fA((6,2/ λij).x-4).

c) j = fA(T(j – p.0 + (n-p).0)).

Portanto:

Rjk: Se x1 não é maior que aproximadamente λij u

n 1 ...

xp não é maior que aproximadamente λpj u

n 1 x(p+1) é

maior que aproximadamente λ(p+1)j u

n 1 ... xn é maior

que aproximadamente λnj u

n 1 j Então yk = jk .


VII. INTERPRETAÇÃO DOS VALORES DE BIAS

Dois tipos de valores de bias aparecem na RNA descrita na

Fig. 1: os valores de bias relacionados aos neurônios de saída

k (k = 1,...,m) e os bias j (j = 1,...,h) associados aos

neurônios escondidos.

Os valores de bias k geram as regras do tipo “R0k: Se

VERDADE então yk = k” no SRF. Estas regras fornecem um

valor default para cada saída yk. Se as demais regras forem

ativadas, elas apenas modificaram os valores default de saída.

Isso é coerente com o processo de raciocínio humano onde um

valor default é modificado quando uma nova informação é

considerada.

Os bias j geram as constantes j que aparecem nos

antecedentes das regras fuzzy Rjk. As constantes j fornecem

um valor default, j

u 1 , para o valor de disparo da regra

Rjk. As proposições fuzzy remanescentes apenas modificam o

valor default de disparo da regra.

VIII. ANÁLISE DE TRANSFORMADORES

Ilustrando o procedimento demonstrado neste artigo, foi

considerando uma aplicação baseada na análise de falhas

incipientes em transformadores, utilizado dados coletados de

gases dissolvidos no óleo isolante do transformador.

Os métodos de diagnósticos em transformadores com base

em DGA (Dissolved Gas Analysis) são amplamente

utilizados. Estes métodos baseiam-se na análise de tipos de

concentração e taxa de produção de gases gerados e

dissolvidos no óleo do transformador, e procuram associar o

tipo de falha ao gás presente. Por exemplo, descargas elétricas

levam à geração de acetileno enquanto a presença de dióxido

de carbono está associada ao sobreaquecimento da celulose.

Convencionalmente, o diagnostico é realizado através da

interpretação dos resultados de laboratório por um

especialista.

A partir de um banco de dados com amostras de gases

coletados de transformadores de potência foi treinada uma

RNA com 3 entradas, 10 neurônios na camada escondida e

um neurônio na camada de saída. Para os neurônios da

camada escondida foi utilizada uma função logística e para o

neurônio de saída uma função linear. Portanto, uma topologia

compatível com o método demonstrado neste artigo.

Do conjunto de dados utilizados, composto de 135

amostras, 95 amostras foram utilizadas para o treinamento da

rede e 40 para a validação da mesma. A entrada da RNA

treinada é através das razões de gases: R1 = CH4/ H2 , R2 =

C2H2/C2H4 e R5 = C2H4 /C2H6. A saída da RNA poderá

indicar o código numérico 1 para Falta Térmica de Baixa

Temperatura, 2 para Falta Térmica de Alta temperatura, 3

para Descarga Parcial de Baixa Energia, 4 para Descarga

Parcial de Alta Energia e 5 para Degradação da Celulose.

Após o treino e validação da RNA foram obtidos os

seguintes valores de pesos e bias:

288286,0022798,2041112,0

054748,2378771,09477073,0

125491,0110015,0275689,0

777081,0331852,4868009,3

807768,033527,48866752,3

271477,0327245,5274797,5

214268,0565215,03544984,0

697832,3110725,77633864,1

80546,3776136,6480831,1

18724,0181829,0131158,0

t

ij

t wW

3250,1

9239,0

1386,0

1154,1

1268,1

7463,1

7320,0

4821,1

1058,6

1935,0

; j

0336,08484,00585,09712,38912,16 t

jk

tB

0284,00009,07971,53725,13175,1 ; 7624,4 k

Aplicando a metodologia apresentada neste artigo, foi

construído um SRF, equivalente a RNA treinada, contendo

onze regras:

Regra 1: SE VERDADE ENTÃO Y = -4,7624.

Regra 2: SE R1 não é maior que aproximadamente 0,24293 59,194

4 R2 não é maior que aproximadamente 0,17523 59,194

4

R5 não é maior que aproximadamente 0,17017 59,194

4

4,96*10-24 ENTÃO Y = 16,8912.



4

R5 é maior que aproximadamente 0,0084 59,194

4 1 ENTÃO Y

= -3,9712.

Regra 4: SE R1 é maior que aproximadamente 0,0181 59,194

4


4 R5 não é

maior que aproximadamente 0,0086 59,194

4 6,33*10-133

ENTÃO Y = -0,0585.


4


4 R5 não é


4 1,56*10-69

ENTÃO Y = -0,8484.



4 R5

não é maior que aproximadamente 0,1174 59,194

4 1 ENTÃO

Y = 0,0336.


4


4 R5 não é


4 6,66*10-103

ENTÃO Y = -1,3175.



4


4 1 ENTÃO Y

= -1,3725.



4


R5 não é maior que aproximadamente 0,2539 59,194

4 2,19*10-

19 ENTÃO Y = 5,7971.


4 R2 é maior que aproximadamente 0,0841 59,194

4 R5


4 1 ENTÃO

Y = -0,0009.


4 R2 é maior que aproximadamente 0,0152 59,194

4 R5


4 1,19*10-119

ENTÃO Y = 0,0284.

O valor de = 194,59 e os valores associados aos termos

independentes (bias) nas regras foram calculados conforme

demonstrado na seção 6.

A Tabela 2 apresenta alguns resultados obtidos. Os valores

de R1, R2 e R5 indicados são exemplos retirados do banco de

dados de transformadores de potência utilizado. Os valores

numéricos obtidos da RNA treinada e do SRF desenvolvido

são sempre iguais, atestando a eficácia do método de

igualdade utilizado neste trabalho. A coluna Resultado indica

os valores obtidos da RNA sem considerar a normalização, e

a Meta indica os valores esperados. Portanto, a RNA e o SRF

conseguem gerar corretamente o resultado numérico de

diagnóstico do transformador analisado.

TABELA 2

RESULTADOS DE SIMULAÇÃO

Valores RNA SFA Resultado Meta

R1= -1,2283; R2= 0,6245; R5= 0,9797 -0,3772 -0,3772 4,0155 4,0000

R1= -0,6242; R2= -0,6288; R5= 1,4721 -0,2190 -0,2190 1,9956 2,0000

R1= -0,6955; R2= -0,7154; R5= -0,0050 1,4159 1,4159 3,0016 3,0000

Com a aplicação do método apresentado, as premissas das

regras obtidas apresentaram valores na faixa das variáveis de

entrada do problema. Melhorando o entendimento das regras.

Analisando os valores de bias obtidos no treinamento da

RNA e que influenciam os termos das regras extraídas. Foi

observado que valores de bias que resultaram em valores extremamente pequenos indicam uma baixa influência da

regra em questão no resultado numérico da aplicação do

conjunto de regras. Esta influência pode ser avaliada de

maneira simplificada através da relação 59,194

1 . Fazendo a

análise da influência dos valores de bias nas regras extraídas

foi observado que três regras do conjunto original poderiam

ser omitidas: Regra 4, Regra 7 e Regra 11.

Também, observando o valor de saída da regra extraída a

partir do neurônio nove da camada escondida da RNA

treinada, a mesma apresenta o valor -0,0009 (valor do peso

que interliga o neurônio com a saída da RNA), que representa

um valor muito pequeno quando comparado as demais saídas

obtidas, portanto a Regra 10 também pode ser omitida.

Considerando a retirada dessas quatro regras que

apresentam uma pequena influência no resultado do sistema

fuzzy, um novo teste foi realizado para os valores indicados na

Tabela 2, com os novos resultados sendo apresentados na

Tabela 3. TABELA 3

NOVOS RESULTADOS DE SIMULAÇÃO

Valores RNA SFA

R1= -1,2283; R2= 0,6245; R5= 0,9797 -0,3772 -0,3659

R1= -0,6242; R2= -0,6288; R5= 1,4721 -0,2191 -0,2213

R1= -0,6955; R2= -0,7154; R5= -0,0050 1,4159 1,4160

Como pode ser observado da comparação dos resultados

das Tabelas 2 e 3, a exclusão das quatro regras do conjunto

original não alterou significamente o resultado do SRF, que é

praticamente igual ao obtido da RNA, comprovando a

influência reduzida das regras omitidas. As demais regras

foram consideradas significativas para a obtenção dos

resultados numéricos do SRF.

IX. CONCLUSÕES

Neste trabalho foi apresentada uma breve discussão sobre

métodos de extração de conhecimento, muitos destes métodos

obtêm regras a partir de RNAs.

Também foi demonstrado, em particular, um método de

obtenção de um SRF a parti de uma RNA treinada, com

alterações que permitem obter valores coerentes com o

domínio das variáveis de entrada do problema para os

intervalos de avaliação nas premissas das regras. As

modificações permitem um melhor entendimento das regras

extraídas.

Duas importantes conclusões podem ser observadas da

igualdade estabelecida entre sistemas SRFs e RNAs.

Primeiro, tudo descoberto para um modelo poderá ser

aplicado no outro modelo. Segundo, o conhecimento de uma

RNA associado às conexões e pesos sinápticos poderá ser

expresso através de regras fuzzy, permitindo uma melhor

compreensão desse conhecimento.

Nas simulações realizadas foi observada a influência dos

termos associados aos valores de bias dos neurônios nas

regras extraídas. Indicando que certas regras podem ser

omitidas sem prejuízo para o resultado numérico.

X. AGRADECIMENTOS

Os autores são gratos ao apoio fornecido pela Companhia

Hidro Elétrica do São Francisco (CHESF) na realização deste

trabalho.

XI. REFERÊNCIAS

[1] J. M. Benitez, J. L. Castro, and I. Requena, “Are artificial neural networks

black boxes?”, IEEE Trans. Neural Netw., vol. 8, no. 5, pp. 1156–1164,

Sep. 1997.

[2] J. L. Castro, C. J. Mantas, and J. M. Benitez, “Interpretation of artificial

neural networks by means of fuzzy rules”, IEEE Trans. Neural Netw., vol.

13, no. 1, pp. 101–116, Jan. 2002.

[3] G. Bologna, “A model for single and multiple knowledge based networks”,

ELSEVIER Artificial Intelligence in Medicine no. 28, pp. 141-163, 2003.

[4] J. Huysmans, B. Baesens and J. Vanthienen. “Using rule extraction to

improve the comprehensibility of predictive models”. Katholieke

Universiteit Leuven. Department of Decision Sciences and Information

Management. Leuven, Belgium, 2006.


[5] K. Hornik, M. Stinchcombe, and H. White, “Multilayer feedforward

networks are universal approximators” Neural Networks, vol. 2, pp. 359–

366, 1989.

[6] Lima S. E. U. “Diagnóstico Inteligente de Falhas Incipientes em

Transformadores de Potência Utilizando Análise dos Gases Dissolvidos em

Óleo”, Dissertação de Mestrado, UFC/CT/DEE, Fortaleza-CE, 2005.

[7] M.W. Craven and J.W. Shavlik. “Extracting tree-structured representations

of trained networks”. In David S. Touretzky, Michael C. Mozer and

Michael E. Hasselmo, editors, Advances in Neural Information Processing

Systems, volume 8, pages 24-30. The MIT Press, 1996.

[8] U. Johansson, R. König and L. Niklasson. “Rule extraction from trained

neural networks using genetic programming”. In Joint 13th International

Conference on Artificial Neural Networks and 10th International

Conference on Neural Information Processing, ICANN/ICONIP 2003,

pages 13-16, 2003.

[9] I. Taha and J. Ghosh. “Symbolic interpretation of artificial neural

networks”. IEEE Transactions on Knowledge and Data Engineering,

11(3):448-463, 1999.

[10] Z.-H. Zhou, S.-F. Chen and Z.-Q. Chen. “A statistics based approach for

extracting priority rules from trained neural networks”. Proceedings of the

IEEE-INNS-ENNS International Joint Conference on Neural Networks, 3,

2000.

[11] Z.-H. Zhou, Y. Jiang and S.-F. Chen. “Extracting symbolic rules from

trained neural network ensembles”. AI Communications, 16(1):3-15,

2003.

[12] U. Markowska-Kaczmar and M. Chumieja. “Discovering the mysteries of

neural networks”. International Journal of Hybrid Intelligent Systems, 1(3-

4):153-163, 2004.

[13] F. Chen. “Learning accurate and understandable rules from SVM

classifiers”. Master's thesis, Simon Fraser University, 2004.

[14] G.P.J. Schmitz, C. Aldrich and F.S. Gouws. “ANN-DT: An algorithm for

extraction of decision trees from artificial neural networks”. IEEE

Transactions on Neural Networks, 10(6):1392-1401, 1999.

[15] N. Barakat and J. Diederich. “Eclectic rule-extraction from support vector

Machines”. International Journal of Computational Intelligence, 2(1):59-

62, 2005.

[16] G. Fung, S. Sandilya and R.B. Rao. “Rule extraction from linear support

vector machines”. In 11th ACM SIGKDD international conference on

Knowledge discovery in data mining, pages 32-40, 2005.

[17] R. Setiono and W.K. Leow. “FERNN: An algorithm for fast extraction of

rules from neural networks”. Applied Intelligence, 12(1-2):15-25, 2000

[18] R. Setiono and H. Liu. “Neurolinear: From neural networks to oblique

decision rules”. Neural Computing, 17(1):1-24, 1997.

[19] R. Setiono and B. Baesens. “Risk management using recursive neural net-

work rule extraction”. Submitted to Management Science, 2006.

[20] H. Núñez, C. Angulo and A. Català. “Rule extraction from support vector

machines”. In European Symposium on Artificial Neural Networks

(ESANN), pages 107-112, 2002.

[21] S. Thrun. “Extracting provably correct rules from artificial neural

networks”. Technical report iai-tr-93-5, Universität Bonn, Institut fur

Informatik III, 1993.

[22] R. Setiono, W.K. Leow and J.M. Zurada. “Extraction of rules from

artificial neural networks for nonlinear regression”. IEEE Transactions on

Neural Networks, 13(3):564-577, 2002.

[23] K. Saito and R. Nakano. “Extracting regression rules from neural

networks”. Neural Networks, 15(10):1279-1288, 2002.

[24] J.R. Quinlan. “C4.5: Programs for Machine Learning”. Morgan Kaufmann

Publishers Inc., San Francisco, CA, USA, 1993.

[25] R. Setiono and J.Y.L. Thong. “An approach to generate rules from neural

networks for regression problems”. European Journal of Operational

Research, 155(1):239-250, 2004.

[26] R. Setiono, W.K. Leow and J.M. Zurada. “Extraction of rules from

artificial neural networks for nonlinear regression”. IEEE Transactions on

Neural Networks, 2002.

XII. BIOGRAFIAS

Márcio A. B. Amora nasceu em Fortaleza-CE, Brasil, em 1972. Possui

graduação em Engenharia Elétrica pela Universidade Federal do Pará (1997) e

mestrado em Engenharia Elétrica pela Universidade Federal do Pará (2001).

Atualmente é professor assistente da Universidade Federal do Ceará. Tem

experiência na área de Engenharia Elétrica, com ênfase em Inteligência

Computacional Aplicada, atuando principalmente nos seguintes temas:

diagnóstico de faltas incipientes em transformadores, análise de carregamento de

transformadores, geração eólica, análise de estabilidade transitória.

Otacílio M. Almeida. Possui graduação em Engenharia Elétrica pela

Universidade Federal do Ceará (1987), mestrado em Engenharia Elétrica pela

Universidade Estadual de Campinas (1990) e doutorado em Engenharia Elétrica

pela Universidade Federal de Santa Catarina (2002). Atualmente é professor

adjunto da Universidade Federal do Ceará. Tem experiência na área de

Engenharia Elétrica, com ênfase em Automação Eletrônica de Processos

Elétricos e Industriais, atuando principalmente nos seguintes temas:

controladores industriais, controle de processos, controladores pid, máquinas

elétricas industriais e controladores inteligentes.

Arthur P. S. Braga nasceu em Natal-RN, Brasil, em 1971. Possui graduação

em Engenharia Elétrica pela Universidade Federal do Ceará (1995), mestrado

em Engenharia Elétrica pela Universidade de São Paulo (1998), doutorado em

Engenharia Elétrica [S. Carlos] pela Universidade de São Paulo (2004), pós-

doutorado pela Universidade de São Paulo/São Carlos - USP/SC (2005) e pós-

doutorado pela Universidade de São Paulo/São Carlos - USP/SC (2006).

Atualmente é Professor Adjunto da Universidade Federal do Ceará. Tem

experiência na área de Engenharia Elétrica, com ênfase em Redes Neurais.

Atuando principalmente nos seguintes temas: Aprendizagem por reforço, agente

autônomo, redes neurais, inteligência artificial, Mapas auto-organizáveis.

Fábio R. Barbosa nasceu em Fortaleza-CE, Brasil, em 1979. Possui nível

médio técnico em Eletrotécnica, pelo Centro Federal de Educação Tecnológica

do Ceará (1999) e graduação em Engenharia Elétrica pela Universidade Federal

do Ceará (2004). Possui título de Mestre em Engenharia Elétrica pelo Programa

de Pós-graduação do Departamento de Engenharia Elétrica da Universidade

Federal do Ceará (2008). Tem experiência em pesquisas de Inteligência

Artificial aplicadas à Engenharia Elétrica. Exerceu atividades de consultoria na

área de automação industrial e controle lógico programável junto ao Serviço

Nacional de Aprendizagem Industrial do Ceará - SENAI. Atualmente, é bolsista

de pós-graduação da CAPES e desenvolve pesquisas no campo de

monitoramento e diagnóstico de transformadores de potência imersos em óleo

isolante como doutorando do Programa de Pós-Graduação do Departamento de

Engenharia Elétrica da Universidade Federal do Ceará.

Sérgio S. Lima possui graduação em Informática pela Universidade de

Fortaleza (2000). Atualmente, é bolsista do Laboratório do Grupo de Pesquisa

em Automação é Robótica (GPAR) do Departamento de Engenharia Elétrica da

Universidade Federal do Ceará, e desenvolve pesquisas no campo de

monitoramento e diagnóstico de transformadores de potência imersos em óleo

isolante.

Luciano A. C. Lisboa possui graduação em Engenharia Eletrônica pela

Universidade Federal de Pernambuco (2002). Atualmente é Engenheiro da

Companhia Hidro Elétrica do São Francisco. Tem experiência na área de

Engenharia Elétrica, com ênfase em Eletrônica Industrial, Sistemas e Controles

Eletrônicos.

CLAGTEE2009 - Aplicação de Extração de Regras Para Análise de Transformadores de Potência

Documents

Transcript of CLAGTEE2009 - Aplicação de Extração de Regras Para Análise de Transformadores de Potência