CLAGTEE2009 - Aplicação de Extração de Regras Para Análise de Transformadores de Potência
description
Transcript of CLAGTEE2009 - Aplicação de Extração de Regras Para Análise de Transformadores de Potência
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 1
Abstract--As redes neurais artificiais representam modelos
computacionais eficientes que são amplamente utilizados para
resolver problemas de difícil solução em Inteligência Artificial.
A maior dificuldade associada à utilização de redes neurais
artificiais se deve ao fato das mesmas serem, também,
consideradas “caixas-pretas”, devido à dificuldade de se obter
conhecimento sobre o comportamento da rede neural. Este
trabalho apresenta um breve histórico dos métodos de extração
de conhecimento, sendo detalhado um método de extração de
regras que estabelece uma relação de igualdade entre certas
classes de redes neurais e sistemas baseados em regras fuzzy,
com modificações que permitem a obtenção de regras coerentes
com o domínio das variáveis do problema. O método de extração
de regras de conhecimento é aplicado para a identificação de
faltas incipientes em transformadores de potência, utilização
dados de gases dissolvidos no óleo do transformador.
Index Terms-- Diagnóstico de faltas em transformadores,
Extração de regras de conhecimento, Redes neurais artificiais,
Sistemas baseados em lógica fuzzy.
I. INTRODUÇÃO
edes Neurais Artificiais (RNAs) são muito utilizadas
para resolver problemas complexos de Inteligência
Artificial e de engenharia, e são conhecidas por sua
característica de paralelismo. Entretanto, são consideradas
também como “caixas-pretas”, pois determinar o porquê de
uma solução particular obtida de uma RNA é uma tarefa
difícil.
Sistemas baseados em Regras Fuzzy (SRFs) representam
uma ferramenta poderosa para resolver problemas de controle
(controlador fuzzy) e para modelar conhecimento.
Pesquisas para a extração de conhecimento de RNAs vêm
crescendo em importância. Neste trabalho é apresentado um
breve histórico dos métodos para a obtenção de regras de
conhecimento.
Neste trabalho é apresentada a obtenção de regras, mais
fáceis de serem analisadas, a partir de uma RNA projetada
para classificar faltas incipientes em um transformador de
potência, utilizando informações dos gases dissolvidos no
M. A. B. Amora, O. M. Almeida, A. P. S. Braga, F. R. Barbosa, e S. S. Lima
são filiados ao Departamento de Engenharia Elétrica da Universidade Federal do
Ceará, Caixa Postal 6001 - Campus do Pici- Bloco 705 - 60.455-760 Fortaleza -
CE - Brasil. E-mails: {marcio,fabio,sergio,arthurp,otacilio}@dee.ufc.br.
L. A. C. Lisboa trabalha na Companhia Hidro Elétrica do São Francisco
(CHESF), Rua Delmiro Gouveia, 333 - Bongi, 50761-901, Recife, PE. E-
mail:[email protected].
óleo isolante do transformador. Nesta aplicação, será utilizado
o método proposto em [1] de igualdade entre alguns tipos de
RNAs e SRFs, permitindo representar o conhecimento de
uma RNA como sentenças fuzzy, mais fáceis de serem
interpretadas.
Para garantir um maior grau de compreensão das regras
obtidas é aplicada uma modificação proposta em [2] para a
obtenção de regras fuzzy coerentes.
Na seção 2 é apresentada uma análise sobre os métodos de
extração de informações. Comentários gerais sobre RNAs e
SRFs são apresentados nas seções 3 e 4, respectivamente. A
igualdade entre SRFs e RNAs é discutida na seção 5. A
obtenção de proposições fuzzy coerentes e a utilização do
operador lógico fuzzy u
n são abordadas na seção 6. A
interpretação dos valores de bias obtidos da RNA é discutida
na seção 7. Na seção 8 é apresentado o problema de
identificação de faltas incipientes em transformadores,
utilizando o método de extração de regras. Finalmente, as
conclusões do artigo são apresentadas na seção 9.
II. TÉCNICAS DE EXTRAÇÃO DE CONHECIMENTO
A. Representação do Conhecimento
Diversas formas de representação do conhecimento foram
empregadas pelas técnicas de aprendizado em RNAs. Um
sumário é apresentado a seguir [3].
Regras convencionais: Representa uma expressão em duas
partes. A primeira parte contém os antecedentes e a segunda
parte a conseqüência, ou seja, a conclusão se os antecedentes
são verdadeiros. A forma dessas regras será:
SE ( x1 ≤ t1 ) E ... E ( xp ≥ tp ) ENTÃO C;
onde xi são variáveis contínuas, ti são variáveis reais e C é
uma classe designando um conceito. Note que as variáveis
discretas são um caso especial das variáveis contínuas.
Regras M de N: São regras similares as regras
convencionais, entretanto uma regra M de N é equivalente a
um conjunto de regras convencionais:
SE M de ( x1 ≥ t1 ) E ... E ( xN ≤ tN ) SÃO
VERDADE ENTÃO C;
Regras oblíquas: São regras da forma:
EExcxccSE nn ...0... 111101
Aplicação de Extração de Regras para Análise
de Transformadores de Potência
M. A. B. Amora, O. M. Almeida, A. P. S. Braga, F. R. Barbosa, S. S. Lima, L. A. C. Lisboa
R
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 2
CENTÃOxcxcc nnmmm 0...110
sendo que xi representa um neurônio de entrada e cij são
número reais. Em comparação com as regras convencionais,
as regra oblíquas são mais difíceis de entender, entretanto
permitem criar uma borda de separação não paralela no
espaço de entrada.
Regras fuzzy: Essas regras utilizam funções de pertinência
para lidar com verdades parciais, atuando de maneira
diferente da lógica Boolena que aceita apenas situações de
Verdade total ou Falso total. As regras fuzzy apresentam a
forma:
SE ( x1 é f1 ) E ... E ( xp é fp ) ENTÃO C;
onde fi e C são definidos como conjuntos fuzzy, com
designação lingüística.
Autômatos de Estado Finito: Apresenta um processador
central de capacidade finita e é baseado no conceito de estado.
São muito utilizados em programas que analisam e geram
regras gramaticais para linguagens.
B. Taxionomia dos Algoritmos de Extração de Regras
Nesta seção é utilizada a taxionomia apresentada por [4]
que utiliza três critérios para classificação dos algoritmos de
extração de regras: escopo de uso, dependência com o método
de solução tipo “caixa-preta”, e formato das regras extraídas.
Em relação ao critério de uso, os algoritmos podem ser de
regressão ou de classificação. Existem alguns algoritmos que
podem ser aplicados para os dois casos, como por exemplo, o
G-REX [4].
Em relação ao segundo critério, um algoritmo é
considerado independente, se o mesmo for totalmente
independente do modelo tipo “caixa-preta” adotado (RNA,
máquinas de vetor suporte, e outros). Os algoritmos que usam
informações do método tipo “caixa-preta” utilizado, são
denominados métodos dependentes.
Em relação ao formato das regras extraídas, os métodos
podem ser classificados em preditivos e descritivos. Os
algoritmos preditivos realizam extração de regras que
permitem ao especialista fazer uma fácil predição para cada
possível observação a partir do espaço de entradas. Caso essa
análise não possa ser feita diretamente, os algoritmos são
denominados como apenas descritivos.
Na Tabela 1 é apresentada a classificação para alguns
algoritmos de extração de conhecimento.
TABELA 1
TAXIONOMIA DE ALGUNS MÉTODOS DE EXTRAÇÃO DE REGRAS Classificação Regressão Classificação Regressão
PreditivosCART, C4.5,
TREPAN [7], G-
REX [8], BIO-
RE [9]
ITER, G-
REX [8],
CART, ANN-
DT [14]
Barakat [15],
Fung [16],
FERNN [17],
NeuroLinear
[18], RE-RX [19]
REFANN
[22], RN2
[23]
Descritivos
STARE [10],
RAFNE [11],
GEX [12], BUR
[13]
SVM [20], VIA
[21], Castro et
al. [2]
III. REDES NEURAIS ARTIFICIAIS
As RNAs são constituídas, basicamente, por dois elementos
físicos: conexões e nós de processamento (neurônios
artificiais). Existem ainda outros componentes (não-físicos)
das redes neurais, tais como: os padrões e os algoritmos de
treinamento. Os padrões são os dados que servirão para o
treinamento, validação e teste da rede.
Na Fig. 1 é apresentado um exemplo de uma RNA do tipo
feedforward com uma única camada escondida, além das
camadas de entrada e de saída. Onde existem n neurônios (x1,
..., xn) na camada de entrada, h neurônios escondidos (z1, ...,
zh), e m neurônios na camada de saída (y1, ..., ym). Sendo wij o
peso da conexão entre um neurônio xi da camada de entrada e
um neurônio zj, e jk o peso da conexão entre o neurônio zj e o
neurônio yk. Nessa rede são considerados, também, j
valores de bias para os neurônios zj da camada escondida, e
k bias para os neurônios yk de saída.
Fig. 1. RNA feedforward [6].
As funções de ativação dessa rede exemplo são gA e fA,
respectivamente, para os neurônios da camada escondida e
para os neurônios da camada de saída. Essas funções são,
usualmente, contínuas, não decrescentes e não-lineares.
A RNA vai representar uma função de rede que:
;: mnF mn yyxxF ,...,,..., 11
com:
k
h
j
jkjAk zgy 1
(1)
j
n
i
ijiAj wxfz 1
(2)
Em [5] é demonstrado que uma RNA com apenas uma
camada escondida tem a capacidade de aproximar qualquer
função, com determinada precisão, independente de sua
complexidade. Portanto, podemos obter com sucesso a
reprodução do comportamento de um sistema físico desde que
tenhamos um conjunto suficiente, em termos quantitativos e
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 3
qualitativos, de amostras para o processo de treinamento da
rede neural.
Entretanto, muitos pesquisadores apresentam criticas a
utilização de RNAs, devido às mesmas apresentarem um
comportamento qualificado como de “caixas-pretas”. Pois as
redes não apresentam uma explicação satisfatória para o seu
comportamento.
IV. SISTEMAS BASEADOS EM REGRAS FUZZY
A lógica fuzzy suporta os modos de raciocínio que são
aproximados, ao invés de exatos, sendo baseada na teoria dos
conjuntos nebulosos. Nesta lógica, o raciocínio exato
corresponde a um caso limite do raciocínio aproximado,
sendo interpretado como um processo de composição
nebulosa.
O desenvolvimento da teoria dos conjuntos nebulosos,
assim como a própria lógica fuzzy, introduziu uma classe de
objetos na qual a transição entre a pertinência e a não-
pertinência se dá de forma gradual ao invés de abrupta. Isso
permitiu a utilização de SRFs em aplicações que vão desde o
controle de processos complexos até o reconhecimento de
padrões.
Nas SRFs o conhecimento é representado utilizando
expressões lingüísticas relacionadas com valores numéricos,
e, portanto, mais acessíveis ao entendimento humano e mais
fáceis de serem interpretadas.
Como indicado na Fig. 2, um SRF é composto de quatro
partes: fuzzificação, base de conhecimento, máquina de
inferência, e defuzzificação.
Fig. 2. Diagrama de blocos de um SRF [6].
O processo de fuzzificação converte valores reais em
valores fuzzy, definidos por conjuntos fuzzy. As funções que
definem os intervalos das variáveis lingüísticas são
representadas na base de dados, junto com as regras fuzzy. A
máquina de inferência calcula a saída fuzzy. A defuzzificação
transformar o valor de saída fuzzy do sistema em um valor
numérico real.
As regras fuzzy apresentam a seguinte forma:
Ri: SE x1 é A1i E x2 é A2i E ... E xn é Ani
ENTÃO y é Bi (3)
onde x1,..., xn são as entradas, y é a saída, e A1i,.., An
i e Bi são
variáveis lingüísticas.
Os Sistemas Fuzzy Aditivos (SFAs) apresentam regras com
a seguinte expressão, denominadas regras do tipo Takagi-
Sugeno-Kang (TSK):
Rjk: SE x1 é Ajk1 E x2 é Ajk
2 E ...E xn é Ajkn
ENTÃO yk é pjk (x1, ..., xn) (4)
sendo pjk (x1, ..., xn) uma função linear das entradas.
Considerando um sistema com n entradas, m saídas, e
regras fuzzy do tipo multi-entradas e saída simples (MISO –
Multiinput Single Output) com lk entradas de regras para a
saída k. Então yk é calculado da seguinte maneira:
kl
j
njkjkk xxpvy1
1,..., (5)
onde vjk representa o valor de ativação (peso) da regra j para a
saída k.
V. EQUIVALÊNCIA ENTRE RNAS E SRFS
Quando as funções de ativação em uma RNA são
contínuas, a função de rede calculada será contínua. Então
uma RNA pode ser aproximada por um SRF, e vice-versa [1].
A equivalência ente RNAs e SRFs já foi estudada por
diversos autores no passado. Muitos desses estudos
estabelecem essa equivalência através de processos de
aproximação. Entretanto, para que essa equivalência ocorra
com um elevado grau de precisão, é necessário um número
elevado de regras para um SRF aproximar uma RNA.
No entanto, em [1] é demonstrado que um SFA pode
representar a mesma função de uma RNA com um número
finito de regras e igualdade nos resultados matemáticos. A
seguir será apresentada uma breve demonstração do método,
baseada na referência.
Considerando uma rede neural de três camadas do tipo
feedforward com uma função de ativação logística nos
neurônios da camada escondida e função identidade para os
neurônios da camada de saída. Então existe um SFA que
calcula a mesma função da rede neural [1].
Para descrever um sistema fuzzy é necessária apenas a base
de regras. Empregando regras do tipo Takagi-Sugeno-Kang
(TSK), para cada par de neurônios entre as camadas
escondida e de saída, (zj e yk), é acrescentada a regra:
jkk
n
i
jijijk yENTÃOAéwxSER 1
:
(6)
sendo A um valor fuzzy em , onde a função de pertinência
é simplesmente a função de ativação fA dos neurônios da
camada escondida.
Como o sistema fuzzy é aditivo, o disparo da regra Rjk, vjk,
será dado por
j
n
i
iji wxA 1
, e a saída do sistema é um
vetor com os componentes dados por:
jkj
n
i
iji
h
j
k wxAy
11
(7)
Através de (6) e (7), pode ser facilmente checado que a
saída yk do SFA é exatamente a mesma obtida com uma RNA.
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 4
Neste desenvolvimento, foram utilizadas simples regras do
tipo “SE z é A ENTÃO y = v” onde v e z são novas
variáveis obtidas por uma mudança de variável nas n
entradas. Também, os conjuntos fuzzy A podem ser
entendidos como “maior que aproximadamente r”, onde r é
um número real positivo obtido de um valor de corte pré-
estabelecido. Desde que as funções logísticas podem variar de
0 até 1, assintoticamente, é usual na literatura considerar os
valores (níveis) 0,1 e 0,9 para total ausência de ativação e
total ativação, respectivamente, conforme ilustrado na Fig. 3.
Fig. 3. Função de pertinência para “aproximadamente maior que 2,2” [2].
As regras obtidas podem ainda serem alteradas para
permitir uma interpretação mais fácil. Para isso, podemos
proceder à decomposição das premissas das regras, que
podem ser reescritas:
Rjk: SE x1 é Ajk1 x2 é Ajk
2 ... xn é Ajkn
ENTÃO yk = jk (8)
com sendo um conectivo lógico e Ajki sendo novos valores
de conjunto fuzzy obtidos de A, dos pesos wij e dos valores de
bias j.
VI. PROPOSIÇÕES FUZZY COERENTES
O método descrito na seção anterior permite a obtenção de
regras fuzzy a partir de uma RNA treinada, entretanto muitas
vezes essas regras não vão estar no domínio das variáveis de
entrada, dificultando a interpretação das mesmas. De modo a
resolver este problema foi utilizada neste trabalho a
metodologia para modificação das regras fuzzy descrita em
[2], que permite a obtenção de novas regras fuzzy de acordo
com o domínio das varáveis de entrada do problema
analisado.
O método descrito em [2] consiste na mudança dos
intervalos de definição das variáveis fuzzy do problema. Este
método utiliza um novo operador lógico na ligação das
premissas das regras fuzzy obtidas da RNA. Este novo
operador apresenta uma série de propriedades, descritas em
[2], úteis a finalidade de obter conhecimento de regras fuzzy
adquiridas de uma RNA. O operador é definido por:
1111
11
1...1...
...,...,
11
11
u
n
uu
n
u
u
n
u
n
u
n
aaaa
aaaa (9)
Considerando uma RNA multicamada com uma única
camada escondida, como ilustrado na Fig. 1. Também,
adotando que alguns pesos wij são positivos e outros
negativos, de modo, sem perda de generalização, que: wij < 0
para 1 i p e wij > 0 para p i n. O procedimento para
transformar as regras fuzzy para o domínio das variáveis de
entrada do problema consistirá dos seguintes passos:
1) Transformar os domínios das variáveis de entrada.
Para obter regras fuzzy com um mesmo operador u
n ,
um valor comum de u deve ser utilizado para todas as
transformações. Portanto, este passo consiste dos
cálculos:
2
1,1,min0
hjniwij , e
0
4
u .
Esses parâmetros serão utilizados na função T(x) =
u.x e no operador u
n .
2) Para cada neurônio de saída yk, uma regra fuzzy “R0k:
Se VERDADE então yk = k” é acrescentada à base
de regras.
3) Para cada par de neurônios das camadas escondida e
de saída (zj, yk), a seguinte regra é acrescentada:
Rjk: Se –T(x1. w1j+0) não é maior que
aproximadamente 2,2 u
n 1 ... –T(xp. wpj+0) não é
maior que aproximadamente 2,2 u
n 1 T(x(p+1). w(p+1)j
- 0) é maior que aproximadamente 2,2 u
n 1 ... T(xn.
wnj - 0) é maior que aproximadamente 2,2 u
n 1 j
Então yk = jk .
Onde:
a) –T(xi.wij+0) não é maior que aproximadamente 2,2
xi não é maior que aproximadamente (2,2+u.0)/(-
u.wij) = 6,2/(-u.wij)=λij , e não é maior que
aproximadamente λij(x)=fA((6,2/ λij).x-4).
b) T(xi.wij-0) é maior que aproximadamente 2,2 xi é
maior que aproximadamente (2,2+u.0)/(u. wij) =
6,2/(u. wij)=λij , e não é maior que
aproximadamente λij(x)=fA((6,2/ λij).x-4).
c) j = fA(T(j – p.0 + (n-p).0)).
Portanto:
Rjk: Se x1 não é maior que aproximadamente λij u
n 1 ...
xp não é maior que aproximadamente λpj u
n 1 x(p+1) é
maior que aproximadamente λ(p+1)j u
n 1 ... xn é maior
que aproximadamente λnj u
n 1 j Então yk = jk .
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 5
VII. INTERPRETAÇÃO DOS VALORES DE BIAS
Dois tipos de valores de bias aparecem na RNA descrita na
Fig. 1: os valores de bias relacionados aos neurônios de saída
k (k = 1,...,m) e os bias j (j = 1,...,h) associados aos
neurônios escondidos.
Os valores de bias k geram as regras do tipo “R0k: Se
VERDADE então yk = k” no SRF. Estas regras fornecem um
valor default para cada saída yk. Se as demais regras forem
ativadas, elas apenas modificaram os valores default de saída.
Isso é coerente com o processo de raciocínio humano onde um
valor default é modificado quando uma nova informação é
considerada.
Os bias j geram as constantes j que aparecem nos
antecedentes das regras fuzzy Rjk. As constantes j fornecem
um valor default, j
u 1 , para o valor de disparo da regra
Rjk. As proposições fuzzy remanescentes apenas modificam o
valor default de disparo da regra.
VIII. ANÁLISE DE TRANSFORMADORES
Ilustrando o procedimento demonstrado neste artigo, foi
considerando uma aplicação baseada na análise de falhas
incipientes em transformadores, utilizado dados coletados de
gases dissolvidos no óleo isolante do transformador.
Os métodos de diagnósticos em transformadores com base
em DGA (Dissolved Gas Analysis) são amplamente
utilizados. Estes métodos baseiam-se na análise de tipos de
concentração e taxa de produção de gases gerados e
dissolvidos no óleo do transformador, e procuram associar o
tipo de falha ao gás presente. Por exemplo, descargas elétricas
levam à geração de acetileno enquanto a presença de dióxido
de carbono está associada ao sobreaquecimento da celulose.
Convencionalmente, o diagnostico é realizado através da
interpretação dos resultados de laboratório por um
especialista.
A partir de um banco de dados com amostras de gases
coletados de transformadores de potência foi treinada uma
RNA com 3 entradas, 10 neurônios na camada escondida e
um neurônio na camada de saída. Para os neurônios da
camada escondida foi utilizada uma função logística e para o
neurônio de saída uma função linear. Portanto, uma topologia
compatível com o método demonstrado neste artigo.
Do conjunto de dados utilizados, composto de 135
amostras, 95 amostras foram utilizadas para o treinamento da
rede e 40 para a validação da mesma. A entrada da RNA
treinada é através das razões de gases: R1 = CH4/ H2 , R2 =
C2H2/C2H4 e R5 = C2H4 /C2H6. A saída da RNA poderá
indicar o código numérico 1 para Falta Térmica de Baixa
Temperatura, 2 para Falta Térmica de Alta temperatura, 3
para Descarga Parcial de Baixa Energia, 4 para Descarga
Parcial de Alta Energia e 5 para Degradação da Celulose.
Após o treino e validação da RNA foram obtidos os
seguintes valores de pesos e bias:
288286,0022798,2041112,0
054748,2378771,09477073,0
125491,0110015,0275689,0
777081,0331852,4868009,3
807768,033527,48866752,3
271477,0327245,5274797,5
214268,0565215,03544984,0
697832,3110725,77633864,1
80546,3776136,6480831,1
18724,0181829,0131158,0
t
ij
t wW
3250,1
9239,0
1386,0
1154,1
1268,1
7463,1
7320,0
4821,1
1058,6
1935,0
; j
0336,08484,00585,09712,38912,16 t
jk
tB
0284,00009,07971,53725,13175,1 ; 7624,4 k
Aplicando a metodologia apresentada neste artigo, foi
construído um SRF, equivalente a RNA treinada, contendo
onze regras:
Regra 1: SE VERDADE ENTÃO Y = -4,7624.
Regra 2: SE R1 não é maior que aproximadamente 0,24293 59,194
4 R2 não é maior que aproximadamente 0,17523 59,194
4
R5 não é maior que aproximadamente 0,17017 59,194
4
4,96*10-24 ENTÃO Y = 16,8912.
Regra 3: SE R1 não é maior que aproximadamente 0,02152 59,194
4 R2 não é maior que aproximadamente 0,00448 59,194
4
R5 é maior que aproximadamente 0,0084 59,194
4 1 ENTÃO Y
= -3,9712.
Regra 4: SE R1 é maior que aproximadamente 0,0181 59,194
4
R2 é maior que aproximadamente 0,0045 59,194
4 R5 não é
maior que aproximadamente 0,0086 59,194
4 6,33*10-133
ENTÃO Y = -0,0585.
Regra 5: SE R1 é maior que aproximadamente 0,0899 59,194
4
R2 é maior que aproximadamente 0,0564 59,194
4 R5 não é
maior que aproximadamente 0,1487 59,194
4 1,56*10-69
ENTÃO Y = -0,8484.
Regra 6: SE R1 não é maior que aproximadamente 0,006 59,194
4 R2 não é maior que aproximadamente 0,006 59,194
4 R5
não é maior que aproximadamente 0,1174 59,194
4 1 ENTÃO
Y = 0,0336.
Regra 7: SE R1 é maior que aproximadamente 0,0082 59,194
4
R2 é maior que aproximadamente 0,0073 59,194
4 R5 não é
maior que aproximadamente 0,0394 59,194
4 6,66*10-103
ENTÃO Y = -1,3175.
Regra 8: SE R1 não é maior que aproximadamente 0,0082 59,194
4 R2 não é maior que aproximadamente 0,0074 59,194
4
R5 é maior que aproximadamente 0,0410 59,194
4 1 ENTÃO Y
= -1,3725.
Regra 9: SE R1 não é maior que aproximadamente 0,1156 59,194
4 R2 não é maior que aproximadamente 0,2896 59,194
4
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 6
R5 não é maior que aproximadamente 0,2539 59,194
4 2,19*10-
19 ENTÃO Y = 5,7971.
Regra 10: SE R1 é maior que aproximadamente 0,0336 59,194
4 R2 é maior que aproximadamente 0,0841 59,194
4 R5
não é maior que aproximadamente 0,0155 59,194
4 1 ENTÃO
Y = -0,0009.
Regra 11: SE R1 não é maior que aproximadamente 0,775 59,194
4 R2 é maior que aproximadamente 0,0152 59,194
4 R5
não é maior que aproximadamente 0,1105 59,194
4 1,19*10-119
ENTÃO Y = 0,0284.
O valor de = 194,59 e os valores associados aos termos
independentes (bias) nas regras foram calculados conforme
demonstrado na seção 6.
A Tabela 2 apresenta alguns resultados obtidos. Os valores
de R1, R2 e R5 indicados são exemplos retirados do banco de
dados de transformadores de potência utilizado. Os valores
numéricos obtidos da RNA treinada e do SRF desenvolvido
são sempre iguais, atestando a eficácia do método de
igualdade utilizado neste trabalho. A coluna Resultado indica
os valores obtidos da RNA sem considerar a normalização, e
a Meta indica os valores esperados. Portanto, a RNA e o SRF
conseguem gerar corretamente o resultado numérico de
diagnóstico do transformador analisado.
TABELA 2
RESULTADOS DE SIMULAÇÃO
Valores RNA SFA Resultado Meta
R1= -1,2283; R2= 0,6245; R5= 0,9797 -0,3772 -0,3772 4,0155 4,0000
R1= -0,6242; R2= -0,6288; R5= 1,4721 -0,2190 -0,2190 1,9956 2,0000
R1= -0,6955; R2= -0,7154; R5= -0,0050 1,4159 1,4159 3,0016 3,0000
Com a aplicação do método apresentado, as premissas das
regras obtidas apresentaram valores na faixa das variáveis de
entrada do problema. Melhorando o entendimento das regras.
Analisando os valores de bias obtidos no treinamento da
RNA e que influenciam os termos das regras extraídas. Foi
observado que valores de bias que resultaram em valores extremamente pequenos indicam uma baixa influência da
regra em questão no resultado numérico da aplicação do
conjunto de regras. Esta influência pode ser avaliada de
maneira simplificada através da relação 59,194
1 . Fazendo a
análise da influência dos valores de bias nas regras extraídas
foi observado que três regras do conjunto original poderiam
ser omitidas: Regra 4, Regra 7 e Regra 11.
Também, observando o valor de saída da regra extraída a
partir do neurônio nove da camada escondida da RNA
treinada, a mesma apresenta o valor -0,0009 (valor do peso
que interliga o neurônio com a saída da RNA), que representa
um valor muito pequeno quando comparado as demais saídas
obtidas, portanto a Regra 10 também pode ser omitida.
Considerando a retirada dessas quatro regras que
apresentam uma pequena influência no resultado do sistema
fuzzy, um novo teste foi realizado para os valores indicados na
Tabela 2, com os novos resultados sendo apresentados na
Tabela 3. TABELA 3
NOVOS RESULTADOS DE SIMULAÇÃO
Valores RNA SFA
R1= -1,2283; R2= 0,6245; R5= 0,9797 -0,3772 -0,3659
R1= -0,6242; R2= -0,6288; R5= 1,4721 -0,2191 -0,2213
R1= -0,6955; R2= -0,7154; R5= -0,0050 1,4159 1,4160
Como pode ser observado da comparação dos resultados
das Tabelas 2 e 3, a exclusão das quatro regras do conjunto
original não alterou significamente o resultado do SRF, que é
praticamente igual ao obtido da RNA, comprovando a
influência reduzida das regras omitidas. As demais regras
foram consideradas significativas para a obtenção dos
resultados numéricos do SRF.
IX. CONCLUSÕES
Neste trabalho foi apresentada uma breve discussão sobre
métodos de extração de conhecimento, muitos destes métodos
obtêm regras a partir de RNAs.
Também foi demonstrado, em particular, um método de
obtenção de um SRF a parti de uma RNA treinada, com
alterações que permitem obter valores coerentes com o
domínio das variáveis de entrada do problema para os
intervalos de avaliação nas premissas das regras. As
modificações permitem um melhor entendimento das regras
extraídas.
Duas importantes conclusões podem ser observadas da
igualdade estabelecida entre sistemas SRFs e RNAs.
Primeiro, tudo descoberto para um modelo poderá ser
aplicado no outro modelo. Segundo, o conhecimento de uma
RNA associado às conexões e pesos sinápticos poderá ser
expresso através de regras fuzzy, permitindo uma melhor
compreensão desse conhecimento.
Nas simulações realizadas foi observada a influência dos
termos associados aos valores de bias dos neurônios nas
regras extraídas. Indicando que certas regras podem ser
omitidas sem prejuízo para o resultado numérico.
X. AGRADECIMENTOS
Os autores são gratos ao apoio fornecido pela Companhia
Hidro Elétrica do São Francisco (CHESF) na realização deste
trabalho.
XI. REFERÊNCIAS
[1] J. M. Benitez, J. L. Castro, and I. Requena, “Are artificial neural networks
black boxes?”, IEEE Trans. Neural Netw., vol. 8, no. 5, pp. 1156–1164,
Sep. 1997.
[2] J. L. Castro, C. J. Mantas, and J. M. Benitez, “Interpretation of artificial
neural networks by means of fuzzy rules”, IEEE Trans. Neural Netw., vol.
13, no. 1, pp. 101–116, Jan. 2002.
[3] G. Bologna, “A model for single and multiple knowledge based networks”,
ELSEVIER Artificial Intelligence in Medicine no. 28, pp. 141-163, 2003.
[4] J. Huysmans, B. Baesens and J. Vanthienen. “Using rule extraction to
improve the comprehensibility of predictive models”. Katholieke
Universiteit Leuven. Department of Decision Sciences and Information
Management. Leuven, Belgium, 2006.
THE 8th LATIN-AMERICAN CONGRESS ON ELECTRICITY GENERATION AND TRANSMISSION - CLAGTEE 2009 7
[5] K. Hornik, M. Stinchcombe, and H. White, “Multilayer feedforward
networks are universal approximators” Neural Networks, vol. 2, pp. 359–
366, 1989.
[6] Lima S. E. U. “Diagnóstico Inteligente de Falhas Incipientes em
Transformadores de Potência Utilizando Análise dos Gases Dissolvidos em
Óleo”, Dissertação de Mestrado, UFC/CT/DEE, Fortaleza-CE, 2005.
[7] M.W. Craven and J.W. Shavlik. “Extracting tree-structured representations
of trained networks”. In David S. Touretzky, Michael C. Mozer and
Michael E. Hasselmo, editors, Advances in Neural Information Processing
Systems, volume 8, pages 24-30. The MIT Press, 1996.
[8] U. Johansson, R. König and L. Niklasson. “Rule extraction from trained
neural networks using genetic programming”. In Joint 13th International
Conference on Artificial Neural Networks and 10th International
Conference on Neural Information Processing, ICANN/ICONIP 2003,
pages 13-16, 2003.
[9] I. Taha and J. Ghosh. “Symbolic interpretation of artificial neural
networks”. IEEE Transactions on Knowledge and Data Engineering,
11(3):448-463, 1999.
[10] Z.-H. Zhou, S.-F. Chen and Z.-Q. Chen. “A statistics based approach for
extracting priority rules from trained neural networks”. Proceedings of the
IEEE-INNS-ENNS International Joint Conference on Neural Networks, 3,
2000.
[11] Z.-H. Zhou, Y. Jiang and S.-F. Chen. “Extracting symbolic rules from
trained neural network ensembles”. AI Communications, 16(1):3-15,
2003.
[12] U. Markowska-Kaczmar and M. Chumieja. “Discovering the mysteries of
neural networks”. International Journal of Hybrid Intelligent Systems, 1(3-
4):153-163, 2004.
[13] F. Chen. “Learning accurate and understandable rules from SVM
classifiers”. Master's thesis, Simon Fraser University, 2004.
[14] G.P.J. Schmitz, C. Aldrich and F.S. Gouws. “ANN-DT: An algorithm for
extraction of decision trees from artificial neural networks”. IEEE
Transactions on Neural Networks, 10(6):1392-1401, 1999.
[15] N. Barakat and J. Diederich. “Eclectic rule-extraction from support vector
Machines”. International Journal of Computational Intelligence, 2(1):59-
62, 2005.
[16] G. Fung, S. Sandilya and R.B. Rao. “Rule extraction from linear support
vector machines”. In 11th ACM SIGKDD international conference on
Knowledge discovery in data mining, pages 32-40, 2005.
[17] R. Setiono and W.K. Leow. “FERNN: An algorithm for fast extraction of
rules from neural networks”. Applied Intelligence, 12(1-2):15-25, 2000
[18] R. Setiono and H. Liu. “Neurolinear: From neural networks to oblique
decision rules”. Neural Computing, 17(1):1-24, 1997.
[19] R. Setiono and B. Baesens. “Risk management using recursive neural net-
work rule extraction”. Submitted to Management Science, 2006.
[20] H. Núñez, C. Angulo and A. Català. “Rule extraction from support vector
machines”. In European Symposium on Artificial Neural Networks
(ESANN), pages 107-112, 2002.
[21] S. Thrun. “Extracting provably correct rules from artificial neural
networks”. Technical report iai-tr-93-5, Universität Bonn, Institut fur
Informatik III, 1993.
[22] R. Setiono, W.K. Leow and J.M. Zurada. “Extraction of rules from
artificial neural networks for nonlinear regression”. IEEE Transactions on
Neural Networks, 13(3):564-577, 2002.
[23] K. Saito and R. Nakano. “Extracting regression rules from neural
networks”. Neural Networks, 15(10):1279-1288, 2002.
[24] J.R. Quinlan. “C4.5: Programs for Machine Learning”. Morgan Kaufmann
Publishers Inc., San Francisco, CA, USA, 1993.
[25] R. Setiono and J.Y.L. Thong. “An approach to generate rules from neural
networks for regression problems”. European Journal of Operational
Research, 155(1):239-250, 2004.
[26] R. Setiono, W.K. Leow and J.M. Zurada. “Extraction of rules from
artificial neural networks for nonlinear regression”. IEEE Transactions on
Neural Networks, 2002.
XII. BIOGRAFIAS
Márcio A. B. Amora nasceu em Fortaleza-CE, Brasil, em 1972. Possui
graduação em Engenharia Elétrica pela Universidade Federal do Pará (1997) e
mestrado em Engenharia Elétrica pela Universidade Federal do Pará (2001).
Atualmente é professor assistente da Universidade Federal do Ceará. Tem
experiência na área de Engenharia Elétrica, com ênfase em Inteligência
Computacional Aplicada, atuando principalmente nos seguintes temas:
diagnóstico de faltas incipientes em transformadores, análise de carregamento de
transformadores, geração eólica, análise de estabilidade transitória.
Otacílio M. Almeida. Possui graduação em Engenharia Elétrica pela
Universidade Federal do Ceará (1987), mestrado em Engenharia Elétrica pela
Universidade Estadual de Campinas (1990) e doutorado em Engenharia Elétrica
pela Universidade Federal de Santa Catarina (2002). Atualmente é professor
adjunto da Universidade Federal do Ceará. Tem experiência na área de
Engenharia Elétrica, com ênfase em Automação Eletrônica de Processos
Elétricos e Industriais, atuando principalmente nos seguintes temas:
controladores industriais, controle de processos, controladores pid, máquinas
elétricas industriais e controladores inteligentes.
Arthur P. S. Braga nasceu em Natal-RN, Brasil, em 1971. Possui graduação
em Engenharia Elétrica pela Universidade Federal do Ceará (1995), mestrado
em Engenharia Elétrica pela Universidade de São Paulo (1998), doutorado em
Engenharia Elétrica [S. Carlos] pela Universidade de São Paulo (2004), pós-
doutorado pela Universidade de São Paulo/São Carlos - USP/SC (2005) e pós-
doutorado pela Universidade de São Paulo/São Carlos - USP/SC (2006).
Atualmente é Professor Adjunto da Universidade Federal do Ceará. Tem
experiência na área de Engenharia Elétrica, com ênfase em Redes Neurais.
Atuando principalmente nos seguintes temas: Aprendizagem por reforço, agente
autônomo, redes neurais, inteligência artificial, Mapas auto-organizáveis.
Fábio R. Barbosa nasceu em Fortaleza-CE, Brasil, em 1979. Possui nível
médio técnico em Eletrotécnica, pelo Centro Federal de Educação Tecnológica
do Ceará (1999) e graduação em Engenharia Elétrica pela Universidade Federal
do Ceará (2004). Possui título de Mestre em Engenharia Elétrica pelo Programa
de Pós-graduação do Departamento de Engenharia Elétrica da Universidade
Federal do Ceará (2008). Tem experiência em pesquisas de Inteligência
Artificial aplicadas à Engenharia Elétrica. Exerceu atividades de consultoria na
área de automação industrial e controle lógico programável junto ao Serviço
Nacional de Aprendizagem Industrial do Ceará - SENAI. Atualmente, é bolsista
de pós-graduação da CAPES e desenvolve pesquisas no campo de
monitoramento e diagnóstico de transformadores de potência imersos em óleo
isolante como doutorando do Programa de Pós-Graduação do Departamento de
Engenharia Elétrica da Universidade Federal do Ceará.
Sérgio S. Lima possui graduação em Informática pela Universidade de
Fortaleza (2000). Atualmente, é bolsista do Laboratório do Grupo de Pesquisa
em Automação é Robótica (GPAR) do Departamento de Engenharia Elétrica da
Universidade Federal do Ceará, e desenvolve pesquisas no campo de
monitoramento e diagnóstico de transformadores de potência imersos em óleo
isolante.
Luciano A. C. Lisboa possui graduação em Engenharia Eletrônica pela
Universidade Federal de Pernambuco (2002). Atualmente é Engenheiro da
Companhia Hidro Elétrica do São Francisco. Tem experiência na área de
Engenharia Elétrica, com ênfase em Eletrônica Industrial, Sistemas e Controles
Eletrônicos.