Post on 01-Jan-2019
Programa de Pos Graduacao em Engenharia Industrial
PREDICAO DA DEMANDA DE ENERGIA
ELETRICA UTILIZANDO REDES NEURAIS
ARTIFICIAIS APLICADO EM UM PROCESSO DE
ELETROGALVANIZACAO
Nielson Cezar Campbell Brasil
Orientador: Prof. Dr. Roselito de Albuquerque Teixeira, PPGE/Unileste-MG
Coronel Fabriciano, Dezembro de 2013
Programa de Pos Graduacao em Engenharia Industrial
PREDICAO DA DEMANDA DE ENERGIA
ELETRICA UTILIZANDO REDES NEURAIS
ARTIFICIAIS APLICADO EM UM PROCESSO DE
ELETROGALVANIZACAO
Nielson Cezar Campbell Brasil
Dissertacao submetida a banca examinadora designada
pelo Colegiado do Programa de Pos-Graduacao em
Engenharia do Centro Universitario do Leste de Minas
Gerais, como parte dos requisitos necessarios a obtencao
do grau de Mestre em Engenharia Industrial.
Area de Concentracao: Modelagem, Otimizacao e Con-
trole de Processos
i
Quebra-galho
Dedico este trabalho a Thersalia, Nayane e Barbara pelo incentivo, pela paciencia e
compreensao nos momentos difıceis e abnegacoes realizadas.
Agradecimentos
Agradeco primeiramente a Deus, pelo dom da vida, pela inteligencia e por iluminar os
caminhos por onde percorro.
Ao UNILESTE-MG pela oportunidade e pelo investimento em minha formacao.
Ao Prof. Dr. Roselito de Albuquerque Teixeira pelas palavras de incentivo e forca, pela
orientacao e, principalmente, pelos ensinamentos que me acompanharao sempre.
Aos meus pais e amigos pelo apoio, incentivo e pela compreensao nos momentos de ausen-
cia. E, principalmente, pelos ensinamentos repassados ao longo da minha vida, sem os
quais seria impossıvel a realizacao desta etapa.
A minha esposa, Thersalia, pelo carinho, companheirismo, compreensao, paciencia e,
principalmente, por sempre acreditar em mim e ser torcedora numero 1 de minhas vitorias.
As secretarias do Mestrado, em especial a Juliana, a Michele pela atencao e pela ajuda
nos momentos solicitados.
E a todos que direta ou indiretamente contribuıram para a realizacao deste trabalho.
Quebra-galho
”O que mais surpreende e o homem, pois perde a saude para juntar dinheiro, depois
perde o dinheiro para recuperar a saude. Vive pensando ansionamente no futuro, de tal
forma que acaba por nao viver nem o presente, nem o futuro. Vive como se nunca fosse
morrer e morre como se nunca tivesse vivido.”
Dalai Lama
Resumo
Este trabalho apresenta a predicao de demanda de energia eletrica por meio da aplicacao
da tecnica de modelagem de processos com redes neurais artificiais, para um processo de
eletrogalvanizacao de tira de aco.
O projeto de redes neurais artificiais do tipo Multilayer Perceptron e discutido. Dentro
deste contexto tambem sao abordados a selecao dos elementos da topologia utilizada,
a definicao do numero de neuronios aplicados a camada oculta e o treinamento com o
algoritmo Backpropagation. O emprego do metodo de otimizacao da estrutura da rede, o
algoritmo OBS (Optimal Brain Surgeon), visa melhorar sua capacidade de generalizacao.
O processo de eletrogalvanizacao e apresentado, exprimindo o princıpio basico de funciona-
mento e os equipamentos que compoem a linha de producao. As variaveis que determinam
o comportamento do processo sao apresentadas, revelando o relacionamento existente com
a demanda de energia solicitada pela producao.
Os dados empregados para o desenvolvimento da rede neural, necessitaram de um pre-
processamento para a identificacao de outliers e a aplicacao de algumas heurısticas para
delimintacao.
Para o treinamento da rede foram definidos alguns parametros como as dimensoes do
material processado, a densidade do revestimento de zinco das camadas superior e infe-
rior, a velocidade do processo, a corrente eletrica empregada nos retificadores das celulas
galvanicas e a energia eletrica consumida no processo. Estes parametros sao determinados
em funcao dos resultados obtidos para dados coletados no sistema de informacoes da linha
de producao.
Os resultados alcancados com a aplicacao das tecnicas de desenvolvimento de redes neu-
rais, utilizando dados reais do processo produtivo, demonstram as necessidades de um
pre-tratamento dos dados. O modelo construıdo sinaliza que sua implementacao em um
sistema industrial e capaz de auxiliar a tomada de decisoes sobre o gerenciamento da
producao, observando como foco principal a utilizacao da energia eletrica no processo.
Abstract
This paper presents the prediction of electricity demand by applying the technique ofbusiness process modeling with artificial neural networks, a process for electroplating ofsteel strip.
The design of artificial neural network Multilayer Perceptron type discussed. Within thiscontext are also addressed the selection of the elements of the topology will be used, settingthe number of hidden layer neurons and applied to training with the backpropagationalgorithm. The use of the method of optimization of the network structure, with the OBSalgorithm (Optimal Brain Surgeon) aims to improve its generalization capability.
The electroplating process will be present, demonstrating the basic principle of operationand equipment that make up the production line. The variables that determine thebehavior of the process will be present, revealing the existing relationship with the energydemand required for production.
The data used to develop the neural network will require a preprocessor to identify outliersand apply some heuristics to delimitation.
For training, the network some parameters such as the dimensions of the processed mate-rial, the density of the zinc coating of the upper and lower layers, the process speed, theelectric current used in rectifiers of galvanic cells and the electric energy consumed in theprocess. Those parameters will be define depending on the results provided for the datacollected in the information system of the production line.
The results achieved with the application of design techniques, neural networks, usingreal data from the production process, demonstration need for a pre-processing of data.The constructed model indicates that its implementation in a industrial system is able toassist decision-making on the management of production, watching as its main focus theuse of electricity in the process.
Sumario
Resumo iv
Abstract v
Lista de Figuras viii
Lista de Tabelas x
Lista de Siglas xii
1 Introducao 2
1.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.2 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Delimitacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Fundamentacao 8
2.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.1 Historico do Desenvolvimento das Redes Neurais . . . . . . . . . . . 8
2.1.2 Redes Perceptron de Multiplas Camadas . . . . . . . . . . . . . . . 10
vii
2.1.3 Selecao da Arquitetura da Rede . . . . . . . . . . . . . . . . . . . . 13
2.1.4 Determinacao do Numero de Neuronios na Camada Oculta . . . . . 14
2.1.5 Treinamento da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.6 Capacidade de Generalizacao da Rede . . . . . . . . . . . . . . . . 20
2.2 Tratamento dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1 Normalizacao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Coeficiente de Correlacao Linear . . . . . . . . . . . . . . . . . . . . 22
2.2.3 Distancia de Mahalanobis . . . . . . . . . . . . . . . . . . . . . . . 25
3 Descricao do Processo 29
3.1 A Galvanoplastia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2 Sistema de Fornecimeto de Energia Eletrica . . . . . . . . . . . . . . . . . 31
3.2.1 Relacionamento entre Energia Eletrica e Producao de Eletrogalva-nizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3 Equipamentos Instalados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.4 Variaveis da Secao do Centro . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5 Dados de Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.6 Variaveis da Secao da Saıda . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.7 Aquisicao dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4 Materiais e Metodos 43
4.1 Preparacao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.1.1 Tratamento das Variaveis de Medicao de Energia . . . . . . . . . . 43
4.2 Tratamento das Variaveis do Processo . . . . . . . . . . . . . . . . . . . . . 46
4.2.1 Tratamento das Variaveis da Secao do Centro . . . . . . . . . . . . 47
4.2.2 Tratamento das Variaveis da Secao da Saıda . . . . . . . . . . . . . 50
4.2.3 Variaveis para a Rede Neural . . . . . . . . . . . . . . . . . . . . . 53
5 Resultados e Analise 55
viii
5.1 Correlacao entre os Dados do Processo . . . . . . . . . . . . . . . . . . . . 55
5.2 Resultados do Treinamento da Rede Neural . . . . . . . . . . . . . . . . . 58
5.2.1 Determinacao dos Parametros da Rede Neural . . . . . . . . . . . . 59
5.2.2 Treinamento com Energia Eletrica Medida . . . . . . . . . . . . . . 62
5.2.3 Treinamento com Energia Eletrica Calculada . . . . . . . . . . . . . 65
5.2.4 Treinamento Final da Rede Neural . . . . . . . . . . . . . . . . . . 67
6 Consideracoes Finais 68
6.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Referencias Bibliograficas 74
Lista de Figuras
2.1 Representacao de um neuronio artificial . . . . . . . . . . . . . . . . . . . . 9
2.2 Representacao grafica de uma RNA MLP com duas camadas intermediarias. 11
2.3 Representacao grafica de funcoes de ativacao de neuronios artificiais. . . . . 12
2.4 Baixa correlacao linear entre variaveis . . . . . . . . . . . . . . . . . . . . . 24
2.5 Elevada correlacao linear entre variaveis . . . . . . . . . . . . . . . . . . . 25
2.6 Dados anteriores a submissao da Distancia de Mahalanobis, resultando em
543 bobinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.7 Histograma dos dados de tempo de processamento das bobinas . . . . . . . 28
2.8 Aplicacao da Distancia de Mahalanobis, resultando em 537 bobinas uteis . 28
3.1 Princıpio de funcionamento de uma celula eletrolıtica . . . . . . . . . . . . 30
3.2 Plano de producao executado no perıodo de 2004 a 2013 . . . . . . . . . . 32
3.3 Diagrama eletrico unifilar simplificado do sistema distribuidor de energia
eletrica da linha de eletrogalvanizacao da Usiminas. . . . . . . . . . . . . . 34
3.4 Comportamento da producao e do consumo de energia eletrica no processo
de eletrogalvanizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.5 Linha de galvanizacao Eletrolıtica da Usiminas . . . . . . . . . . . . . . . . 37
3.6 Cirtuito de interligacao dos medidores de energia e a rede Ethernet . . . . 38
3.7 Dados do medidor de energia do Transformador TR1 em fevereiro de 2012 40
4.1 Erro causado pelo medidor . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
x
4.2 Aplicacao de interpolacao nos dados medidos . . . . . . . . . . . . . . . . . 44
4.3 Amostras de Energia Medida(-), Amostras de Energia corrigida por interpolacao(-
-), fevereiro de 2012 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.1 Energia medida no perıodo de fevereiro a julho/12 . . . . . . . . . . . . . . 56
5.2 Energia estimada no perıodo de fevereiro a julho/12 . . . . . . . . . . . . . 57
5.3 Respostas da rede neural com dados medidos de energia do perıodo de
fevereiro/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Respostas da rede neural com dados medidos de energia do perıodo de
junho/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.5 Respostas da rede neural com dados estimados de energia do perıodo de
fevereiro/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.6 Respostas da rede neural com dados estimados de energia do perıodo de
junho/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.7 Resultado final de validacao da RNA . . . . . . . . . . . . . . . . . . . . . 67
Lista de Tabelas
2.1 Numero de neuronios da camada oculta, conforme proposto por Balestrassi
et al. (2009) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Numero de neuronios da camada oculta, como proposto por Wei e Xing-
yang (2011) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.3 Correlacao entre variaveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.1 Dados de BF na saıda coletados. . . . . . . . . . . . . . . . . . . . . . . . . 41
4.1 Dados inciais coletados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.2 Coletas de Dados Primarios na Secao do Centro. . . . . . . . . . . . . . . . 48
4.3 Dados primarios calculados na Secao do Centro. . . . . . . . . . . . . . . . 50
4.4 Coletas de dados primarios na Secao de Saıda. . . . . . . . . . . . . . . . . 52
4.5 Dados primarios calculados na Secao da Saıda. . . . . . . . . . . . . . . . . 53
4.6 Dados de bobinas calculados nas Secoes do Centro e Saıda. . . . . . . . . . 53
5.1 Correlacao linear em relacao a Energia Eletrica Medida. . . . . . . . . . . . 57
5.2 Correlacao linear em relacao a Energia Eletrica Estimada. . . . . . . . . . 58
5.3 Treinamento da RNA com Levenberg-Marquardt . . . . . . . . . . . . . . . 60
5.4 Treinamento da RNA com Gradiente Conjugado Decrescente . . . . . . . . 60
5.5 Treinamento da RNA com Gradiente descendente com momento e taxa de
aprendizado adaptativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.6 Resultado do erro da RNA para os dados de energia eletrica medidos. . . . 64
xii
5.7 Resultado do erro da RNA para os dados de energia eletrica calculada. . . 66
Lista de Siglas
ADALINE Neuronio Adaptativo Linear
(ADAptative LInear NEuron)
BF Bobina a Frio
EGL Linha de galvanizacao Eletrolıtica
(Electric Galvanaizing Line)
ETEG (Estacao de Tratamento de Efluentes da Galvanizacao)
HVAC Aquecimento, ventilacao e ar condicionado
(Heating Ventilation and Air Conditioning)
MAPE Erro Medio Absoluto Percentual
(Mean Absolute Percentual Error)
MSE Erro Medio Quadratico
(Mean Square Error)
MLP Rede Neural de Multiplas Camadas
(Multi Layer Perceptron)
OBD Otimizacao Cerebral Danosa
(Optimal Brain Damage)
OBS Otimizacao Cerebral Cirurgica
(Optimal Brain Surgeon)
PIMS Sistema de Gerenciamento de Informacoes de Processo
(Process Information Managment System)
PLC Controlador Logico Programavel
(Programable Logic Controller)
RMSE Raiz quadrada do erro medio
(Root Mean Square Error)
RNA Rede Neural Artificial
TR1 (Transformador numero 1 )
TR2 (Transformador numero 2 )
WD Decaimento de pesos
(Weigth Decay)
1
Capıtulo 1
Introducao
A energia eletrica solicitada pelos processos de galvanoplastia e um dos fatores predo-
minantes para a determinacao da viabilidade desse processo. Sua correta determinacao
influencia diretamente os custos de producao e consequentemente os custos do produto
final. Nos ultimos anos, algumas linhas de producao que empregam este sistema sofreram
uma drastica reducao em seus volumes produtivos, causada pela inviabilidade economica
como descrito por Marques (2008).
As estimativas para o comportamento do mercado e do processo sao requeridas para agen-
damento de atividades como a geracao e contratos do consumo de energia, planejamento
dos investimentos, operacao segura e manutencao nos equipamentos. Uma predicao de
carga eletrica precisa, para um curto espaco de tempo, e um ponto significante para o
gerenciamento dos sistemas de potencia de cidades e regioes. A superestimacao de cargas
futuras implica em reservas energeticas e financeiras desnecessarias. Como descrito por
Kelo e Dudul (2011), existem indıcios de que o incremento do erro em 1%, resulta no
acrescimo de varios milhoes de reais nos custos de operacao. Por outro lado, a subesti-
macao de cargas futuras pode resultar em elevada queda das reservas e elevacao de custos
para producao.
A predicao aprimorada e confiavel da demanda de energia eletrica, tende a evidenciar
quais produtos e processos podem ser classificados como viaveis, do ponto de vista do
gerenciamento da energia eletrica empregada. Conforme Takahashi (2006) a construcao
de modelos que expliquem detalhadamente processos complexos, com multiplas variaveis
relacionadas nao-linearmente, exigem tempo e conhecimento profundo das diversas etapas
do processo.
Os metodos tradicionalmente descritos na literatura para a predicao do comportamento
de sistemas, sao metodos matematicos tais como analise de regressao, series temporais,
3
sistemas de caixa cinza, filtros de Kalman, sistemas especialistas, otimizacao de colonias de
formigas, analises de forma de onda, modelagem de sistemas por logica fuzzy, modelagem
por redes neurais e algoritmos geneticos, como descrito por Xia et al. (2010).
As redes neurais artificiais tambem tem sido aplicadas para a modelagem e simulacao de
sistemas nao-lineares. Algumas das utilizacoes mais frequentes sao a predicao de parame-
tros de equipamentos e demandas dos sistemas energeticos. Um dos fatores relevantes e
sua habilidade de aprender e construir mapeamentos nao-lineares complexos, atraves de
um conjunto de exemplos que expressem os comportamentos das variaveis de entrada e
saıda.
No predio da administracao da Universidade de Sao Paulo, Hernandez Neto e Fiorelli
(2008) promoveram a comparacao das capacidades de predicao da demada de energia
eletrica empregada no sistema de HVAC (Heating, Ventilation and Air Conditioning),
entre um complexo modelo detalhado, denominado EnergyPlus e uma rede neural do tipo
feed-forward simples. Os resultados fornecidos demonstraram que o modelo detalhado
foi capaz de gerar simulacoes que produziram erros oscilantes entre 0,8% e 1,2%, para
as principais variaveis. Por sua vez, a rede neural do tipo feed-forward simples, forneceu
um erro de 0,3% e 2,3% para as mesmas variaveis. Para o conjunto total de dados o
EnergyPlus forneceu um erro medio de 13%, para uma parcela de 80% do conjunto total,
das informacoes da base de dados enquanto que a RNA forneceu um erro de 10% para
todo o conjunto de dados, podendo ser mais eficiente com uma melhor elaboracao da rede.
Diversas pesquisas foram realizadas dedicando-se atencao a demanda de energia eletrica
para perıodos de curto, medio e longo prazos, como as executadas por Yalcinoz e Eminoglu
(2005) e Xia et al. (2010). Para as estimativas anuais de energia Azadeh et al. (2008),
Geem e Roper (2009) e Kelo e Dudul (2011) demontraram as capacidades das redes neurais
em apresentar resultados coerentes com os dados historicos e diversas vezez superiores
aos fornecidos pelos modelos tradicionais. Blondou (2011) aplicou redes neurais para a
predicao da energia eolica, em horizontes muito curtos de tempo informando com exatidao
os dados nos perıodos propostos.
Para predizer o coeficiente de performance de unidades de refrigeracao Jia et al. (2011),
utilizou redes neurais devido ao elevado numero de parametros envolvidos e as relacoes
nao-lineares existentes. Haidar et al. (2011) propos a aplicacao de RNA para a classificacao
de redes de transmissao de energia eletrica para acessoria em sistemas de potencia. Em
um outro sistema, a otimizacao da performance de um processo de purificacao de agua
foi executado por Hernandez et al. (2009), utilizando redes do tipo feedforward obtendo
resultados com elevado ındice de correlacao entre as resposta estimadas e as respostas do
sistema real.
1.1 Objetivo 4
Tambem aplicando os recursos disponibilizados pelas redes neurais, a predicao das princi-
pais variaveis do sistema para tratamento de efluentes em estacao de um distrito industrial,
em Bu-Ali no Iran, foi simulada por Curteanu et al. (2011). Os modelos fenomenologicos
apresentam uma grande dificuldade em representar processos quımicos de multiplas varia-
veis e com limitado conhecimento disponıvel. O modelo empregando as tecnicas das redes
neurais contornou a necessidade de conhecimento profundo sobre as multiplas variaveis
que compoem o processo.
Com base nas pesquisas citadas anteriormente, neste trabalho aplica-se os fundamentos
e desenvolvimentos das redes neurais artificiais para a predicao da demanda de energia
eletrica no processo de eletrogalvanizacao de tiras de aco carbono, laminadas a frio, na
planta da Usiminas em Ipatinga.
Na referida linha de producao, as dimensoes do material em conjunto com as especificacoes
dos produtos influenciam diretamente no consumo de energia requerido pelo processo. Por
esta razao, essas sao as principais variaveis investigadas neste trabalho. Atualmente os
criterios para a sequencia de produtos e norteada apenas pelas especificacoes do mate-
rial a ser produzido, sem considerar os impactos de alteracao do ponto de operacao dos
equipamentos do ponto de vista das energias requeridas.
A orientacao fornecida pelo conhecimento das demandas de energia eletrica para cada
grupo de materiais e processos, pode ser capaz de minimizar os gastos com este insumo,
por meio de uma nova forma de organizacao da sequencia produtiva.
1.1 Objetivo
1.1.1 Objetivo Geral
O objetivo deste trabalho e obter um modelo capaz de predizer o consumo de energia
eletrica em funcao de algumas das variaveis requeridas pelas especificacoes solicitadas
para os materiais eletrogalvanizados.
1.1.2 Objetivos Especıficos
• Evidenciar as variaveis mais importantes para a determinacao do consumo de energia
eletrica no processo de revestimento do aco com zinco;
• Elaborar um sistema capaz de informar a demanda de energia prevista para deter-
minados revestimentos no processo de eletrogalvanizacao ;
1.2 Delimitacao 5
1.2 Delimitacao
Construcao de um preditor de demanda de energia eletrica para o revestimento de mate-
riais em um processo de eletrogalvanizacao de tiras de aco. Essas tiras de aco sao con-
struidas com baixo teor de carbono, laminadas a frio com espessura, largura e densidade
das camadas de revestimento de zinco limitadas as capacidades nominais do equipamento
analizado. Para este fim sera realizada a predicao da demanda de energia eletrica, apli-
cando redes neurais artificiais, com os dados coletados em um perıodo definido de 180
dias, na planta de eletrogalvanizacao da Usiminas em Ipatinga. O consumo sera avaliado
em funcao de uma quantidade limitada de materiais a serem processados, diponibilizados
no fluxo de producao no perıodo citado.
1.3 Justificativa
Recentemente o consumo de energia eletrica, no processo de eletrogalvanizacao, e uma
variavel de elevado custo presente na matriz de producao. Na unidade de processo onde
o estudo e realizado, seu controle e efetuado por meio de medicoes periodicas do consumo
integralizado, generalizando os valores de consumo para diferentes tipos de processos.
Esta medicao resulta em um rateio do custo da energia eletrica sobre a producao total
do perıodo, privilegiando alguns processos de maior consumo com um custo menor e
depreciando os resultados em outros processos de menor consumo com um custo superior
ao real.
Por meio da modelagem do consumo de energia eletrica na eletrogalvanizacao de acos
para uma determinada classe de materiais especificados, os custos reais relacionados a
esta variavel podem ser dimensionados corretamente, viabilizando os reajustes adequados
e necessarios a realidade produtiva.
Nos casos onde o custo real for superior ao estimado, este estudo pode redirecionar a
busca por novos meios capazes de promover uma reducao nestes custos, desenvolvendo
outras caracterısticas relativas ao processo. Para os casos particulares em que outros
aspectos, diferentes do consumo de energia eletrica, tal como aplicacao da liga metalica
de zinco-cromo, esta variavel pode ser considerada mais significativa para a determinacao
das margens de ganhos no processo.
Avaliando os dados historicos, pode-se verificar que em alguns perıodos distintos, para a
mesma faixa de producao, existiram valores de demanda ora mais reduzidos, ora mais ele-
vados. A predicao da demanda de energia eletrica para este projeto pretende demonstrar
com clareza o motivo responsavel por este fato, colocando em evidencia uma ou varias
das principais variaveis que conduziram a esse consumo.
1.4 Hipotese 6
No presente momento, a acao obscura destas variaveis dificulta a realizacao de planos
eficientes para o combate a desperdıcios no processo e reducao eficaz dos custos. Clareando
esses pontos, torna-se possıvel exercer acoes assertivas e direcionadas, visando a melhoria
da utilizacao dos recursos desprendidos.
No sistema atual, o modelo de aquisicao de dados e prejudicado pela falha no armazena-
mento e transferencia das informacoes pelos medidores de energia. Os sinais espurios pro-
duzidos deformam o comportamento da curva de energia dispendida em cada processo,
individualizado por bobina. A aplicacao de um filtro nos dados, tal como a Distancia de
Mahalanobis aplicada por Krusinka (1987) e capaz de minimizar esse problema identifi-
cando quais sao os pontos espurios. Apos os pontos serem identificados torna-se possıvel
a aplicacao de uma tecnica de interpolacao entre os dados, que permita a utilizacao de
valores fısicamente mais proximos da realidade, permitindo uma melhora na predicao
proposta.
De um ponto de vista generalizado, o presente trabalho busca contribuir com a evolucao
das ferramentas disponıveis e, em uso nesse ambiente, para a predicao de demanda de
energia. Procura-se tambem difundir o uso das redes neurais artificiais para a modelagem
de sistemas. Este metodo de predicao pode ser estendido para outras variaveis, tais
como consumo de vapor, agua e zinco, que necessitem de um controle mais apurado.
Tambem pode ser extendido a outros processos que vislumbrem a necessidade de controle
e modelagem de variaveis com comportamentos semelhantes.
Como uma consequencia secundaria, a acao de modelagem desenvolvida neste trabalho
podera fundamentar algumas sugestoes para a evolucao do desempenho da planta, como
a producao seletiva em determinados perıodos onde o custo da energia eletrica e diferen-
ciado. Esta possibilidade, teoricamente implicaria em reducoes nas variacoes indesejadas
no ponto de operacao da planta, tambem como reducao nos custos relativos ao reparo e
substituicao de equipamentos utilizados no processo.
1.4 Hipotese
A seguinte hipotese foi investigada:
• e possıvel realizar a predicao de demanda de energia eletrica para uma determinada
quantidade de materiais com qualidades distintas em um perıodo definido, por meio
das redes neurais artificiais.
1.5 Estrutura do Trabalho 7
1.5 Estrutura do Trabalho
Esta dissertacao esta estruturada em 6 capıtulos cujas descricoes sao apresentadas na
sequencia.
Capıtulo 1: Introducao. Foi apresentada uma abordagem, de forma generalizada, sobre
as ferramentas disponıveis para a predicao de demanda de algumas variaveis do segmento
energetico e produtivo em um perıodo relativamente recente. Sao apresentados ainda o
objetivo geral e os objetivos especıficos do trabalho, sua delimitacao, a justificativa do
estudo e a hipotese que sera estudada ao longo do trabalho.
Capıtulo 2: Fundamentacao. Serao apresentados os princıpios empregados para a
elaboracao do trabalho, baseados em uma revisao bibliografica. Os assuntos abordados
contem um breve historico sobre o desenvolvimento das redes neurais artificiais e o trata-
mento empregado para os dados de treinamento como sua normalizacao e a existencia de
correlacao. Tambem sera descrito o metodo da Distancia de Mahalanobis para a identifi-
cacao dos dados espurios obtidos durante a amostragem do comportamento do processo.
Capıtulo 3: Descricao do Processo. Serao apresentados os princıpios basicos de um
processo de galvanoplastia. Em seguida sera descrito o sistema de distribuicao de energia
eletrica para o processo e seu relacionamento direto com as especificacoes tecnicas do
produto a ser eletrogralvanizado. Tambem serao abordados os equipamentos instalados e
as variaveis manuseadas no processo de preparacao dos dados para o treinamento da rede
neural.
Capıtulo 4: Materiais e Metodos. Este capıtulo apresentara todo o desenvolvimento
realizado para o trabalho. Serao descritas a selecao e o pre-processamento das variaveis a
serem utilizadas na modelagem, segregando-as conforme a secao onde foram geradas para
a coleta.
Capıtulo 5: Resultados e Analise. Os resultados obtidos por meio desta pesquisa
serao apresentados neste capıtulo, bem como a analise e a discussao sobre os resultados
alcancados.
Capıtulo 6: Consideracoes Finais. Apresentara as conclusoes sobre esta dissertacao,
descrevendo algumas sugestoes para trabalhos futuros.
Capıtulo 2
Fundamentacao
Nesta secao, e feita uma busca na literatura sobre os fundamentos a serem utilizados no
desenvolvimento do trabalho.
2.1 Redes Neurais Artificiais
As Redes Neurais Artificiais, conhecidas como sistemas de processamento paralelo e dis-
tribuıdo sao uma forma de computacao que nao segue um algoritmo e relembram a estru-
tura do cerebro humano. As redes neurais sao compostas por unidades simplificadas de
processamento, denominados neuronios, que sao capazes de calcular determinadas funcoes
matematicas nao-lineares. Cada unidade de neuronios pode ser disposta em uma ou mais
camadas e interligadas por um elevado numero de conexoes. A cada conexao sao associa-
dos pesos que armazenam o conhecimento representado pelo modelo e ponderam a entrada
recebida por cada neuronio de entrada da rede, como descrito por Braga et al. (2000).
2.1.1 Historico do Desenvolvimento das Redes Neurais
Em um trabalho conjunto realizado no ano de 1943, o psiquiatra e neuro-anatomista
Waren McCullocg e o matematico Walter Pitts, propuseram um modelo artificial para
representar o neuronio biologico, como descrito por Fiorin et al. (2011). O neuronio mais
simples, representado na figura 2.1, possui m terminais x1, x2,...,xm, por onde os sinais
de entrada do processo sao encaminhados para o neuronio. Os sinais das entradas sao
ponderados por intermedio da aplicacao de pesos fixos Wj1, Wj2,...,Wjm, nas conexoes
entre as entradas e o neuronio. No centro de processamento do neuronio, o resultado do
somatorio entre os produtos produzidos pela relacao entre as entradas e o pesos xi.Wji,
e submetido a uma funcao de ativacao que emite uma resposta para o calculo. Caso o
2.1 Redes Neurais Artificiais 9
valor resultante seja igual ou superior ao limiar da funcao de ativacao, o sinal de saıda do
neuronio pode ser igual a 1, ou seja o neuronio foi excitado. No caso contrario, em que o
valor resultante seja inferior ao limiar de ativacao da funcao, o sinal de saıda sera nulo.
Figura 2.1: Representacao de um neuronio artificial
Fonte: Haykin (2001).
No final da decada de 50, Frank Rosenblatt demonstrou que um neuronio de uma camada,
denominado perceptron, dotado de sinapses ajustaveis de acordo com as saıdas desejadas
poderia ser aplicado na classificacao de alguns tipos de padroes, segundo Fiorin et al.
(2011) apud Rosenblatt (1958). No inıcio da decada de 60, Widroff e Hoff apresentaram
um modelo conhecido como Adaline (ADAptive LInear NEuron), diferenciando-se do per-
ceptron por possuir uma saıda binaria bipolar, variando de −1 a 1 ao inves das saıdas
unipolares que variam de 0 a 1. Neste modelo, o ajuste dos pesos das sinapses e realizado
de acordo com o metodo do gradiente para minimizacao do erro da saıda da rede, como
descrito por Braga et al. (2000) apud Widrow e Hoff (1960). Na decada de 70 as pesquisas
e desenvolvimentos de metodos envolvendo redes neurais foram drasticamente reduzidos,
apos a divulgacao do trabalho de Minsky e Papert. Este trabalho afirmava que os per-
ceptrons estavam limitados a solucao de problemas apenas linearmente separaveis e que o
processo de aprendizagem nao garantia a convergencia das RNAs de mais de uma camada,
como apresentado por Fiorin et al. (2011) citando Minsky e Papert (1972). No inıcio da
decada de 1980, Hopfield(1982, citado por Braga et al. (2000)) publicou em seu trabalho
demonstracoes das propriedades associativas das redes neurais com problemas fısicos e em
sequencia descreveu o algoritmo de treinamento denominado Back-propagation. Este al-
goritmo possibilitou as redes neurais artificiais de multiplas camadas solucionar problemas
de alta complexidade, reiniciando uma nova etapa de interesse cientıfico pela aplicacao
das redes neurais artificiais.
2.1 Redes Neurais Artificiais 10
Segundo Kalogirou (1999) a arquitetura a ser empregada em uma RNA e determinada
pelo tipo de problema a ser abordado, tais como classificacao de padroes, modelagem
e controle de sistemas, previsao e predicao de cargas, otimizacao e tomadas de decisao.
Basicamente os principais parametros para se definir uma RNA sao o numero de camadas
da rede, o numero de neuronios em cada camada, a arquitetura da rede que define como
os neuronios serao agrupados em suas camadas e a topologia que determinara o modo de
transmissao dos dados entre estes neuronios.
As redes mais simples possuem apenas um unico neuronio coletando as informacoes de
entrada, processando-as e fornecendo uma saıda, restringindo-se a solucao de problemas
linearmente separaveis. As redes de multiplas camadas possuem basicamente uma camada
de entrada, uma ou mais camadas de processamento internas e uma camada de saıda. As
saıdas dos neuronios da camada de entrada sao interligados as entradas dos neuronios
das camadas ocultas ou internas. Podem ocorrer conexoes entre a saıda de um neuronio
de uma camada interna com a entrada de um outro neuronio da mesma camada interna,
porem nao ocorrem conexoes entre a entrada de um neuronio da camada interna e a
entrada de outro neuronio da mesma camada.
Tratando-se das conexoes entre os neuronios, estas podem ser realizadas de duas formas.
A primeira maneira e a conexao da saıda de um neuronio de uma camada anterior a
entrada de um neuronio da camada posterior, conhecida como conexao acıclica ou feed-
forward. Na segunda maneira de conexao, a saıda de um neuronio pode ser conectada
a entrada de um neuronio da mesma camada ou a entrada do neuronio de uma camada
anterior, sendo conhecida como conexao cıclica ou do tipo feedback.
Entre as diversas redes neurais encontradas, podem-se destacar as seguintes: as redes
Perceptron e Adaline, as redes MLP (Multi Layer Perceptron), redes de Memorias Ma-
triciais, Self-Organizing e de Processamento Temporal. Neste trabalho serao empregadas
redes neurais com arquitetura do tipo MLP, com uma camda oculta onde os neuronios
emitirao suas respostas condicionadas a uma funcao de ativacao de uma tangente hiper-
bolica, em uma topologia de redes diretas (feedforward).
2.1.2 Redes Perceptron de Multiplas Camadas
As redes MLPs, sao redes que apresentam uma ou mais camadas intermediarias de
neuronios, como representado na figura 2.2. Por apresentar uma consideravel simplici-
dade e facilidade de implementacao sao muito utilizadas, como demonstrado em varios
trabalhos tais como Madal et al. (2006), Hernandez Neto e Fiorelli (2008), Kandil et al.
(2006) e outros. As MLPs exibem um elevado poder computacional, atribuıdo ao uso
das camadas internas, capazes de solucionar problemas com dados nao linearmente sepa-
2.1 Redes Neurais Artificiais 11
raveis. Segundo Cybenko(1988 citado por Fiorin et al. (2011), as redes do tipo MLP com
uma camada intermediaria podem representar qualquer funcao contınua, enquanto que as
redes MLP que possuem duas ou mais camadas intermediarias, sao teoricamente capazes
de implementar qualquer funcao linearmente separavel ou nao, sendo que a precisao dos
resultados produzidos por esta rede estarao relacionados diretamente com a quantidade
de neuronios das camadas intermediarias.
Figura 2.2: Representacao grafica de uma RNA MLP com duas camadas intermediarias.
Fonte: Fiorin et al. (2011).
Nas redes MLP os neuronios permitem que as saıdas apresentem valores diversos. Di-
ferente do que ocorre em um perceptron em que o somatorio das entradas ponderadas,
comparado ao limiar de uma funcao de ativacao gera um sinal binario (0 ou 1). Para esta
solucao foram desenvolvidos novos neuronios artificiais, em que sao aplicadas diferentes
funcoes de ativacao nao-lineares, capazes de representar problemas nao-lineares e diferen-
ciaveis. As funcoes de ativacao mais aplicadas sao a funcao de degrau (limiar), a funcao
linear e as funcoes sigmoide logıstica e a funcao de tangente hiperbolica, representadas
pelas equacoes 2.1 a 2.4, respectivamente.
Funcao Degrau
ϕ(vj) =
{+γ se (vj) > 0
−γ se (vj) < 0(2.1)
Funcao Linear
ϕ(vj) = α.vj (2.2)
2.1 Redes Neurais Artificiais 12
Funcao Sigmoide Logıstica
ϕ(vj) =1
1 + exp(−α.vj)(2.3)
Funcao Tangente Hiperbolica
ϕ(vj) = tanhvj2
=1− exp(−vj)1 + exp(−vj)
(2.4)
Os sinais de saıda das funcoes de ativacao, descritas acima, sao exibidos na figura 2.3.
As funcoes de ativacao sao definidas para algumas faixas de valores em suas saıdas. No
caso da funcao degrau, com representacao grafica exibida na figura 2.3-a, o valor tıpico de
γ e 1, representando um intervalo existente entre −1 e 1. A funcao linear, representada
na figura 2.3-b, e diretamente proporcional ao sinal de entrada, nao necessitando de um
limiar mınimo para sua ativacao. Desta maneira seus limites sao de−∞ a +∞. As funcoes
sigmoides, logıstica e tangente hiperbolica, sao mais comumente empregadas nas camadas
internas das MLP por serem contınuas, diferenciaveis e nao-lineares. A funcao logıstica
apresenta uma saıda com uma suavizacao nos momentos de transicao, descrevendo uma
curva no formato de um s, como exibido na figura 2.3-c, e variando entre 0 e 1. Por ultimo,
a funcao tangente hiperbolica, representada na figura 2.3-d, apresenta um sinal de saıda
semelhante ao fornecido pela funcao logıstica sigmoidal, com diferenciacao em relacao a
faixa de atuacao que e de −1 a 1.
Figura 2.3: Representacao grafica de funcoes de ativacao de neuronios artificiais.
Fonte: Fiorin et al. (2011).
Nas redes MLP, o resultado proveniente do somatorio ponderado pelos pesos adicionados
2.1 Redes Neurais Artificiais 13
as entradas da rede, e combinado com outra variavel ajustavel, conhecida como bias(b1).
O bias tem a capacidade de ampliar ou minimizar o resultado do somatorio a ser aplicado
na funcao de ativacao selecionada para o neuronio. Este mecanismo controla o nıvel de
atividade interna do neuronio (vj). O resultado a ser fornecido pela saıda do neuronio
(yi) e obtido pela aplicacao do nıvel de atividade interna do neuronio (vj), a funcao de
ativacao (ϕ). Estas relacoes sao descritas pelas equacoes 2.5 e 2.6.
vj =m∑i=1
wjixi + bj (2.5)
yj = ϕ(vj) (2.6)
2.1.3 Selecao da Arquitetura da Rede
Alguns parametros das redes MLP devem ser definidos de acordo com fatores tais como
a complexidade do problema em avaliacao, o numero de amostras para o treinamento, a
quantidade de ruıdo presente nas amostras e a distribuicao estatıstica destes dados.
Sabe-se que existem diversos metodos propostos para determinar a arquitetura de uma
rede neural. Contudo, o caminho mais recomendado e a construcao de diversos modelos,
variantes em suas funcoes de ativacao, numero de neuronios nas camadas ocultas, quan-
tidade de camadas ocultas, ou intermediarias e metodos de treinamento. O objetivo e
averiguar entre as opcoes a melhor combinacao dos parametros que atenda as especifi-
cacoes estabelecidas para a aplicacao. Deve-se observar o equilıbrio entre a rigidez e a
flexibilidade da rede.
A rede selecionada nao deve ser excessivamente complexa e rıgida ao ponto de incluir, no
modelo, os dados ruidosos apresentados durante a etapa de treinamento, comportamento
conhecido com overfitting ou excesso de aprendizado, que reduz drasticamente sua capaci-
dade de generalizacao e a flexibilidade da rede. Quando ocorre este fato observa-se que
o erro medio para os padroes de treinamento pode assumir um valor elevado, enquanto o
erro medio para os valores de teste, ou validacao, podem se tornar pequenos como descrito
por Teixeira (2001). No outro extremo da questao, onde se verifica uma grande flexibi-
lidade da rede, esta nao deve ser excessivamente generalista a ponto de incluir somente
alguns dos dados apresentados ao modelo. Neste caso, a rede apresenta o comportamento
conhecido como underfitting, e sua capacidade de representacao do modelo primario e
reduzida porque a complexidade da funcao a ser modelada e superior a complexidade do
modelo.
2.1 Redes Neurais Artificiais 14
Uma rede corretamente ajustada deve ser capaz de interpretar e responder adequadamente
as diferentes informacoes, porem dentro de uma certa faixa de valores permissıveis ao
processo. Um dos metodos utilizados para determinar o erro obtido apos o treinamento
da rede e o emprego do erro medio quadratico, como descrito na equacao 2.7.
MSE =
∑Pj=0
∑Ni=0(dij − yij)2
NP, (2.7)
Sendo que:
• dij, representa a saıda desejada de um ponto do conjunto de amostras;
• yij, representa a saıda fornecida de um ponto do conjunto de amostras;
• N, representa o numero de amostras do conjunto de dados;
• P, representa o numero de saıdas do conjunto de dados.
2.1.4 Determinacao do Numero de Neuronios na Camada Oculta
Um dos problemas a ser considerado em uma rede neural e a quantidade de neuronios
existentes na camada oculta. Segundo Hornik(1989, citado por Hernandez et al. (2009)),
uma unica camada oculta de uma rede neural feedforward e capaz de aproximar qualquer
funcao contınua enquanto redes com duas ou mais camadas ocultas podem teoricamente
implementar qualquer funcao, seja esta linearmente separavel ou nao. Contudo, o excesso
de neuronios na camada oculta e capaz de tornar os calculos muito trabalhosos e produzir
resultados finais ruins, como no caso descrito pelo sobreajuste da rede. Da mesma forma,
um numero muito pequeno de neuronios na camada oculta, tambem pode nao ser capaz
de responder adequadamente, tornando a rede excessivamente flexıvel.
Com o objetivo de delimitar o numero de neuronios na camada oculta, foram observadas
duas tecnicas distintas. Na primeira, proposta por Balestrassi et al. (2009), a capacidade
de captura das nao-linearidades da estrutura, atraves dos neuronios da camada oculta
pode ser determinada pela relacao existente com o numero de neuronios da camada de
entrada, como descrito na equacao 2.8.
Noculto = k(Nentrada + 1), (2.8)
sendo que
• Noculto, representa o numero de neuronios na camada oculta;
2.1 Redes Neurais Artificiais 15
• k, constante de relacionamento, variando entre 1, 1.5 e 2;
• Nentrada, representa o numero de neuronios da camada de entrada.
Considerando-se um sistema que possua um total de 8 variaveis de entrada, sendo que cada
uma destas variaveis e inserida em um dos neuronios da camada de entrada, por intermedio
deste metodo, a tabela 2.1 demonstra que pode-se empregar as seguintes quantidades de
neuronios na camada oculta.
Tabela 2.1: Numero de neuronios da camada oculta, conforme proposto por Balestrassi et al.(2009)
k Numero de neuroniosOcultos
1 91,5 142 18
Uma segunda tecnica, proposta por Wei e Xing-yang (2011), amplia o proposto por
Balestrassi et al. (2009), inserindo o numero de neuronios que compoem a camada de
saıda na determinacao no numero de neuronios da camada oculta. A definicao apresen-
tada e baseada em uma formula empırica, demonstrada na expressao 2.9.
Noculto =√
(Nentrada +Nsada) + a, (2.9)
sendo que
• Noculto, representa o numero de neuronios na camada oculta;
• Nentrada, representa o numero de neuronios da camada de entrada;
• Nsada, representa o numero de neuronios da camada de saıda;
• a, constante de relacionamento empırica, variante entre 1 e 10.
Considerando novamente que o sistema que possua um total de 8 neuronios na camada
de entrada e um unico neuronio na camada de saıda, por intermedio deste metodo, pode-
se empregar as seguintes quantidades de neuronios na camada oculta, de acorco como
exibido na tabela 2.2.
De maneira geral, e frequente adotar tecnicas que aperfeicoem a arquitetuta da rede. Uma
destas tecnicas consiste na reducao do numero de neuronios de uma rede superdimensio-
nada por meio da retirada dos neuronios que possuam ligacoes sinapticas fracas, ou seja,
2.1 Redes Neurais Artificiais 16
Tabela 2.2: Numero de neuronios da camada oculta, como proposto por Wei e Xing-yang (2011)
a Numero de neuroniosOcultos
1 42 54 76 98 1110 13
que possuam pequenos valores nos pesos e consequentemente nao sejam relevantes para
o funcionamento da rede. Esta tecnica e conhecida como prunning, ou poda de conexoes
e pode ser realizada por algoritmos como WD (Weigth Decay), OBD (Optimal Brain
Damage) e OBS (Optimal Brain Surgeon). Descrevendo de uma maneira superficial o
algoritmo WD, altera a funcao de custo do treinamento da rede penalizando as solucoes
que apresentem normas elevadas. Esta penalizacao conduz os pesos a convergencia para
o menor valor absoluto permitido.
No algoritmo OBD, a complexidade da rede e alterada ajustando a estrutura por meio
da retirada de neuronios em que os pesos apresetem um efeito pouco perceptıvel no erro
cometido para a resposta da rede, no momento do treinamento. Para cada alteracao
executada na estrutura da RNA, um novo treinamento deve ser realizado e os resultados
avaliados, verificando o efeito exercido pela poda das conexoes, como descrito por LeCun
et al. (1990) e Pedersen et al. (1994).
O algoritmo OBS somente permite uma poda das conexoes sinapticas dos neuronios apos
a avaliacao de criterios mais restritivos, se comparado com os criterios determinados para
os algoritmos de WD e OBD. Quando o algoritmo OBS e aplicado nao necessario um
novo treinamento apos as podas dos pesos como acontece no OBD, conforme Wah (2003).
O algoritmo OBS usa o criterio de incremento mınimo do erro de treinamento para a
determinar a eliminacao dos pesos. Para isso e necessario que o calculo da matriz Hessiana
seja realizado de forma integral, isto e nenhuma restricao a esta matriz e imposta. Uma
restricao as caracterısticas da matriz Hessiana ocorre no algoritmo OBD que a considera
como uma matriz diagonal, com o objetivo de eliminar pesos. Como descrito por Hassibi
et al. (1993), a eliminacao indevida dos pesos pode provocar o incrementado do erro e
alguns pequenos pesos podem ser necessarios para a reducao do erro global da rede.
Baseando nas informacoes citadas anteriormente, a rede neural proposta para este trabalho
aplicara o algoritmo OBS para a solucao do problema proposto.
2.1 Redes Neurais Artificiais 17
2.1.5 Treinamento da Rede
O processo de treinamento ou aprendizagem da rede, consiste na apresentacao de um
limitado conjunto de exemplos, contendo as variaveis de entrada e o resultado desejado
para cada evento. Partindo destas informacoes, os pesos das conexoes entre as camadas
de entrada e os neuronios das camadas intermediarias, os pesos entre os neuronios das
camadadas intermediarias e a camada de saıda sao ajustados de forma iterativa ate que
as caracterısticas que as representem sejam obtidas. Uma vez determinados os pesos
das conexoes, outro conjunto de exemplos pode ser aplicado a rede para gerar solucoes,
baseadas no conhecimento anteriormente adquirido.
Para o treinamento das redes podem ser empregados algoritmos diferentes que divergem
basicamente no modo de execucao dos ajustes dos pesos. Estes algoritmos se dividem
entre dois paradigmas que sao o treinamento nao-supervisionado e o treinamento super-
visionado. No treinamento nao-supervisionado, os exemplos apresentados para a rede
compreendem somente informacoes de entrada, que sao agrupados em classes conforme a
semelhanca de suas propriedades dadas pelos ajustes dos pesos da rede.
O outro modo de treinamento, o supervisionado, considera o emprego de um elemento
externo de supervisao que fornece a rede, exemplos de treinamento que comportam tanto
informacoes da entrada do processo quanto da saıda para os mesmos eventos. Este e o
metodo mais comumente utilizado para o treinamento das redes neurais. O treinamento
supervisionado pode ser classificado em dois segmentos sendo o primeiro o treinamento
dinamico, onde ocorrem alteracoes na estrutura da rede tais como aumento ou diminuicao
dos numeros de neuronios, camadas ocultas e conexoes entre os neuronios das camadas
de entrada, intermediaria e de saıda. O segundo segmento compreende o treinamento
estatico, onde somente os pesos das conexoes sao alterados. A estrutura da rede nao e
alterada em nenhum momento.
O ajuste dos pesos de uma RNA, com treinamento supervisionado, compara o valor
fornecido como solucao pela rede, com o valor apresentado como desejado no conjunto
de dados de treinamento. Obtendo a diferenca entre os dois resultados, e possıvel realizar
um ajuste nos pesos visando minimizar este erro e melhorar a relacao entre as informacoes
de entrada e saıda da rede. De maneira algebrica, a expressao 2.10 representa o termo
relativo ao erro e(t) que e descrito como a diferenca entre o valor desejado, d(t) e o valor
calculado pela rede, y(t), no instante t.
ej(t) = dj(t)− yj(t), (2.10)
Em cada nova realizacao de treinamento sao realizadas modificacoes nos pesos, buscando
2.1 Redes Neurais Artificiais 18
a convergencia ao valor esperado. A equacao 2.11 representa de forma generica para a al-
teracao dos pesos, determinando que os pesos do proximo treinamento serao baseados nos
valores atuais do peso, acrescidos de um termo construıdo com uma taxa de aprendizado
η , que define a velocidade de ajuste dos pesos para convergir ao menor erro e(t) e xi(t)
que e a entrada para o neuronio i no instante t.
wj,i(t+ 1) = wj,i(t) + η.e(t).xi(t), (2.11)
Existem algoritmos em que a taxa de aprendizado e mantida constante durante todo o
treinamento. Sua importancia e verificada no desempenho do algoritmo, uma vez que
valores elevados causam oscilacoes e tornam o algoritmo instavel. Por outro lado, valores
reduzidos da taxa de aprendizado requerem um tempo de calculos elevado para a con-
clusao do treinamento. Em algoritmos em que a taxa de aprendizado e variavel, estas
taxas se adaptam a superfıcie estabelecida pelas informacoes de erro fornecidas, buscando
sua maximizacao enquanto a estabilidade existir. No decorrer do treinamento a taxa de
aprendizado e reduzida aos mımimos valores possıveis.
A soma dos erros quadraticos, de todas as saıdas fornecidas pela rede, tem sido adotada
como um parametro para medicao do desempenho da rede, bem como a funcao de custo
E(t), como descrito na equacao 2.12. Esta funcao de custo deve ser minimizada pelo
algoritmo de treinamento e constitui o princıpio da regra delta de Widrow e Hoff.
E(t) =1
2
∑e2j(t), (2.12)
A funcao de custo representa a superfıcie de erro com os parametros livres do sistema, peso
e bias como coordenadas. Quando sao empregadas somente funcoes de ativacao lineares,
esta superfıcie apresenta apenas um unico ponto de mınimo. Quando sao empregadas
funcoes de ativacao nao-lineares a superfıcie e alterada de tal forma que pode apresentar
diversos pontos de mımimos locais e apenas um mınimo global. O objetivo da minimizacao
dos erros e que durante o perıodo de treinamento, o erro seja deslocado de um ponto
qualquer na superfıcie de erro em direcao ao mımimo global. Como este deslocamento
segue um comportamento aleatorio, existe a possibilidade de que o algoritmo realize a
convergencia para um ponto de mınimo local, que possua um erro superior ao que poderia
ser obtido em um ponto onde o mınimo e global.
O algoritmo mais empregado para o treinamento das redes MLP e o algoritmo de retro-
propagacao, ou backpropagation. Na primeira fase do treinamento, o sinal funcional e
transferido dentro da rede no sentido da camada de entrada para a camada de saıda (feed-
forward), com os valores das variaveis de entrada apresentadas e mantendo fixos os pesos,
2.1 Redes Neurais Artificiais 19
com o objetivo de gerar uma resposta na saıda da rede. Na segunda fase do treinamento,
os valores obtidos nas saıdas sao comparados com os valores desejados produzindo um
sinal de erro. Este sinal de erro e entao retornado pela rede, no sentido da camada de
saıda para a camada de entrada, ajustanto os pesos de forma a minimizar o erro encon-
trado. Este processo de retro-propagacao do erro e que define o termo backpropagation
no treinamento das MLP.
A correcao de cada peso do neuronio, ou seja o seu ajuste, e baseada no metodo do
gradiente para a minimizacao do erro. Isto e realizado pelo produto existente entre a
taxa de aprendizado assumida e a derivada parcial da funcao de custo em relacao ao peso
atual. Conforme descrito por Fiorin et al. (2011), pode-se dizer que os ajustes nos pesos,
∆wji, definidos pela equacao 2.13 , sao dependentes do valor do gradiente local da curva
de erro. Para se definir o valor do gradiente local, descrito pela equacao 2.14, e aplicado
o valor da derivada da funcao de ativacao interna do neuronio, ϕj(vj(t)). Este algoritmo
e aplicavel para a correcao dos pesos tanto dos neuronios das camandas intermediarias da
rede quanto para os neuronios da camada de saıda.
∆wji = η.δj(t).xi(t), (2.13)
δj(t) = ej.ϕj(vj(t)), (2.14)
O ajuste dos pesos de uma rede MLP pode ser realizada de duas formas distintas que sao
os modos sequencial e por lote. Braga et al. (2000) descrevem que no modo sequencial
os pesos sao atualizados apos a apresentacao de cada exemplo de treinamento. Neste
modo de ajuste e estavel quando a taxa de aprendizado e pequena, porem quando a
taxa de aprendizado e elevada geralmente a rede se torna instavel. No modo por lote, o
ajuste dos pesos e realizado apos a apresentacao de todos os exemplos de treinamento. O
intervalo que compreende a apresentacao de todos os dados de treinamento e denominado
uma epoca. Haykin (2001), descreve que o modo sequencial e preferıvel em relacao ao
modo por lote por solicitar uma menor quantidade de memoria para armazenamento das
informacoes das conexoes sinapticas. Outro fator favoravel e que a apresentacao dos
parametros de forma aleatoria torna a busca no espaco de pesos de natureza estocastica e
por sua vez miniminiza as possibilidades do algoritmo de retropropagacao estabilizar em
um mınimo local da superfıcie de erro. As duas razoes praticas que tornam a atualizacao
dos pesos no modo sequencial mais popular sao a sua facilidade de implementacao e sua
capacidade de fornecer solucoes efetivas para problema difıceis.
2.2 Tratamento dos Dados 20
2.1.6 Capacidade de Generalizacao da Rede
Uma das etapas finais para o desenvolvimento das redes neurais e a avaliacao da ca-
pacidade de generalizacao. Apos selecionar a arquitetura a ser empregada, determinar
do numero de neuronios nas camadas ocultas e realizar o treinamento da rede com os
dados disponibilizados e necessario avaliar a qualidade da resposta emitida pela rede.
Com a insercao de dados do conjunto de treinamento empregado, que ja foram avaliados
anteriormente, a RNA pode fornecer pequenos valores de erro para os resultados apre-
sentados. Contudo, ao apresentar informacoes diferentes, que estao compreendidas nos
dados do conjunto de validacao e ainda nao foram apresentados, a mesma RNA pode
fornecer respostas com elevados erros. Neste caso a rede ”memoriza”, e nao incorpora,
o comportamento do processo caracterizando o seu sobreajuste tambem conhecido como
overfitting.
Como detalhado por Haykin (2001), o processo de treinamento de uma rede neural pode
ser relacionado como um problema de ”ajuste de curva”. Considerando que a RNA e
um mapeador nao-linear de entrada-saıda, sua capacidade de generalizacao tem o efeito
de uma boa interpolacao nao-linear sobre os dados de entrada. Uma rede neural bem
ajustada e capaz de produzir um mapeamento das entradas e saıdas adequado, mesmo
quando os valores de entrada forem um pouco diferentes dos exemplos usados para o
treinamento.
A capacidade de generalizacao de uma rede neural e influenciada pelo tamanho e a quali-
dade do conjunto de dados de treinamento, pela arquitetura utilizada e pela complexidade
fısica do problema. Com o intuito de promover a capacidade de generalizacao da rede, po-
dem ser aplicados metodos numericos como a regularizacao e a parada antecipada (Early
Stopping) do treinamento. No metodo de regularizacao a funcao de custo e alterada para
minimizar tanto o erro e(t), como tambem os valores dos pesos ao longo do treinamento.
No metodo de parada antecipada os dados sao divididos em grupos de treinamento e va-
lidacao. O ajuste dos pesos sao realizados somente quando os dados de treinamento sao
apresentados e o grupo de dados de validacao e utilizado para a avaliacao da capacidade de
generalizacao da rede durante a etapa de treinamento. Esta etapa e interrompida quando
o erro do conjunto de validacao tende a crescer, enquanto o erro para o conjunto de dados
de treinamento continuaria decrescendo.
2.2 Tratamento dos Dados
A coleta dos dados necessarios a modelagem de um processo e uma tarefa que demanda
tempo e cuidados especiais. Em muitos exemplos os dados sao adquiridos compreendendo
2.2 Tratamento dos Dados 21
tanto as informacoes pertinentes ao processo como tambem dados espurios, dados falsos e
ruidosos. A introducao destas informacoes nas redes neurais tendem a causar incrementos
nos erros e consequentemente levar aos problemas de generalizacao e convergencia. Algu-
mas das ferramentas atualmente disponıveis e aplicadas no tratamento dos dados serao
apresentadas em seguida.
2.2.1 Normalizacao dos Dados
A normalizacao dos valores das variaveis a serem utilizadas na camada de entradas das
redes neurais e outro fator importante a ser observado. Nascimento et al. (2009) descre-
vem que a finalidade da normalizacao e adaptar os dados de entrada a faixa de valores
dinamicos das funcoes de ativacao dos neuronios da rede. Nos casos em que os valores as
entradas sao muito elevados e possıvel que a funcao de ativacao seja saturada, prejudi-
cando a convergencia da rede neural, como descrito por Lima (2010).
Um metodo de normalizacao, apresentado por Aydinalp et al. (2007), implica na subtracao
do valor medio da variavel, dividindo o resultado pelo seu desvio padrao. A representacao
matematica e demonstrada na equacao 2.15.
xn =x− µσ
, (2.15)
sendo
• xn, o valor resultante da normalizacao;
• x, o valor atual da variavel referida;
• µ, o valor medio da variavel referida;
• σ, o desvio padrao da variavel referida.
Em outro metodo de normalizacao e empregado um valor de offset, que e deduzido para os
dados amostrados, que serao transformados sobre uma faixa desejada pela media de um
fator escalar. O metodo mais frequentemente empregado envolve o mapeamento dos dados
linearizados sobre uma faixa especıfica. A representacao matematica e demonstrada na
equacao 2.16. A faixa de valores aproximada de 0,1 a 0,9 e considerada a mais apropriada
para a transformacao dos valores de variaveis para a aplicacao na faixa de sensibilizacao
da funcao de ativacao logıstica sigmoidal.
x′ = (x− xmin)x′max − x′min
xmax − xmin
+ x′min, (2.16)
2.2 Tratamento dos Dados 22
sendo
• x′, o valor resultante da normalizacao;
• x, o valor atual da variavel referida;
• x′max, o valor maximo esperado para a variavel referida;
• x′min, o valor mınimo esperado para a variavel referida;
• xmax, o valor maximo desejado para a variavel referida;
• xmin, o valor mınimo desejado para a variavel referida.
A avaliacao estatıstica das informacoes e variaveis relacionadas ao problema e uma das
tecnicas que aperfeicoam a arquitetura da rede. A aplicacao desta tecnica de avaliacao,
resulta em uma selecao das variaveis que realmente sao necessarias para suprir a rede
neural de informacoes, excluindo aquelas que nao influenciam de maneira significativa os
resultados. Verificam-se disponıveis para a execucao desta avaliacao os metodos de analise
da correlacao linear entre os pares de variaveis de entrada/saıda e a analise de auto-
correlacao entre as variaveis. Neste trabalho a analise da correlacao linear foi empregada
na preparacao dos dados para o treinamento da rede neural.
2.2.2 Coeficiente de Correlacao Linear
Frequentemente procura-se pesquisar a existencia da relacao entre duas ou mais variaveis,
para avaliar o comportamento destas variaveis quando quando uma delas sofre alteracoes.
O estudo da correlacao presente entre as variaveis permite que sejam determinadas a
existencia e o grau de relacao entre as variaveis. Um metodo para determinacao do
sentido e o grau de correlacao e dado pela medida da covariancia entre duas variaveis
aleatorias u e y, informando a correlacao linear entre elas. A funcao de covariancia e
definida pela equacao 2.17
COV (u.y) =1
n
[∑u.y −
∑u.∑y
n
](2.17)
sendo que:
• N , indica o numero total de dados;
• u, refere-se as amostras dos dados de entrada;
• y, refere-se as amostras dos dados de saıda;
2.2 Tratamento dos Dados 23
Magalhaes e Lima (2009) descrevem que o coeficiente de correlacao linear de Pearson e
convenientemente utilizado para medir a correlacao entre variaveis e e determinado pela
equacao 2.18.
ru.y =COV (u.y)√σuσy
(2.18)
O coeficiente de correlacao de Pearson e confinado na faixa entre −1 e +1. Quando
r=−1, existe uma correlacao linear perfeitamente negativa entre as variaveis, demons-
trando que variam em um mesmo sentido, porem em direcoes opostas. Isto e, quando y
e incrementado, u e decrementado na mesma dimensao. Quando r=0, significa que nao
existe qualquer correlacao entre y e u, e as variaveis sao consideradas descorrelacionadas.
Quando r=+1 existe uma correlacao linear perfeitamente positiva entre as variaveis u
e y. Isto quer dizer que eles variam na mesma quantidade. Uma definicao citada por
Figueiredo Filho e Silva Junior (2009) para o coeficiente de correlacao, descreve que ”a
correlacao cruzada dimensiona a direcao e o grau de relacao linear entre duas variaveis
quantitativas”. Para Lira (2004), o coeficiente de correlacao pode ser avaliado de forma
qualitativa, dependendo dos objetivos para sua utilizacao e as razoes para seu calculo.
Na tabela 2.3, estao relacionadas algumas faixas representantes da qualidade dos dados
avaliados segundo o criterio do coeficiente de correlacao de Pearson. Nesta tabela sao
expressos apenas os valores de modulo do resultado da correlacao.
Tabela 2.3: Correlacao entre variaveis.
Faixa Definicao0,00 a 0,29 Fraca0,30 a 0,59 Moderada0,60 a 0,89 Forte0,90 a 1,00 Muito ForteFonte: Lira (2004)
Os pares dos valores das duas variaveis podem ser representados em um diagrama de
dispersao, que possui a vantagem de fornecer uma simples visualizacao do relacionamento
entre as variaveis. A correlacao existente entre os dados e representada pelos pontos no
grafico, formando uma nuvem com os dados dispersos na superfıcie de avaliacao. As duas
retas representadas na figura significam o valor maximo possıvel para a correlacao das
variaveis, em uma linha tracejada, e o valor obtido pelos dados apresentados, na linha
contınua. A medida da inclinacao da reta determina o grau de correlacao linear presente.
A figura 2.4 apresenta um diagrama de dispersao, onde um conjunto de dados do tipo
(u,y) e representado e as variaveis avaliadas possuem uma correlacao muito fraca.
2.2 Tratamento dos Dados 24
Outro indicador para a relacao presente entre as variaveis e o coeficiente de correlacao
multipla R2, determinado pela equacao 2.19. O valor de R2 e diretamente proporcional a
correlacao linear existente entre as duas variaveis. Ou seja, quanto menor R2, menor sera
a correlacao entre as duas variaveis analizadas, como descrito por Aydinalp et al. (2007).
R2 = 1−∑N
i=1(ui − yi)2∑Ni=1 u
2i
(2.19)
Como um outro exemplo para a situacao onde duas variaveis possuem uma elevada cor-
relacao linear, a figura 2.5 fornece uma explicacao grafica. Neste caso a correlacao entre
as variaveis u e y produz uma nuvem de dados com distribuicao dos pontos em uma reta
bastante proxima do eixo objetivo. Quanto menor for a distancia entre a linha de obje-
tivo e a linha representativa da correlacao entre as variaveis, maior e a correlacao linear
existente entre estas variaveis.
O valor de correlacao linear entre variaveis depende fortemente da qualidade dos dados
aplicados. Dados ruidosos, com valores espurios inclusos, sao determinantes para a re-
ducao do ındice de correlacao. Um recurso disponıvel para mitigacao deste problema e
o emprego da Distancia de Mahalanobis para evidenciar e orientar a eliminacao destes
Figura 2.4: Baixa correlacao linear entre variaveis
2.2 Tratamento dos Dados 25
Figura 2.5: Elevada correlacao linear entre variaveis
pontos especıficos nos conjuntos de dados.
2.2.3 Distancia de Mahalanobis
Quando um conjunto de informacoes exprime um comportamento estavel das variaveis
de um sistema, as conclusoes sobre o processo podem ser facilmente expressas e determi-
nadas. Segundo Angiulli et al. (2010), um conjunto de observacoes que demonstre algumas
propriedades contrastantes com o dados padronizados, que possam ser logicamente justi-
ficadas pelo conhecimento basico, sao defindas como outliers.
Frequentemente, as tecnicas de medicao multivariavel sao baseadas nos valores das distan-
cias entre um ponto referencial e um outro ponto desejado. A Distancia de Mahalanobis
e uma das tecnicas mais comumente usadas, segundo Maesschalck et al. (2000). No es-
paco original das variaveis, a Distancia de Mahalanobis correlaciona os dados, calculando
a matriz inversa de variancia-covariancia do conjunto de dados de interesse. Porem o
calculo da matriz de variancia-covariancia pode causar problemas. Quando os dados pos-
suem um elevado numero de variaveis, estas podem conter informacoes redundantes ou
muito correlacionadas. A multicolinearidade nos dados e capaz de promover uma matriz
de variancia-covariancia singular que nao pode ser invertida. A segunda limitacao para
2.2 Tratamento dos Dados 26
o calculo e que o numero de amostras no conjunto de dados seja tao grande quanto o
numero de variaveis. Nestes casos a reducao no numero de variaveis deve ser executada.
A Distancia de Mahalanobis e aplicada a diferentes propositos no campo de calibracao
multivariavel. Um deles, aplicado neste trabalho, e a deteccao de outliers no conjunto
de dados. A eliminacao dos outliers permite uma reducao nos erros cometidos pela rede.
Uma outra aplicacao possıvel e a avaliacao de quanto uma amostra se difere de uma
norma para a variavel, como descrito por Krusinka (1987) em seu trabalho. Neste caso,
uma norma estimada e obtida em funcao de um conjunto de amostras de treinamento,
excluindo a classe de objetos normais como um ponto ou estimativa coerente. A distancia
entre a amostra considerada anormal e a norma estimada obtida e tratada como a medicao
procurada por um degrau de diferenciacao.
Para calcular a Distancia de Mahalanobis, primeiramente a matriz de variancia-covariancia
Cx deve ser construıda.
Cx =1
(n− 1)(Xc)
T (Xc), (2.20)
sendo que
• Cx, representa a matiz de dados contendo n amostras de p variaveis;
• Xc, representa matriz (X −X).
Para o caso onde sao avaliadas somente duas variaveis, x1 e x2, a matriz de variancia-
covariancia sera
Cx =
[σ21 ρ12σ1σ2
ρ12σ1σ2 σ22
](2.21)
sendo que
• σ21, representa a variancia dos valores da primeira variavel;
• σ22, representa a variancia dos valores da segunda variavel;
• ρ12σ1σ2, representa a covariancia entre as duas variaveis.
A Distancia de Mahalanobis para cada objeto xi e entao
DMi =√
(xi − x)C−1x (xi − x)T , (2.22)
2.2 Tratamento dos Dados 27
Para corroborar sua aplicacao no trabalho, a Distancia de Mahalanobis foi utilizada para
eliminar os outliers dos dados amostrados, para o perıodo de processamento de bobinas.
Os dados de um determinado perıodo do processo, contendo 543 amostras, sao exibidos
na figura 2.6, onde o eixo das ordenadas representa as bobinas amostradas e o eixo das
abcissas o tempo despreendido para o processo de cada bobina respectivamente.
Figura 2.6: Dados anteriores a submissao da Distancia de Mahalanobis, resultando em 543 bobi-nas
Nesta figura existem dois pontos com elevada discrepancia em relacao ao demais, o
primeiro com amplitude de 6605 minutos e o segundo com 14726 minutos de processo.
Estas amostras foram geradas por uma caracterıstica particular do processo, durante o
perıodo de inatividade da linha de producao. Nesta condicao o valor medio do tempo de
processo das bobinas no perıodo e igual a 74 minutos de processo, demonstrando o quao
divergente estas amostras estao dos dados aceitaveis. Como a Distancia de Mahalanobis
entre os valores e consideravelmente elevada, ambos sao evidenciados e considerados como
outliers.
Com os outliers evidenciados, em sucessivas aplicacoes desta tecnica, estes dados sao
eliminados. A alteracao realizada no conjunto de dados total proporciona uma reducao do
valor medio do perıodo para 33 minutos de processo, como demonstrado na figura 2.7, onde
a maior concentracao na quantidade de bobinas processadas esta na faixa compreendida
entre 20 e 40 minutos. Verifica-se tambem a existencia de processos com perıodos muito
maiores, porem em uma frequencia bem reduzida.
Obtendo-se uma maior homogeneidade nos dados, a quantidade de erros que poderiam
serem inseridos no treinamento da rede neural e reduzinda. O resultado final, com a eli-
minacao de praticamente todos os dados espurios do processo, para o perıodo avaliado, e
demonstrado na figura 2.8, que promove uma visualisacao mais detalhada do comporta-
2.2 Tratamento dos Dados 28
Figura 2.7: Histograma dos dados de tempo de processamento das bobinas
mento da variavel tempo de processo das bobinas, representando seus resultados de forma
mais realista de acordo como conhecimento empırico do processo. Os valores evidenciados
na figura com um tempo de processo de 85 e 108 minutos sao exemplos mais raros, porem
considerados como pertencentes ao processo.
Figura 2.8: Aplicacao da Distancia de Mahalanobis, resultando em 537 bobinas uteis
No proximo capıtulo sera apresentado uma descricao do processo de eletrogalvanizacao
descrevendo seu princıpio basico de funcionamento, e as variaveis coletadas no sistema
que foram empregadas no trabalho.
Capıtulo 3
Descricao do Processo
3.1 A Galvanoplastia
Um dos processos siderurgicos destinados a melhoria da qualidade superficial das cha-
pas de aco, e o revestimento protetivo das tiras de aco. Esse efeito pode ser concebido
atraves da galvanoplastia, ou eletrogalvanizacao, que consiste na formacao de uma bar-
reira protetora quanto a oxidacao por meio da precipitacao eletrolıtica de metais nobres
sobre metais comuns. A aplicacao de zinco sobre a superfıcie de um substrato em aco
lhe permite melhores caracterısticas mecanico-metalurgicas de resistencia a corrosao, oxi-
dacao e conformacao superiores as aferidas ao metal primario isolado e sem este tipo de
tratamento, conforme foi confirmado por Marques (2008) em seu trabalho.
A galvanoplastia e baseada na reacao fısico-quımica existente entre o movimento de
eletrons no interior dos condutores eletricos e os ıons metalicos disponıveis dentro de uma
solucao aquosa preparada. De modo geral, quando uma determinada corrente eletrica e
aplicada aos anodos de uma celula galvanica, os cations metalicos sao retirados da solucao
e transportados para o catodo. Na chapa de aco, que se transforma no catodo, os ıons
sao novamente convertidos em metal e precipitados sobre sua superfıcie. O volume de
precipitacao metalica e determinado pela 1a lei de Faraday, cujo enunciado e dado por:
A massa de qualquer elemento depositado em um dos eletrodos por efeito
da eletrolise e diretamente proporcional a intensidade da corrente e ao
tempo durante o qual se da a eletrolise. Salmeron (1961)
No processo de eletrogalvanizacao da Usiminas, uma fonte de energia fornece uma corrente
eletrica contınua, estabilizada e ajustavel conforme a necessidade da aplicacao. O fluxo
3.1 A Galvanoplastia 30
de eletrons disponibilizado e direcionado atraves dos condutores eletricos para as placas
de anodo, confeccionados em material inerte, e reage com os ıons metalicos disponıveis na
solucao de sulfato de zinco (ZnSO4), formando um ıon de zinco. Devido a concentracao
de ıons de zinco (Zn+2) liberados pela reacao da corrente eletrica com a solucao, estes
ıons sao agregados a superfıcie da chapa de aco e entao convertidos novamente em um
metal que tem a funcao de catodo no processo. A Figura 3.1 ilustra o princıpio basico
e as reacoes quımicas de uma celula eletrolıtica empregando como anodo um eletrodo de
zinco e como catodo uma chapa de aco. Ambos submersos em uma solucao de sulfato de
zinco e submetidos a um fluxo de eletrons.
Figura 3.1: Princıpio de funcionamento de uma celula eletrolıtica
Fonte: Manual de operacao Andritz, 1993.
Considera-se que o zinco tem uma precipitacao especıfica equivalente a 1,2197 g/Ah.
Para ilustrar o processo em um exemplo pratico, a aplicacao de 65 A/dm2 de densidade de
corrente eletrica produz um revestimento de 7,5 µm de espessura media de camada de zinco
nas duas faces de uma tira de aco. Neste caso, a energia consumida aproxima-se de 140
kWh/t de aco revestido, conforme o manual de procedimentos e funcionamento da Andritz
(1993). O custo agregado ao produto, observando-se somente a demanda de energia
eletrica aplicado para o kW/h, oscila em torno de 48,80 R$/t para o material processado.
3.2 Sistema de Fornecimeto de Energia Eletrica 31
Observando este ponto, verifica-se a relacao direta existente entre o consumo de energia
eletrica e os custos dispendidos no processo de revestimento por eletrogalvanizacao para
tiras de aco.
E necessario observar que a espessura e a densidade da camada de zinco adicionada ao
material primario devem ser controladas com precisao, pois estes fatores determinam os
principais custos advindos do processo. Quanto mais elevada for a eficiencia do agrupa-
mento do zinco sobre a superfıcie do aco maiores serao a homogeneidade e qualidade do
revestimento, consequentemente menores serao os custos de producao. Um dos fatores
que influenciam diretamente na eficiencia do processo e o controle da energia eletrica
provida pelos conversores reguladores de corrente contınua. Consequentemente, um dos
itens mais relevantes para o processo em escala industrial e a demanda de energia eletrica.
Seu gerenciamento e dimensionamento impactam diretamente no custo final do produto
e em sequencia nas margens de ganhos. O modelo correntemente aplicado generaliza a
parcela do custo do consumo de energia eletrica sobre a producao, apenas totalizando-o
no final de um perıodo especıfico.
A capacidade nominal de producao da linha de eletrogalvanizacao da Usiminas gira em
torno de 25.000 toneladas/mes, dependendo do material inserido no processo e das especi-
ficacoes do cliente. As variaveis basicas que constituem a especificacao tecnica do produto
sao:
• Largura da tira, dada em mm e variando entre 500 a 1650 mm;
• Espessura da tira, dada em mm e variando entre 0.50 a 1.65 mm ;
• Densidade da camada de revestimento, dado em g/m2 e variando entre 11 a 120
g/m2 ;
• Peso da bobina a ser revestida, dado em toneladas e variando entre 5 a 30 t;
• Superfıcie a ser revestida, selecionavel entre inferior, superior ou ambas;
Utilizando como base os dados historicos de producao, fornecidos pela empresa, pode-se
verificar o volume de aco produzido pela linha de eletrogalvanizacao na Figura 3.2. Esta
figura exprime a producao realizada no perıodo entre janeiro de 2004 e maio de 2013, com
amostras coletadas mensalmente.
3.2 Sistema de Fornecimeto de Energia Eletrica
A energia eletrica empregada no processo e proveniente de duas linhas de transmissao
em uma voltagem de 69 kV, que em seguida e reduzida para aplicacao aos equipamentos
do processo em voltagens de 11 kV e 460 V. O consumo de energia eletrica no processo
analisado, dado em kW/h, e formado pela demanda criada pelas cargas dos equipamentos
3.2 Sistema de Fornecimeto de Energia Eletrica 32
Figura 3.2: Plano de producao executado no perıodo de 2004 a 2013
instalados como transformadores de potencia, conversores CA/CC para acionamento de
motores e retificadores, inversores de frequencia, motores eletricos, filtros para reducao de
distorcao das componentes harmonicas de corrente de 5a, 7a e 11a ordem e equipamentos
de controle e de refrigeracao.
A variavel de consumo de energia eletrica e registrada por medidores instalados nos dois
paineis de recebimento da concessionaria e armazenados em um banco de dados para
registro e determinacao dos custos no perıodo. O valor total da energia empregada no
processo de eletrogalvanizacao e formado por duas componentes. A primeira componente
e definida pelo somatorio dos valores registrados nos dois medidores de recebimento. A
segunda componente e fornecida por outros dois medidores, instalados em circuitos que
nao fazem parte do processo de eletrogalvanizacao. Um destes equipamentos realiza o
tratamento dos efluentes produzidos pela eletrogalvanizacao, denominado ETEG (Es-
tacao de Tratamento dos Efluentes da Galvanizacao). Apesar de ser um subequipamento
da linha de eletrogalvanizacao, considera-se a ETEG como pertencente ao outro grupo de
equipamentos auxiliares de producao, dispostos em varias areas da empresa. O segundo
equipamento refere-se a uma unidade de tratamento superficial de cilindros de laminacao,
denominada Usiroll. Esta unidade e uma joint-venture entre a Usiminas e a Court Hold-
ing, uma empresa de origem canadense, que fornece subsıdios para a producao de outras
linhas de producao na empresa. A energia eletrica para estes dois equipamentos e provida
atraves da linha de eletrogalvanizacao simplesmente por motivos de estrutura instalada,
localizacao fısica e logıstica. Os consumos realizados por estes equipamentos sao registra-
dos e subtraıdos do somatorio do consumo geral do processo. A equacao 3.1, explica esta
manipulacao.
3.2 Sistema de Fornecimeto de Energia Eletrica 33
EProcesso = ETR1 + ETR2 − (EETEG + EUsiroll) (3.1)
Sendo que:
• EProcesso - Energia total do processo;
• ETR1 - Energia medida na linha de recebimento numero 1;
• ETR2 - Energia medida na linha de recebimento numero 2 ;
• EETEG - Energia medida na linha de fornecimento para a ETEG;
• EUsiroll - Energia medida na linha de fornecimento para a Usiroll;
Um diagrama unifilar do sistema distribuidor de energia eletrica, exibido na Figura 3.3
representa o fluxo da energia eletrica, as cargas alimentadas pelo barramento e os pontos
onde sao realizadas as medicoes de consumo.
3.2.1 Relacionamento entre Energia Eletrica e Producao de Eletrogalvaniza-
dos
Estabelecendo a relacao entre o consumo de energia eletrica e a producao executada,
verifica-se a interdependencia da primeira em relacao a segunda. O consumo de energia
eletrica, medido em kWh, no processo analisado e diretamente ligado ao plano de pro-
ducao da planta, que por sua vez e dado em toneladas. A Figura 3.4 exibe o compor-
tamento do consumo de energia eletrica e producao nos ultimos nove anos, na linha de
eletrogalvanizacao da Usiminas. Contudo, a diversidade disponibilizada para as especifi-
cacoes tecnicas do material implica em diferentes comportamentos do consumo de energia
eletrica, produzindo resultados semelhantes para condicoes de producao distintas. Por
esta razao e possıvel visualizar que em determinados perıodos o valor especıfico de con-
sumo de energia se difere em muito para um perıodo onde os volumes de producao sao
semelhantes. Destacando-se o ponto A na Figura 3.4, obtem-se um consumo de energia
eletrica de 7.331.102 kWh para uma producao de 22.697 toneladas de aco eletrogalva-
nizado. No ponto B, uma producao relativamente semelhante de 22.797 toneladas deman-
dou um montante de 5.829.176 kWh de energia eletrica para ser produzido. Analizando
essas informacoes verifica-se que a diferenca de aco produzido entre os dois pontos, de 100
toneladas indica uma diferenca de 1.501.926 kWh de energia eletrica. Com o objetivo de
validar a correlacao entre as informacoes de producao executada e consumo de energia
eletrica, estas variaveis foram normatizadas nesta representacao.
O consumo de energia eletrica e formado por duas partes distintas para todos os produtos
processados, sendo uma constante e a outra variavel, dependendo diretamente da especi-
ficacao de producao solicitada. A componente constante do consumo de energia eletrica
3.2 Sistema de Fornecimeto de Energia Eletrica 34
Figura 3.3: Diagrama eletrico unifilar simplificado do sistema distribuidor de energia eletrica dalinha de eletrogalvanizacao da Usiminas.
3.2 Sistema de Fornecimeto de Energia Eletrica 35
Figura 3.4: Comportamento da producao e do consumo de energia eletrica no processo de ele-trogalvanizacao
e formada pela operacao dos equipamentos que auxiliam na operacao do processo, inde-
pendente do tipo de material que esta sendo produzido. As cargas que constituem estes
conjuntos sao:
• Os sistemas de refrigeracao e ventilacao da salas de controle e de equipamentos;
• Os sistemas de bombas para transferencia de fluıdos e solucoes;
• Os sistemas de iluminacao dos equipamentos, salas de controle e galpoes da insta-
lacao;
• Os sistemas de manuseio de bobinas processadas, como transportadores e pontes
rolantes;
• Os equipamentos de controle e supervisao do processo;
Para cada bobina de aco revestida e consumida uma quantidade distinta de energia eletrica
no processo. Este fato se da fundamentalmente por questoes das especificacoes tecnicas
do produto, determinadas pelos clientes e pelas condicoes operacionais disponibilizadas
pelos equipamentos durante o processo. A alteracao de algumas destas variaveis influi
diretamente no calculo realizado para a necessidade de corrente eletrica a ser fornecida
pelos conversores reguladores de corrente em operacao para as celulas galvanicas. A
componente variavel do consumo de energia eletrica e basicamente definida por:
• Velocidade de processo dos materiais;
• Quantidade de material a ser depositado na superfıcie da tira;
3.3 Equipamentos Instalados 36
• Numero de faces a serem revestidas (uma ou duas);
• Dimensoes do material processado;
Como um exemplo, para o caso de uma reducao na velocidade de processo e manutencao
do valor de quantidade de material depositado na superfıcie revestida, a corrente eletrica
disponibilizada pelos retificadores e reduzida. A demanda total de corrente eletrica e dis-
tribuıda entre os conversores, considerando o numero de retificadores em operacao. Deste
modo a energia total fornecida pelos retificadores, para o revestimento de um determi-
nado produto, nao e alterada. Porem a energia solicitada pelos motores de acionamento
de alguns equipamentos como desbobinadeiras, bobinadeiras, bombas de solucao e rolos
condutores, tende a variar para se ajustar as atuais necessidades de torque e velocidade.
3.3 Equipamentos Instalados
O equipamento de eletrogalvanizacao e composto por tres secoes basicas de sub-equipamentos
que sao:
• Secao de entrada:
– Desbobinadeiras;
– Maquina de Soldas;
– Carro de compensacao de tiras;
• Secao do centro:
– Desempenadeira Tensora;
– Limpeza Eletrolıtica;
– Decapagem;
– Celulas galvanicas;
– Secao de Pos-Tratamento;
• Secao da saıda:
– Carro de compensacao de tiras;
– Tesouras Laterais;
– Oleadeira;
– Guilhotina;
– Bobinadeiras;
A Figura 3.5, representa a linha de producao da Galvanizacao Eletrolıtica dividida em
suas secoes de processo princiais.
As variaveis adquiridas para o trabalho foram divididas em dois grupos distintos, sendo
estes:
3.4 Variaveis da Secao do Centro 37
Figura 3.5: Linha de galvanizacao Eletrolıtica da Usiminas
Fonte: Usiminas , 1995.
• Grupo de variaveis da secao do centro do processo;
• Grupo de variaveis da secao de saıda do processo;
3.4 Variaveis da Secao do Centro
O grupo de variaveis do centro do processo representa o conjunto de informacoes que
atuam diretamente no ponto em que o consumo de energia e mais elevado e representativo.
Fisicamente este conjunto esta na regiao das celulas galvanicas onde foram instalados os
retificadores. As variaveis registradas sao:
• Numero da BF (Bobina a Frio) no Centro - usado para identificar a bobina atual,
nesta etapa do processo. E formado por um numero de 8 caracteres, exclusivo para
cada bobina;
• Velocidade no Centro - velocidade do processo na regiao central da linha de pro-
ducao. Normalmente varia dentro de valores pre-estabelecidos para nao afetar a
qualidade do produto. Nos casos em que seu valor se torna nulo, ocorrem danos
ao produto, tornando-o inadequado para as solicitacoes do cliente. Seu valor e me-
dido em funcao de um dos rolos condutores da tira e e dado em metros por minuto
(mpm);
• Densidade da camada inferior - valor medido por um leitor de camadas, construıdo
pela empresa FAG. Esse medidor, do modelo Gauge FH 46 M-E, possui uma faixa
de medicao de 0 a 130 g/m2. Seu tempo de atualizacao das leituras e de 10 ms,
com uma perıodo entre amostragens de 480 ms. O sinal fornecido para o PLC
(Programable Logic Controller) de controle e dado em uma malha de voltagem, em
que 10 g/m2 equivale a +10 Vcc;
• Densidade da camada superior - variavel obtida pelo mesmo medidor de camada
citado anteriormente. Difere-se apenas pelo fato de executar leituras na parte supe-
rior da tira de aco.
3.4 Variaveis da Secao do Centro 38
• Energia TR1 medida - totalizador da energia ativa consumida pelas cargas instaladas
no circuito a jusante do transformador TR1. A unidade de medida empregada e o
kW/h. E aplicado um medidor do modelo Multi-K, fabricado pela KRON medidores.
Por meio da leitura das correntes eletricas e das voltagens nas tres fases, calcula e
informa o valor medido pelo instrumento. A leitura obtida e armazenada em um
banco de dados e posteriormente enviado, via rede Ethernet, para o coletor de dados
do PIMS;
• Energia TR2 medida- totalizador da energia ativa consumida pelas cargas instaladas
no circuito a jusante do transformador TR2. O medidor aplicado e identico ao
instalado no TR1;
• Energia ETEG medida - totalizador da energia ativa consumida pelas cargas insta-
ladas no circuito a jusante da chave que alimenta a ETEG. O medidor aplicado e
identico ao instalado no TR1;
• Energia Usiroll medida- totalizador da energia ativa consumida pelas cargas insta-
ladas no circuito a jusante da chave que alimenta a Usiroll. O medidor aplicado e
identico ao instalado no TR1. O esquema de ligacao do sistema de comunicacao
entre os quatro medidores e exibido na Figura 3.6;
• Corrente de todos os retificadores - somatorio das correntes individuais de cada um
dos 40 retificadores instalados nas celulas galvanicas, com o valor calibrado retirando
os elementos negativos. Cada um dos retificadores possui uma capacidade nominal
de 37 kA, totalizando 1480 kA para todo o conjunto ;
Figura 3.6: Cirtuito de interligacao dos medidores de energia e a rede Ethernet
Fonte: Manual de operacao Kron, 2012.
3.5 Dados de Energia 39
3.5 Dados de Energia
A energia eletrica empregada registrada pelos medidores no processo de eletrogalvaniza-
cao, descreve uma curva ascendente com inclinacao variavel dependendo das solicitacoes
de cada processo. Para obter o valor de energia dispendido individualmente por bobina e
necessario realizar um calculo considerando os instantes em que o processo de cada bobina
e iniciado e finalizado. A equacao 3.2 descreve o calculo realizado.
Consumo(K) = Energia(K) − Energia(K−1) (3.2)
sendo:
• Consumo(K) , energia eletrica consumida por bobina;
• Energia(K−1) , a medida de energia na amostra inicial;
• Energia(K), a medida de energia na amostra final.
As informacoes fornecidas pelos medidores de energia apresentaram muitos pontos com
dados espurios, distorcendo o comportamento da curva. A Figura 3.7 revela o comporta-
mento da variavel por um perıodo delimitado para o mes de Fevereiro/12. Foram obtidos
valores para a variavel ”Consumo(K)” tanto positivos quanto negativos. Estes valores
encontrados foram analisados e concluiu-se que se tratam de dados espurios produzidos
por um problema interno dos medidores, que adicionam um termo de ± 216 na medicao
realizada e os transmite para o sistema de armazenagem de dados.
3.6 Variaveis da Secao da Saıda
O grupo de variaveis da saıda do processo representa o conjunto de informacoes que
representam o produto final gerado pelo processo. Fisicamente esses dados sao gerados
nos equipamentos que concluem o processo. As variaveis registradas sao:
• Numero da BF na Saıda - usado para identificar a bobina atual, nesta etapa do
processo. E formado por um numero de 8 caracteres, exclusivo para cada bobina.
• Velocidade na Saıda - velocidade atingida no processo de bobinamento da tira de
aco. Geralmente seu valor e diferente da velocidade na secao do centro da linha de
producao. A variavel tambem e informada em metros por minuto (mpm);
• Comprimento da BF na Saıda - valor calculado pela relacao ao numero de voltas
de um dos rolos tensores do processo e seu diametro externo, dada em metros;
• Largura da BF na Saıda - valor medido atraves do deslocamento do conjunto
aparador de bordas da tira, conhecido como Tesoura Lateral. A posicao do con-
junto e medida por meio do deslocamento do equipamento mecanico e informado
para o PLC. A variavel e informada em milımetros (mm);
3.6 Variaveis da Secao da Saıda 40
Figura 3.7: Dados do medidor de energia do Transformador TR1 em fevereiro de 2012
• Espessura da BF na Saıda - valor medido atraves do medidor de camadas, adicio-
nando a espessura da entrada as camadas superior e inferior depositadas no processo.
A variavel e informada em milımetros (mm);
Uma guilhotina, instalada na secao de saıda do processo permite que uma BF seja sec-
cionada em diversas partes de acordo com as especificacoes do cliente. Em diversos casos
a bobina processada pode ser dividida em varias outras que possuirao uma nova numera-
cao nao relacionada diretamente com a bobina geradora. Esse fato interfere diretamente
no modelo desenvolvido, uma vez que as componentes necessarias para a identificacao
desse evento nao foram consideradas durante o levantamento dos dados. Motivado pela
falta de uma correspondencia entre essas bobinas, disponıbiblizado nesse sistema de co-
leta de dados, as informacoes relativas a essas bobinas em especial serao descartados.
Para a pesquisa pela ocorrencia destes eventos considerou-se a concatenacao dos registros
de processo nas secoes de centro e saıda. Somente sao consideradas validas as bobinas
que possuırem o numero de BF presente nos dois conjuntos. Os casos diferentes foram
automaticamente excluıdos. A quantidade de bobinas consideradas na secao de saıda e
constatada na Tabela 3.1.
Conforme pode ser observado na Tabela 3.1, a quantidade de BF uteis para o treinamento
da rede foi reduzido em relacao a quantidade de bobinas processadas. Diversas bobinas
que foram disponibilizadas para os clientes foram originadas da divisao de bobinas maiores,
3.7 Aquisicao dos dados 41
Tabela 3.1: Dados de BF na saıda coletados.
Mes Qt. Incial BF utilfevereiro 509 346marco 695 475abril 562 322maio 703 403junho 589 443julho 460 341
inseridas no inıcio da linha de producao. Pela falta de informacoes para correlacionar as
partes que formavam um conjunto de bobinas derivadas da bobina primaria, estes dados
foram descartados, para o presente trabalho.
3.7 Aquisicao dos dados
Os dados do processo foram coletados pelo sistema integrado de informacoes, PIMS (Pro-
cess Information Managment System), da planta da Galvanizacao Eletrolıtica. As va-
riaveis coletadas por meio do PIMS sao submetidas a um algoritmo de aquisicao com
periodicidade diferenciada para cada elemento. O armazenamento das informacoes no
banco de dados e controlado individualmente, buscando manter a integridade dos dados.
No sistema avaliado o intervalo entre a leitura das amostras dos dados foi definido em 1
minuto. Como os perıodos de amostragem, nos equipamentos e sensores, sao diferentes e
o volume de informacoes e elevado, um algoritmo de compactacao dos dados foi aplicado.
No algoritmo de compactacao de dados aplicado no PIMS, ao surgir um novo valor para
a variavel, e avaliada a condicao de excecao deste valor. As condicoes basicas para se
verificar uma excecao sao: ultrapassar os limites de desvio da excecao ou ultrapassar o
limite maximo do tempo para a excecao. Caso o valor atenda a essas exigencias, este se
torna uma nova amostra. Os valores atual e anterior transformam-se em novas amostras
selecionadas, entao submetidas a um algoritmo de compressao. O teste de compressao
avalia os parametros de desvio de compressao, normalmente em 2% do valor de nomi-
nal de ajuste da variavel, e tempo de compressao, ajustavel conforme o comportamento
da variavel. Caso algum valor entre o ultimo evento arquivado e a valor atual estiver
fora da faixa delimitada, este valor viola o teste de compressao. Assim este novo valor
tambem sera armazenado no banco de dados relacional do sistema. Essa estrategia de
compactacao dos dados promove o armazenamento de uma elevada quantidade de dados,
consumindo uma quantidade relativamente pequena de espaco de memoria para os bancos
de dados, conforme apresentado no manual de treinamento do software OSIsoft, escrito
3.7 Aquisicao dos dados 42
por Joao Netto (2008).
Quando os dados sao pesquisados no PIMS, sua estrutura de banco de dados relacional
permite a exibicao em diversos perıodos de amostragem. Para os eventos onde os dados
basicos nao sao amostrados, o sistema proporciona uma resposta com um valor interpolado
para o intervalo solicitado.
No proximo capıtulo serao apresentados os metodos empregados para o pre-tratamento
das variaveis coletadas em cada uma das secoes do processo e utilizadas no trabalho.
Capıtulo 4
Materiais e Metodos
4.1 Preparacao dos Dados
Os dados coletados em cada uma das secoes da linha de producao necessitaram de um
pre-processamento para eliminacao de informacoes espurias. Tambem foi requerida a
aplicacao de algumas heurısticas para viabilizar o treinamento da rede neural e obter
resultados consistentes com o comportamento fısico do processo.
4.1.1 Tratamento das Variaveis de Medicao de Energia
Um erro nas medicoes registradas para as variaveis de energia eletrica foi causado por
um fator interno ao medidor, que adiciona em varios pontos aleatorios um componente
na ordem de grandeza de ±216, como exposto anteriormente na figura 3.7. Inicialmente
para eliminar este problema, removeu-se a componente identificada na amostra danificada.
Como a componente espuria soma-se a energia consumida neste perıodo, o erro e ampli-
ficado. A solucao obtida para a situacao foi a aplicacao do metodo de interpolacao das
medicoes, observando-se os valores anterior e posterior ao da amostra identificada como
incorreta. A Figura 4.1 exibe um evento onde uma componente de valor aproximado de
−216 e adicionado na medicao de energia, para uma amostra especıfica evidenciada pelo
ponto a.
A simples retirada deste pico de amplitude negativa, considerando o valor constante,
provoca um decrescimo na curva e consequentemente um terceiro valor com erro. A
interpolacao considerando as duas amostras vizinhas melhora a representacao fısica do
comportamento da energia eletrica empregada no processo, mitigando o erro gerado. A
Figura 4.2 apresenta uma vista amplificada do ponto registrado a, onde a correcao foi em-
4.1 Preparacao dos Dados 44
Figura 4.1: Erro causado pelo medidor
pregada para a mesma amostra exibida pela Figura 4.1. Nesse exemplo o valor amostrado
para o ponto a, da Figura 4.1, e de −65133 kWh. Eliminando o erro inserido de −216 a
medida no ponto b, da figura 4.2, e de 304 kWh. Aplicando a interpolacao proposta o
valor obtido para o ponto c, da figura 4.2, torna-se 405 kWh, para as amostras anterior
de 403 kWh e posterior de 407 kWh.
Figura 4.2: Aplicacao de interpolacao nos dados medidos
O valor aplicado em substituicao ao corrompido foi determinado pela equacao:
4.1 Preparacao dos Dados 45
Energia(K) =Energia(K+1) + Energia(K−1)
2(4.1)
Aplicou-se este metodo para todas as variaveis de medicoes de energia, resultando em
um comportamento fisicamente coerente com o esperado. Isto e, a energia acumulada
dentro de um perıodo definido deve sempre ser superior a anterior e nao pode conter os-
cilacoes depreciativas. O resultado alcancado e demonstrado na figura 4.3, representando
as energias medidas nos transformadores TR1 e TR2 e nos consumidores ETEG e Usiroll.
Observa-se que, devido aos pontos onde a energia medida atual, Energia(K+1), e inferior
a medida no instante imediatamente anterior, Energia(K−1), e produzido um valor de
energia consumida negativo. Desta forma a integracao da energia consumida se torna
inferior ao que foi realmente executado. Este ponto em especial, sem as devidas correcoes
influencia diretamente no resultado do processo de treinamento e validacao da rede neural.
Figura 4.3: Amostras de Energia Medida (-), Amostras de Energia Corrigida por interpolacao(- -), fevereiro de 2012
Com os dados de energia coletados nos medidores tratados, a energia utilizada no pro-
cesso de eletrogalvanizacao pode ser corretamente calculada de acordo com a equacao 3.1,
apresentada anteriormente e que nao sofre a necessidade de alteracoes.
4.2 Tratamento das Variaveis do Processo 46
4.2 Tratamento das Variaveis do Processo
Cada bobina possui caracterısticas proprias e por meio de algumas heurısticas foram
delimitados valores para diferenciar dados nulos de dados validos.
Como os dados foram coletados com uma taxa de amostragem fixa, de 1 minuto, os
valores dessa variavel se repetiam constantemente durante o perıodo de processo da mesma
bobina. Para determinar o numero da BF processada foi realizada a comparacao entre o
primeiro valor registrado, no vetor correspondente a variavel, e sua presenca entre todos os
demais valores armazenados no mesmo vetor. Encontrando o valor semelhante, computou-
se o numero de repeticoes, com o objetivo de determinar as dimensoes maximas da matriz
para armazenamento das demais variaveis relacionadas ao processo dessa bobina. Uma
vez encontrada a referencia da BF e armazenada, este valor foi eliminado do vetor de
pesquisa e entao reiniciada uma nova busca.
Analisando os dados verificou-se que, em alguns casos, certos numeros de BF repetiam-se
em demasia. Este fato ocorreu com algumas BFs por uma razao operacional. Devido a
necessidade de o processo ser interrompido periodicamente, o material imerso na solucao
eletrolıtica e sobrecarregado e se torna inadequado para a comercializacao. Para minimizar
estas perdas, algumas BFs sao usadas como materiais de sacrifıcio para permanecerem
imersas durante o intervalo de parada e consequentemente elevam o perıodo de sua per-
manencia no processo. Outro fator que incrementa esse valor e a repeticao ilimitada
da utilizacao desse recurso e reducao da quantidade de BFs disponıveis para esta finali-
dade. Como pre-tratamanto para a eliminacao dos dados espurios, encontrados no vetor
representativo da variavel numero da bobina, a analise da Distancia de Mahalanobis foi
empregada.
A Distancia de Mahalanobis avalia o quao distante um ponto de observacao esta em relacao
ao valor medio da variavel avaliada, como desmonstrado por Maesschalck et al. (2000).
Um resumo, expressando a quantidade dos dados coletados mensalmente e apresentado
na Tabela 4.1.
Inicialmente a quantidade total de informacoes registradas atingiu um volume de 256.386
linhas de dados. Analisando estes dados em relacao a distancia de Mahalanobis, na
primeira etapa formam eliminados basicamente as informacoes relacionadas com os pro-
cessos onde foram utilizadas as bobinas de sacrifıcio, totalizando uma retirada de 128.834
linhas de dados. A segunda etapa de selecao dos dados foi necessaria para a eliminacao
das informacoes relacionadas ao processo de bobinas onde ocorreram falhas nos equipa-
mentos do processo produtivo, tais como falhas mecanicas, eletricas e falta de energia
eletrica da concessionaria, gerando a necessidade de descarte do material. Nesta condicao
foram encontradas 14.094 linhas de dados e que tambem foram removidas, resultado em
4.2 Tratamento das Variaveis do Processo 47
Tabela 4.1: Dados inciais coletados.
Linhas 1a Etapa 2a Etapa Linhas BobinasMes de dados de selecao de selecao Resultantes uteis
Fevereiro 40.381 21.331 1.323 17.727 542Marco 43.201 19.943 1.398 21.860 736Abril 41.761 19.943 4.260 15.301 613Maio 43.201 19.943 2.200 20.442 742Junho 43.201 20.227 2.622 20.352 634Julho 44.641 27.447 2.291 14.903 489Total 256.386 128.834 14.094 110.585 3.756
um total de 110.585 linhas de dados. Por fim, com a selecao do numero de bobinas no
universo dos dados resultantes foram regitrados os processos de 3.756 bobinas na secao
de saıda.
4.2.1 Tratamento das Variaveis da Secao do Centro
Na secao do centro, que comporta os equipamentos destinados ao processo de eletro-
galvanizacao da tira de aco, as variaveis disponibilizadas para coleta de dados foram as
seguintes :
• Numero da BF na secao do centro - valor unico para cada bobina;
• Velocidade do processo no centro - valor medio obtido em todas as observacoes de
velocidade da secao do centro da referida BF;
• Densidade da camada inferior adicionada - valor medio obtido em todas as obser-
vacoes de Densidade da camada inferior adicionada da referida BF;
• Densidade da camada superior adicionada - valor medio obtido em todas as obser-
vacoes de Densidade da camada superior adicionada da referida BF;
• Energia do TR1 - valor obtido entre os instantes de inıcio e termino do processo
da referida BF;
• Energia do TR2 -valor obtido entre os instantes de inıcio e termino do processo da
referida BF;
• Energia da ETEG - valor obtido entre os instantes de inıcio e termino do processo
da referida BF;
• Energia da Usiroll - valor obtido entre os instantes de inıcio e termino do processo
da referida BF;
A forma como estas informacoes foram apresentadas incialmente para a coleta de dados
e apresentada na Tabela 4.2.
4.2 Tratamento das Variaveis do Processo 48
Tabela 4.2: Coletas de Dados Primarios na Secao do Centro.
Numero Velo- Camada Camada Energia Energia Energia EnergiaBF cidade Inferior Superior TR1 TR2 ETEG Usiroll
(mpm) (g/m2) (g/m2) (kW/h) (kW/h) (kW/h)) (kW/h)13923317 80 24,57 24,00 9003234 8944731 204478 53095613923317 80 23,91 27,00 9003282 8944777 204479 53095913923317 90 23,25 25,29 9003652 8945148 204480 53096213923317 89 60,36 60,23 9004104 8945601 204482 53096413923317 88 58,09 59,55 9004566 8946053 204483 53096713923317 22 55,23 61,29 9004945 8946439 204484 53096913923317 21 55,15 59,58 9004945 8946440 204485 53097213923317 21 59,06 62,00 9004946 8946440 204487 53097413923317 79 58,19 62,17 9004949 8946445 204488 53097713923317 89 59,14 62,00 9005420 8946914 204489 53097913923317 88 57,28 64,00 9005899 8947397 204490 53098113923317 87 56,77 63,38 9006393 8947883 204491 53098413932399 82 62,58 70,22 9833583 9768643 226763 58911013932399 81 70,00 69,80 9834074 9769144 226764 58911313932399 107 79,53 51,89 9834584 9769647 226766 58911513932399 115 44,00 43,75 9835360 9770434 226767 58911813932399 18 48,16 50,97 9835715 9770789 226768 58912113932399 17 46,49 50,95 9835715 9770789 226769 58912313932399 22 44,14 42,87 9835716 9770790 226771 58912613932399 36 43,65 49,80 9835716 9770790 226772 58912813932399 105 48,18 53,00 9836291 9771367 226773 58913113932399 81 55,67 56,75 9836915 9771995 226774 58913413932399 80 36,00 41,75 9837540 9772621 226775 58913614009238 80 57,76 53,34 11091000 10967496 253161 64506214009238 81 53,39 52,76 11091020 10967521 253163 64506414009238 81 51,28 54,05 11091020 10967521 253164 64506714009238 82 66,64 65,13 11091020 10967521 253165 64506914009238 87 59,00 65,48 11091020 10967521 253167 64507014009238 86 57,84 64,34 11091020 10967521 253168 64507214009238 86 63,02 61,29 11091020 10967521 253169 64507414009238 25 59,01 65,27 11091020 10967521 253171 64507514009238 25 56,76 62,11 11091021 10967521 253172 64507714009238 24 64,41 66,00 11091021 10967522 253173 64507914009238 87 56,29 64,00 11091021 10967522 253174 64508014009238 87 59,44 67,00 11091021 10967522 253176 64508214009238 87 67,38 62,90 11091021 10967522 253177 64508414009238 87 56,71 62,62 11091021 10967522 253178 645085
4.2 Tratamento das Variaveis do Processo 49
Nessa tabela sao exemplificados os dados de 3 bobinas, que foram processadas na regiao
do centro, com os valores registrados em cada instante de amostragem. O objetivo de
apresentar os dados coletados nesta tabela e salientar as diferencas presentes no processo
de cada bobina, levando em consideracao a quantidade de amostras, a ordem de grandeza,
e a variacao entre os valores incial, intermediario e final de cada variavel. Para a primeira
BF, foram registrados 12 amostras, para a segunda 11 e para a ultima, 14. Considerando
que cada evento de amostragem possui um intevalo fixo de 1 minuto, pode-se afirmar que
o tempo de processo de uma bobina e determinado pela quantidade de amostras desta
bobina, assim as bobinas citadas na tabela foram processadas em 12, 11 e 14 minutos
respectivamente.
Em funcao dos valores de energia registrada pelos medidores dos circuitos TR1, TR2,
ETEG e Usiroll e a aplicacao da equacao 3.1 torna-se possıvel o calculo da energia solici-
tada para o processo da bobina, definida como EProcesso. Como foi citado anteriormente,
os medidores de energia eletrica instalados apresentam erro de registro e armazenamento
dos dados durante as aquisicoes realizadas. Com a funcao de se avaliar os resultados
de correlacao entre as variaveis e os resultados do treinamento da rede neural a variavel
EProcesso, gerou duas novas variaveis, sendo estas a Energia Ativa Medida e Energia Ativa
Calculada. A primeira variavel comporta os dados originais, contendo todos os erros de
medicoes regitrados pelos medidores. A segunda variavel resulta do pre-processamento da
primeira, submetido ao procedimento descrito na Secao 4.1.1.
A variavel que registra a corrente eletrica disponibilizada para o processo, foi denominada
Corrente Eletrica Total Aplicada, e representa a corrente eletrica disponibilizada pelos 40
retificadores instalados nas celulas galvanicas, para o processo de eletrogalvanizacao.
Com a geracao destas variaveis, o grupo que representa o comportamento do processo na
secao do centro se transforma no seguinte:
• Numero da BF na secao do centro;
• Velocidade do processo no centro;
• Densidade da camada inferior adicionada;
• Densidade da camada superior adicionada;
• Corrente eletrica total aplicada - valor de somatorio, obtido em todas as observacoes
de Corrente eletrica total aplicada aos retificadores das celulas galvanicas, durante
o processo da referida BF;
• Energia ativa calculada - valor da diferenca entre o ultimo e o primeiro registro de
Energia Ativa Calculada, durante o processo da referida BF;
• Energia ativa medida- valor da diferenca entre o ultimo e o primeiro registro de
Energia Ativa Medida, durante o processo da referida BF;
4.2 Tratamento das Variaveis do Processo 50
A Tabela 4.3 apresenta os valores obtidos para as BF citadas anteriormente, e que foram
empregados neste trabalho.
Tabela 4.3: Dados primarios calculados na Secao do Centro.
Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Velocidade mpm 69,39 67,63 71,72Camada Inferior g/m2 49,24 52,58 59,20Camada Superior g/m2 52,54 52,88 61,87Corrente Retificadores kA 5.755 5.545 6.058Energia Calculada kW/h 6.269,64 7.897,06 2,31Energia Medida kW/h 6.269,64 7.897,06 6,21Tempo Processo minutos 12 11 14
4.2.2 Tratamento das Variaveis da Secao da Saıda
Na secao de saıda, estao instalados os equipamentos destinados a mensurar quantitativa-
mente os resultados do processo de eletrogalvanizacao. As variaveis disponibilizadas para
a aquisicao das informacoes do processo, nesta secao, foram as seguintes:
• Numero da BF na secao de saıda - valor unico para cada bobina;
• Comprimento da BF - valor obtido em um acumulador de comprimento, calculado
em funcao do diametro calibrado de um rolo, instalado em um ponto estrategico do
processo;
• Largura da BF - valor obtido atraves da media das medicoes da posicao de abertura
entre as laminas laterais da tesoura rotativa. Cuja funcao e adequar a largura final
do material as especificacoes tecnicas do consumidor final;
• Espessura da BF - valor obtido atraves da media das medicoes do medidor de ca-
madas;
• Tempo de Processo da BF - valor calculado em funcao do numero de amostras
coletados para cada BF;
• Peso da BF - valor calculado durante o processo;
O peso do produto final e calculado em funcao de parametros medidos durante o pro-
cessamento do material, de forma dinamica, como apresentado na expressao 4.2. Esta e
uma informacao com elevado grau de confiabilidade, pois os seccionamentos do material
determinados pela especificacao do cliente sao executados em funcao de sua observacao e
conferidos posteriormente em um balanca aferida e certificada.
4.2 Tratamento das Variaveis do Processo 51
PesoBF (Kg) = Comprimento(m) ∗Largura(m) ∗Espessura(m) ∗ 7.850(Kg/m3) (4.2)
em que a constante 7.850(Kg/m3) refere-se ao peso especıfico para o aco.
O comprimento da bobina tem seu valor determinado dinamicamente durante o processo,
dependendo de algumas condicoes do processo para iniciar e encerrar o registro desta
medicao. Seu valor e reinicializado instantaneamente apos o evento de seccionamento da
tira pela guilhotina, instalada nesta secao, indicando o inıcio de um novo produto.
A Tabela 4.4 exibe a maneira como essas informacoes sao disponibilizadas inicialmente.
Com o intuito de manter as visualizacoes das informacoes das bobinas, de forma sim-
ples, os dados apresentados nesta tabela referem-se ao mesmo grupo de bobinas citados
anteriormente.
E possıvel observar que, a velocidade da secao de saıda alcanca valores nulos sem prej-
udicar o produto final. Este fato se da pela necessidade operacional de se inspecionar
superficialmente o material produzido.
As tesouras laterais sao um equipamento, cuja finalidade e adequar a variavel largura
as especificacoes do cliente. Por esta caracterıstica, neste equipamento sao instalados
sensores de posicao com elevada precisao e confiabilidade. Porem existem casos onde
o material processado nao e submetido a acao deste equipamento. Nesta situacao, as
laminas das tesouras laterais sao recolhidas para a posicao inicial e o valor de largura
informado para o PLC e mantido constante em 3.856 mm. Sabendo-se que a largura
maxima nominal dos produtos executados na linha de eletrogalvanizacao da Usiminas e
limitada em 1.650 mm, foi elaborado um filtro que eliminou as ocorrencias onde a largura
informada ao PLC se tornasse superior a este valor.
Observou-se que frequentemente, no intervalo compreendido entre a conclusao do processo
de uma bobina e a preparacao para o processo da seguinte, acontece reposicionamento
de equipamentos como a tesoura lateral. Este fato provoca uma falha de sincronismo no
registro dos eventos, e o ultimo registro de largura de uma bobina assume o valor setado
da proxima bobina. No processo real nao existem mudancas drasticas para esta variavel,
como pode ser observado nos ultimos registros de largura de cada bobina da tabela 4.4.
Contudo, como todos os dados de determinadas bobinas formam excluıdos por algum
motivo descrito previamente, muitas vezes e difıcil validar esta informacao atraves apenas
da avaliacao dos dados.
A Tabela 4.5, exprime o resultado dos calculos e amostragens executadas para as variaveis
da secao de saıda, empregados neste estudo. Pode-se verificar que devido aos valores das
4.2 Tratamento das Variaveis do Processo 52
Tabela 4.4: Coletas de dados primarios na Secao de Saıda.
Num. BF Velocidade Comprimento Largura Espessura(mpm) (m) (mm) (mm)
13923317 48 25,08 1255 1,5013923317 0 73,45 1255 1,5113923317 0 126,50 1255 1,5213923317 2 145,83 1256 1,5113923317 155 250,46 1256 1,5213923317 155 398,58 1257 1,5113923317 76 520,43 1257 1,5213923317 83 607,34 1258 1,5113923317 77 694,25 1258 1,5113923317 124 788,15 1258 1,5013923317 5 866,48 1681 1,5113923317 0 883,94 2308 1,9813932399 105 22,26 1523 1,7313932399 81 90,44 1522 1,6713932399 80 282,69 1522 1,6913932399 81 387,46 1522 1,6913932399 82 436,95 1522 1,6713932399 99 557,10 1522 1,6813932399 103 688,73 1521 1,6913932399 104 715,53 1308 1,6914009238 49,99 25,10 1005,20 1,1914009238 140,10 92,35 1005,20 1,1914009238 43,42 206,75 1005,20 1,1914009238 18,99 250,01 1005,20 1,2014009238 91,00 303,38 1005,20 1,2014009238 85,31 387,93 1005,20 1,2114009238 85,99 472,47 1005,20 1,1914009238 88,21 557,02 1005,20 1,1914009238 76,51 641,57 1005,20 1,1914009238 83,05 726,11 1005,20 1,2014009238 87,24 810,66 1005,20 1,1914009238 86,51 895,21 1005,20 1,1814009238 60,05 979,75 1005,20 1,1914009238 -0,21 998,96 1675,30 1,22
4.2 Tratamento das Variaveis do Processo 53
Tabela 4.5: Dados primarios calculados na Secao da Saıda.
Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Comprimento m 883,93 715,53 998,96Largura mm 1.379,51 1.495,00 1.053,06Espessura mm 1,55 1,69 1,19Peso kg 14.842,06 14.185,42 9.890,91Tempo de processo minutos 12 11 14
variaveis comprimento, largura e espessura serem apresentados com valores decimais, o
peso por ser calculado, tambem e expresso desta forma. Por se tratar de uma variavel de
dimensoes elevadas, sempre na ordem de milhares de kg, um erro da ordem de 20 kg e
aceitavel para o cliente.
4.2.3 Variaveis para a Rede Neural
A concatenacao dos dados adquiridos nas secoes do centro e da saıda, fornece todas as
informacoes sobre o processo de eletrogalvanizacao para o procedimentos de treinamento e
validacao da rede neural. A tabela 4.6, exibe um exemplo dos dados que foram produzidos
nos processos citados anteriormente neste capıtulo, reunidos em um unico conjunto.
Tabela 4.6: Dados de bobinas calculados nas Secoes do Centro e Saıda.
Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Comprimento m 883,93 715,53 998,96Largura mm 1379,51 1495,00 1053,06Espessura mm 1,55 1,69 1,19Peso kg 14842,06 14185,42 9890,91Velocidade Processo mpm 69,39 67,63 71,72Camada Inferior g/m2 49,24 52,58 59,20Camada Superior g/m2 52,54 52,88 61,87Corrente Retificadores kA 5.755.716 5.545.608 6.058.629Energia Calculada kW/h 6269,64 7897,06 2,31Energia Medida kW/h 6269,64 7897,06 6,21
Para este trabalho a rede neural foi construıda com as seguintes variaveis de entrada:
• Comprimento da BF ;
• Largura da BF ;
• Espessura da BF ;
4.2 Tratamento das Variaveis do Processo 54
• Peso total da BF ;
• Velocidade do processo no centro ;
• Densidade da camada inferior adicionada;
• Densidade da camada superior adicionada ;
• Corrente eletrica total aplicada;
A variavel Numero de BF, e empregada como um identificador para as bobinas, aplicado
para o rastreamento destas nos processos produtivos da empresa. Por este motivo, foi
empregada apenas como referencial para o agrupamento das variaveis realmente impor-
tantes ao processo, nao e importante para o desenvolvimento da rede neural. Assim seus
dados nao foram aplicados no desenvolvimento da rede neural.
A resposta emitida atraves da variavel de saıda a ser informada pela rede neural sera
comparada observando sua relacao a variavel Energia calculada. O erro existente entre a
resposta da rede e essa variavel tornou-se o balizador para o desenvolvimento da RNA.
Os resultados obtidos durante o desenvolvimento do processo de geracao, treinamento,
ajustes e validacao da rede neural sao apresentados no proximo capıtulo.
Capıtulo 5
Resultados e Analise
Os dados coltados no perıodo compreendido entre os meses de fevereiro e julho do ano de
2012 apresentaram variacoes relevantes no que se refere a energia eletrica consumida. As
correlacoes entre os dados registrados nas variaveis de entrada e saıda para o treinamento
da rede neural apresentaram-se extremamente divergentes. Tornou-se necessaria uma
estimativa dos valores de energia eletrica para suprimir os erros oriundos dos medidores
de energia dos respectivos circuitos. Referenciando os dados amostrados no processo,
em funcao das energias medida e estimada, observou-se que o sucesso do treinamento e
validacao da rede neural dependeu diretamente da mitigacao nos erros embutidos durante
a coleta dos dados.
A correlacao existente entre os dados de entrada e saıda da rede, para os casos de energia
medida e estimada sao discutidos a seguir. Sequencialmente sao apresentados os resultados
de treinamento e validacao da rede para cada mes individualmente, observando os mesmos
dados de energia dos dois casos.
Sao apresentrados os resultados com variacao do numero de neuronios nas camadas ocul-
tas, variacao do numero de epocas de treinamento e os parametros selecionados para o
treinamento da rede. Por fim, e apresentado o resultado do treimento da melhor rede
neural obtida com os dados de energia eletrica calculada.
5.1 Correlacao entre os Dados do Processo
As informacoes sobre o sistema de medicao de energia para os meses de fevereiro a julho
do ano de 2012 foram coletados e sao apresentadas na Figura 5.1. Observa-se que em
todos os meses estao presentes valores negativos para a energia registrada. Considerando
que o sistema avaliado nao possui equipamentos para a geracao de energia eletrica, este
5.1 Correlacao entre os Dados do Processo 56
comportamento e fisicamente impossıvel. A unica resposta plausıvel sao os incrementos
de erros de medicao e armazenagem, como descrito na Secao 4.1.1.
Para este conjunto de dados foram avaliadas as correlacoes existentes entre as variaveis
de entrada a serem empregadas para o treinamento da rede e a resposta que a rede devera
fornecer, ou seja a energia medida pelo processo. A funcao de correlacao linear entre
cada uma das variaveis de entrada e a energia eletrica medida esta expressa na Tabela
5.1. Segundo o criterio descrito por Lira (2004), nenhum valor obtido apresentou uma
correlacao com conceito considerado melhor do que ”fraca”, ou seja, todos os valores estao
compreendidos entre 0,00 a 0,29, observando sobre o ponto de vista de modulo para os
resultados.
A apresentacao destes resultados para a rede neural causaram grandes problemas de con-
vergencia dos algoritmos de treinamento. Isto se deve ao fato de que muitos exemplos
de treinamento com valores das variaveis de entrada semelhantes, dispunham de valores
totalmente divergentes para a energia eletrica medida empregada no processo.
As tecnicas descritas nos capıtulos anteriores, como a identificacao dos dados espurios
pela Distancia de Mahalanobis, substituicao destes valores por outros interpolados e as
heurısticas para determinacao do peso e largura das tiras de aco, foram empregadas.
Com esta acao praticamente todos os dados que poderiam ser considerados ruidosos para
Figura 5.1: Energia medida no perıodo de fevereiro a julho/12
5.1 Correlacao entre os Dados do Processo 57
o processo de treinamento da rede neural foram eliminados.
Baseando neste resultado, a Figura 5.2 representa o comportamento da energia estimada
para o processo para o mesmo perıodo, ou seja entre fevereiro e julho de 2012. Deve ser
evidencido que nao existem valores negativos para a energia empregada no processo em
nenhum dos meses representados.
Figura 5.2: Energia estimada no perıodo de fevereiro a julho/12
Avaliando novamente a correlacao existente entre as variaveis de entrada e, neste mo-
Tabela 5.1: Correlacao linear em relacao a Energia Eletrica Medida.
Mes Amostra Fev Mar Abr Mai Jun JulVelocidade Processo 0,1069 0,0873 −0,0423 0,0800 0,0527 −0,0974Densidade Inferior 0,0070 −0,0503 0,0086 0,0021 −0,0199 0,1025Densidade Superior 0,0322 −0,0331 0,0255 −0,0348 −0,0553 0,0837Corrente Eletrica 0,0841 0,0209 0,1099 0,1473 0,0532 0,0837Comprimento 0,0731 0,1251 0,0778 0,1579 0,0637 0,0303Largura −0,0471 −0,0881 0,0514 0,1022 −0,0404 0,0232Espessura −0,0631 −0,0057 −0,0895 −0,1905 −0,0915 0,0156Peso 0,0302 0,1445 0,0298 0,1012 0,2680 0,0726Tempo de processo 0,0458 0,0198 0,1111 0,0875 −0,0575 0,0760
5.2 Resultados do Treinamento da Rede Neural 58
mento, a energia eletrica corrigida empregada no processo, os resultados sao consideravel-
mente distintos. A Tabela 5.2, exibe os resulados dos calculos executados. Em diversos
pontos a funcao de correlacao linear entre a variavel Corrente eletrica e a energia empre-
gada no processo apresenta o conceito ”forte”. Em poucos exemplos isolados o conceito
de correlacao ”fraca” e encontrado, e o sentido da correlacao e alterado, como apresentado
anteriormente na Tabela 2.3.
Tabela 5.2: Correlacao linear em relacao a Energia Eletrica Estimada.
Mes Amostra Fev Mar Abr Mai Jun JulVelocidade Processo −0,1227 −0,0451 0,1922 −0,2178 0,0171 0,0870Densidade Inferior 0,3655 0,0466 −0,1131 0,4493 0,3474 0,3377Densidade Superior 0,4049 −0,0024 0,1313 0,4279 0,3620 0,3781Corrente Eletrica 0,6198 0,2821 0,5246 0,4302 0,7226 0,5491Comprimento 0,2834 0,1936 0,4848 0,1930 0,3652 0,3616Largura 0,5018 0,1159 −0,0154 0,4578 0,4023 0,2461Espessura −0,1537 −0,2297 −0,2526 −0,0590 −0,2420 −0,0740Peso 0,4542 0,1066 0,3731 0,3976 0,4865 0,4708Tempo de processo 0,3453 0,3149 0,4908 0,2171 0,4857 0,3666
Em funcao da aquisicao destas informacoes sobre a correlacao entre os dados de entrada
e saıda do processo, estas sao as variaveis que melhor representam o comportamento
do processo. Com a aplicacao destes dados foram alcancados melhores resultados nas
etapas de treinamento da rede neural quando comparados com os resultados empregando
a energia eletrica medida. Nesta condicao a convergencia dos algoritmos tanto para o
treinamento quanto para a validacao foram atingidas.
5.2 Resultados do Treinamento da Rede Neural
O treinamento da rede neural, contemplando todos os dados do interlavo compreendido
entre os meses de fevereiro e julho de 2012, solicitou um grande perıodo de tempo para
processamento. Os resultados obtidos nao foram satisfatorios e apresentaram um erro
considerado elevado durante as etapas de treinamento e validacao da RNA. Considerando
a possibilidade de apresentacao por partes das informacoes para a rede, foram realizados
treinamentos com os dados em perıodos mensais e avaliacao dos seus resultados. Os dados
apresentados compreenderam tanto as informacoes da energia eletrica medida no processo
quanto a energia eletrica corrigida empregada.
5.2 Resultados do Treinamento da Rede Neural 59
5.2.1 Determinacao dos Parametros da Rede Neural
A configuracao da rede neural requer atencao e cuidados especiais durante o desenvolvi-
mento do modelo. A determinacao dos parametros que a compoem nao seguem regras
bem definidas, como descrito anteriormente em varios trabalhos. A busca pelos melhores
resultados e norteada pela avaliacao contınua dos resultados.
No presente trabalho, os seguintes parametros foram ajustados:
• Algoritmo de treinamento, alternando entre os algoritmos do tipo backpropagation
de Levenberg-Marquardt (trainlm), Gradiente Conjugado Decrescente (trainscg) e
Gradiente descendente com momento e taxa de aprendizado adaptativa (traingdx);
• Numero de neuronios na camada oculta, alternando entre os valores de 7, 12 e 18
neuronios. Estes valores foram selecionados do conjunto de possibilidades demon-
strado por Balestrassi et al. (2009) e Wei e Xing-yang (2011), descritos na secao
2.1.4;
• Numero de camadas ocultas, alternando entre 1 e 2 camadas ocultas;
Os parametros erro meta e numero de epocas de treinamento foram mantidos constantes
em 0,001 e 1000 respectivamente, bem como os conjuntos de dados de treinamento e
validacao. O primeiro objetivo e validar qual o melhor conjunto de parametros fornecera
o resultado mais adequado para a rede, observando os criterios determinados. Os criterios
para avaliacao destes resultados foram mensurados em razao do MSE e do coeficiente de
correlacao R2 entre os resultados fornecidos para os dados compreendidos no conjunto
de validacao da rede neural dados de validacao pela rede neural e o conjunto de dados
adquirido nas amostragens. Como referencia para a qualidade dos resultados, uma melhor
resposta implica em um valor de MSE o mais proximo possıvel de 0, enquanto que o
melhor coeficiente de correlacao acontece quando o resultado e o mais proximo possıvel
da unidade.
O primeiro grupo avaliado consiste da combinacao do treinamento da rede neural apli-
cando o algoritmo de Levenberg-Marquardt, e as variantes dos numeros de neuronios
presentes nas camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.3 exibe os
resultados para esta execucao.
As informacoes dispostas por este treinamento revelam que a combinacao de 18 neuronios
instalados em cada uma das duas camada ocultas produz o maior coeficiente de correlacao
(0,97138) entre os dados produzidos pela rede e os dados desejados como resposta. Porem
o erro medio obtido (0,0348) e um dos mais elevados de todo este conjunto. Observou-se
que o treinamento foi executado com rapidez, porem foi encerrado por atingir o valor
5.2 Resultados do Treinamento da Rede Neural 60
Tabela 5.3: Treinamento da RNA com Levenberg-Marquardt
Camadas Neuronios MSE R2
Ocultas Ocultos07 0,0059 0,92329
1 12 0,1166 0,9515818 0,1707 0,9679307 0,0379 0,96793
2 12 0,0189 0,9682418 0,0348 0,97138
maximo de erro aceitavel e nao pelo numero maximo de epocas de treinamento. Como
descrito por Silva (2010), o algoritmo de Levenberg-Marquardt e muito rapido e possui
grande precisao durante a convergencia, porem frequentemente converge para um ponto
de mınimo local e conclui o treinamento da rede neural. Por esta caracterıstica este
algoritmo foi avaliado e nao empregado para as etapas seguintes do trabalho.
O segundo grupo avaliado consiste da combinacao do treinamento com o algoritmo de
Gradiente Conjugado Decrescente, e as variantes dos numeros de neuronios presentes nas
camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.4 exibe os resultados
para esta execucao.
As informacoes dispostas para este treinamento revelam que novamente o melhor resul-
tado ocorre quando o numero de camadas de neuronios ocultos e maior, porem com um
numero menor de neuronios considerando a comparacao com o resultado disposto ante-
riormente. Neste exemplo, com apenas 12 neuronios nas camadas ocultas o coeficiente de
correlacao entre os valores desejados e os fornecidos pela rede neural foi o mais elevado,
atingindo 0,85095. Mas o valor do MSE alvancado foi de 0,0078, que nao foi o menor
entre os avaliados neste algoritmo. Conforme Goncalves (2011), a principal vantagem do
metodo do gradiente descendente e sua simplicidade. E a principal desvantagem e que
Tabela 5.4: Treinamento da RNA com Gradiente Conjugado Decrescente
Camadas Neuronios MSE R2
Ocultas Ocultos07 0,0077 0,77733
1 12 0,0075 0,7880218 0,0089 0,8027607 0,0083 0,78123
2 12 0,0078 0,8509518 0,0079 0,81956
5.2 Resultados do Treinamento da Rede Neural 61
a taxa de convergencia e fortemente dependente do problema. Analisando os resultados
obtidos pelos dois algoritmos, Levenberg-Marquardt e Gradiente Conjugado Decrescente,
o segundo apresenta respostas mais acertivas do que o primeiro, levando em consideracao
apenas os dois parametros avaliados ate o momento.
O ultimo grupo avaliado combina o treinamento com o algoritmo de Gradiente descendente
com momento e taxa de aprendizado adaptativa, e as variantes dos numeros de neuronios
presentes nas camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.5 exibe os
resultados para esta execucao.
Tabela 5.5: Treinamento da RNA com Gradiente descendente com momento e taxa de apren-dizado adaptativa
Camadas Neuronios MSE R2
Ocultas Ocultos07 0,0082 0,88115
1 12 0,0076 0,8811618 0,0068 0,8862807 0,0065 0,90252
2 12 0,0086 0,9109118 0,0072 0,94521
Conforme as informacoes exibidas na Tabela 5.5 para este treinamento os melhores resul-
tados em relacao ao MSE e ao R2 sao obtidos quando sao empregados 7 neuronios nas
duas camadas ocultas. Porem avaliando os resultados fornecidos pela rede neural com
18 neuronios empregados em uma unica camada, a diferenca entre as respostas e muito
pequena, sugerindo que esta arquitetura tambem possa fornecer uma boa representacao
para a modelagem do problema proposto.
Comparando os resultados entre os tres algoritmos, o Levenberg-Marquardt apresentou
o melhor ındice de correlacao entre as variaveis porem o erro medio quadratico e o mais
elevado entre eles. O algoritmo Gradiente Conjugado Decrescente com momento e taxa
de aprendizado adaptativa e o mais lento entre os testados, contudo forneceu um melhor
equilibrio nos resultados para os dois parametros avaliados. A analise das informacoes
dispostas nas tabelas 5.3 a 5.5 indicam que a melhor rede neural para os dados amostrados
sera construıda com a seguinte arquitetura:
• Numero de neuronios na camada de entrada, igual a 8, compreendendo as variaveis
descritas na Secao 4.2.3;
• Numero de neuronios na camada intermediaria, 18 neuronios ;
• Funcao de ativacao dos neuronios da camada intermediaria, tangente hiperbolica ;
5.2 Resultados do Treinamento da Rede Neural 62
• Numero de neuronio na camada de saıda, apenas 1 neuronio etimando a energia
eletrica necessaria ao processo para os dados informados na camada de entrada;
• Funcao de ativacao dos neuronios da camada de saıda, linear;
A definicao dos parametros de treinamento da rede foi realizada como:
• Algoritmo de treinamento da rede, Gradiente descendente com momento e taxa
de aprendizado adaptativa por apresentar os melhores resultados no treinamento
preliminar;
• Erro meta a ser alcancado, 0,001 ;
• Numero maximo para iteracoes, 10000 epocas de treinamento;
No treinamento da rede neural com o algoritmo de Gradiente descendente com momento
e taxa de aprendizado adaptativa os pesos de todas as conexoes sinapticas da rede neural
foram ajustados, com o objetivo de minimizar o erro de treinamento e consequentemente
tambem o erro cometido durante a etapa de validacao. Todo o conjunto de dados foi divi-
dido em duas partes distintas. A primeira parcela contem os dados para treinamento da
rede e comporta 80% do conjunto total de dados. A segunda parcela de dados foi destinada
a validacao do treinamento realizado contendo os 20% restantes do dados disponibilizados.
O algoritmo OBS(Optimal Brain Surgeon) foi empregado para realizar a eliminacao dos
pesos menos significtivos para o funcionamento da rede e ampliar a capacidade de gene-
ralizacao da rede neural. Nas primeiras execucoes do treinamento, ocorreram elevados
valores de erro na resposta da rede neural para os dados apresentados, visualizados prin-
cipalmente nas representacoes graficas. A avaliacao da correta execucao dos algoritmo de
validacao foi realizada produzindo um novo conjunto de dados para serem apresentados
a rede nesta etapa. Entao um conjunto contendo dados do grupo de treinamento com as
mesmas dimensoes do grupo de validacao foi aplicado ao algoritmo de validacao, denomi-
nado validacao/treinamento. A representacao do menor erro para este conjunto de dados
durante a validacao e o indicativo de que a rede processou os dados adequadamente.
5.2.2 Treinamento com Energia Eletrica Medida
Esta secao demonstra o comportamento da RNA para a aplicacao dos dados de energia
registrados pelos medidores sem nenhum tratamento. A ideia principal e mostrar que
mesmo com dados ruidosos e com baixa representatividade do comportamento do processo
as redes neurais artificiais sao capazes de fornecer respostas para a modelagem deste
processo. Contudo, as ferramentas de analise dos resultados determinam sua qualidade e
5.2 Resultados do Treinamento da Rede Neural 63
indicam a necessidade de atencao ao dados inseridos. A Figura 5.3, exibe os resultados
da rede para os dados do mes de Fevereiro/12. O primeiro grafico, na Figura 5.3-a,
exibe o comportamento do modelo para comparacao entre os dados respondidos pela
rede neural e os dados desejados durante a etapa de treinamento. Observa-se que em
muitos pontos a rede nao consegui assimilar o comportamento do sistema. No segundo
grafico, a Figura 5.3-b, apresenta a resposta do modelo para o conjunto de dados de
validacao. A comparacao entre a resposta produzida pela rede neural e os dados desejados
reafirmam o comportamento inadequado do modelo para os dados fornecidos. Por ultimo,
o grafico da Figura 5.3-c demonstra que mesmo inserindo os dados de treinamento, que
ja foram apresentados anteriormente a rede neural, para a etapa de validacao o modelo
nao conseguiu produzir uma boa resposta.
Figura 5.3: Respostas da rede neural com dados medidos de energia do perıodo de fevereiro/12
A resposta da rede neural para o conjunto de dados representando o mes de fevereiro,
esteve influenciada pelo comportamento do dados amostrados e nao pela arquitetura ou
parametros determinados para o desenvolvimento da rede. A validacao desta afirmativa foi
realizada substituindo o conjunto de dados apresentados para a rede neural pelo conjunto
representativo do mes de julho. Na Figura 5.4 observa-se que mesmo para um novo
conjunto de dados a resposta da rede para para as etapas de treinamento e validacao, tanto
com os dados somente de validacao como tamtem com o grupo treinamento/validacao
repete o comportamento descrito anteriormente e nao consegue modelar o processo.
5.2 Resultados do Treinamento da Rede Neural 64
Figura 5.4: Respostas da rede neural com dados medidos de energia do perıodo de junho/12
Os resultados das simulacoes da rede neural para todo o conjunto de dados compreendido
entre os meses de fevereiro a julho sao apresentados na Tabela 5.6. Sao apresentando
os valores obtidos para o MSE nos eventos de treinamento e validacao, tanto quando o
algoritmo de generalizacao foi utizado quanto este recurso nao foi empregado.
Tabela 5.6: Resultado do erro da RNA para os dados de energia eletrica medidos.
Fev Mar Abr Mai Jun JulTreinamento sem OBS 0,0303 0,0262 0,0292 0,0223 0,0079 0,0168Treinamento com OBS 0,0199 0,0268 0,0139 0,0097 0,0032 0,0059Validacao sem OBS 0,0303 0,0247 0,0358 0,0276 0,0109 0,0344Validacao com OBS 0,0512 0,0246 0,0601 0,0696 0,0133 0,0479
A avaliacao somente pelos valores de MSE nos eventos de treinamento e validacao nao
revelam a presenca dos problemas dados amostrados. Mesmo com valores aparentente
tao pequenos para o MSE nao refletem um comportamento considerado adequado para
solucoes fornecidas por uma rede neural. Em seguida sao abordados os resultados prove-
nientes da aplicacao dos dados de energia eletrica calculada para a mesma rede.
5.2 Resultados do Treinamento da Rede Neural 65
5.2.3 Treinamento com Energia Eletrica Calculada
Esta secao demonstra o comportamento da rede neural para a aplicacao dos dados de
energia eletrica calculada para os medidores apos os tratamentos propostos na Secao
4.1.1. Com a eliminacao dos dados espurios em todo o conjunto de dados para treina-
mento e validacao, as respostas fornecidas pela rede neural representaram de maneira mais
adequada o modelamento do processo. A Figura 5.5 exibe o resultado do treinamento da
rede para os dados tratados do mes de fevereiro/12. A sequencia de informacoes dispostas
no grafico e dada pela apresentacao dos resultados de treinamento na Figura 5.5-a, os
resultados para a etapa de validacao na Figura 5.5-b e finalmente o conjunto de dados
treinamento/validacao na Figura 5.5-c.
Figura 5.5: Respostas da rede neural com dados estimados de energia do perıodo de fevereiro/12
A resposta da RNA para os dados apresentados no mes de fevereiro, nao mais foi influen-
ciada pelo comportamento do dados espurios presentes na amostragem inicial. Durante
a representacao do evento de treinamento na Figura 5.5-a ocorre um acoplamento entre
a resposta fornecida pela rede neural e os dados desejados. Em todos os exemplos desta
figura, o erro presente entre a resposta fornecida pela rede neural e o valor desejado como
resposta foi extremamente reduzido. Como realizado na secao anterior, as informacoes
relacionadas ao mes de fevereiro forma substituıdos pelas informacoes do mes de junho
para validacao dos resultados alcancados. A Figura 5.6 exibe a resposta da rede para os
5.2 Resultados do Treinamento da Rede Neural 66
dados do mes de Junho.
Figura 5.6: Respostas da rede neural com dados estimados de energia do perıodo de junho/12
Os resultados das simulacoes da rede neural para todo o conjunto de dados compreendido
entre os meses de fevereiro a julho sao expostos na Tabela 5.7. Desta vez com os resultados
foram obtidos atraves os dados de energia eletrica calculada e sao apresentados da mesma
maneira com realizado na secao anterior.
Tabela 5.7: Resultado do erro da RNA para os dados de energia eletrica calculada.
Fev Mar Abr Mai Jun JulTreinamento sem OBS 0,0047 0,0218 0,0162 0,0092 0,0060 0,0098Treinamento com OBS 0,0014 0,0116 0,0043 0,0030 0,0020 0,0020Validacao sem OBS 0,0020 0,0355 0,0214 0,0159 0,0085 0,0089Validacao com OBS 0,0068 0,0362 0,0437 0,0186 0,0073 0,0121
Os resultados apresentados pela tabela 5.7, representam a reducao dos valores de MSE
ocorridos no treinamento e validacao da rede com os dados calculados. Esta afirmacao
e realizada em comparacao aos resultados apresentados na Tabela 5.6. Por esta razao,
para a execucao da etapa de final de treinamento da rede neural, os dados aplicados
foram exclusivamente os que compreendem as informacoes relacionadas a energia eletrica
calculada para o sistema de distribuicao de energia do processo de eletrogalvanizacao.
5.2 Resultados do Treinamento da Rede Neural 67
5.2.4 Treinamento Final da Rede Neural
As informacoes apresentadas na secao anterior apresentaram que o tratamento dos dados
de energia eletrica calculada mitigaram os valores espurios do processo para esta varia-
vel. A avaliacao dos dados amostrados para os meses de marco e abril, em funcao do
coeficiente de correlacao linear, expressou que os conjuntos destes dois meses possuem
divergencias consideraveis em relacao ao demais meses da Tabela 5.7, que nao puderam
ser interpretadas e demandam uma nova pesquisa. Os registros de graficos do mesmo
perıodo tambem demonstram uma maior perturbacao nos dados de energia eletrica, como
indicado na Figura 5.1. Com base nestas observacoes o conjunto de dados a serem apre-
sentados para a rede neural foi novamente alterado, excluindo as informacoes dos meses
de marco e abril.
O resultado do treinamento da rede neural com 18 neuronios em apenas uma camada
oculta foi suficiente para realizar com sucesso a predicao da demanda de energia eletrica
para o processo de eletrogalvanizacao em tiras de aco. A Figura 5.7 exibe os resultados
alcancados com os ajustes dos parametros citados nas secoes anteriores. Na condicao final
do processo de treinamento e validacao dos resultados da rede obteve-se um erro medio
quadratico de validacao na ordem de 0,0097.
Figura 5.7: Resultado final de validacao da RNA
Com os resultados apresentados, pode-se afirmar que a predicao de demanda de energia
eletrica aplicando redes neurais artificiais, pode ser exercida como um meio para obtencao
de dados para gerenciar a organizacao de um sistema produtivo sem serie.
Capıtulo 6
Consideracoes Finais
Este trabalho apresentou uma aplicacao, com dados reais de uma linha de producao
industrial de tiras de aco eletrogalvanizadas, para a predicao da demanda de energia
eletrica solicitada para este produto com redes neurais artificiais.
A primeira parte do trabalho descreve uma revisao bibliografica sobre as aplicacoes re-
alizadas com as Redes Neurais Artificiais, com foco no tipo Multi-Layer Perceptron e os
procedimentos mınimos necessarios para o desenvolvimento desta ferramenta, bem como
sua capacidade de generalizacao para respostas a informacoes um pouco diferentes das
apresentadas durante sua elaboracao.
Em seguida foi apresentada um descricao do processo de galvanoplastia, e sua forma
industrial para a eletrogalvanizacao de tiras de aco laminadas a frio. Destacaram-se as
relacoes existentes entre o processo de producao e o sistema de fornecimento de energia
eletrica necessaria, definindo as principais variaveis que contribuem para a execucao das
exigencias tecnicas do produto.
No Capıtulo 4 foram apresentados os metodos empregados no tratamento das variaveis a
serem utilizadas no desenvolimento do projeto.
No Capıtulo 5 foram apresentados os resultados obtidos com o emprego das variaveis
selecionadas no desenvolvimento das redes neurais e as respostas disponibilizadas para os
casos em que estas variaveis foram tratadas previamente.
A seguir, sao listadas as principais conclusoes deste trabalho.
6.1 Conclusoes 69
6.1 Conclusoes
A aplicacao das tecnicas de desenvovilmento de redes neurais artificiais demonstra quao
importante sao os criterios de selecao e pre-tratamento dos dados reais que constituem as
informacoes a serem inseridas no sistema. A quantidade e a qualidade dos dados coletados
em um processo industrial real sao determinantes para correta definicao dos parametros
que construtivos da rede.
Por causa das caracteristicas de robustez e por ser um excelente mapeador de funcoes e
a capacidade de generalizacao das redes neruais artificiais fazem com que seja necessario
uma elevada atencao ao desenvolvimento de aplicacoes. As redes neurais sao capazes de
fornecer solucoes que representem o comportamento do processo, de forma independente
de qualquer qualidade de dados sejam eles corretos ou nao.
Neste trabalho as informacoes compreendidas na variavel objetivo, que e a demanda de
energia eletrica do processo, por possuirem falhas nos equipamentos de medicao e ar-
mazenamento, produziram um serie de transtornos que nao foram totalmente esclarecidos
e solucionados. Estes problemas nos dados implicaram diretamente nos resultados pro-
duzidos pela rede neural.
Para o conjunto de informacoes fornecidas na etapa de levantamento de dados, o modelo
desenvolvido apresentou respostas satisfatorias, permitindo uma nova forma de organiza-
cao da sequencia de producao em funcao da demanda de energia eletrica. As principais
variaveis que representam o processo foram evidenciadas sendo estas as densidades da
camadas de revestimento superior e inferior, a corrente eletrica aplicada no processo, o
tempo de processo e o peso da bobina.
Referencias Bibliograficas 70
6.2 Trabalhos Futuros
Como proposta de trabalhos futuros, sugere-se:
1. Investigar uma forma eficaz de coleta e registro dos dados de energia eletrica para
aplicacao em novos modelos do processo;
2. Pesquisar novas tecnicas para o dimensionamento dos parametros das RNA;
3. Realizar a modelagem do sistema utilizando outras tecnicas de modelagem com
o mesmo conjunto de dados utilizados neste trabalho e fazer a comparacao dos
resultados obtidos com os resultados deste trabalho;
4. Acrescentar outras variaveis de entrada ao processo de modelagem, como por exem-
plo a temperatura e a concentracao da solucao galvanica, e realizar o estudo nova-
mente;
5. Ampliar a abrangencia deste trabalho para as demais variaveis do processo, com
elevada demanda e custos significativos, tais como agua, vapor, acidos e outros
produtos quımicos;
Referencias Bibliograficas
Andritz, V. A. I. S. (1993). Standart pratical instructions. Manual de treinamento,
Voest-Alpine Industrial Services, Austria.
Angiulli, F., Ben Eliayahu Zohary, R., e Palopoli, L. (2010). Outlier detection for simple
default theories. Artificial Inteligence, (174):1247–1253.
Aydinalp, M., Ugursal, V., e Fung, A. (2007). Modeling of the appliance, ligtting, and
space-cooling energy consumptions inthe residential sector using neural networks. Ap-
plied Energy, (71):87–110.
Azadeh, A., Ghaderi, S., e Sohrabkhami, S. (2008). Annual electricity consumptiion
forecasting by neural network in high energy consuming industrial sectors. Energy
Conversion and Managemente, (49):2272–2278.
Balestrassi, P., Popova, E., Paiva, A., e Marangon Lima, J. (2009). Design of experiments
on neural networks training for nonlinear time series forecasting. Neurocomputing,
(72):1160–1178.
Blondou, R. (2011). Very short-term wind power forecasting with neural networks and
adaptive bayesian learnig. Renewable Energy, (36):1118–1124.
Braga, A., Ludemir, T. B., e Carvalho, A. (2000). Redes Neurais Artificiais - Teoria e
aplicacoes. LTC - Livros Tecnicos e Cientıficos Editora, Rio de Janeiro, RJ, 1ed. edicao.
Curteanu, S., Piuleac, C., Godini, K., e Azaryan, G. (2011). Modeling of electrolysis
process in wastewater treatment using different types of neural networks. Chemical
Engineering Journal, (172):267–276.
Figueiredo Filho, D. B. e Silva Junior, J. (2009). Desvendando os misterios do coeficiente
de correlacao de pearson(r). Revista Politica Hoje, (18):352–364.
Fiorin, D., Martins, F. R., Schuch, N., e Pereira, E. (2011). Aplicacoes de redes neurais
e previsoes de disponibilidade de recursos energeticos solares. Revista Brasileira de
Ensino de Fısica, (33):1309.1–1309.13.
Referencias Bibliograficas 72
Geem, Z. e Roper, W. (2009). Energy demand estimation of south korea using artificial
neural network. Energy Police, (37):4049–4054.
Goncalves, A. (2011). Otimizacao em ambientes dinamicos com variaveis contınuas em-
pregando algoritmos de estimacao de distribuicao. Dissertacao de Mestrado.
Haidar, A., Mustafa, M., Ibrahim, F., e Ahmed, I. (2011). Transient stability evaluation
of electrical power system using generalized regression neural networks. Appleid Soft
Computing, (11):3558–3570.
Hassibi, B., Stork, D., e Wolff, G. J. (1993). Optimal brain surgeon and general network
prunnig. Proceedings of the 1993 IEE International Conference on Neural Networks,
(1):293–299.
Haykin, S. (2001). Redes Neurais - Princıpios e pratica. Bookman, Porto Alegre, RS,
2ed. edicao.
Hernandez Neto, A. e Fiorelli, F. A. S. (2008). Comparison between detailed model
simulation and artificial neural network for forecasting building energy consumption.
Energy and Buildings, (40):2169–2176.
Hernandez, J., Bassam, A., Siqueiros, J., e Juarez-Romero, D. (2009). Optimum operating
conditions for a water purification process integrated to a heat transformer with energy
recycling using neural network inverse. Renewable Energy, (34):1084–1091.
Jia, Y., Chan, K., Xiangsheng, W., e Xiaofeng, Y. (2011). Modelling of chiller performance
using artificial neural networks. Energy Procedia, (13):1011–1016.
Joao Netto, P. (2008). Treinamento de clientes pi. Manual de treinamento da TSA.
Kalogirou, S. (1999). Applications of artificial neural networks in energy system. Energy
Conversion and Management, (40):1073–1087.
Kandil, N., Wamkeue, R., Saad, M., e Georges, S. (2006). An efficient approach for short
term load forecasting using artificial neural networks. Electrical Power and Energy
Systems, (28):525–530.
Kelo, S. e Dudul, S. (2011). Short-term maharashtra state electrical power load prediction
with special emphasis on seasonal changes using a novel focused time laggef recurrent
neural network based on time delay neural network model. Expert Systemseith Applca-
tions, (38):1554–1564.
Krusinka, E. (1987). A valuation of state of object based on weigthed mahalanobis dis-
tance. Pergamon Journals Ltd., (20):413–418.
Referencias Bibliograficas 73
LeCun, Y., Denker, J. S., e Solla, S. (1990). Optimal brain damage. Advances in Neural
Information Processing Systems, (2):598–605.
Lima, V. (2010). Desenvolvimento e avaliacao de sistema neural para reducao de tempo
de ensaio de desempenho de compressores. Dissertacao de Mestrado.
Lira, S. A. (2004). Analise de correlacao: Abordagem teorica e de contrucao dos coefi-
cientes com aplicacoes. Dissertacao de Mestrado.
Madal, P., Senjyu, T., Naomitsu, U., e Funabashi, T. (2006). A neural network based
several-hour-ahead electric load forecasting using similar days approch. Electrical Power
and Energy Systems, (28):367–373.
Maesschalck, R., Jouan-Rimbaud, D., e Massart, D. (2000). Fault identification in chem-
ical processes through a modified mahalanobis-taguchi strategy. Chemometrics and
Intelligent Laboratory Systems, (50):1–18.
Magalhaes, M. e Lima, A. (2009). Nocoes de Probabilidade e Estatıstica. Edusp, Sao
Paulo, 7ed. edicao.
Marques, R. J. A. (2008). Avaliacao da resistencia a corrosao de acos if revestidos
com zinco e ligas de ferro-zinco destinados a industria automobilistica. Dissertacao
de Mestrado.
Nascimento, E., Pereira, B., e Seixas, J. (2009). Redes neurais artificiais: Uma aplicacao
no estudo da poluicao atmosferica e seus efeitos adversos a saude. Revista Brasileira de
Biomedicina, (27):37–50.
Pedersen, M. E., Hansen, L. K., e Larsen, J. (1994). Prunning with generalization based
weigth saliences: Obd, obs. Connect, Electronics Institute, (1):1–7.
Salmeron, A. R. (1961). Introducao a Eletricidade e ao Magnetismo. 4ed. Sao Paulo.
Silva, J. E. M. M. (2010). Estimacao de parametros de modelos comportamentais para
tomografia por emissao de positrons. Dissertacao de Mestrado.
Takahashi, H. (2006). Predicao das propriedades mecanicas de acos de alta resistencia mi-
croligados utilizando tecnicas de inteligencia computacional. Dissertacao de Mestrado.
Teixeira, R. (2001). Treinamento de redes neurais artificiais atraves de otimizacao multi-
objetivo: uma nova abordagem para o equilıbrio entre a polarizacao e a variancia. Tese
de Doutorado.
Wah, C. (2003). Prunnig of hidden markov model with optimal brain surgeon. Dissertacao
de Mestrado.
Referencias Bibliograficas 74
Wei, D. e Xing-yang, L. (2011). An improved bp neural networks applied to classification.
Energy Procedia, (13):7065–7069.
Xia, C., Wang, J., e McMeneny, K. (2010). Short, medium and long term load forecast-
ing model and virtual load forecaster based on radial basis function neural networks.
Electrical Power Energy Systems, (32):743–750.
Yalcinoz, T. e Eminoglu, U. (2005). Short term and medium term power distribuitin load
forecastin by neural networks. Energy Conversion and Management, (46):1393–1405.