PREDIC˘AO DA DEMANDA DE ENERGIA~ ELETRICA … · Quebra-galho Dedico este trabalho a Thers alia,...

Programa de Pos Graduacao em Engenharia Industrial

PREDICAO DA DEMANDA DE ENERGIA

ELETRICA UTILIZANDO REDES NEURAIS

ARTIFICIAIS APLICADO EM UM PROCESSO DE

ELETROGALVANIZACAO

Nielson Cezar Campbell Brasil

Orientador: Prof. Dr. Roselito de Albuquerque Teixeira, PPGE/Unileste-MG

Coronel Fabriciano, Dezembro de 2013

Programa de Pos Graduacao em Engenharia Industrial

PREDICAO DA DEMANDA DE ENERGIA

ELETRICA UTILIZANDO REDES NEURAIS

ARTIFICIAIS APLICADO EM UM PROCESSO DE

ELETROGALVANIZACAO

Nielson Cezar Campbell Brasil

Dissertacao submetida a banca examinadora designada

pelo Colegiado do Programa de Pos-Graduacao em

Engenharia do Centro Universitario do Leste de Minas

Gerais, como parte dos requisitos necessarios a obtencao

do grau de Mestre em Engenharia Industrial.

Area de Concentracao: Modelagem, Otimizacao e Con-

trole de Processos

Quebra-galho

Dedico este trabalho a Thersalia, Nayane e Barbara pelo incentivo, pela paciencia e

compreensao nos momentos difıceis e abnegacoes realizadas.

Agradecimentos

Agradeco primeiramente a Deus, pelo dom da vida, pela inteligencia e por iluminar os

caminhos por onde percorro.

Ao UNILESTE-MG pela oportunidade e pelo investimento em minha formacao.

Ao Prof. Dr. Roselito de Albuquerque Teixeira pelas palavras de incentivo e forca, pela

orientacao e, principalmente, pelos ensinamentos que me acompanharao sempre.

Aos meus pais e amigos pelo apoio, incentivo e pela compreensao nos momentos de ausen-

cia. E, principalmente, pelos ensinamentos repassados ao longo da minha vida, sem os

quais seria impossıvel a realizacao desta etapa.

A minha esposa, Thersalia, pelo carinho, companheirismo, compreensao, paciencia e,

principalmente, por sempre acreditar em mim e ser torcedora numero 1 de minhas vitorias.

As secretarias do Mestrado, em especial a Juliana, a Michele pela atencao e pela ajuda

nos momentos solicitados.

E a todos que direta ou indiretamente contribuıram para a realizacao deste trabalho.

Quebra-galho

”O que mais surpreende e o homem, pois perde a saude para juntar dinheiro, depois

perde o dinheiro para recuperar a saude. Vive pensando ansionamente no futuro, de tal

forma que acaba por nao viver nem o presente, nem o futuro. Vive como se nunca fosse

morrer e morre como se nunca tivesse vivido.”

Dalai Lama

Resumo

Este trabalho apresenta a predicao de demanda de energia eletrica por meio da aplicacao

da tecnica de modelagem de processos com redes neurais artificiais, para um processo de

eletrogalvanizacao de tira de aco.

O projeto de redes neurais artificiais do tipo Multilayer Perceptron e discutido. Dentro

deste contexto tambem sao abordados a selecao dos elementos da topologia utilizada,

a definicao do numero de neuronios aplicados a camada oculta e o treinamento com o

algoritmo Backpropagation. O emprego do metodo de otimizacao da estrutura da rede, o

algoritmo OBS (Optimal Brain Surgeon), visa melhorar sua capacidade de generalizacao.

O processo de eletrogalvanizacao e apresentado, exprimindo o princıpio basico de funciona-

mento e os equipamentos que compoem a linha de producao. As variaveis que determinam

o comportamento do processo sao apresentadas, revelando o relacionamento existente com

a demanda de energia solicitada pela producao.

Os dados empregados para o desenvolvimento da rede neural, necessitaram de um pre-

processamento para a identificacao de outliers e a aplicacao de algumas heurısticas para

delimintacao.

Para o treinamento da rede foram definidos alguns parametros como as dimensoes do

material processado, a densidade do revestimento de zinco das camadas superior e infe-

rior, a velocidade do processo, a corrente eletrica empregada nos retificadores das celulas

galvanicas e a energia eletrica consumida no processo. Estes parametros sao determinados

em funcao dos resultados obtidos para dados coletados no sistema de informacoes da linha

de producao.

Os resultados alcancados com a aplicacao das tecnicas de desenvolvimento de redes neu-

rais, utilizando dados reais do processo produtivo, demonstram as necessidades de um

pre-tratamento dos dados. O modelo construıdo sinaliza que sua implementacao em um

sistema industrial e capaz de auxiliar a tomada de decisoes sobre o gerenciamento da

producao, observando como foco principal a utilizacao da energia eletrica no processo.

Abstract

This paper presents the prediction of electricity demand by applying the technique ofbusiness process modeling with artificial neural networks, a process for electroplating ofsteel strip.

The design of artificial neural network Multilayer Perceptron type discussed. Within thiscontext are also addressed the selection of the elements of the topology will be used, settingthe number of hidden layer neurons and applied to training with the backpropagationalgorithm. The use of the method of optimization of the network structure, with the OBSalgorithm (Optimal Brain Surgeon) aims to improve its generalization capability.

The electroplating process will be present, demonstrating the basic principle of operationand equipment that make up the production line. The variables that determine thebehavior of the process will be present, revealing the existing relationship with the energydemand required for production.

The data used to develop the neural network will require a preprocessor to identify outliersand apply some heuristics to delimitation.

For training, the network some parameters such as the dimensions of the processed mate-rial, the density of the zinc coating of the upper and lower layers, the process speed, theelectric current used in rectifiers of galvanic cells and the electric energy consumed in theprocess. Those parameters will be define depending on the results provided for the datacollected in the information system of the production line.

The results achieved with the application of design techniques, neural networks, usingreal data from the production process, demonstration need for a pre-processing of data.The constructed model indicates that its implementation in a industrial system is able toassist decision-making on the management of production, watching as its main focus theuse of electricity in the process.

Sumario

Resumo iv

Abstract v

Lista de Figuras viii

Lista de Tabelas x

Lista de Siglas xii

1 Introducao 2

1.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.1 Objetivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.1.2 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Delimitacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4 Hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.5 Estrutura do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Fundamentacao 8

2.1 Redes Neurais Artificiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.1.1 Historico do Desenvolvimento das Redes Neurais . . . . . . . . . . . 8

2.1.2 Redes Perceptron de Multiplas Camadas . . . . . . . . . . . . . . . 10

2.1.3 Selecao da Arquitetura da Rede . . . . . . . . . . . . . . . . . . . . 13

2.1.4 Determinacao do Numero de Neuronios na Camada Oculta . . . . . 14

2.1.5 Treinamento da Rede . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.1.6 Capacidade de Generalizacao da Rede . . . . . . . . . . . . . . . . 20

2.2 Tratamento dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2.1 Normalizacao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . 21

2.2.2 Coeficiente de Correlacao Linear . . . . . . . . . . . . . . . . . . . . 22

2.2.3 Distancia de Mahalanobis . . . . . . . . . . . . . . . . . . . . . . . 25

3 Descricao do Processo 29

3.1 A Galvanoplastia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2 Sistema de Fornecimeto de Energia Eletrica . . . . . . . . . . . . . . . . . 31

3.2.1 Relacionamento entre Energia Eletrica e Producao de Eletrogalva-nizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3.3 Equipamentos Instalados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.4 Variaveis da Secao do Centro . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.5 Dados de Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.6 Variaveis da Secao da Saıda . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3.7 Aquisicao dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4 Materiais e Metodos 43

4.1 Preparacao dos Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.1.1 Tratamento das Variaveis de Medicao de Energia . . . . . . . . . . 43

4.2 Tratamento das Variaveis do Processo . . . . . . . . . . . . . . . . . . . . . 46

4.2.1 Tratamento das Variaveis da Secao do Centro . . . . . . . . . . . . 47

4.2.2 Tratamento das Variaveis da Secao da Saıda . . . . . . . . . . . . . 50

4.2.3 Variaveis para a Rede Neural . . . . . . . . . . . . . . . . . . . . . 53

5 Resultados e Analise 55

5.1 Correlacao entre os Dados do Processo . . . . . . . . . . . . . . . . . . . . 55

5.2 Resultados do Treinamento da Rede Neural . . . . . . . . . . . . . . . . . 58

5.2.1 Determinacao dos Parametros da Rede Neural . . . . . . . . . . . . 59

5.2.2 Treinamento com Energia Eletrica Medida . . . . . . . . . . . . . . 62

5.2.3 Treinamento com Energia Eletrica Calculada . . . . . . . . . . . . . 65

5.2.4 Treinamento Final da Rede Neural . . . . . . . . . . . . . . . . . . 67

6 Consideracoes Finais 68

6.1 Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.2 Trabalhos Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

Referencias Bibliograficas 74

Lista de Figuras

2.1 Representacao de um neuronio artificial . . . . . . . . . . . . . . . . . . . . 9

2.2 Representacao grafica de uma RNA MLP com duas camadas intermediarias. 11

2.3 Representacao grafica de funcoes de ativacao de neuronios artificiais. . . . . 12

2.4 Baixa correlacao linear entre variaveis . . . . . . . . . . . . . . . . . . . . . 24

2.5 Elevada correlacao linear entre variaveis . . . . . . . . . . . . . . . . . . . 25

2.6 Dados anteriores a submissao da Distancia de Mahalanobis, resultando em

543 bobinas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.7 Histograma dos dados de tempo de processamento das bobinas . . . . . . . 28

2.8 Aplicacao da Distancia de Mahalanobis, resultando em 537 bobinas uteis . 28

3.1 Princıpio de funcionamento de uma celula eletrolıtica . . . . . . . . . . . . 30

3.2 Plano de producao executado no perıodo de 2004 a 2013 . . . . . . . . . . 32

3.3 Diagrama eletrico unifilar simplificado do sistema distribuidor de energia

eletrica da linha de eletrogalvanizacao da Usiminas. . . . . . . . . . . . . . 34

3.4 Comportamento da producao e do consumo de energia eletrica no processo

de eletrogalvanizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3.5 Linha de galvanizacao Eletrolıtica da Usiminas . . . . . . . . . . . . . . . . 37

3.6 Cirtuito de interligacao dos medidores de energia e a rede Ethernet . . . . 38

3.7 Dados do medidor de energia do Transformador TR1 em fevereiro de 2012 40

4.1 Erro causado pelo medidor . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.2 Aplicacao de interpolacao nos dados medidos . . . . . . . . . . . . . . . . . 44

4.3 Amostras de Energia Medida(-), Amostras de Energia corrigida por interpolacao(-

-), fevereiro de 2012 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1 Energia medida no perıodo de fevereiro a julho/12 . . . . . . . . . . . . . . 56

5.2 Energia estimada no perıodo de fevereiro a julho/12 . . . . . . . . . . . . . 57

5.3 Respostas da rede neural com dados medidos de energia do perıodo de

fevereiro/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

5.4 Respostas da rede neural com dados medidos de energia do perıodo de

junho/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

5.5 Respostas da rede neural com dados estimados de energia do perıodo de

fevereiro/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.6 Respostas da rede neural com dados estimados de energia do perıodo de

junho/12 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.7 Resultado final de validacao da RNA . . . . . . . . . . . . . . . . . . . . . 67

Lista de Tabelas

2.1 Numero de neuronios da camada oculta, conforme proposto por Balestrassi

et al. (2009) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.2 Numero de neuronios da camada oculta, como proposto por Wei e Xing-

yang (2011) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.3 Correlacao entre variaveis. . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.1 Dados de BF na saıda coletados. . . . . . . . . . . . . . . . . . . . . . . . . 41

4.1 Dados inciais coletados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.2 Coletas de Dados Primarios na Secao do Centro. . . . . . . . . . . . . . . . 48

4.3 Dados primarios calculados na Secao do Centro. . . . . . . . . . . . . . . . 50

4.4 Coletas de dados primarios na Secao de Saıda. . . . . . . . . . . . . . . . . 52

4.5 Dados primarios calculados na Secao da Saıda. . . . . . . . . . . . . . . . . 53

4.6 Dados de bobinas calculados nas Secoes do Centro e Saıda. . . . . . . . . . 53

5.1 Correlacao linear em relacao a Energia Eletrica Medida. . . . . . . . . . . . 57

5.2 Correlacao linear em relacao a Energia Eletrica Estimada. . . . . . . . . . 58

5.3 Treinamento da RNA com Levenberg-Marquardt . . . . . . . . . . . . . . . 60

5.4 Treinamento da RNA com Gradiente Conjugado Decrescente . . . . . . . . 60

5.5 Treinamento da RNA com Gradiente descendente com momento e taxa de

aprendizado adaptativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

5.6 Resultado do erro da RNA para os dados de energia eletrica medidos. . . . 64

5.7 Resultado do erro da RNA para os dados de energia eletrica calculada. . . 66

Lista de Siglas

ADALINE Neuronio Adaptativo Linear

(ADAptative LInear NEuron)

BF Bobina a Frio

EGL Linha de galvanizacao Eletrolıtica

(Electric Galvanaizing Line)

ETEG (Estacao de Tratamento de Efluentes da Galvanizacao)

HVAC Aquecimento, ventilacao e ar condicionado

(Heating Ventilation and Air Conditioning)

MAPE Erro Medio Absoluto Percentual

(Mean Absolute Percentual Error)

MSE Erro Medio Quadratico

(Mean Square Error)

MLP Rede Neural de Multiplas Camadas

(Multi Layer Perceptron)

OBD Otimizacao Cerebral Danosa

(Optimal Brain Damage)

OBS Otimizacao Cerebral Cirurgica

(Optimal Brain Surgeon)

PIMS Sistema de Gerenciamento de Informacoes de Processo

(Process Information Managment System)

PLC Controlador Logico Programavel

(Programable Logic Controller)

RMSE Raiz quadrada do erro medio

(Root Mean Square Error)

RNA Rede Neural Artificial

TR1 (Transformador numero 1 )

TR2 (Transformador numero 2 )

WD Decaimento de pesos

(Weigth Decay)

Capıtulo 1

Introducao

A energia eletrica solicitada pelos processos de galvanoplastia e um dos fatores predo-

minantes para a determinacao da viabilidade desse processo. Sua correta determinacao

influencia diretamente os custos de producao e consequentemente os custos do produto

final. Nos ultimos anos, algumas linhas de producao que empregam este sistema sofreram

uma drastica reducao em seus volumes produtivos, causada pela inviabilidade economica

como descrito por Marques (2008).

As estimativas para o comportamento do mercado e do processo sao requeridas para agen-

damento de atividades como a geracao e contratos do consumo de energia, planejamento

dos investimentos, operacao segura e manutencao nos equipamentos. Uma predicao de

carga eletrica precisa, para um curto espaco de tempo, e um ponto significante para o

gerenciamento dos sistemas de potencia de cidades e regioes. A superestimacao de cargas

futuras implica em reservas energeticas e financeiras desnecessarias. Como descrito por

Kelo e Dudul (2011), existem indıcios de que o incremento do erro em 1%, resulta no

acrescimo de varios milhoes de reais nos custos de operacao. Por outro lado, a subesti-

macao de cargas futuras pode resultar em elevada queda das reservas e elevacao de custos

para producao.

A predicao aprimorada e confiavel da demanda de energia eletrica, tende a evidenciar

quais produtos e processos podem ser classificados como viaveis, do ponto de vista do

gerenciamento da energia eletrica empregada. Conforme Takahashi (2006) a construcao

de modelos que expliquem detalhadamente processos complexos, com multiplas variaveis

relacionadas nao-linearmente, exigem tempo e conhecimento profundo das diversas etapas

do processo.

Os metodos tradicionalmente descritos na literatura para a predicao do comportamento

de sistemas, sao metodos matematicos tais como analise de regressao, series temporais,

sistemas de caixa cinza, filtros de Kalman, sistemas especialistas, otimizacao de colonias de

formigas, analises de forma de onda, modelagem de sistemas por logica fuzzy, modelagem

por redes neurais e algoritmos geneticos, como descrito por Xia et al. (2010).

As redes neurais artificiais tambem tem sido aplicadas para a modelagem e simulacao de

sistemas nao-lineares. Algumas das utilizacoes mais frequentes sao a predicao de parame-

tros de equipamentos e demandas dos sistemas energeticos. Um dos fatores relevantes e

sua habilidade de aprender e construir mapeamentos nao-lineares complexos, atraves de

um conjunto de exemplos que expressem os comportamentos das variaveis de entrada e

saıda.

No predio da administracao da Universidade de Sao Paulo, Hernandez Neto e Fiorelli

(2008) promoveram a comparacao das capacidades de predicao da demada de energia

eletrica empregada no sistema de HVAC (Heating, Ventilation and Air Conditioning),

entre um complexo modelo detalhado, denominado EnergyPlus e uma rede neural do tipo

feed-forward simples. Os resultados fornecidos demonstraram que o modelo detalhado

foi capaz de gerar simulacoes que produziram erros oscilantes entre 0,8% e 1,2%, para

as principais variaveis. Por sua vez, a rede neural do tipo feed-forward simples, forneceu

um erro de 0,3% e 2,3% para as mesmas variaveis. Para o conjunto total de dados o

EnergyPlus forneceu um erro medio de 13%, para uma parcela de 80% do conjunto total,

das informacoes da base de dados enquanto que a RNA forneceu um erro de 10% para

todo o conjunto de dados, podendo ser mais eficiente com uma melhor elaboracao da rede.

Diversas pesquisas foram realizadas dedicando-se atencao a demanda de energia eletrica

para perıodos de curto, medio e longo prazos, como as executadas por Yalcinoz e Eminoglu

(2005) e Xia et al. (2010). Para as estimativas anuais de energia Azadeh et al. (2008),

Geem e Roper (2009) e Kelo e Dudul (2011) demontraram as capacidades das redes neurais

em apresentar resultados coerentes com os dados historicos e diversas vezez superiores

aos fornecidos pelos modelos tradicionais. Blondou (2011) aplicou redes neurais para a

predicao da energia eolica, em horizontes muito curtos de tempo informando com exatidao

os dados nos perıodos propostos.

Para predizer o coeficiente de performance de unidades de refrigeracao Jia et al. (2011),

utilizou redes neurais devido ao elevado numero de parametros envolvidos e as relacoes

nao-lineares existentes. Haidar et al. (2011) propos a aplicacao de RNA para a classificacao

de redes de transmissao de energia eletrica para acessoria em sistemas de potencia. Em

um outro sistema, a otimizacao da performance de um processo de purificacao de agua

foi executado por Hernandez et al. (2009), utilizando redes do tipo feedforward obtendo

resultados com elevado ındice de correlacao entre as resposta estimadas e as respostas do

sistema real.

1.1 Objetivo 4

Tambem aplicando os recursos disponibilizados pelas redes neurais, a predicao das princi-

pais variaveis do sistema para tratamento de efluentes em estacao de um distrito industrial,

em Bu-Ali no Iran, foi simulada por Curteanu et al. (2011). Os modelos fenomenologicos

apresentam uma grande dificuldade em representar processos quımicos de multiplas varia-

veis e com limitado conhecimento disponıvel. O modelo empregando as tecnicas das redes

neurais contornou a necessidade de conhecimento profundo sobre as multiplas variaveis

que compoem o processo.

Com base nas pesquisas citadas anteriormente, neste trabalho aplica-se os fundamentos

e desenvolvimentos das redes neurais artificiais para a predicao da demanda de energia

eletrica no processo de eletrogalvanizacao de tiras de aco carbono, laminadas a frio, na

planta da Usiminas em Ipatinga.

Na referida linha de producao, as dimensoes do material em conjunto com as especificacoes

dos produtos influenciam diretamente no consumo de energia requerido pelo processo. Por

esta razao, essas sao as principais variaveis investigadas neste trabalho. Atualmente os

criterios para a sequencia de produtos e norteada apenas pelas especificacoes do mate-

rial a ser produzido, sem considerar os impactos de alteracao do ponto de operacao dos

equipamentos do ponto de vista das energias requeridas.

A orientacao fornecida pelo conhecimento das demandas de energia eletrica para cada

grupo de materiais e processos, pode ser capaz de minimizar os gastos com este insumo,

por meio de uma nova forma de organizacao da sequencia produtiva.

1.1 Objetivo

1.1.1 Objetivo Geral

O objetivo deste trabalho e obter um modelo capaz de predizer o consumo de energia

eletrica em funcao de algumas das variaveis requeridas pelas especificacoes solicitadas

para os materiais eletrogalvanizados.

1.1.2 Objetivos Especıficos

• Evidenciar as variaveis mais importantes para a determinacao do consumo de energia

eletrica no processo de revestimento do aco com zinco;

• Elaborar um sistema capaz de informar a demanda de energia prevista para deter-

minados revestimentos no processo de eletrogalvanizacao ;

1.2 Delimitacao 5

1.2 Delimitacao

Construcao de um preditor de demanda de energia eletrica para o revestimento de mate-

riais em um processo de eletrogalvanizacao de tiras de aco. Essas tiras de aco sao con-

struidas com baixo teor de carbono, laminadas a frio com espessura, largura e densidade

das camadas de revestimento de zinco limitadas as capacidades nominais do equipamento

analizado. Para este fim sera realizada a predicao da demanda de energia eletrica, apli-

cando redes neurais artificiais, com os dados coletados em um perıodo definido de 180

dias, na planta de eletrogalvanizacao da Usiminas em Ipatinga. O consumo sera avaliado

em funcao de uma quantidade limitada de materiais a serem processados, diponibilizados

no fluxo de producao no perıodo citado.

1.3 Justificativa

Recentemente o consumo de energia eletrica, no processo de eletrogalvanizacao, e uma

variavel de elevado custo presente na matriz de producao. Na unidade de processo onde

o estudo e realizado, seu controle e efetuado por meio de medicoes periodicas do consumo

integralizado, generalizando os valores de consumo para diferentes tipos de processos.

Esta medicao resulta em um rateio do custo da energia eletrica sobre a producao total

do perıodo, privilegiando alguns processos de maior consumo com um custo menor e

depreciando os resultados em outros processos de menor consumo com um custo superior

ao real.

Por meio da modelagem do consumo de energia eletrica na eletrogalvanizacao de acos

para uma determinada classe de materiais especificados, os custos reais relacionados a

esta variavel podem ser dimensionados corretamente, viabilizando os reajustes adequados

e necessarios a realidade produtiva.

Nos casos onde o custo real for superior ao estimado, este estudo pode redirecionar a

busca por novos meios capazes de promover uma reducao nestes custos, desenvolvendo

outras caracterısticas relativas ao processo. Para os casos particulares em que outros

aspectos, diferentes do consumo de energia eletrica, tal como aplicacao da liga metalica

de zinco-cromo, esta variavel pode ser considerada mais significativa para a determinacao

das margens de ganhos no processo.

Avaliando os dados historicos, pode-se verificar que em alguns perıodos distintos, para a

mesma faixa de producao, existiram valores de demanda ora mais reduzidos, ora mais ele-

vados. A predicao da demanda de energia eletrica para este projeto pretende demonstrar

com clareza o motivo responsavel por este fato, colocando em evidencia uma ou varias

das principais variaveis que conduziram a esse consumo.

1.4 Hipotese 6

No presente momento, a acao obscura destas variaveis dificulta a realizacao de planos

eficientes para o combate a desperdıcios no processo e reducao eficaz dos custos. Clareando

esses pontos, torna-se possıvel exercer acoes assertivas e direcionadas, visando a melhoria

da utilizacao dos recursos desprendidos.

No sistema atual, o modelo de aquisicao de dados e prejudicado pela falha no armazena-

mento e transferencia das informacoes pelos medidores de energia. Os sinais espurios pro-

duzidos deformam o comportamento da curva de energia dispendida em cada processo,

individualizado por bobina. A aplicacao de um filtro nos dados, tal como a Distancia de

Mahalanobis aplicada por Krusinka (1987) e capaz de minimizar esse problema identifi-

cando quais sao os pontos espurios. Apos os pontos serem identificados torna-se possıvel

a aplicacao de uma tecnica de interpolacao entre os dados, que permita a utilizacao de

valores fısicamente mais proximos da realidade, permitindo uma melhora na predicao

proposta.

De um ponto de vista generalizado, o presente trabalho busca contribuir com a evolucao

das ferramentas disponıveis e, em uso nesse ambiente, para a predicao de demanda de

energia. Procura-se tambem difundir o uso das redes neurais artificiais para a modelagem

de sistemas. Este metodo de predicao pode ser estendido para outras variaveis, tais

como consumo de vapor, agua e zinco, que necessitem de um controle mais apurado.

Tambem pode ser extendido a outros processos que vislumbrem a necessidade de controle

e modelagem de variaveis com comportamentos semelhantes.

Como uma consequencia secundaria, a acao de modelagem desenvolvida neste trabalho

podera fundamentar algumas sugestoes para a evolucao do desempenho da planta, como

a producao seletiva em determinados perıodos onde o custo da energia eletrica e diferen-

ciado. Esta possibilidade, teoricamente implicaria em reducoes nas variacoes indesejadas

no ponto de operacao da planta, tambem como reducao nos custos relativos ao reparo e

substituicao de equipamentos utilizados no processo.

1.4 Hipotese

A seguinte hipotese foi investigada:

• e possıvel realizar a predicao de demanda de energia eletrica para uma determinada

quantidade de materiais com qualidades distintas em um perıodo definido, por meio

das redes neurais artificiais.

1.5 Estrutura do Trabalho 7

1.5 Estrutura do Trabalho

Esta dissertacao esta estruturada em 6 capıtulos cujas descricoes sao apresentadas na

sequencia.

Capıtulo 1: Introducao. Foi apresentada uma abordagem, de forma generalizada, sobre

as ferramentas disponıveis para a predicao de demanda de algumas variaveis do segmento

energetico e produtivo em um perıodo relativamente recente. Sao apresentados ainda o

objetivo geral e os objetivos especıficos do trabalho, sua delimitacao, a justificativa do

estudo e a hipotese que sera estudada ao longo do trabalho.

Capıtulo 2: Fundamentacao. Serao apresentados os princıpios empregados para a

elaboracao do trabalho, baseados em uma revisao bibliografica. Os assuntos abordados

contem um breve historico sobre o desenvolvimento das redes neurais artificiais e o trata-

mento empregado para os dados de treinamento como sua normalizacao e a existencia de

correlacao. Tambem sera descrito o metodo da Distancia de Mahalanobis para a identifi-

cacao dos dados espurios obtidos durante a amostragem do comportamento do processo.

Capıtulo 3: Descricao do Processo. Serao apresentados os princıpios basicos de um

processo de galvanoplastia. Em seguida sera descrito o sistema de distribuicao de energia

eletrica para o processo e seu relacionamento direto com as especificacoes tecnicas do

produto a ser eletrogralvanizado. Tambem serao abordados os equipamentos instalados e

as variaveis manuseadas no processo de preparacao dos dados para o treinamento da rede

neural.

Capıtulo 4: Materiais e Metodos. Este capıtulo apresentara todo o desenvolvimento

realizado para o trabalho. Serao descritas a selecao e o pre-processamento das variaveis a

serem utilizadas na modelagem, segregando-as conforme a secao onde foram geradas para

a coleta.

Capıtulo 5: Resultados e Analise. Os resultados obtidos por meio desta pesquisa

serao apresentados neste capıtulo, bem como a analise e a discussao sobre os resultados

alcancados.

Capıtulo 6: Consideracoes Finais. Apresentara as conclusoes sobre esta dissertacao,

descrevendo algumas sugestoes para trabalhos futuros.

Capıtulo 2

Fundamentacao

Nesta secao, e feita uma busca na literatura sobre os fundamentos a serem utilizados no

desenvolvimento do trabalho.

2.1 Redes Neurais Artificiais

As Redes Neurais Artificiais, conhecidas como sistemas de processamento paralelo e dis-

tribuıdo sao uma forma de computacao que nao segue um algoritmo e relembram a estru-

tura do cerebro humano. As redes neurais sao compostas por unidades simplificadas de

processamento, denominados neuronios, que sao capazes de calcular determinadas funcoes

matematicas nao-lineares. Cada unidade de neuronios pode ser disposta em uma ou mais

camadas e interligadas por um elevado numero de conexoes. A cada conexao sao associa-

dos pesos que armazenam o conhecimento representado pelo modelo e ponderam a entrada

recebida por cada neuronio de entrada da rede, como descrito por Braga et al. (2000).

2.1.1 Historico do Desenvolvimento das Redes Neurais

Em um trabalho conjunto realizado no ano de 1943, o psiquiatra e neuro-anatomista

Waren McCullocg e o matematico Walter Pitts, propuseram um modelo artificial para

representar o neuronio biologico, como descrito por Fiorin et al. (2011). O neuronio mais

simples, representado na figura 2.1, possui m terminais x1, x2,...,xm, por onde os sinais

de entrada do processo sao encaminhados para o neuronio. Os sinais das entradas sao

ponderados por intermedio da aplicacao de pesos fixos Wj1, Wj2,...,Wjm, nas conexoes

entre as entradas e o neuronio. No centro de processamento do neuronio, o resultado do

somatorio entre os produtos produzidos pela relacao entre as entradas e o pesos xi.Wji,

e submetido a uma funcao de ativacao que emite uma resposta para o calculo. Caso o

2.1 Redes Neurais Artificiais 9

valor resultante seja igual ou superior ao limiar da funcao de ativacao, o sinal de saıda do

neuronio pode ser igual a 1, ou seja o neuronio foi excitado. No caso contrario, em que o

valor resultante seja inferior ao limiar de ativacao da funcao, o sinal de saıda sera nulo.

Figura 2.1: Representacao de um neuronio artificial

Fonte: Haykin (2001).

No final da decada de 50, Frank Rosenblatt demonstrou que um neuronio de uma camada,

denominado perceptron, dotado de sinapses ajustaveis de acordo com as saıdas desejadas

poderia ser aplicado na classificacao de alguns tipos de padroes, segundo Fiorin et al.

(2011) apud Rosenblatt (1958). No inıcio da decada de 60, Widroff e Hoff apresentaram

um modelo conhecido como Adaline (ADAptive LInear NEuron), diferenciando-se do per-

ceptron por possuir uma saıda binaria bipolar, variando de −1 a 1 ao inves das saıdas

unipolares que variam de 0 a 1. Neste modelo, o ajuste dos pesos das sinapses e realizado

de acordo com o metodo do gradiente para minimizacao do erro da saıda da rede, como

descrito por Braga et al. (2000) apud Widrow e Hoff (1960). Na decada de 70 as pesquisas

e desenvolvimentos de metodos envolvendo redes neurais foram drasticamente reduzidos,

apos a divulgacao do trabalho de Minsky e Papert. Este trabalho afirmava que os per-

ceptrons estavam limitados a solucao de problemas apenas linearmente separaveis e que o

processo de aprendizagem nao garantia a convergencia das RNAs de mais de uma camada,

como apresentado por Fiorin et al. (2011) citando Minsky e Papert (1972). No inıcio da

decada de 1980, Hopfield(1982, citado por Braga et al. (2000)) publicou em seu trabalho

demonstracoes das propriedades associativas das redes neurais com problemas fısicos e em

sequencia descreveu o algoritmo de treinamento denominado Back-propagation. Este al-

goritmo possibilitou as redes neurais artificiais de multiplas camadas solucionar problemas

de alta complexidade, reiniciando uma nova etapa de interesse cientıfico pela aplicacao

das redes neurais artificiais.

Segundo Kalogirou (1999) a arquitetura a ser empregada em uma RNA e determinada

pelo tipo de problema a ser abordado, tais como classificacao de padroes, modelagem

e controle de sistemas, previsao e predicao de cargas, otimizacao e tomadas de decisao.

Basicamente os principais parametros para se definir uma RNA sao o numero de camadas

da rede, o numero de neuronios em cada camada, a arquitetura da rede que define como

os neuronios serao agrupados em suas camadas e a topologia que determinara o modo de

transmissao dos dados entre estes neuronios.

As redes mais simples possuem apenas um unico neuronio coletando as informacoes de

entrada, processando-as e fornecendo uma saıda, restringindo-se a solucao de problemas

linearmente separaveis. As redes de multiplas camadas possuem basicamente uma camada

de entrada, uma ou mais camadas de processamento internas e uma camada de saıda. As

saıdas dos neuronios da camada de entrada sao interligados as entradas dos neuronios

das camadas ocultas ou internas. Podem ocorrer conexoes entre a saıda de um neuronio

de uma camada interna com a entrada de um outro neuronio da mesma camada interna,

porem nao ocorrem conexoes entre a entrada de um neuronio da camada interna e a

entrada de outro neuronio da mesma camada.

Tratando-se das conexoes entre os neuronios, estas podem ser realizadas de duas formas.

A primeira maneira e a conexao da saıda de um neuronio de uma camada anterior a

entrada de um neuronio da camada posterior, conhecida como conexao acıclica ou feed-

forward. Na segunda maneira de conexao, a saıda de um neuronio pode ser conectada

a entrada de um neuronio da mesma camada ou a entrada do neuronio de uma camada

anterior, sendo conhecida como conexao cıclica ou do tipo feedback.

Entre as diversas redes neurais encontradas, podem-se destacar as seguintes: as redes

Perceptron e Adaline, as redes MLP (Multi Layer Perceptron), redes de Memorias Ma-

triciais, Self-Organizing e de Processamento Temporal. Neste trabalho serao empregadas

redes neurais com arquitetura do tipo MLP, com uma camda oculta onde os neuronios

emitirao suas respostas condicionadas a uma funcao de ativacao de uma tangente hiper-

bolica, em uma topologia de redes diretas (feedforward).

2.1.2 Redes Perceptron de Multiplas Camadas

As redes MLPs, sao redes que apresentam uma ou mais camadas intermediarias de

neuronios, como representado na figura 2.2. Por apresentar uma consideravel simplici-

dade e facilidade de implementacao sao muito utilizadas, como demonstrado em varios

trabalhos tais como Madal et al. (2006), Hernandez Neto e Fiorelli (2008), Kandil et al.

(2006) e outros. As MLPs exibem um elevado poder computacional, atribuıdo ao uso

das camadas internas, capazes de solucionar problemas com dados nao linearmente sepa-

raveis. Segundo Cybenko(1988 citado por Fiorin et al. (2011), as redes do tipo MLP com

uma camada intermediaria podem representar qualquer funcao contınua, enquanto que as

redes MLP que possuem duas ou mais camadas intermediarias, sao teoricamente capazes

de implementar qualquer funcao linearmente separavel ou nao, sendo que a precisao dos

resultados produzidos por esta rede estarao relacionados diretamente com a quantidade

de neuronios das camadas intermediarias.

Figura 2.2: Representacao grafica de uma RNA MLP com duas camadas intermediarias.

Fonte: Fiorin et al. (2011).

Nas redes MLP os neuronios permitem que as saıdas apresentem valores diversos. Di-

ferente do que ocorre em um perceptron em que o somatorio das entradas ponderadas,

comparado ao limiar de uma funcao de ativacao gera um sinal binario (0 ou 1). Para esta

solucao foram desenvolvidos novos neuronios artificiais, em que sao aplicadas diferentes

funcoes de ativacao nao-lineares, capazes de representar problemas nao-lineares e diferen-

ciaveis. As funcoes de ativacao mais aplicadas sao a funcao de degrau (limiar), a funcao

linear e as funcoes sigmoide logıstica e a funcao de tangente hiperbolica, representadas

pelas equacoes 2.1 a 2.4, respectivamente.

Funcao Degrau

ϕ(vj) =

{+γ se (vj) > 0

−γ se (vj) < 0(2.1)

Funcao Linear

ϕ(vj) = α.vj (2.2)

Funcao Sigmoide Logıstica

ϕ(vj) =1

1 + exp(−α.vj)(2.3)

Funcao Tangente Hiperbolica

ϕ(vj) = tanhvj2

=1− exp(−vj)1 + exp(−vj)

Os sinais de saıda das funcoes de ativacao, descritas acima, sao exibidos na figura 2.3.

As funcoes de ativacao sao definidas para algumas faixas de valores em suas saıdas. No

caso da funcao degrau, com representacao grafica exibida na figura 2.3-a, o valor tıpico de

γ e 1, representando um intervalo existente entre −1 e 1. A funcao linear, representada

na figura 2.3-b, e diretamente proporcional ao sinal de entrada, nao necessitando de um

limiar mınimo para sua ativacao. Desta maneira seus limites sao de−∞ a +∞. As funcoes

sigmoides, logıstica e tangente hiperbolica, sao mais comumente empregadas nas camadas

internas das MLP por serem contınuas, diferenciaveis e nao-lineares. A funcao logıstica

apresenta uma saıda com uma suavizacao nos momentos de transicao, descrevendo uma

curva no formato de um s, como exibido na figura 2.3-c, e variando entre 0 e 1. Por ultimo,

a funcao tangente hiperbolica, representada na figura 2.3-d, apresenta um sinal de saıda

semelhante ao fornecido pela funcao logıstica sigmoidal, com diferenciacao em relacao a

faixa de atuacao que e de −1 a 1.

Figura 2.3: Representacao grafica de funcoes de ativacao de neuronios artificiais.

Fonte: Fiorin et al. (2011).

Nas redes MLP, o resultado proveniente do somatorio ponderado pelos pesos adicionados

as entradas da rede, e combinado com outra variavel ajustavel, conhecida como bias(b1).

O bias tem a capacidade de ampliar ou minimizar o resultado do somatorio a ser aplicado

na funcao de ativacao selecionada para o neuronio. Este mecanismo controla o nıvel de

atividade interna do neuronio (vj). O resultado a ser fornecido pela saıda do neuronio

(yi) e obtido pela aplicacao do nıvel de atividade interna do neuronio (vj), a funcao de

ativacao (ϕ). Estas relacoes sao descritas pelas equacoes 2.5 e 2.6.

vj =m∑i=1

wjixi + bj (2.5)

yj = ϕ(vj) (2.6)

2.1.3 Selecao da Arquitetura da Rede

Alguns parametros das redes MLP devem ser definidos de acordo com fatores tais como

a complexidade do problema em avaliacao, o numero de amostras para o treinamento, a

quantidade de ruıdo presente nas amostras e a distribuicao estatıstica destes dados.

Sabe-se que existem diversos metodos propostos para determinar a arquitetura de uma

rede neural. Contudo, o caminho mais recomendado e a construcao de diversos modelos,

variantes em suas funcoes de ativacao, numero de neuronios nas camadas ocultas, quan-

tidade de camadas ocultas, ou intermediarias e metodos de treinamento. O objetivo e

averiguar entre as opcoes a melhor combinacao dos parametros que atenda as especifi-

cacoes estabelecidas para a aplicacao. Deve-se observar o equilıbrio entre a rigidez e a

flexibilidade da rede.

A rede selecionada nao deve ser excessivamente complexa e rıgida ao ponto de incluir, no

modelo, os dados ruidosos apresentados durante a etapa de treinamento, comportamento

conhecido com overfitting ou excesso de aprendizado, que reduz drasticamente sua capaci-

dade de generalizacao e a flexibilidade da rede. Quando ocorre este fato observa-se que

o erro medio para os padroes de treinamento pode assumir um valor elevado, enquanto o

erro medio para os valores de teste, ou validacao, podem se tornar pequenos como descrito

por Teixeira (2001). No outro extremo da questao, onde se verifica uma grande flexibi-

lidade da rede, esta nao deve ser excessivamente generalista a ponto de incluir somente

alguns dos dados apresentados ao modelo. Neste caso, a rede apresenta o comportamento

conhecido como underfitting, e sua capacidade de representacao do modelo primario e

reduzida porque a complexidade da funcao a ser modelada e superior a complexidade do

modelo.

Uma rede corretamente ajustada deve ser capaz de interpretar e responder adequadamente

as diferentes informacoes, porem dentro de uma certa faixa de valores permissıveis ao

processo. Um dos metodos utilizados para determinar o erro obtido apos o treinamento

da rede e o emprego do erro medio quadratico, como descrito na equacao 2.7.

∑Pj=0

∑Ni=0(dij − yij)2

NP, (2.7)

Sendo que:

• dij, representa a saıda desejada de um ponto do conjunto de amostras;

• yij, representa a saıda fornecida de um ponto do conjunto de amostras;

• N, representa o numero de amostras do conjunto de dados;

• P, representa o numero de saıdas do conjunto de dados.

2.1.4 Determinacao do Numero de Neuronios na Camada Oculta

Um dos problemas a ser considerado em uma rede neural e a quantidade de neuronios

existentes na camada oculta. Segundo Hornik(1989, citado por Hernandez et al. (2009)),

uma unica camada oculta de uma rede neural feedforward e capaz de aproximar qualquer

funcao contınua enquanto redes com duas ou mais camadas ocultas podem teoricamente

implementar qualquer funcao, seja esta linearmente separavel ou nao. Contudo, o excesso

de neuronios na camada oculta e capaz de tornar os calculos muito trabalhosos e produzir

resultados finais ruins, como no caso descrito pelo sobreajuste da rede. Da mesma forma,

um numero muito pequeno de neuronios na camada oculta, tambem pode nao ser capaz

de responder adequadamente, tornando a rede excessivamente flexıvel.

Com o objetivo de delimitar o numero de neuronios na camada oculta, foram observadas

duas tecnicas distintas. Na primeira, proposta por Balestrassi et al. (2009), a capacidade

de captura das nao-linearidades da estrutura, atraves dos neuronios da camada oculta

pode ser determinada pela relacao existente com o numero de neuronios da camada de

entrada, como descrito na equacao 2.8.

Noculto = k(Nentrada + 1), (2.8)

sendo que

• Noculto, representa o numero de neuronios na camada oculta;

• k, constante de relacionamento, variando entre 1, 1.5 e 2;

• Nentrada, representa o numero de neuronios da camada de entrada.

Considerando-se um sistema que possua um total de 8 variaveis de entrada, sendo que cada

uma destas variaveis e inserida em um dos neuronios da camada de entrada, por intermedio

deste metodo, a tabela 2.1 demonstra que pode-se empregar as seguintes quantidades de

neuronios na camada oculta.

Tabela 2.1: Numero de neuronios da camada oculta, conforme proposto por Balestrassi et al.(2009)

k Numero de neuroniosOcultos

1 91,5 142 18

Uma segunda tecnica, proposta por Wei e Xing-yang (2011), amplia o proposto por

Balestrassi et al. (2009), inserindo o numero de neuronios que compoem a camada de

saıda na determinacao no numero de neuronios da camada oculta. A definicao apresen-

tada e baseada em uma formula empırica, demonstrada na expressao 2.9.

Noculto =√

(Nentrada +Nsada) + a, (2.9)

sendo que

• Noculto, representa o numero de neuronios na camada oculta;

• Nentrada, representa o numero de neuronios da camada de entrada;

• Nsada, representa o numero de neuronios da camada de saıda;

• a, constante de relacionamento empırica, variante entre 1 e 10.

Considerando novamente que o sistema que possua um total de 8 neuronios na camada

de entrada e um unico neuronio na camada de saıda, por intermedio deste metodo, pode-

se empregar as seguintes quantidades de neuronios na camada oculta, de acorco como

exibido na tabela 2.2.

De maneira geral, e frequente adotar tecnicas que aperfeicoem a arquitetuta da rede. Uma

destas tecnicas consiste na reducao do numero de neuronios de uma rede superdimensio-

nada por meio da retirada dos neuronios que possuam ligacoes sinapticas fracas, ou seja,

Tabela 2.2: Numero de neuronios da camada oculta, como proposto por Wei e Xing-yang (2011)

a Numero de neuroniosOcultos

1 42 54 76 98 1110 13

que possuam pequenos valores nos pesos e consequentemente nao sejam relevantes para

o funcionamento da rede. Esta tecnica e conhecida como prunning, ou poda de conexoes

e pode ser realizada por algoritmos como WD (Weigth Decay), OBD (Optimal Brain

Damage) e OBS (Optimal Brain Surgeon). Descrevendo de uma maneira superficial o

algoritmo WD, altera a funcao de custo do treinamento da rede penalizando as solucoes

que apresentem normas elevadas. Esta penalizacao conduz os pesos a convergencia para

o menor valor absoluto permitido.

No algoritmo OBD, a complexidade da rede e alterada ajustando a estrutura por meio

da retirada de neuronios em que os pesos apresetem um efeito pouco perceptıvel no erro

cometido para a resposta da rede, no momento do treinamento. Para cada alteracao

executada na estrutura da RNA, um novo treinamento deve ser realizado e os resultados

avaliados, verificando o efeito exercido pela poda das conexoes, como descrito por LeCun

et al. (1990) e Pedersen et al. (1994).

O algoritmo OBS somente permite uma poda das conexoes sinapticas dos neuronios apos

a avaliacao de criterios mais restritivos, se comparado com os criterios determinados para

os algoritmos de WD e OBD. Quando o algoritmo OBS e aplicado nao necessario um

novo treinamento apos as podas dos pesos como acontece no OBD, conforme Wah (2003).

O algoritmo OBS usa o criterio de incremento mınimo do erro de treinamento para a

determinar a eliminacao dos pesos. Para isso e necessario que o calculo da matriz Hessiana

seja realizado de forma integral, isto e nenhuma restricao a esta matriz e imposta. Uma

restricao as caracterısticas da matriz Hessiana ocorre no algoritmo OBD que a considera

como uma matriz diagonal, com o objetivo de eliminar pesos. Como descrito por Hassibi

et al. (1993), a eliminacao indevida dos pesos pode provocar o incrementado do erro e

alguns pequenos pesos podem ser necessarios para a reducao do erro global da rede.

Baseando nas informacoes citadas anteriormente, a rede neural proposta para este trabalho

aplicara o algoritmo OBS para a solucao do problema proposto.

2.1.5 Treinamento da Rede

O processo de treinamento ou aprendizagem da rede, consiste na apresentacao de um

limitado conjunto de exemplos, contendo as variaveis de entrada e o resultado desejado

para cada evento. Partindo destas informacoes, os pesos das conexoes entre as camadas

de entrada e os neuronios das camadas intermediarias, os pesos entre os neuronios das

camadadas intermediarias e a camada de saıda sao ajustados de forma iterativa ate que

as caracterısticas que as representem sejam obtidas. Uma vez determinados os pesos

das conexoes, outro conjunto de exemplos pode ser aplicado a rede para gerar solucoes,

baseadas no conhecimento anteriormente adquirido.

Para o treinamento das redes podem ser empregados algoritmos diferentes que divergem

basicamente no modo de execucao dos ajustes dos pesos. Estes algoritmos se dividem

entre dois paradigmas que sao o treinamento nao-supervisionado e o treinamento super-

visionado. No treinamento nao-supervisionado, os exemplos apresentados para a rede

compreendem somente informacoes de entrada, que sao agrupados em classes conforme a

semelhanca de suas propriedades dadas pelos ajustes dos pesos da rede.

O outro modo de treinamento, o supervisionado, considera o emprego de um elemento

externo de supervisao que fornece a rede, exemplos de treinamento que comportam tanto

informacoes da entrada do processo quanto da saıda para os mesmos eventos. Este e o

metodo mais comumente utilizado para o treinamento das redes neurais. O treinamento

supervisionado pode ser classificado em dois segmentos sendo o primeiro o treinamento

dinamico, onde ocorrem alteracoes na estrutura da rede tais como aumento ou diminuicao

dos numeros de neuronios, camadas ocultas e conexoes entre os neuronios das camadas

de entrada, intermediaria e de saıda. O segundo segmento compreende o treinamento

estatico, onde somente os pesos das conexoes sao alterados. A estrutura da rede nao e

alterada em nenhum momento.

O ajuste dos pesos de uma RNA, com treinamento supervisionado, compara o valor

fornecido como solucao pela rede, com o valor apresentado como desejado no conjunto

de dados de treinamento. Obtendo a diferenca entre os dois resultados, e possıvel realizar

um ajuste nos pesos visando minimizar este erro e melhorar a relacao entre as informacoes

de entrada e saıda da rede. De maneira algebrica, a expressao 2.10 representa o termo

relativo ao erro e(t) que e descrito como a diferenca entre o valor desejado, d(t) e o valor

calculado pela rede, y(t), no instante t.

ej(t) = dj(t)− yj(t), (2.10)

Em cada nova realizacao de treinamento sao realizadas modificacoes nos pesos, buscando

a convergencia ao valor esperado. A equacao 2.11 representa de forma generica para a al-

teracao dos pesos, determinando que os pesos do proximo treinamento serao baseados nos

valores atuais do peso, acrescidos de um termo construıdo com uma taxa de aprendizado

η , que define a velocidade de ajuste dos pesos para convergir ao menor erro e(t) e xi(t)

que e a entrada para o neuronio i no instante t.

wj,i(t+ 1) = wj,i(t) + η.e(t).xi(t), (2.11)

Existem algoritmos em que a taxa de aprendizado e mantida constante durante todo o

treinamento. Sua importancia e verificada no desempenho do algoritmo, uma vez que

valores elevados causam oscilacoes e tornam o algoritmo instavel. Por outro lado, valores

reduzidos da taxa de aprendizado requerem um tempo de calculos elevado para a con-

clusao do treinamento. Em algoritmos em que a taxa de aprendizado e variavel, estas

taxas se adaptam a superfıcie estabelecida pelas informacoes de erro fornecidas, buscando

sua maximizacao enquanto a estabilidade existir. No decorrer do treinamento a taxa de

aprendizado e reduzida aos mımimos valores possıveis.

A soma dos erros quadraticos, de todas as saıdas fornecidas pela rede, tem sido adotada

como um parametro para medicao do desempenho da rede, bem como a funcao de custo

E(t), como descrito na equacao 2.12. Esta funcao de custo deve ser minimizada pelo

algoritmo de treinamento e constitui o princıpio da regra delta de Widrow e Hoff.

E(t) =1

∑e2j(t), (2.12)

A funcao de custo representa a superfıcie de erro com os parametros livres do sistema, peso

e bias como coordenadas. Quando sao empregadas somente funcoes de ativacao lineares,

esta superfıcie apresenta apenas um unico ponto de mınimo. Quando sao empregadas

funcoes de ativacao nao-lineares a superfıcie e alterada de tal forma que pode apresentar

diversos pontos de mımimos locais e apenas um mınimo global. O objetivo da minimizacao

dos erros e que durante o perıodo de treinamento, o erro seja deslocado de um ponto

qualquer na superfıcie de erro em direcao ao mımimo global. Como este deslocamento

segue um comportamento aleatorio, existe a possibilidade de que o algoritmo realize a

convergencia para um ponto de mınimo local, que possua um erro superior ao que poderia

ser obtido em um ponto onde o mınimo e global.

O algoritmo mais empregado para o treinamento das redes MLP e o algoritmo de retro-

propagacao, ou backpropagation. Na primeira fase do treinamento, o sinal funcional e

transferido dentro da rede no sentido da camada de entrada para a camada de saıda (feed-

forward), com os valores das variaveis de entrada apresentadas e mantendo fixos os pesos,

com o objetivo de gerar uma resposta na saıda da rede. Na segunda fase do treinamento,

os valores obtidos nas saıdas sao comparados com os valores desejados produzindo um

sinal de erro. Este sinal de erro e entao retornado pela rede, no sentido da camada de

saıda para a camada de entrada, ajustanto os pesos de forma a minimizar o erro encon-

trado. Este processo de retro-propagacao do erro e que define o termo backpropagation

no treinamento das MLP.

A correcao de cada peso do neuronio, ou seja o seu ajuste, e baseada no metodo do

gradiente para a minimizacao do erro. Isto e realizado pelo produto existente entre a

taxa de aprendizado assumida e a derivada parcial da funcao de custo em relacao ao peso

atual. Conforme descrito por Fiorin et al. (2011), pode-se dizer que os ajustes nos pesos,

∆wji, definidos pela equacao 2.13 , sao dependentes do valor do gradiente local da curva

de erro. Para se definir o valor do gradiente local, descrito pela equacao 2.14, e aplicado

o valor da derivada da funcao de ativacao interna do neuronio, ϕj(vj(t)). Este algoritmo

e aplicavel para a correcao dos pesos tanto dos neuronios das camandas intermediarias da

rede quanto para os neuronios da camada de saıda.

∆wji = η.δj(t).xi(t), (2.13)

δj(t) = ej.ϕj(vj(t)), (2.14)

O ajuste dos pesos de uma rede MLP pode ser realizada de duas formas distintas que sao

os modos sequencial e por lote. Braga et al. (2000) descrevem que no modo sequencial

os pesos sao atualizados apos a apresentacao de cada exemplo de treinamento. Neste

modo de ajuste e estavel quando a taxa de aprendizado e pequena, porem quando a

taxa de aprendizado e elevada geralmente a rede se torna instavel. No modo por lote, o

ajuste dos pesos e realizado apos a apresentacao de todos os exemplos de treinamento. O

intervalo que compreende a apresentacao de todos os dados de treinamento e denominado

uma epoca. Haykin (2001), descreve que o modo sequencial e preferıvel em relacao ao

modo por lote por solicitar uma menor quantidade de memoria para armazenamento das

informacoes das conexoes sinapticas. Outro fator favoravel e que a apresentacao dos

parametros de forma aleatoria torna a busca no espaco de pesos de natureza estocastica e

por sua vez miniminiza as possibilidades do algoritmo de retropropagacao estabilizar em

um mınimo local da superfıcie de erro. As duas razoes praticas que tornam a atualizacao

dos pesos no modo sequencial mais popular sao a sua facilidade de implementacao e sua

capacidade de fornecer solucoes efetivas para problema difıceis.

2.2 Tratamento dos Dados 20

2.1.6 Capacidade de Generalizacao da Rede

Uma das etapas finais para o desenvolvimento das redes neurais e a avaliacao da ca-

pacidade de generalizacao. Apos selecionar a arquitetura a ser empregada, determinar

do numero de neuronios nas camadas ocultas e realizar o treinamento da rede com os

dados disponibilizados e necessario avaliar a qualidade da resposta emitida pela rede.

Com a insercao de dados do conjunto de treinamento empregado, que ja foram avaliados

anteriormente, a RNA pode fornecer pequenos valores de erro para os resultados apre-

sentados. Contudo, ao apresentar informacoes diferentes, que estao compreendidas nos

dados do conjunto de validacao e ainda nao foram apresentados, a mesma RNA pode

fornecer respostas com elevados erros. Neste caso a rede ”memoriza”, e nao incorpora,

o comportamento do processo caracterizando o seu sobreajuste tambem conhecido como

overfitting.

Como detalhado por Haykin (2001), o processo de treinamento de uma rede neural pode

ser relacionado como um problema de ”ajuste de curva”. Considerando que a RNA e

um mapeador nao-linear de entrada-saıda, sua capacidade de generalizacao tem o efeito

de uma boa interpolacao nao-linear sobre os dados de entrada. Uma rede neural bem

ajustada e capaz de produzir um mapeamento das entradas e saıdas adequado, mesmo

quando os valores de entrada forem um pouco diferentes dos exemplos usados para o

treinamento.

A capacidade de generalizacao de uma rede neural e influenciada pelo tamanho e a quali-

dade do conjunto de dados de treinamento, pela arquitetura utilizada e pela complexidade

fısica do problema. Com o intuito de promover a capacidade de generalizacao da rede, po-

dem ser aplicados metodos numericos como a regularizacao e a parada antecipada (Early

Stopping) do treinamento. No metodo de regularizacao a funcao de custo e alterada para

minimizar tanto o erro e(t), como tambem os valores dos pesos ao longo do treinamento.

No metodo de parada antecipada os dados sao divididos em grupos de treinamento e va-

lidacao. O ajuste dos pesos sao realizados somente quando os dados de treinamento sao

apresentados e o grupo de dados de validacao e utilizado para a avaliacao da capacidade de

generalizacao da rede durante a etapa de treinamento. Esta etapa e interrompida quando

o erro do conjunto de validacao tende a crescer, enquanto o erro para o conjunto de dados

de treinamento continuaria decrescendo.

2.2 Tratamento dos Dados

A coleta dos dados necessarios a modelagem de um processo e uma tarefa que demanda

tempo e cuidados especiais. Em muitos exemplos os dados sao adquiridos compreendendo

tanto as informacoes pertinentes ao processo como tambem dados espurios, dados falsos e

ruidosos. A introducao destas informacoes nas redes neurais tendem a causar incrementos

nos erros e consequentemente levar aos problemas de generalizacao e convergencia. Algu-

mas das ferramentas atualmente disponıveis e aplicadas no tratamento dos dados serao

apresentadas em seguida.

2.2.1 Normalizacao dos Dados

A normalizacao dos valores das variaveis a serem utilizadas na camada de entradas das

redes neurais e outro fator importante a ser observado. Nascimento et al. (2009) descre-

vem que a finalidade da normalizacao e adaptar os dados de entrada a faixa de valores

dinamicos das funcoes de ativacao dos neuronios da rede. Nos casos em que os valores as

entradas sao muito elevados e possıvel que a funcao de ativacao seja saturada, prejudi-

cando a convergencia da rede neural, como descrito por Lima (2010).

Um metodo de normalizacao, apresentado por Aydinalp et al. (2007), implica na subtracao

do valor medio da variavel, dividindo o resultado pelo seu desvio padrao. A representacao

matematica e demonstrada na equacao 2.15.

xn =x− µσ

, (2.15)

• xn, o valor resultante da normalizacao;

• x, o valor atual da variavel referida;

• µ, o valor medio da variavel referida;

• σ, o desvio padrao da variavel referida.

Em outro metodo de normalizacao e empregado um valor de offset, que e deduzido para os

dados amostrados, que serao transformados sobre uma faixa desejada pela media de um

fator escalar. O metodo mais frequentemente empregado envolve o mapeamento dos dados

linearizados sobre uma faixa especıfica. A representacao matematica e demonstrada na

equacao 2.16. A faixa de valores aproximada de 0,1 a 0,9 e considerada a mais apropriada

para a transformacao dos valores de variaveis para a aplicacao na faixa de sensibilizacao

da funcao de ativacao logıstica sigmoidal.

x′ = (x− xmin)x′max − x′min

xmax − xmin

+ x′min, (2.16)

• x′, o valor resultante da normalizacao;

• x, o valor atual da variavel referida;

• x′max, o valor maximo esperado para a variavel referida;

• x′min, o valor mınimo esperado para a variavel referida;

• xmax, o valor maximo desejado para a variavel referida;

• xmin, o valor mınimo desejado para a variavel referida.

A avaliacao estatıstica das informacoes e variaveis relacionadas ao problema e uma das

tecnicas que aperfeicoam a arquitetura da rede. A aplicacao desta tecnica de avaliacao,

resulta em uma selecao das variaveis que realmente sao necessarias para suprir a rede

neural de informacoes, excluindo aquelas que nao influenciam de maneira significativa os

resultados. Verificam-se disponıveis para a execucao desta avaliacao os metodos de analise

da correlacao linear entre os pares de variaveis de entrada/saıda e a analise de auto-

correlacao entre as variaveis. Neste trabalho a analise da correlacao linear foi empregada

na preparacao dos dados para o treinamento da rede neural.

2.2.2 Coeficiente de Correlacao Linear

Frequentemente procura-se pesquisar a existencia da relacao entre duas ou mais variaveis,

para avaliar o comportamento destas variaveis quando quando uma delas sofre alteracoes.

O estudo da correlacao presente entre as variaveis permite que sejam determinadas a

existencia e o grau de relacao entre as variaveis. Um metodo para determinacao do

sentido e o grau de correlacao e dado pela medida da covariancia entre duas variaveis

aleatorias u e y, informando a correlacao linear entre elas. A funcao de covariancia e

definida pela equacao 2.17

COV (u.y) =1

[∑u.y −

∑u.∑y

](2.17)

sendo que:

• N , indica o numero total de dados;

• u, refere-se as amostras dos dados de entrada;

• y, refere-se as amostras dos dados de saıda;

Magalhaes e Lima (2009) descrevem que o coeficiente de correlacao linear de Pearson e

convenientemente utilizado para medir a correlacao entre variaveis e e determinado pela

equacao 2.18.

ru.y =COV (u.y)√σuσy

(2.18)

O coeficiente de correlacao de Pearson e confinado na faixa entre −1 e +1. Quando

r=−1, existe uma correlacao linear perfeitamente negativa entre as variaveis, demons-

trando que variam em um mesmo sentido, porem em direcoes opostas. Isto e, quando y

e incrementado, u e decrementado na mesma dimensao. Quando r=0, significa que nao

existe qualquer correlacao entre y e u, e as variaveis sao consideradas descorrelacionadas.

Quando r=+1 existe uma correlacao linear perfeitamente positiva entre as variaveis u

e y. Isto quer dizer que eles variam na mesma quantidade. Uma definicao citada por

Figueiredo Filho e Silva Junior (2009) para o coeficiente de correlacao, descreve que ”a

correlacao cruzada dimensiona a direcao e o grau de relacao linear entre duas variaveis

quantitativas”. Para Lira (2004), o coeficiente de correlacao pode ser avaliado de forma

qualitativa, dependendo dos objetivos para sua utilizacao e as razoes para seu calculo.

Na tabela 2.3, estao relacionadas algumas faixas representantes da qualidade dos dados

avaliados segundo o criterio do coeficiente de correlacao de Pearson. Nesta tabela sao

expressos apenas os valores de modulo do resultado da correlacao.

Tabela 2.3: Correlacao entre variaveis.

Faixa Definicao0,00 a 0,29 Fraca0,30 a 0,59 Moderada0,60 a 0,89 Forte0,90 a 1,00 Muito ForteFonte: Lira (2004)

Os pares dos valores das duas variaveis podem ser representados em um diagrama de

dispersao, que possui a vantagem de fornecer uma simples visualizacao do relacionamento

entre as variaveis. A correlacao existente entre os dados e representada pelos pontos no

grafico, formando uma nuvem com os dados dispersos na superfıcie de avaliacao. As duas

retas representadas na figura significam o valor maximo possıvel para a correlacao das

variaveis, em uma linha tracejada, e o valor obtido pelos dados apresentados, na linha

contınua. A medida da inclinacao da reta determina o grau de correlacao linear presente.

A figura 2.4 apresenta um diagrama de dispersao, onde um conjunto de dados do tipo

(u,y) e representado e as variaveis avaliadas possuem uma correlacao muito fraca.

Outro indicador para a relacao presente entre as variaveis e o coeficiente de correlacao

multipla R2, determinado pela equacao 2.19. O valor de R2 e diretamente proporcional a

correlacao linear existente entre as duas variaveis. Ou seja, quanto menor R2, menor sera

a correlacao entre as duas variaveis analizadas, como descrito por Aydinalp et al. (2007).

R2 = 1−∑N

i=1(ui − yi)2∑Ni=1 u

(2.19)

Como um outro exemplo para a situacao onde duas variaveis possuem uma elevada cor-

relacao linear, a figura 2.5 fornece uma explicacao grafica. Neste caso a correlacao entre

as variaveis u e y produz uma nuvem de dados com distribuicao dos pontos em uma reta

bastante proxima do eixo objetivo. Quanto menor for a distancia entre a linha de obje-

tivo e a linha representativa da correlacao entre as variaveis, maior e a correlacao linear

existente entre estas variaveis.

O valor de correlacao linear entre variaveis depende fortemente da qualidade dos dados

aplicados. Dados ruidosos, com valores espurios inclusos, sao determinantes para a re-

ducao do ındice de correlacao. Um recurso disponıvel para mitigacao deste problema e

o emprego da Distancia de Mahalanobis para evidenciar e orientar a eliminacao destes

Figura 2.4: Baixa correlacao linear entre variaveis

Figura 2.5: Elevada correlacao linear entre variaveis

pontos especıficos nos conjuntos de dados.

2.2.3 Distancia de Mahalanobis

Quando um conjunto de informacoes exprime um comportamento estavel das variaveis

de um sistema, as conclusoes sobre o processo podem ser facilmente expressas e determi-

nadas. Segundo Angiulli et al. (2010), um conjunto de observacoes que demonstre algumas

propriedades contrastantes com o dados padronizados, que possam ser logicamente justi-

ficadas pelo conhecimento basico, sao defindas como outliers.

Frequentemente, as tecnicas de medicao multivariavel sao baseadas nos valores das distan-

cias entre um ponto referencial e um outro ponto desejado. A Distancia de Mahalanobis

e uma das tecnicas mais comumente usadas, segundo Maesschalck et al. (2000). No es-

paco original das variaveis, a Distancia de Mahalanobis correlaciona os dados, calculando

a matriz inversa de variancia-covariancia do conjunto de dados de interesse. Porem o

calculo da matriz de variancia-covariancia pode causar problemas. Quando os dados pos-

suem um elevado numero de variaveis, estas podem conter informacoes redundantes ou

muito correlacionadas. A multicolinearidade nos dados e capaz de promover uma matriz

de variancia-covariancia singular que nao pode ser invertida. A segunda limitacao para

o calculo e que o numero de amostras no conjunto de dados seja tao grande quanto o

numero de variaveis. Nestes casos a reducao no numero de variaveis deve ser executada.

A Distancia de Mahalanobis e aplicada a diferentes propositos no campo de calibracao

multivariavel. Um deles, aplicado neste trabalho, e a deteccao de outliers no conjunto

de dados. A eliminacao dos outliers permite uma reducao nos erros cometidos pela rede.

Uma outra aplicacao possıvel e a avaliacao de quanto uma amostra se difere de uma

norma para a variavel, como descrito por Krusinka (1987) em seu trabalho. Neste caso,

uma norma estimada e obtida em funcao de um conjunto de amostras de treinamento,

excluindo a classe de objetos normais como um ponto ou estimativa coerente. A distancia

entre a amostra considerada anormal e a norma estimada obtida e tratada como a medicao

procurada por um degrau de diferenciacao.

Para calcular a Distancia de Mahalanobis, primeiramente a matriz de variancia-covariancia

Cx deve ser construıda.

(n− 1)(Xc)

T (Xc), (2.20)

sendo que

• Cx, representa a matiz de dados contendo n amostras de p variaveis;

• Xc, representa matriz (X −X).

Para o caso onde sao avaliadas somente duas variaveis, x1 e x2, a matriz de variancia-

covariancia sera

[σ21 ρ12σ1σ2

ρ12σ1σ2 σ22

](2.21)

sendo que

• σ21, representa a variancia dos valores da primeira variavel;

• σ22, representa a variancia dos valores da segunda variavel;

• ρ12σ1σ2, representa a covariancia entre as duas variaveis.

A Distancia de Mahalanobis para cada objeto xi e entao

DMi =√

(xi − x)C−1x (xi − x)T , (2.22)

Para corroborar sua aplicacao no trabalho, a Distancia de Mahalanobis foi utilizada para

eliminar os outliers dos dados amostrados, para o perıodo de processamento de bobinas.

Os dados de um determinado perıodo do processo, contendo 543 amostras, sao exibidos

na figura 2.6, onde o eixo das ordenadas representa as bobinas amostradas e o eixo das

abcissas o tempo despreendido para o processo de cada bobina respectivamente.

Figura 2.6: Dados anteriores a submissao da Distancia de Mahalanobis, resultando em 543 bobi-nas

Nesta figura existem dois pontos com elevada discrepancia em relacao ao demais, o

primeiro com amplitude de 6605 minutos e o segundo com 14726 minutos de processo.

Estas amostras foram geradas por uma caracterıstica particular do processo, durante o

perıodo de inatividade da linha de producao. Nesta condicao o valor medio do tempo de

processo das bobinas no perıodo e igual a 74 minutos de processo, demonstrando o quao

divergente estas amostras estao dos dados aceitaveis. Como a Distancia de Mahalanobis

entre os valores e consideravelmente elevada, ambos sao evidenciados e considerados como

outliers.

Com os outliers evidenciados, em sucessivas aplicacoes desta tecnica, estes dados sao

eliminados. A alteracao realizada no conjunto de dados total proporciona uma reducao do

valor medio do perıodo para 33 minutos de processo, como demonstrado na figura 2.7, onde

a maior concentracao na quantidade de bobinas processadas esta na faixa compreendida

entre 20 e 40 minutos. Verifica-se tambem a existencia de processos com perıodos muito

maiores, porem em uma frequencia bem reduzida.

Obtendo-se uma maior homogeneidade nos dados, a quantidade de erros que poderiam

serem inseridos no treinamento da rede neural e reduzinda. O resultado final, com a eli-

minacao de praticamente todos os dados espurios do processo, para o perıodo avaliado, e

demonstrado na figura 2.8, que promove uma visualisacao mais detalhada do comporta-

Figura 2.7: Histograma dos dados de tempo de processamento das bobinas

mento da variavel tempo de processo das bobinas, representando seus resultados de forma

mais realista de acordo como conhecimento empırico do processo. Os valores evidenciados

na figura com um tempo de processo de 85 e 108 minutos sao exemplos mais raros, porem

considerados como pertencentes ao processo.

Figura 2.8: Aplicacao da Distancia de Mahalanobis, resultando em 537 bobinas uteis

No proximo capıtulo sera apresentado uma descricao do processo de eletrogalvanizacao

descrevendo seu princıpio basico de funcionamento, e as variaveis coletadas no sistema

que foram empregadas no trabalho.

Capıtulo 3

Descricao do Processo

3.1 A Galvanoplastia

Um dos processos siderurgicos destinados a melhoria da qualidade superficial das cha-

pas de aco, e o revestimento protetivo das tiras de aco. Esse efeito pode ser concebido

atraves da galvanoplastia, ou eletrogalvanizacao, que consiste na formacao de uma bar-

reira protetora quanto a oxidacao por meio da precipitacao eletrolıtica de metais nobres

sobre metais comuns. A aplicacao de zinco sobre a superfıcie de um substrato em aco

lhe permite melhores caracterısticas mecanico-metalurgicas de resistencia a corrosao, oxi-

dacao e conformacao superiores as aferidas ao metal primario isolado e sem este tipo de

tratamento, conforme foi confirmado por Marques (2008) em seu trabalho.

A galvanoplastia e baseada na reacao fısico-quımica existente entre o movimento de

eletrons no interior dos condutores eletricos e os ıons metalicos disponıveis dentro de uma

solucao aquosa preparada. De modo geral, quando uma determinada corrente eletrica e

aplicada aos anodos de uma celula galvanica, os cations metalicos sao retirados da solucao

e transportados para o catodo. Na chapa de aco, que se transforma no catodo, os ıons

sao novamente convertidos em metal e precipitados sobre sua superfıcie. O volume de

precipitacao metalica e determinado pela 1a lei de Faraday, cujo enunciado e dado por:

A massa de qualquer elemento depositado em um dos eletrodos por efeito

da eletrolise e diretamente proporcional a intensidade da corrente e ao

tempo durante o qual se da a eletrolise. Salmeron (1961)

No processo de eletrogalvanizacao da Usiminas, uma fonte de energia fornece uma corrente

eletrica contınua, estabilizada e ajustavel conforme a necessidade da aplicacao. O fluxo

3.1 A Galvanoplastia 30

de eletrons disponibilizado e direcionado atraves dos condutores eletricos para as placas

de anodo, confeccionados em material inerte, e reage com os ıons metalicos disponıveis na

solucao de sulfato de zinco (ZnSO4), formando um ıon de zinco. Devido a concentracao

de ıons de zinco (Zn+2) liberados pela reacao da corrente eletrica com a solucao, estes

ıons sao agregados a superfıcie da chapa de aco e entao convertidos novamente em um

metal que tem a funcao de catodo no processo. A Figura 3.1 ilustra o princıpio basico

e as reacoes quımicas de uma celula eletrolıtica empregando como anodo um eletrodo de

zinco e como catodo uma chapa de aco. Ambos submersos em uma solucao de sulfato de

zinco e submetidos a um fluxo de eletrons.

Figura 3.1: Princıpio de funcionamento de uma celula eletrolıtica

Fonte: Manual de operacao Andritz, 1993.

Considera-se que o zinco tem uma precipitacao especıfica equivalente a 1,2197 g/Ah.

Para ilustrar o processo em um exemplo pratico, a aplicacao de 65 A/dm2 de densidade de

corrente eletrica produz um revestimento de 7,5 µm de espessura media de camada de zinco

nas duas faces de uma tira de aco. Neste caso, a energia consumida aproxima-se de 140

kWh/t de aco revestido, conforme o manual de procedimentos e funcionamento da Andritz

(1993). O custo agregado ao produto, observando-se somente a demanda de energia

eletrica aplicado para o kW/h, oscila em torno de 48,80 R$/t para o material processado.

3.2 Sistema de Fornecimeto de Energia Eletrica 31

Observando este ponto, verifica-se a relacao direta existente entre o consumo de energia

eletrica e os custos dispendidos no processo de revestimento por eletrogalvanizacao para

tiras de aco.

E necessario observar que a espessura e a densidade da camada de zinco adicionada ao

material primario devem ser controladas com precisao, pois estes fatores determinam os

principais custos advindos do processo. Quanto mais elevada for a eficiencia do agrupa-

mento do zinco sobre a superfıcie do aco maiores serao a homogeneidade e qualidade do

revestimento, consequentemente menores serao os custos de producao. Um dos fatores

que influenciam diretamente na eficiencia do processo e o controle da energia eletrica

provida pelos conversores reguladores de corrente contınua. Consequentemente, um dos

itens mais relevantes para o processo em escala industrial e a demanda de energia eletrica.

Seu gerenciamento e dimensionamento impactam diretamente no custo final do produto

e em sequencia nas margens de ganhos. O modelo correntemente aplicado generaliza a

parcela do custo do consumo de energia eletrica sobre a producao, apenas totalizando-o

no final de um perıodo especıfico.

A capacidade nominal de producao da linha de eletrogalvanizacao da Usiminas gira em

torno de 25.000 toneladas/mes, dependendo do material inserido no processo e das especi-

ficacoes do cliente. As variaveis basicas que constituem a especificacao tecnica do produto

• Largura da tira, dada em mm e variando entre 500 a 1650 mm;

• Espessura da tira, dada em mm e variando entre 0.50 a 1.65 mm ;

• Densidade da camada de revestimento, dado em g/m2 e variando entre 11 a 120

g/m2 ;

• Peso da bobina a ser revestida, dado em toneladas e variando entre 5 a 30 t;

• Superfıcie a ser revestida, selecionavel entre inferior, superior ou ambas;

Utilizando como base os dados historicos de producao, fornecidos pela empresa, pode-se

verificar o volume de aco produzido pela linha de eletrogalvanizacao na Figura 3.2. Esta

figura exprime a producao realizada no perıodo entre janeiro de 2004 e maio de 2013, com

amostras coletadas mensalmente.

3.2 Sistema de Fornecimeto de Energia Eletrica

A energia eletrica empregada no processo e proveniente de duas linhas de transmissao

em uma voltagem de 69 kV, que em seguida e reduzida para aplicacao aos equipamentos

do processo em voltagens de 11 kV e 460 V. O consumo de energia eletrica no processo

analisado, dado em kW/h, e formado pela demanda criada pelas cargas dos equipamentos

Figura 3.2: Plano de producao executado no perıodo de 2004 a 2013

instalados como transformadores de potencia, conversores CA/CC para acionamento de

motores e retificadores, inversores de frequencia, motores eletricos, filtros para reducao de

distorcao das componentes harmonicas de corrente de 5a, 7a e 11a ordem e equipamentos

de controle e de refrigeracao.

A variavel de consumo de energia eletrica e registrada por medidores instalados nos dois

paineis de recebimento da concessionaria e armazenados em um banco de dados para

registro e determinacao dos custos no perıodo. O valor total da energia empregada no

processo de eletrogalvanizacao e formado por duas componentes. A primeira componente

e definida pelo somatorio dos valores registrados nos dois medidores de recebimento. A

segunda componente e fornecida por outros dois medidores, instalados em circuitos que

nao fazem parte do processo de eletrogalvanizacao. Um destes equipamentos realiza o

tratamento dos efluentes produzidos pela eletrogalvanizacao, denominado ETEG (Es-

tacao de Tratamento dos Efluentes da Galvanizacao). Apesar de ser um subequipamento

da linha de eletrogalvanizacao, considera-se a ETEG como pertencente ao outro grupo de

equipamentos auxiliares de producao, dispostos em varias areas da empresa. O segundo

equipamento refere-se a uma unidade de tratamento superficial de cilindros de laminacao,

denominada Usiroll. Esta unidade e uma joint-venture entre a Usiminas e a Court Hold-

ing, uma empresa de origem canadense, que fornece subsıdios para a producao de outras

linhas de producao na empresa. A energia eletrica para estes dois equipamentos e provida

atraves da linha de eletrogalvanizacao simplesmente por motivos de estrutura instalada,

localizacao fısica e logıstica. Os consumos realizados por estes equipamentos sao registra-

dos e subtraıdos do somatorio do consumo geral do processo. A equacao 3.1, explica esta

manipulacao.

EProcesso = ETR1 + ETR2 − (EETEG + EUsiroll) (3.1)

Sendo que:

• EProcesso - Energia total do processo;

• ETR1 - Energia medida na linha de recebimento numero 1;

• ETR2 - Energia medida na linha de recebimento numero 2 ;

• EETEG - Energia medida na linha de fornecimento para a ETEG;

• EUsiroll - Energia medida na linha de fornecimento para a Usiroll;

Um diagrama unifilar do sistema distribuidor de energia eletrica, exibido na Figura 3.3

representa o fluxo da energia eletrica, as cargas alimentadas pelo barramento e os pontos

onde sao realizadas as medicoes de consumo.

3.2.1 Relacionamento entre Energia Eletrica e Producao de Eletrogalvaniza-

Estabelecendo a relacao entre o consumo de energia eletrica e a producao executada,

verifica-se a interdependencia da primeira em relacao a segunda. O consumo de energia

eletrica, medido em kWh, no processo analisado e diretamente ligado ao plano de pro-

ducao da planta, que por sua vez e dado em toneladas. A Figura 3.4 exibe o compor-

tamento do consumo de energia eletrica e producao nos ultimos nove anos, na linha de

eletrogalvanizacao da Usiminas. Contudo, a diversidade disponibilizada para as especifi-

cacoes tecnicas do material implica em diferentes comportamentos do consumo de energia

eletrica, produzindo resultados semelhantes para condicoes de producao distintas. Por

esta razao e possıvel visualizar que em determinados perıodos o valor especıfico de con-

sumo de energia se difere em muito para um perıodo onde os volumes de producao sao

semelhantes. Destacando-se o ponto A na Figura 3.4, obtem-se um consumo de energia

eletrica de 7.331.102 kWh para uma producao de 22.697 toneladas de aco eletrogalva-

nizado. No ponto B, uma producao relativamente semelhante de 22.797 toneladas deman-

dou um montante de 5.829.176 kWh de energia eletrica para ser produzido. Analizando

essas informacoes verifica-se que a diferenca de aco produzido entre os dois pontos, de 100

toneladas indica uma diferenca de 1.501.926 kWh de energia eletrica. Com o objetivo de

validar a correlacao entre as informacoes de producao executada e consumo de energia

eletrica, estas variaveis foram normatizadas nesta representacao.

O consumo de energia eletrica e formado por duas partes distintas para todos os produtos

processados, sendo uma constante e a outra variavel, dependendo diretamente da especi-

ficacao de producao solicitada. A componente constante do consumo de energia eletrica

Figura 3.3: Diagrama eletrico unifilar simplificado do sistema distribuidor de energia eletrica dalinha de eletrogalvanizacao da Usiminas.

Figura 3.4: Comportamento da producao e do consumo de energia eletrica no processo de ele-trogalvanizacao

e formada pela operacao dos equipamentos que auxiliam na operacao do processo, inde-

pendente do tipo de material que esta sendo produzido. As cargas que constituem estes

conjuntos sao:

• Os sistemas de refrigeracao e ventilacao da salas de controle e de equipamentos;

• Os sistemas de bombas para transferencia de fluıdos e solucoes;

• Os sistemas de iluminacao dos equipamentos, salas de controle e galpoes da insta-

lacao;

• Os sistemas de manuseio de bobinas processadas, como transportadores e pontes

rolantes;

• Os equipamentos de controle e supervisao do processo;

Para cada bobina de aco revestida e consumida uma quantidade distinta de energia eletrica

no processo. Este fato se da fundamentalmente por questoes das especificacoes tecnicas

do produto, determinadas pelos clientes e pelas condicoes operacionais disponibilizadas

pelos equipamentos durante o processo. A alteracao de algumas destas variaveis influi

diretamente no calculo realizado para a necessidade de corrente eletrica a ser fornecida

pelos conversores reguladores de corrente em operacao para as celulas galvanicas. A

componente variavel do consumo de energia eletrica e basicamente definida por:

• Velocidade de processo dos materiais;

• Quantidade de material a ser depositado na superfıcie da tira;

3.3 Equipamentos Instalados 36

• Numero de faces a serem revestidas (uma ou duas);

• Dimensoes do material processado;

Como um exemplo, para o caso de uma reducao na velocidade de processo e manutencao

do valor de quantidade de material depositado na superfıcie revestida, a corrente eletrica

disponibilizada pelos retificadores e reduzida. A demanda total de corrente eletrica e dis-

tribuıda entre os conversores, considerando o numero de retificadores em operacao. Deste

modo a energia total fornecida pelos retificadores, para o revestimento de um determi-

nado produto, nao e alterada. Porem a energia solicitada pelos motores de acionamento

de alguns equipamentos como desbobinadeiras, bobinadeiras, bombas de solucao e rolos

condutores, tende a variar para se ajustar as atuais necessidades de torque e velocidade.

3.3 Equipamentos Instalados

O equipamento de eletrogalvanizacao e composto por tres secoes basicas de sub-equipamentos

que sao:

• Secao de entrada:

– Desbobinadeiras;

– Maquina de Soldas;

– Carro de compensacao de tiras;

• Secao do centro:

– Desempenadeira Tensora;

– Limpeza Eletrolıtica;

– Decapagem;

– Celulas galvanicas;

– Secao de Pos-Tratamento;

• Secao da saıda:

– Carro de compensacao de tiras;

– Tesouras Laterais;

– Oleadeira;

– Guilhotina;

– Bobinadeiras;

A Figura 3.5, representa a linha de producao da Galvanizacao Eletrolıtica dividida em

suas secoes de processo princiais.

As variaveis adquiridas para o trabalho foram divididas em dois grupos distintos, sendo

estes:

3.4 Variaveis da Secao do Centro 37

Figura 3.5: Linha de galvanizacao Eletrolıtica da Usiminas

Fonte: Usiminas , 1995.

• Grupo de variaveis da secao do centro do processo;

• Grupo de variaveis da secao de saıda do processo;

3.4 Variaveis da Secao do Centro

O grupo de variaveis do centro do processo representa o conjunto de informacoes que

atuam diretamente no ponto em que o consumo de energia e mais elevado e representativo.

Fisicamente este conjunto esta na regiao das celulas galvanicas onde foram instalados os

retificadores. As variaveis registradas sao:

• Numero da BF (Bobina a Frio) no Centro - usado para identificar a bobina atual,

nesta etapa do processo. E formado por um numero de 8 caracteres, exclusivo para

cada bobina;

• Velocidade no Centro - velocidade do processo na regiao central da linha de pro-

ducao. Normalmente varia dentro de valores pre-estabelecidos para nao afetar a

qualidade do produto. Nos casos em que seu valor se torna nulo, ocorrem danos

ao produto, tornando-o inadequado para as solicitacoes do cliente. Seu valor e me-

dido em funcao de um dos rolos condutores da tira e e dado em metros por minuto

(mpm);

• Densidade da camada inferior - valor medido por um leitor de camadas, construıdo

pela empresa FAG. Esse medidor, do modelo Gauge FH 46 M-E, possui uma faixa

de medicao de 0 a 130 g/m2. Seu tempo de atualizacao das leituras e de 10 ms,

com uma perıodo entre amostragens de 480 ms. O sinal fornecido para o PLC

(Programable Logic Controller) de controle e dado em uma malha de voltagem, em

que 10 g/m2 equivale a +10 Vcc;

• Densidade da camada superior - variavel obtida pelo mesmo medidor de camada

citado anteriormente. Difere-se apenas pelo fato de executar leituras na parte supe-

rior da tira de aco.

3.4 Variaveis da Secao do Centro 38

• Energia TR1 medida - totalizador da energia ativa consumida pelas cargas instaladas

no circuito a jusante do transformador TR1. A unidade de medida empregada e o

kW/h. E aplicado um medidor do modelo Multi-K, fabricado pela KRON medidores.

Por meio da leitura das correntes eletricas e das voltagens nas tres fases, calcula e

informa o valor medido pelo instrumento. A leitura obtida e armazenada em um

banco de dados e posteriormente enviado, via rede Ethernet, para o coletor de dados

do PIMS;

• Energia TR2 medida- totalizador da energia ativa consumida pelas cargas instaladas

no circuito a jusante do transformador TR2. O medidor aplicado e identico ao

instalado no TR1;

• Energia ETEG medida - totalizador da energia ativa consumida pelas cargas insta-

ladas no circuito a jusante da chave que alimenta a ETEG. O medidor aplicado e

identico ao instalado no TR1;

• Energia Usiroll medida- totalizador da energia ativa consumida pelas cargas insta-

ladas no circuito a jusante da chave que alimenta a Usiroll. O medidor aplicado e

identico ao instalado no TR1. O esquema de ligacao do sistema de comunicacao

entre os quatro medidores e exibido na Figura 3.6;

• Corrente de todos os retificadores - somatorio das correntes individuais de cada um

dos 40 retificadores instalados nas celulas galvanicas, com o valor calibrado retirando

os elementos negativos. Cada um dos retificadores possui uma capacidade nominal

de 37 kA, totalizando 1480 kA para todo o conjunto ;

Figura 3.6: Cirtuito de interligacao dos medidores de energia e a rede Ethernet

Fonte: Manual de operacao Kron, 2012.

3.5 Dados de Energia 39

3.5 Dados de Energia

A energia eletrica empregada registrada pelos medidores no processo de eletrogalvaniza-

cao, descreve uma curva ascendente com inclinacao variavel dependendo das solicitacoes

de cada processo. Para obter o valor de energia dispendido individualmente por bobina e

necessario realizar um calculo considerando os instantes em que o processo de cada bobina

e iniciado e finalizado. A equacao 3.2 descreve o calculo realizado.

Consumo(K) = Energia(K) − Energia(K−1) (3.2)

sendo:

• Consumo(K) , energia eletrica consumida por bobina;

• Energia(K−1) , a medida de energia na amostra inicial;

• Energia(K), a medida de energia na amostra final.

As informacoes fornecidas pelos medidores de energia apresentaram muitos pontos com

dados espurios, distorcendo o comportamento da curva. A Figura 3.7 revela o comporta-

mento da variavel por um perıodo delimitado para o mes de Fevereiro/12. Foram obtidos

valores para a variavel ”Consumo(K)” tanto positivos quanto negativos. Estes valores

encontrados foram analisados e concluiu-se que se tratam de dados espurios produzidos

por um problema interno dos medidores, que adicionam um termo de ± 216 na medicao

realizada e os transmite para o sistema de armazenagem de dados.

3.6 Variaveis da Secao da Saıda

O grupo de variaveis da saıda do processo representa o conjunto de informacoes que

representam o produto final gerado pelo processo. Fisicamente esses dados sao gerados

nos equipamentos que concluem o processo. As variaveis registradas sao:

• Numero da BF na Saıda - usado para identificar a bobina atual, nesta etapa do

processo. E formado por um numero de 8 caracteres, exclusivo para cada bobina.

• Velocidade na Saıda - velocidade atingida no processo de bobinamento da tira de

aco. Geralmente seu valor e diferente da velocidade na secao do centro da linha de

producao. A variavel tambem e informada em metros por minuto (mpm);

• Comprimento da BF na Saıda - valor calculado pela relacao ao numero de voltas

de um dos rolos tensores do processo e seu diametro externo, dada em metros;

• Largura da BF na Saıda - valor medido atraves do deslocamento do conjunto

aparador de bordas da tira, conhecido como Tesoura Lateral. A posicao do con-

junto e medida por meio do deslocamento do equipamento mecanico e informado

para o PLC. A variavel e informada em milımetros (mm);

3.6 Variaveis da Secao da Saıda 40

Figura 3.7: Dados do medidor de energia do Transformador TR1 em fevereiro de 2012

• Espessura da BF na Saıda - valor medido atraves do medidor de camadas, adicio-

nando a espessura da entrada as camadas superior e inferior depositadas no processo.

A variavel e informada em milımetros (mm);

Uma guilhotina, instalada na secao de saıda do processo permite que uma BF seja sec-

cionada em diversas partes de acordo com as especificacoes do cliente. Em diversos casos

a bobina processada pode ser dividida em varias outras que possuirao uma nova numera-

cao nao relacionada diretamente com a bobina geradora. Esse fato interfere diretamente

no modelo desenvolvido, uma vez que as componentes necessarias para a identificacao

desse evento nao foram consideradas durante o levantamento dos dados. Motivado pela

falta de uma correspondencia entre essas bobinas, disponıbiblizado nesse sistema de co-

leta de dados, as informacoes relativas a essas bobinas em especial serao descartados.

Para a pesquisa pela ocorrencia destes eventos considerou-se a concatenacao dos registros

de processo nas secoes de centro e saıda. Somente sao consideradas validas as bobinas

que possuırem o numero de BF presente nos dois conjuntos. Os casos diferentes foram

automaticamente excluıdos. A quantidade de bobinas consideradas na secao de saıda e

constatada na Tabela 3.1.

Conforme pode ser observado na Tabela 3.1, a quantidade de BF uteis para o treinamento

da rede foi reduzido em relacao a quantidade de bobinas processadas. Diversas bobinas

que foram disponibilizadas para os clientes foram originadas da divisao de bobinas maiores,

3.7 Aquisicao dos dados 41

Tabela 3.1: Dados de BF na saıda coletados.

Mes Qt. Incial BF utilfevereiro 509 346marco 695 475abril 562 322maio 703 403junho 589 443julho 460 341

inseridas no inıcio da linha de producao. Pela falta de informacoes para correlacionar as

partes que formavam um conjunto de bobinas derivadas da bobina primaria, estes dados

foram descartados, para o presente trabalho.

3.7 Aquisicao dos dados

Os dados do processo foram coletados pelo sistema integrado de informacoes, PIMS (Pro-

cess Information Managment System), da planta da Galvanizacao Eletrolıtica. As va-

riaveis coletadas por meio do PIMS sao submetidas a um algoritmo de aquisicao com

periodicidade diferenciada para cada elemento. O armazenamento das informacoes no

banco de dados e controlado individualmente, buscando manter a integridade dos dados.

No sistema avaliado o intervalo entre a leitura das amostras dos dados foi definido em 1

minuto. Como os perıodos de amostragem, nos equipamentos e sensores, sao diferentes e

o volume de informacoes e elevado, um algoritmo de compactacao dos dados foi aplicado.

No algoritmo de compactacao de dados aplicado no PIMS, ao surgir um novo valor para

a variavel, e avaliada a condicao de excecao deste valor. As condicoes basicas para se

verificar uma excecao sao: ultrapassar os limites de desvio da excecao ou ultrapassar o

limite maximo do tempo para a excecao. Caso o valor atenda a essas exigencias, este se

torna uma nova amostra. Os valores atual e anterior transformam-se em novas amostras

selecionadas, entao submetidas a um algoritmo de compressao. O teste de compressao

avalia os parametros de desvio de compressao, normalmente em 2% do valor de nomi-

nal de ajuste da variavel, e tempo de compressao, ajustavel conforme o comportamento

da variavel. Caso algum valor entre o ultimo evento arquivado e a valor atual estiver

fora da faixa delimitada, este valor viola o teste de compressao. Assim este novo valor

tambem sera armazenado no banco de dados relacional do sistema. Essa estrategia de

compactacao dos dados promove o armazenamento de uma elevada quantidade de dados,

consumindo uma quantidade relativamente pequena de espaco de memoria para os bancos

de dados, conforme apresentado no manual de treinamento do software OSIsoft, escrito

3.7 Aquisicao dos dados 42

por Joao Netto (2008).

Quando os dados sao pesquisados no PIMS, sua estrutura de banco de dados relacional

permite a exibicao em diversos perıodos de amostragem. Para os eventos onde os dados

basicos nao sao amostrados, o sistema proporciona uma resposta com um valor interpolado

para o intervalo solicitado.

No proximo capıtulo serao apresentados os metodos empregados para o pre-tratamento

das variaveis coletadas em cada uma das secoes do processo e utilizadas no trabalho.

Capıtulo 4

Materiais e Metodos

4.1 Preparacao dos Dados

Os dados coletados em cada uma das secoes da linha de producao necessitaram de um

pre-processamento para eliminacao de informacoes espurias. Tambem foi requerida a

aplicacao de algumas heurısticas para viabilizar o treinamento da rede neural e obter

resultados consistentes com o comportamento fısico do processo.

4.1.1 Tratamento das Variaveis de Medicao de Energia

Um erro nas medicoes registradas para as variaveis de energia eletrica foi causado por

um fator interno ao medidor, que adiciona em varios pontos aleatorios um componente

na ordem de grandeza de ±216, como exposto anteriormente na figura 3.7. Inicialmente

para eliminar este problema, removeu-se a componente identificada na amostra danificada.

Como a componente espuria soma-se a energia consumida neste perıodo, o erro e ampli-

ficado. A solucao obtida para a situacao foi a aplicacao do metodo de interpolacao das

medicoes, observando-se os valores anterior e posterior ao da amostra identificada como

incorreta. A Figura 4.1 exibe um evento onde uma componente de valor aproximado de

−216 e adicionado na medicao de energia, para uma amostra especıfica evidenciada pelo

ponto a.

A simples retirada deste pico de amplitude negativa, considerando o valor constante,

provoca um decrescimo na curva e consequentemente um terceiro valor com erro. A

interpolacao considerando as duas amostras vizinhas melhora a representacao fısica do

comportamento da energia eletrica empregada no processo, mitigando o erro gerado. A

Figura 4.2 apresenta uma vista amplificada do ponto registrado a, onde a correcao foi em-

4.1 Preparacao dos Dados 44

Figura 4.1: Erro causado pelo medidor

pregada para a mesma amostra exibida pela Figura 4.1. Nesse exemplo o valor amostrado

para o ponto a, da Figura 4.1, e de −65133 kWh. Eliminando o erro inserido de −216 a

medida no ponto b, da figura 4.2, e de 304 kWh. Aplicando a interpolacao proposta o

valor obtido para o ponto c, da figura 4.2, torna-se 405 kWh, para as amostras anterior

de 403 kWh e posterior de 407 kWh.

Figura 4.2: Aplicacao de interpolacao nos dados medidos

O valor aplicado em substituicao ao corrompido foi determinado pela equacao:

4.1 Preparacao dos Dados 45

Energia(K) =Energia(K+1) + Energia(K−1)

2(4.1)

Aplicou-se este metodo para todas as variaveis de medicoes de energia, resultando em

um comportamento fisicamente coerente com o esperado. Isto e, a energia acumulada

dentro de um perıodo definido deve sempre ser superior a anterior e nao pode conter os-

cilacoes depreciativas. O resultado alcancado e demonstrado na figura 4.3, representando

as energias medidas nos transformadores TR1 e TR2 e nos consumidores ETEG e Usiroll.

Observa-se que, devido aos pontos onde a energia medida atual, Energia(K+1), e inferior

a medida no instante imediatamente anterior, Energia(K−1), e produzido um valor de

energia consumida negativo. Desta forma a integracao da energia consumida se torna

inferior ao que foi realmente executado. Este ponto em especial, sem as devidas correcoes

influencia diretamente no resultado do processo de treinamento e validacao da rede neural.

Figura 4.3: Amostras de Energia Medida (-), Amostras de Energia Corrigida por interpolacao(- -), fevereiro de 2012

Com os dados de energia coletados nos medidores tratados, a energia utilizada no pro-

cesso de eletrogalvanizacao pode ser corretamente calculada de acordo com a equacao 3.1,

apresentada anteriormente e que nao sofre a necessidade de alteracoes.

4.2 Tratamento das Variaveis do Processo 46

4.2 Tratamento das Variaveis do Processo

Cada bobina possui caracterısticas proprias e por meio de algumas heurısticas foram

delimitados valores para diferenciar dados nulos de dados validos.

Como os dados foram coletados com uma taxa de amostragem fixa, de 1 minuto, os

valores dessa variavel se repetiam constantemente durante o perıodo de processo da mesma

bobina. Para determinar o numero da BF processada foi realizada a comparacao entre o

primeiro valor registrado, no vetor correspondente a variavel, e sua presenca entre todos os

demais valores armazenados no mesmo vetor. Encontrando o valor semelhante, computou-

se o numero de repeticoes, com o objetivo de determinar as dimensoes maximas da matriz

para armazenamento das demais variaveis relacionadas ao processo dessa bobina. Uma

vez encontrada a referencia da BF e armazenada, este valor foi eliminado do vetor de

pesquisa e entao reiniciada uma nova busca.

Analisando os dados verificou-se que, em alguns casos, certos numeros de BF repetiam-se

em demasia. Este fato ocorreu com algumas BFs por uma razao operacional. Devido a

necessidade de o processo ser interrompido periodicamente, o material imerso na solucao

eletrolıtica e sobrecarregado e se torna inadequado para a comercializacao. Para minimizar

estas perdas, algumas BFs sao usadas como materiais de sacrifıcio para permanecerem

imersas durante o intervalo de parada e consequentemente elevam o perıodo de sua per-

manencia no processo. Outro fator que incrementa esse valor e a repeticao ilimitada

da utilizacao desse recurso e reducao da quantidade de BFs disponıveis para esta finali-

dade. Como pre-tratamanto para a eliminacao dos dados espurios, encontrados no vetor

representativo da variavel numero da bobina, a analise da Distancia de Mahalanobis foi

empregada.

A Distancia de Mahalanobis avalia o quao distante um ponto de observacao esta em relacao

ao valor medio da variavel avaliada, como desmonstrado por Maesschalck et al. (2000).

Um resumo, expressando a quantidade dos dados coletados mensalmente e apresentado

na Tabela 4.1.

Inicialmente a quantidade total de informacoes registradas atingiu um volume de 256.386

linhas de dados. Analisando estes dados em relacao a distancia de Mahalanobis, na

primeira etapa formam eliminados basicamente as informacoes relacionadas com os pro-

cessos onde foram utilizadas as bobinas de sacrifıcio, totalizando uma retirada de 128.834

linhas de dados. A segunda etapa de selecao dos dados foi necessaria para a eliminacao

das informacoes relacionadas ao processo de bobinas onde ocorreram falhas nos equipa-

mentos do processo produtivo, tais como falhas mecanicas, eletricas e falta de energia

eletrica da concessionaria, gerando a necessidade de descarte do material. Nesta condicao

foram encontradas 14.094 linhas de dados e que tambem foram removidas, resultado em

Tabela 4.1: Dados inciais coletados.

Linhas 1a Etapa 2a Etapa Linhas BobinasMes de dados de selecao de selecao Resultantes uteis

Fevereiro 40.381 21.331 1.323 17.727 542Marco 43.201 19.943 1.398 21.860 736Abril 41.761 19.943 4.260 15.301 613Maio 43.201 19.943 2.200 20.442 742Junho 43.201 20.227 2.622 20.352 634Julho 44.641 27.447 2.291 14.903 489Total 256.386 128.834 14.094 110.585 3.756

um total de 110.585 linhas de dados. Por fim, com a selecao do numero de bobinas no

universo dos dados resultantes foram regitrados os processos de 3.756 bobinas na secao

de saıda.

4.2.1 Tratamento das Variaveis da Secao do Centro

Na secao do centro, que comporta os equipamentos destinados ao processo de eletro-

galvanizacao da tira de aco, as variaveis disponibilizadas para coleta de dados foram as

seguintes :

• Numero da BF na secao do centro - valor unico para cada bobina;

• Velocidade do processo no centro - valor medio obtido em todas as observacoes de

velocidade da secao do centro da referida BF;

• Densidade da camada inferior adicionada - valor medio obtido em todas as obser-

vacoes de Densidade da camada inferior adicionada da referida BF;

• Densidade da camada superior adicionada - valor medio obtido em todas as obser-

vacoes de Densidade da camada superior adicionada da referida BF;

• Energia do TR1 - valor obtido entre os instantes de inıcio e termino do processo

da referida BF;

• Energia do TR2 -valor obtido entre os instantes de inıcio e termino do processo da

referida BF;

• Energia da ETEG - valor obtido entre os instantes de inıcio e termino do processo

da referida BF;

• Energia da Usiroll - valor obtido entre os instantes de inıcio e termino do processo

da referida BF;

A forma como estas informacoes foram apresentadas incialmente para a coleta de dados

e apresentada na Tabela 4.2.

Tabela 4.2: Coletas de Dados Primarios na Secao do Centro.

Numero Velo- Camada Camada Energia Energia Energia EnergiaBF cidade Inferior Superior TR1 TR2 ETEG Usiroll

(mpm) (g/m2) (g/m2) (kW/h) (kW/h) (kW/h)) (kW/h)13923317 80 24,57 24,00 9003234 8944731 204478 53095613923317 80 23,91 27,00 9003282 8944777 204479 53095913923317 90 23,25 25,29 9003652 8945148 204480 53096213923317 89 60,36 60,23 9004104 8945601 204482 53096413923317 88 58,09 59,55 9004566 8946053 204483 53096713923317 22 55,23 61,29 9004945 8946439 204484 53096913923317 21 55,15 59,58 9004945 8946440 204485 53097213923317 21 59,06 62,00 9004946 8946440 204487 53097413923317 79 58,19 62,17 9004949 8946445 204488 53097713923317 89 59,14 62,00 9005420 8946914 204489 53097913923317 88 57,28 64,00 9005899 8947397 204490 53098113923317 87 56,77 63,38 9006393 8947883 204491 53098413932399 82 62,58 70,22 9833583 9768643 226763 58911013932399 81 70,00 69,80 9834074 9769144 226764 58911313932399 107 79,53 51,89 9834584 9769647 226766 58911513932399 115 44,00 43,75 9835360 9770434 226767 58911813932399 18 48,16 50,97 9835715 9770789 226768 58912113932399 17 46,49 50,95 9835715 9770789 226769 58912313932399 22 44,14 42,87 9835716 9770790 226771 58912613932399 36 43,65 49,80 9835716 9770790 226772 58912813932399 105 48,18 53,00 9836291 9771367 226773 58913113932399 81 55,67 56,75 9836915 9771995 226774 58913413932399 80 36,00 41,75 9837540 9772621 226775 58913614009238 80 57,76 53,34 11091000 10967496 253161 64506214009238 81 53,39 52,76 11091020 10967521 253163 64506414009238 81 51,28 54,05 11091020 10967521 253164 64506714009238 82 66,64 65,13 11091020 10967521 253165 64506914009238 87 59,00 65,48 11091020 10967521 253167 64507014009238 86 57,84 64,34 11091020 10967521 253168 64507214009238 86 63,02 61,29 11091020 10967521 253169 64507414009238 25 59,01 65,27 11091020 10967521 253171 64507514009238 25 56,76 62,11 11091021 10967521 253172 64507714009238 24 64,41 66,00 11091021 10967522 253173 64507914009238 87 56,29 64,00 11091021 10967522 253174 64508014009238 87 59,44 67,00 11091021 10967522 253176 64508214009238 87 67,38 62,90 11091021 10967522 253177 64508414009238 87 56,71 62,62 11091021 10967522 253178 645085

Nessa tabela sao exemplificados os dados de 3 bobinas, que foram processadas na regiao

do centro, com os valores registrados em cada instante de amostragem. O objetivo de

apresentar os dados coletados nesta tabela e salientar as diferencas presentes no processo

de cada bobina, levando em consideracao a quantidade de amostras, a ordem de grandeza,

e a variacao entre os valores incial, intermediario e final de cada variavel. Para a primeira

BF, foram registrados 12 amostras, para a segunda 11 e para a ultima, 14. Considerando

que cada evento de amostragem possui um intevalo fixo de 1 minuto, pode-se afirmar que

o tempo de processo de uma bobina e determinado pela quantidade de amostras desta

bobina, assim as bobinas citadas na tabela foram processadas em 12, 11 e 14 minutos

respectivamente.

Em funcao dos valores de energia registrada pelos medidores dos circuitos TR1, TR2,

ETEG e Usiroll e a aplicacao da equacao 3.1 torna-se possıvel o calculo da energia solici-

tada para o processo da bobina, definida como EProcesso. Como foi citado anteriormente,

os medidores de energia eletrica instalados apresentam erro de registro e armazenamento

dos dados durante as aquisicoes realizadas. Com a funcao de se avaliar os resultados

de correlacao entre as variaveis e os resultados do treinamento da rede neural a variavel

EProcesso, gerou duas novas variaveis, sendo estas a Energia Ativa Medida e Energia Ativa

Calculada. A primeira variavel comporta os dados originais, contendo todos os erros de

medicoes regitrados pelos medidores. A segunda variavel resulta do pre-processamento da

primeira, submetido ao procedimento descrito na Secao 4.1.1.

A variavel que registra a corrente eletrica disponibilizada para o processo, foi denominada

Corrente Eletrica Total Aplicada, e representa a corrente eletrica disponibilizada pelos 40

retificadores instalados nas celulas galvanicas, para o processo de eletrogalvanizacao.

Com a geracao destas variaveis, o grupo que representa o comportamento do processo na

secao do centro se transforma no seguinte:

• Numero da BF na secao do centro;

• Velocidade do processo no centro;

• Densidade da camada inferior adicionada;

• Densidade da camada superior adicionada;

• Corrente eletrica total aplicada - valor de somatorio, obtido em todas as observacoes

de Corrente eletrica total aplicada aos retificadores das celulas galvanicas, durante

o processo da referida BF;

• Energia ativa calculada - valor da diferenca entre o ultimo e o primeiro registro de

Energia Ativa Calculada, durante o processo da referida BF;

• Energia ativa medida- valor da diferenca entre o ultimo e o primeiro registro de

Energia Ativa Medida, durante o processo da referida BF;

A Tabela 4.3 apresenta os valores obtidos para as BF citadas anteriormente, e que foram

empregados neste trabalho.

Tabela 4.3: Dados primarios calculados na Secao do Centro.

Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Velocidade mpm 69,39 67,63 71,72Camada Inferior g/m2 49,24 52,58 59,20Camada Superior g/m2 52,54 52,88 61,87Corrente Retificadores kA 5.755 5.545 6.058Energia Calculada kW/h 6.269,64 7.897,06 2,31Energia Medida kW/h 6.269,64 7.897,06 6,21Tempo Processo minutos 12 11 14

4.2.2 Tratamento das Variaveis da Secao da Saıda

Na secao de saıda, estao instalados os equipamentos destinados a mensurar quantitativa-

mente os resultados do processo de eletrogalvanizacao. As variaveis disponibilizadas para

a aquisicao das informacoes do processo, nesta secao, foram as seguintes:

• Numero da BF na secao de saıda - valor unico para cada bobina;

• Comprimento da BF - valor obtido em um acumulador de comprimento, calculado

em funcao do diametro calibrado de um rolo, instalado em um ponto estrategico do

processo;

• Largura da BF - valor obtido atraves da media das medicoes da posicao de abertura

entre as laminas laterais da tesoura rotativa. Cuja funcao e adequar a largura final

do material as especificacoes tecnicas do consumidor final;

• Espessura da BF - valor obtido atraves da media das medicoes do medidor de ca-

madas;

• Tempo de Processo da BF - valor calculado em funcao do numero de amostras

coletados para cada BF;

• Peso da BF - valor calculado durante o processo;

O peso do produto final e calculado em funcao de parametros medidos durante o pro-

cessamento do material, de forma dinamica, como apresentado na expressao 4.2. Esta e

uma informacao com elevado grau de confiabilidade, pois os seccionamentos do material

determinados pela especificacao do cliente sao executados em funcao de sua observacao e

conferidos posteriormente em um balanca aferida e certificada.

PesoBF (Kg) = Comprimento(m) ∗Largura(m) ∗Espessura(m) ∗ 7.850(Kg/m3) (4.2)

em que a constante 7.850(Kg/m3) refere-se ao peso especıfico para o aco.

O comprimento da bobina tem seu valor determinado dinamicamente durante o processo,

dependendo de algumas condicoes do processo para iniciar e encerrar o registro desta

medicao. Seu valor e reinicializado instantaneamente apos o evento de seccionamento da

tira pela guilhotina, instalada nesta secao, indicando o inıcio de um novo produto.

A Tabela 4.4 exibe a maneira como essas informacoes sao disponibilizadas inicialmente.

Com o intuito de manter as visualizacoes das informacoes das bobinas, de forma sim-

ples, os dados apresentados nesta tabela referem-se ao mesmo grupo de bobinas citados

anteriormente.

E possıvel observar que, a velocidade da secao de saıda alcanca valores nulos sem prej-

udicar o produto final. Este fato se da pela necessidade operacional de se inspecionar

superficialmente o material produzido.

As tesouras laterais sao um equipamento, cuja finalidade e adequar a variavel largura

as especificacoes do cliente. Por esta caracterıstica, neste equipamento sao instalados

sensores de posicao com elevada precisao e confiabilidade. Porem existem casos onde

o material processado nao e submetido a acao deste equipamento. Nesta situacao, as

laminas das tesouras laterais sao recolhidas para a posicao inicial e o valor de largura

informado para o PLC e mantido constante em 3.856 mm. Sabendo-se que a largura

maxima nominal dos produtos executados na linha de eletrogalvanizacao da Usiminas e

limitada em 1.650 mm, foi elaborado um filtro que eliminou as ocorrencias onde a largura

informada ao PLC se tornasse superior a este valor.

Observou-se que frequentemente, no intervalo compreendido entre a conclusao do processo

de uma bobina e a preparacao para o processo da seguinte, acontece reposicionamento

de equipamentos como a tesoura lateral. Este fato provoca uma falha de sincronismo no

registro dos eventos, e o ultimo registro de largura de uma bobina assume o valor setado

da proxima bobina. No processo real nao existem mudancas drasticas para esta variavel,

como pode ser observado nos ultimos registros de largura de cada bobina da tabela 4.4.

Contudo, como todos os dados de determinadas bobinas formam excluıdos por algum

motivo descrito previamente, muitas vezes e difıcil validar esta informacao atraves apenas

da avaliacao dos dados.

A Tabela 4.5, exprime o resultado dos calculos e amostragens executadas para as variaveis

da secao de saıda, empregados neste estudo. Pode-se verificar que devido aos valores das

Tabela 4.4: Coletas de dados primarios na Secao de Saıda.

Num. BF Velocidade Comprimento Largura Espessura(mpm) (m) (mm) (mm)

13923317 48 25,08 1255 1,5013923317 0 73,45 1255 1,5113923317 0 126,50 1255 1,5213923317 2 145,83 1256 1,5113923317 155 250,46 1256 1,5213923317 155 398,58 1257 1,5113923317 76 520,43 1257 1,5213923317 83 607,34 1258 1,5113923317 77 694,25 1258 1,5113923317 124 788,15 1258 1,5013923317 5 866,48 1681 1,5113923317 0 883,94 2308 1,9813932399 105 22,26 1523 1,7313932399 81 90,44 1522 1,6713932399 80 282,69 1522 1,6913932399 81 387,46 1522 1,6913932399 82 436,95 1522 1,6713932399 99 557,10 1522 1,6813932399 103 688,73 1521 1,6913932399 104 715,53 1308 1,6914009238 49,99 25,10 1005,20 1,1914009238 140,10 92,35 1005,20 1,1914009238 43,42 206,75 1005,20 1,1914009238 18,99 250,01 1005,20 1,2014009238 91,00 303,38 1005,20 1,2014009238 85,31 387,93 1005,20 1,2114009238 85,99 472,47 1005,20 1,1914009238 88,21 557,02 1005,20 1,1914009238 76,51 641,57 1005,20 1,1914009238 83,05 726,11 1005,20 1,2014009238 87,24 810,66 1005,20 1,1914009238 86,51 895,21 1005,20 1,1814009238 60,05 979,75 1005,20 1,1914009238 -0,21 998,96 1675,30 1,22

Tabela 4.5: Dados primarios calculados na Secao da Saıda.

Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Comprimento m 883,93 715,53 998,96Largura mm 1.379,51 1.495,00 1.053,06Espessura mm 1,55 1,69 1,19Peso kg 14.842,06 14.185,42 9.890,91Tempo de processo minutos 12 11 14

variaveis comprimento, largura e espessura serem apresentados com valores decimais, o

peso por ser calculado, tambem e expresso desta forma. Por se tratar de uma variavel de

dimensoes elevadas, sempre na ordem de milhares de kg, um erro da ordem de 20 kg e

aceitavel para o cliente.

4.2.3 Variaveis para a Rede Neural

A concatenacao dos dados adquiridos nas secoes do centro e da saıda, fornece todas as

informacoes sobre o processo de eletrogalvanizacao para o procedimentos de treinamento e

validacao da rede neural. A tabela 4.6, exibe um exemplo dos dados que foram produzidos

nos processos citados anteriormente neste capıtulo, reunidos em um unico conjunto.

Tabela 4.6: Dados de bobinas calculados nas Secoes do Centro e Saıda.

Variavel Unidade RegistroNumero BF - 13923317 13932399 14009238Comprimento m 883,93 715,53 998,96Largura mm 1379,51 1495,00 1053,06Espessura mm 1,55 1,69 1,19Peso kg 14842,06 14185,42 9890,91Velocidade Processo mpm 69,39 67,63 71,72Camada Inferior g/m2 49,24 52,58 59,20Camada Superior g/m2 52,54 52,88 61,87Corrente Retificadores kA 5.755.716 5.545.608 6.058.629Energia Calculada kW/h 6269,64 7897,06 2,31Energia Medida kW/h 6269,64 7897,06 6,21

Para este trabalho a rede neural foi construıda com as seguintes variaveis de entrada:

• Comprimento da BF ;

• Largura da BF ;

• Espessura da BF ;

• Peso total da BF ;

• Velocidade do processo no centro ;

• Densidade da camada inferior adicionada;

• Densidade da camada superior adicionada ;

• Corrente eletrica total aplicada;

A variavel Numero de BF, e empregada como um identificador para as bobinas, aplicado

para o rastreamento destas nos processos produtivos da empresa. Por este motivo, foi

empregada apenas como referencial para o agrupamento das variaveis realmente impor-

tantes ao processo, nao e importante para o desenvolvimento da rede neural. Assim seus

dados nao foram aplicados no desenvolvimento da rede neural.

A resposta emitida atraves da variavel de saıda a ser informada pela rede neural sera

comparada observando sua relacao a variavel Energia calculada. O erro existente entre a

resposta da rede e essa variavel tornou-se o balizador para o desenvolvimento da RNA.

Os resultados obtidos durante o desenvolvimento do processo de geracao, treinamento,

ajustes e validacao da rede neural sao apresentados no proximo capıtulo.

Capıtulo 5

Resultados e Analise

Os dados coltados no perıodo compreendido entre os meses de fevereiro e julho do ano de

2012 apresentaram variacoes relevantes no que se refere a energia eletrica consumida. As

correlacoes entre os dados registrados nas variaveis de entrada e saıda para o treinamento

da rede neural apresentaram-se extremamente divergentes. Tornou-se necessaria uma

estimativa dos valores de energia eletrica para suprimir os erros oriundos dos medidores

de energia dos respectivos circuitos. Referenciando os dados amostrados no processo,

em funcao das energias medida e estimada, observou-se que o sucesso do treinamento e

validacao da rede neural dependeu diretamente da mitigacao nos erros embutidos durante

a coleta dos dados.

A correlacao existente entre os dados de entrada e saıda da rede, para os casos de energia

medida e estimada sao discutidos a seguir. Sequencialmente sao apresentados os resultados

de treinamento e validacao da rede para cada mes individualmente, observando os mesmos

dados de energia dos dois casos.

Sao apresentrados os resultados com variacao do numero de neuronios nas camadas ocul-

tas, variacao do numero de epocas de treinamento e os parametros selecionados para o

treinamento da rede. Por fim, e apresentado o resultado do treimento da melhor rede

neural obtida com os dados de energia eletrica calculada.

5.1 Correlacao entre os Dados do Processo

As informacoes sobre o sistema de medicao de energia para os meses de fevereiro a julho

do ano de 2012 foram coletados e sao apresentadas na Figura 5.1. Observa-se que em

todos os meses estao presentes valores negativos para a energia registrada. Considerando

que o sistema avaliado nao possui equipamentos para a geracao de energia eletrica, este

5.1 Correlacao entre os Dados do Processo 56

comportamento e fisicamente impossıvel. A unica resposta plausıvel sao os incrementos

de erros de medicao e armazenagem, como descrito na Secao 4.1.1.

Para este conjunto de dados foram avaliadas as correlacoes existentes entre as variaveis

de entrada a serem empregadas para o treinamento da rede e a resposta que a rede devera

fornecer, ou seja a energia medida pelo processo. A funcao de correlacao linear entre

cada uma das variaveis de entrada e a energia eletrica medida esta expressa na Tabela

5.1. Segundo o criterio descrito por Lira (2004), nenhum valor obtido apresentou uma

correlacao com conceito considerado melhor do que ”fraca”, ou seja, todos os valores estao

compreendidos entre 0,00 a 0,29, observando sobre o ponto de vista de modulo para os

resultados.

A apresentacao destes resultados para a rede neural causaram grandes problemas de con-

vergencia dos algoritmos de treinamento. Isto se deve ao fato de que muitos exemplos

de treinamento com valores das variaveis de entrada semelhantes, dispunham de valores

totalmente divergentes para a energia eletrica medida empregada no processo.

As tecnicas descritas nos capıtulos anteriores, como a identificacao dos dados espurios

pela Distancia de Mahalanobis, substituicao destes valores por outros interpolados e as

heurısticas para determinacao do peso e largura das tiras de aco, foram empregadas.

Com esta acao praticamente todos os dados que poderiam ser considerados ruidosos para

Figura 5.1: Energia medida no perıodo de fevereiro a julho/12

5.1 Correlacao entre os Dados do Processo 57

o processo de treinamento da rede neural foram eliminados.

Baseando neste resultado, a Figura 5.2 representa o comportamento da energia estimada

para o processo para o mesmo perıodo, ou seja entre fevereiro e julho de 2012. Deve ser

evidencido que nao existem valores negativos para a energia empregada no processo em

nenhum dos meses representados.

Figura 5.2: Energia estimada no perıodo de fevereiro a julho/12

Avaliando novamente a correlacao existente entre as variaveis de entrada e, neste mo-

Tabela 5.1: Correlacao linear em relacao a Energia Eletrica Medida.

Mes Amostra Fev Mar Abr Mai Jun JulVelocidade Processo 0,1069 0,0873 −0,0423 0,0800 0,0527 −0,0974Densidade Inferior 0,0070 −0,0503 0,0086 0,0021 −0,0199 0,1025Densidade Superior 0,0322 −0,0331 0,0255 −0,0348 −0,0553 0,0837Corrente Eletrica 0,0841 0,0209 0,1099 0,1473 0,0532 0,0837Comprimento 0,0731 0,1251 0,0778 0,1579 0,0637 0,0303Largura −0,0471 −0,0881 0,0514 0,1022 −0,0404 0,0232Espessura −0,0631 −0,0057 −0,0895 −0,1905 −0,0915 0,0156Peso 0,0302 0,1445 0,0298 0,1012 0,2680 0,0726Tempo de processo 0,0458 0,0198 0,1111 0,0875 −0,0575 0,0760

5.2 Resultados do Treinamento da Rede Neural 58

mento, a energia eletrica corrigida empregada no processo, os resultados sao consideravel-

mente distintos. A Tabela 5.2, exibe os resulados dos calculos executados. Em diversos

pontos a funcao de correlacao linear entre a variavel Corrente eletrica e a energia empre-

gada no processo apresenta o conceito ”forte”. Em poucos exemplos isolados o conceito

de correlacao ”fraca” e encontrado, e o sentido da correlacao e alterado, como apresentado

anteriormente na Tabela 2.3.

Tabela 5.2: Correlacao linear em relacao a Energia Eletrica Estimada.

Mes Amostra Fev Mar Abr Mai Jun JulVelocidade Processo −0,1227 −0,0451 0,1922 −0,2178 0,0171 0,0870Densidade Inferior 0,3655 0,0466 −0,1131 0,4493 0,3474 0,3377Densidade Superior 0,4049 −0,0024 0,1313 0,4279 0,3620 0,3781Corrente Eletrica 0,6198 0,2821 0,5246 0,4302 0,7226 0,5491Comprimento 0,2834 0,1936 0,4848 0,1930 0,3652 0,3616Largura 0,5018 0,1159 −0,0154 0,4578 0,4023 0,2461Espessura −0,1537 −0,2297 −0,2526 −0,0590 −0,2420 −0,0740Peso 0,4542 0,1066 0,3731 0,3976 0,4865 0,4708Tempo de processo 0,3453 0,3149 0,4908 0,2171 0,4857 0,3666

Em funcao da aquisicao destas informacoes sobre a correlacao entre os dados de entrada

e saıda do processo, estas sao as variaveis que melhor representam o comportamento

do processo. Com a aplicacao destes dados foram alcancados melhores resultados nas

etapas de treinamento da rede neural quando comparados com os resultados empregando

a energia eletrica medida. Nesta condicao a convergencia dos algoritmos tanto para o

treinamento quanto para a validacao foram atingidas.

5.2 Resultados do Treinamento da Rede Neural

O treinamento da rede neural, contemplando todos os dados do interlavo compreendido

entre os meses de fevereiro e julho de 2012, solicitou um grande perıodo de tempo para

processamento. Os resultados obtidos nao foram satisfatorios e apresentaram um erro

considerado elevado durante as etapas de treinamento e validacao da RNA. Considerando

a possibilidade de apresentacao por partes das informacoes para a rede, foram realizados

treinamentos com os dados em perıodos mensais e avaliacao dos seus resultados. Os dados

apresentados compreenderam tanto as informacoes da energia eletrica medida no processo

quanto a energia eletrica corrigida empregada.

5.2.1 Determinacao dos Parametros da Rede Neural

A configuracao da rede neural requer atencao e cuidados especiais durante o desenvolvi-

mento do modelo. A determinacao dos parametros que a compoem nao seguem regras

bem definidas, como descrito anteriormente em varios trabalhos. A busca pelos melhores

resultados e norteada pela avaliacao contınua dos resultados.

No presente trabalho, os seguintes parametros foram ajustados:

• Algoritmo de treinamento, alternando entre os algoritmos do tipo backpropagation

de Levenberg-Marquardt (trainlm), Gradiente Conjugado Decrescente (trainscg) e

Gradiente descendente com momento e taxa de aprendizado adaptativa (traingdx);

• Numero de neuronios na camada oculta, alternando entre os valores de 7, 12 e 18

neuronios. Estes valores foram selecionados do conjunto de possibilidades demon-

strado por Balestrassi et al. (2009) e Wei e Xing-yang (2011), descritos na secao

2.1.4;

• Numero de camadas ocultas, alternando entre 1 e 2 camadas ocultas;

Os parametros erro meta e numero de epocas de treinamento foram mantidos constantes

em 0,001 e 1000 respectivamente, bem como os conjuntos de dados de treinamento e

validacao. O primeiro objetivo e validar qual o melhor conjunto de parametros fornecera

o resultado mais adequado para a rede, observando os criterios determinados. Os criterios

para avaliacao destes resultados foram mensurados em razao do MSE e do coeficiente de

correlacao R2 entre os resultados fornecidos para os dados compreendidos no conjunto

de validacao da rede neural dados de validacao pela rede neural e o conjunto de dados

adquirido nas amostragens. Como referencia para a qualidade dos resultados, uma melhor

resposta implica em um valor de MSE o mais proximo possıvel de 0, enquanto que o

melhor coeficiente de correlacao acontece quando o resultado e o mais proximo possıvel

da unidade.

O primeiro grupo avaliado consiste da combinacao do treinamento da rede neural apli-

cando o algoritmo de Levenberg-Marquardt, e as variantes dos numeros de neuronios

presentes nas camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.3 exibe os

resultados para esta execucao.

As informacoes dispostas por este treinamento revelam que a combinacao de 18 neuronios

instalados em cada uma das duas camada ocultas produz o maior coeficiente de correlacao

(0,97138) entre os dados produzidos pela rede e os dados desejados como resposta. Porem

o erro medio obtido (0,0348) e um dos mais elevados de todo este conjunto. Observou-se

que o treinamento foi executado com rapidez, porem foi encerrado por atingir o valor

Tabela 5.3: Treinamento da RNA com Levenberg-Marquardt

Camadas Neuronios MSE R2

Ocultas Ocultos07 0,0059 0,92329

1 12 0,1166 0,9515818 0,1707 0,9679307 0,0379 0,96793

2 12 0,0189 0,9682418 0,0348 0,97138

maximo de erro aceitavel e nao pelo numero maximo de epocas de treinamento. Como

descrito por Silva (2010), o algoritmo de Levenberg-Marquardt e muito rapido e possui

grande precisao durante a convergencia, porem frequentemente converge para um ponto

de mınimo local e conclui o treinamento da rede neural. Por esta caracterıstica este

algoritmo foi avaliado e nao empregado para as etapas seguintes do trabalho.

O segundo grupo avaliado consiste da combinacao do treinamento com o algoritmo de

Gradiente Conjugado Decrescente, e as variantes dos numeros de neuronios presentes nas

camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.4 exibe os resultados

para esta execucao.

As informacoes dispostas para este treinamento revelam que novamente o melhor resul-

tado ocorre quando o numero de camadas de neuronios ocultos e maior, porem com um

numero menor de neuronios considerando a comparacao com o resultado disposto ante-

riormente. Neste exemplo, com apenas 12 neuronios nas camadas ocultas o coeficiente de

correlacao entre os valores desejados e os fornecidos pela rede neural foi o mais elevado,

atingindo 0,85095. Mas o valor do MSE alvancado foi de 0,0078, que nao foi o menor

entre os avaliados neste algoritmo. Conforme Goncalves (2011), a principal vantagem do

metodo do gradiente descendente e sua simplicidade. E a principal desvantagem e que

Tabela 5.4: Treinamento da RNA com Gradiente Conjugado Decrescente

1 12 0,0075 0,7880218 0,0089 0,8027607 0,0083 0,78123

2 12 0,0078 0,8509518 0,0079 0,81956

a taxa de convergencia e fortemente dependente do problema. Analisando os resultados

obtidos pelos dois algoritmos, Levenberg-Marquardt e Gradiente Conjugado Decrescente,

o segundo apresenta respostas mais acertivas do que o primeiro, levando em consideracao

apenas os dois parametros avaliados ate o momento.

O ultimo grupo avaliado combina o treinamento com o algoritmo de Gradiente descendente

com momento e taxa de aprendizado adaptativa, e as variantes dos numeros de neuronios

presentes nas camadas ocultas e a quantidade de camadas ocultas. A Tabela 5.5 exibe os

resultados para esta execucao.

Tabela 5.5: Treinamento da RNA com Gradiente descendente com momento e taxa de apren-dizado adaptativa

1 12 0,0076 0,8811618 0,0068 0,8862807 0,0065 0,90252

2 12 0,0086 0,9109118 0,0072 0,94521

Conforme as informacoes exibidas na Tabela 5.5 para este treinamento os melhores resul-

tados em relacao ao MSE e ao R2 sao obtidos quando sao empregados 7 neuronios nas

duas camadas ocultas. Porem avaliando os resultados fornecidos pela rede neural com

18 neuronios empregados em uma unica camada, a diferenca entre as respostas e muito

pequena, sugerindo que esta arquitetura tambem possa fornecer uma boa representacao

para a modelagem do problema proposto.

Comparando os resultados entre os tres algoritmos, o Levenberg-Marquardt apresentou

o melhor ındice de correlacao entre as variaveis porem o erro medio quadratico e o mais

elevado entre eles. O algoritmo Gradiente Conjugado Decrescente com momento e taxa

de aprendizado adaptativa e o mais lento entre os testados, contudo forneceu um melhor

equilibrio nos resultados para os dois parametros avaliados. A analise das informacoes

dispostas nas tabelas 5.3 a 5.5 indicam que a melhor rede neural para os dados amostrados

sera construıda com a seguinte arquitetura:

• Numero de neuronios na camada de entrada, igual a 8, compreendendo as variaveis

descritas na Secao 4.2.3;

• Numero de neuronios na camada intermediaria, 18 neuronios ;

• Funcao de ativacao dos neuronios da camada intermediaria, tangente hiperbolica ;

• Numero de neuronio na camada de saıda, apenas 1 neuronio etimando a energia

eletrica necessaria ao processo para os dados informados na camada de entrada;

• Funcao de ativacao dos neuronios da camada de saıda, linear;

A definicao dos parametros de treinamento da rede foi realizada como:

• Algoritmo de treinamento da rede, Gradiente descendente com momento e taxa

de aprendizado adaptativa por apresentar os melhores resultados no treinamento

preliminar;

• Erro meta a ser alcancado, 0,001 ;

• Numero maximo para iteracoes, 10000 epocas de treinamento;

No treinamento da rede neural com o algoritmo de Gradiente descendente com momento

e taxa de aprendizado adaptativa os pesos de todas as conexoes sinapticas da rede neural

foram ajustados, com o objetivo de minimizar o erro de treinamento e consequentemente

tambem o erro cometido durante a etapa de validacao. Todo o conjunto de dados foi divi-

dido em duas partes distintas. A primeira parcela contem os dados para treinamento da

rede e comporta 80% do conjunto total de dados. A segunda parcela de dados foi destinada

a validacao do treinamento realizado contendo os 20% restantes do dados disponibilizados.

O algoritmo OBS(Optimal Brain Surgeon) foi empregado para realizar a eliminacao dos

pesos menos significtivos para o funcionamento da rede e ampliar a capacidade de gene-

ralizacao da rede neural. Nas primeiras execucoes do treinamento, ocorreram elevados

valores de erro na resposta da rede neural para os dados apresentados, visualizados prin-

cipalmente nas representacoes graficas. A avaliacao da correta execucao dos algoritmo de

validacao foi realizada produzindo um novo conjunto de dados para serem apresentados

a rede nesta etapa. Entao um conjunto contendo dados do grupo de treinamento com as

mesmas dimensoes do grupo de validacao foi aplicado ao algoritmo de validacao, denomi-

nado validacao/treinamento. A representacao do menor erro para este conjunto de dados

durante a validacao e o indicativo de que a rede processou os dados adequadamente.

5.2.2 Treinamento com Energia Eletrica Medida

Esta secao demonstra o comportamento da RNA para a aplicacao dos dados de energia

registrados pelos medidores sem nenhum tratamento. A ideia principal e mostrar que

mesmo com dados ruidosos e com baixa representatividade do comportamento do processo

as redes neurais artificiais sao capazes de fornecer respostas para a modelagem deste

processo. Contudo, as ferramentas de analise dos resultados determinam sua qualidade e

indicam a necessidade de atencao ao dados inseridos. A Figura 5.3, exibe os resultados

da rede para os dados do mes de Fevereiro/12. O primeiro grafico, na Figura 5.3-a,

exibe o comportamento do modelo para comparacao entre os dados respondidos pela

rede neural e os dados desejados durante a etapa de treinamento. Observa-se que em

muitos pontos a rede nao consegui assimilar o comportamento do sistema. No segundo

grafico, a Figura 5.3-b, apresenta a resposta do modelo para o conjunto de dados de

validacao. A comparacao entre a resposta produzida pela rede neural e os dados desejados

reafirmam o comportamento inadequado do modelo para os dados fornecidos. Por ultimo,

o grafico da Figura 5.3-c demonstra que mesmo inserindo os dados de treinamento, que

ja foram apresentados anteriormente a rede neural, para a etapa de validacao o modelo

nao conseguiu produzir uma boa resposta.

Figura 5.3: Respostas da rede neural com dados medidos de energia do perıodo de fevereiro/12

A resposta da rede neural para o conjunto de dados representando o mes de fevereiro,

esteve influenciada pelo comportamento do dados amostrados e nao pela arquitetura ou

parametros determinados para o desenvolvimento da rede. A validacao desta afirmativa foi

realizada substituindo o conjunto de dados apresentados para a rede neural pelo conjunto

representativo do mes de julho. Na Figura 5.4 observa-se que mesmo para um novo

conjunto de dados a resposta da rede para para as etapas de treinamento e validacao, tanto

com os dados somente de validacao como tamtem com o grupo treinamento/validacao

repete o comportamento descrito anteriormente e nao consegue modelar o processo.

Figura 5.4: Respostas da rede neural com dados medidos de energia do perıodo de junho/12

Os resultados das simulacoes da rede neural para todo o conjunto de dados compreendido

entre os meses de fevereiro a julho sao apresentados na Tabela 5.6. Sao apresentando

os valores obtidos para o MSE nos eventos de treinamento e validacao, tanto quando o

algoritmo de generalizacao foi utizado quanto este recurso nao foi empregado.

Tabela 5.6: Resultado do erro da RNA para os dados de energia eletrica medidos.

Fev Mar Abr Mai Jun JulTreinamento sem OBS 0,0303 0,0262 0,0292 0,0223 0,0079 0,0168Treinamento com OBS 0,0199 0,0268 0,0139 0,0097 0,0032 0,0059Validacao sem OBS 0,0303 0,0247 0,0358 0,0276 0,0109 0,0344Validacao com OBS 0,0512 0,0246 0,0601 0,0696 0,0133 0,0479

A avaliacao somente pelos valores de MSE nos eventos de treinamento e validacao nao

revelam a presenca dos problemas dados amostrados. Mesmo com valores aparentente

tao pequenos para o MSE nao refletem um comportamento considerado adequado para

solucoes fornecidas por uma rede neural. Em seguida sao abordados os resultados prove-

nientes da aplicacao dos dados de energia eletrica calculada para a mesma rede.

5.2.3 Treinamento com Energia Eletrica Calculada

Esta secao demonstra o comportamento da rede neural para a aplicacao dos dados de

energia eletrica calculada para os medidores apos os tratamentos propostos na Secao

4.1.1. Com a eliminacao dos dados espurios em todo o conjunto de dados para treina-

mento e validacao, as respostas fornecidas pela rede neural representaram de maneira mais

adequada o modelamento do processo. A Figura 5.5 exibe o resultado do treinamento da

rede para os dados tratados do mes de fevereiro/12. A sequencia de informacoes dispostas

no grafico e dada pela apresentacao dos resultados de treinamento na Figura 5.5-a, os

resultados para a etapa de validacao na Figura 5.5-b e finalmente o conjunto de dados

treinamento/validacao na Figura 5.5-c.

Figura 5.5: Respostas da rede neural com dados estimados de energia do perıodo de fevereiro/12

A resposta da RNA para os dados apresentados no mes de fevereiro, nao mais foi influen-

ciada pelo comportamento do dados espurios presentes na amostragem inicial. Durante

a representacao do evento de treinamento na Figura 5.5-a ocorre um acoplamento entre

a resposta fornecida pela rede neural e os dados desejados. Em todos os exemplos desta

figura, o erro presente entre a resposta fornecida pela rede neural e o valor desejado como

resposta foi extremamente reduzido. Como realizado na secao anterior, as informacoes

relacionadas ao mes de fevereiro forma substituıdos pelas informacoes do mes de junho

para validacao dos resultados alcancados. A Figura 5.6 exibe a resposta da rede para os

dados do mes de Junho.

Figura 5.6: Respostas da rede neural com dados estimados de energia do perıodo de junho/12

Os resultados das simulacoes da rede neural para todo o conjunto de dados compreendido

entre os meses de fevereiro a julho sao expostos na Tabela 5.7. Desta vez com os resultados

foram obtidos atraves os dados de energia eletrica calculada e sao apresentados da mesma

maneira com realizado na secao anterior.

Tabela 5.7: Resultado do erro da RNA para os dados de energia eletrica calculada.

Fev Mar Abr Mai Jun JulTreinamento sem OBS 0,0047 0,0218 0,0162 0,0092 0,0060 0,0098Treinamento com OBS 0,0014 0,0116 0,0043 0,0030 0,0020 0,0020Validacao sem OBS 0,0020 0,0355 0,0214 0,0159 0,0085 0,0089Validacao com OBS 0,0068 0,0362 0,0437 0,0186 0,0073 0,0121

Os resultados apresentados pela tabela 5.7, representam a reducao dos valores de MSE

ocorridos no treinamento e validacao da rede com os dados calculados. Esta afirmacao

e realizada em comparacao aos resultados apresentados na Tabela 5.6. Por esta razao,

para a execucao da etapa de final de treinamento da rede neural, os dados aplicados

foram exclusivamente os que compreendem as informacoes relacionadas a energia eletrica

calculada para o sistema de distribuicao de energia do processo de eletrogalvanizacao.

5.2.4 Treinamento Final da Rede Neural

As informacoes apresentadas na secao anterior apresentaram que o tratamento dos dados

de energia eletrica calculada mitigaram os valores espurios do processo para esta varia-

vel. A avaliacao dos dados amostrados para os meses de marco e abril, em funcao do

coeficiente de correlacao linear, expressou que os conjuntos destes dois meses possuem

divergencias consideraveis em relacao ao demais meses da Tabela 5.7, que nao puderam

ser interpretadas e demandam uma nova pesquisa. Os registros de graficos do mesmo

perıodo tambem demonstram uma maior perturbacao nos dados de energia eletrica, como

indicado na Figura 5.1. Com base nestas observacoes o conjunto de dados a serem apre-

sentados para a rede neural foi novamente alterado, excluindo as informacoes dos meses

de marco e abril.

O resultado do treinamento da rede neural com 18 neuronios em apenas uma camada

oculta foi suficiente para realizar com sucesso a predicao da demanda de energia eletrica

para o processo de eletrogalvanizacao em tiras de aco. A Figura 5.7 exibe os resultados

alcancados com os ajustes dos parametros citados nas secoes anteriores. Na condicao final

do processo de treinamento e validacao dos resultados da rede obteve-se um erro medio

quadratico de validacao na ordem de 0,0097.

Figura 5.7: Resultado final de validacao da RNA

Com os resultados apresentados, pode-se afirmar que a predicao de demanda de energia

eletrica aplicando redes neurais artificiais, pode ser exercida como um meio para obtencao

de dados para gerenciar a organizacao de um sistema produtivo sem serie.

Capıtulo 6

Consideracoes Finais

Este trabalho apresentou uma aplicacao, com dados reais de uma linha de producao

industrial de tiras de aco eletrogalvanizadas, para a predicao da demanda de energia

eletrica solicitada para este produto com redes neurais artificiais.

A primeira parte do trabalho descreve uma revisao bibliografica sobre as aplicacoes re-

alizadas com as Redes Neurais Artificiais, com foco no tipo Multi-Layer Perceptron e os

procedimentos mınimos necessarios para o desenvolvimento desta ferramenta, bem como

sua capacidade de generalizacao para respostas a informacoes um pouco diferentes das

apresentadas durante sua elaboracao.

Em seguida foi apresentada um descricao do processo de galvanoplastia, e sua forma

industrial para a eletrogalvanizacao de tiras de aco laminadas a frio. Destacaram-se as

relacoes existentes entre o processo de producao e o sistema de fornecimento de energia

eletrica necessaria, definindo as principais variaveis que contribuem para a execucao das

exigencias tecnicas do produto.

No Capıtulo 4 foram apresentados os metodos empregados no tratamento das variaveis a

serem utilizadas no desenvolimento do projeto.

No Capıtulo 5 foram apresentados os resultados obtidos com o emprego das variaveis

selecionadas no desenvolvimento das redes neurais e as respostas disponibilizadas para os

casos em que estas variaveis foram tratadas previamente.

A seguir, sao listadas as principais conclusoes deste trabalho.

6.1 Conclusoes 69

6.1 Conclusoes

A aplicacao das tecnicas de desenvovilmento de redes neurais artificiais demonstra quao

importante sao os criterios de selecao e pre-tratamento dos dados reais que constituem as

informacoes a serem inseridas no sistema. A quantidade e a qualidade dos dados coletados

em um processo industrial real sao determinantes para correta definicao dos parametros

que construtivos da rede.

Por causa das caracteristicas de robustez e por ser um excelente mapeador de funcoes e

a capacidade de generalizacao das redes neruais artificiais fazem com que seja necessario

uma elevada atencao ao desenvolvimento de aplicacoes. As redes neurais sao capazes de

fornecer solucoes que representem o comportamento do processo, de forma independente

de qualquer qualidade de dados sejam eles corretos ou nao.

Neste trabalho as informacoes compreendidas na variavel objetivo, que e a demanda de

energia eletrica do processo, por possuirem falhas nos equipamentos de medicao e ar-

mazenamento, produziram um serie de transtornos que nao foram totalmente esclarecidos

e solucionados. Estes problemas nos dados implicaram diretamente nos resultados pro-

duzidos pela rede neural.

Para o conjunto de informacoes fornecidas na etapa de levantamento de dados, o modelo

desenvolvido apresentou respostas satisfatorias, permitindo uma nova forma de organiza-

cao da sequencia de producao em funcao da demanda de energia eletrica. As principais

variaveis que representam o processo foram evidenciadas sendo estas as densidades da

camadas de revestimento superior e inferior, a corrente eletrica aplicada no processo, o

tempo de processo e o peso da bobina.

6.2 Trabalhos Futuros

Como proposta de trabalhos futuros, sugere-se:

1. Investigar uma forma eficaz de coleta e registro dos dados de energia eletrica para

aplicacao em novos modelos do processo;

2. Pesquisar novas tecnicas para o dimensionamento dos parametros das RNA;

3. Realizar a modelagem do sistema utilizando outras tecnicas de modelagem com

o mesmo conjunto de dados utilizados neste trabalho e fazer a comparacao dos

resultados obtidos com os resultados deste trabalho;

4. Acrescentar outras variaveis de entrada ao processo de modelagem, como por exem-

plo a temperatura e a concentracao da solucao galvanica, e realizar o estudo nova-

mente;

5. Ampliar a abrangencia deste trabalho para as demais variaveis do processo, com

elevada demanda e custos significativos, tais como agua, vapor, acidos e outros

produtos quımicos;

Referencias Bibliograficas

Andritz, V. A. I. S. (1993). Standart pratical instructions. Manual de treinamento,

Voest-Alpine Industrial Services, Austria.

Angiulli, F., Ben Eliayahu Zohary, R., e Palopoli, L. (2010). Outlier detection for simple

default theories. Artificial Inteligence, (174):1247–1253.

Aydinalp, M., Ugursal, V., e Fung, A. (2007). Modeling of the appliance, ligtting, and

space-cooling energy consumptions inthe residential sector using neural networks. Ap-

plied Energy, (71):87–110.

Azadeh, A., Ghaderi, S., e Sohrabkhami, S. (2008). Annual electricity consumptiion

forecasting by neural network in high energy consuming industrial sectors. Energy

Conversion and Managemente, (49):2272–2278.

Balestrassi, P., Popova, E., Paiva, A., e Marangon Lima, J. (2009). Design of experiments

on neural networks training for nonlinear time series forecasting. Neurocomputing,

(72):1160–1178.

Blondou, R. (2011). Very short-term wind power forecasting with neural networks and

adaptive bayesian learnig. Renewable Energy, (36):1118–1124.

Braga, A., Ludemir, T. B., e Carvalho, A. (2000). Redes Neurais Artificiais - Teoria e

aplicacoes. LTC - Livros Tecnicos e Cientıficos Editora, Rio de Janeiro, RJ, 1ed. edicao.

Curteanu, S., Piuleac, C., Godini, K., e Azaryan, G. (2011). Modeling of electrolysis

process in wastewater treatment using different types of neural networks. Chemical

Engineering Journal, (172):267–276.

Figueiredo Filho, D. B. e Silva Junior, J. (2009). Desvendando os misterios do coeficiente

de correlacao de pearson(r). Revista Politica Hoje, (18):352–364.

Fiorin, D., Martins, F. R., Schuch, N., e Pereira, E. (2011). Aplicacoes de redes neurais

e previsoes de disponibilidade de recursos energeticos solares. Revista Brasileira de

Ensino de Fısica, (33):1309.1–1309.13.

Geem, Z. e Roper, W. (2009). Energy demand estimation of south korea using artificial

neural network. Energy Police, (37):4049–4054.

Goncalves, A. (2011). Otimizacao em ambientes dinamicos com variaveis contınuas em-

pregando algoritmos de estimacao de distribuicao. Dissertacao de Mestrado.

Haidar, A., Mustafa, M., Ibrahim, F., e Ahmed, I. (2011). Transient stability evaluation

of electrical power system using generalized regression neural networks. Appleid Soft

Computing, (11):3558–3570.

Hassibi, B., Stork, D., e Wolff, G. J. (1993). Optimal brain surgeon and general network

prunnig. Proceedings of the 1993 IEE International Conference on Neural Networks,

(1):293–299.

Haykin, S. (2001). Redes Neurais - Princıpios e pratica. Bookman, Porto Alegre, RS,

2ed. edicao.

Hernandez Neto, A. e Fiorelli, F. A. S. (2008). Comparison between detailed model

simulation and artificial neural network for forecasting building energy consumption.

Energy and Buildings, (40):2169–2176.

Hernandez, J., Bassam, A., Siqueiros, J., e Juarez-Romero, D. (2009). Optimum operating

conditions for a water purification process integrated to a heat transformer with energy

recycling using neural network inverse. Renewable Energy, (34):1084–1091.

Jia, Y., Chan, K., Xiangsheng, W., e Xiaofeng, Y. (2011). Modelling of chiller performance

using artificial neural networks. Energy Procedia, (13):1011–1016.

Joao Netto, P. (2008). Treinamento de clientes pi. Manual de treinamento da TSA.

Kalogirou, S. (1999). Applications of artificial neural networks in energy system. Energy

Conversion and Management, (40):1073–1087.

Kandil, N., Wamkeue, R., Saad, M., e Georges, S. (2006). An efficient approach for short

term load forecasting using artificial neural networks. Electrical Power and Energy

Systems, (28):525–530.

Kelo, S. e Dudul, S. (2011). Short-term maharashtra state electrical power load prediction

with special emphasis on seasonal changes using a novel focused time laggef recurrent

neural network based on time delay neural network model. Expert Systemseith Applca-

tions, (38):1554–1564.

Krusinka, E. (1987). A valuation of state of object based on weigthed mahalanobis dis-

tance. Pergamon Journals Ltd., (20):413–418.

LeCun, Y., Denker, J. S., e Solla, S. (1990). Optimal brain damage. Advances in Neural

Information Processing Systems, (2):598–605.

Lima, V. (2010). Desenvolvimento e avaliacao de sistema neural para reducao de tempo

de ensaio de desempenho de compressores. Dissertacao de Mestrado.

Lira, S. A. (2004). Analise de correlacao: Abordagem teorica e de contrucao dos coefi-

cientes com aplicacoes. Dissertacao de Mestrado.

Madal, P., Senjyu, T., Naomitsu, U., e Funabashi, T. (2006). A neural network based

several-hour-ahead electric load forecasting using similar days approch. Electrical Power

and Energy Systems, (28):367–373.

Maesschalck, R., Jouan-Rimbaud, D., e Massart, D. (2000). Fault identification in chem-

ical processes through a modified mahalanobis-taguchi strategy. Chemometrics and

Intelligent Laboratory Systems, (50):1–18.

Magalhaes, M. e Lima, A. (2009). Nocoes de Probabilidade e Estatıstica. Edusp, Sao

Paulo, 7ed. edicao.

Marques, R. J. A. (2008). Avaliacao da resistencia a corrosao de acos if revestidos

com zinco e ligas de ferro-zinco destinados a industria automobilistica. Dissertacao

de Mestrado.

Nascimento, E., Pereira, B., e Seixas, J. (2009). Redes neurais artificiais: Uma aplicacao

no estudo da poluicao atmosferica e seus efeitos adversos a saude. Revista Brasileira de

Biomedicina, (27):37–50.

Pedersen, M. E., Hansen, L. K., e Larsen, J. (1994). Prunning with generalization based

weigth saliences: Obd, obs. Connect, Electronics Institute, (1):1–7.

Salmeron, A. R. (1961). Introducao a Eletricidade e ao Magnetismo. 4ed. Sao Paulo.

Silva, J. E. M. M. (2010). Estimacao de parametros de modelos comportamentais para

tomografia por emissao de positrons. Dissertacao de Mestrado.

Takahashi, H. (2006). Predicao das propriedades mecanicas de acos de alta resistencia mi-

croligados utilizando tecnicas de inteligencia computacional. Dissertacao de Mestrado.

Teixeira, R. (2001). Treinamento de redes neurais artificiais atraves de otimizacao multi-

objetivo: uma nova abordagem para o equilıbrio entre a polarizacao e a variancia. Tese

de Doutorado.

Wah, C. (2003). Prunnig of hidden markov model with optimal brain surgeon. Dissertacao

de Mestrado.

Wei, D. e Xing-yang, L. (2011). An improved bp neural networks applied to classification.

Energy Procedia, (13):7065–7069.

Xia, C., Wang, J., e McMeneny, K. (2010). Short, medium and long term load forecast-

ing model and virtual load forecaster based on radial basis function neural networks.

Electrical Power Energy Systems, (32):743–750.

Yalcinoz, T. e Eminoglu, U. (2005). Short term and medium term power distribuitin load

forecastin by neural networks. Energy Conversion and Management, (46):1393–1405.

PREDIC˘AO DA DEMANDA DE ENERGIA~ ELETRICA … · Quebra-galho Dedico este trabalho a Thers alia,...

Documents

Transcript of PREDIC˘AO DA DEMANDA DE ENERGIA~ ELETRICA … · Quebra-galho Dedico este trabalho a Thers alia,...

Probabilidade, Estat stica e Processos Estoc asticos · Na confec˘c~ao dessa apostila tivemos o cuidado de escolher exemplos que propiciam ao leitor uma melhor compreens~ao das no˘c~oes

REDES SOCIAIS E PODER - redalyc.org · Redes sociais e poder no estado brasileiro. ... analiso o impacto dos resultados para a compreens o da rela o entre pol tica e pol ticas p blicas

Implica es de distintas compreens es de cultura visual ...

CÉLULAS DE JOVENS: IGREJA BATISTA DE TAUÁ · Mas ele tinha uma fonte secreta de vergonha: ... Elas ligavam para casa todos os dias para mostrar ... Liliane e arbara.

Sumário - DECOM-UFOP · Cap´ıtulo 1 Conceitos Básicos 1.1 Introdu¸cão Pretendemos neste cap´ıtulo relembrar alguns conceitos basicos, que irao facilitar a compreensão

Estratégias para o desenvolvimento de modelos de credit score · 2008-10-16 · Ao meu filho Gabriel pela paciência e compreensão da espera por um tempo livre para poder bincar

Agradecimen - lss.fnal.govlss.fnal.gov/archive/2001/thesis/t-nicola.pdf · Agradecimen tos a H elio, p ela orien ta c~ ao, p ela compreens~ ao e acima de tudo p ela amizade. ao Ja

Voluntary Cough Detection By Internal Sound Analysis · Pelo vosso perseverante e carinhoso apoio, compreens~ao e disponibilidade, o meu mais verdadeiro agradecimento. Al em do presente

O Cosmo de Einstein - Como a vis£o de Albert Einstein transformou nossa compreens£o de espa§o e

Compreens - ceale.fae.ufmg.br 2017 2018... · nPassar de onze a quinze anos na escola deveria, ... podem ter poder explicativo, ... •Retire do texto, busque no texto,

UNIVERSIDADE FEDERAL DO AMAZONAS INSTITUTO DE …§ão... · Dedico este trabalho ao meu primo, Vitor Gabriel (in memoriam) um anjo que veio com a ... amor e compreens~ao perante

Minicurso LaTeX + Beamer - Aula 8Minicurso LATEX + Beamer - Aula 8 Prof. DSc. B arbara Quintela Cursos de Ver~ao PPGMC - 2016

Melhorias na Predic¸ ao da Estrutura de Larga Escala do ...€¦ · Além disso, há uma escala privilegiada nos limites integrais que envolvem o método perturbativo. Nós calculamos

T ecnicas - USP...ux e L A T E X. P or ultimo, gostaria de registrar meus sinceros agradecimen tos a minha na-morada Silv ana M. Vicen te, pelo ap oio, carinho, compreens~ ao, paci

Programa de Engenharia Elétrica - REDES NEURAIS ARTIFICIAIS …pee.ufrj.br/teses/textocompleto/2014033101.pdf · 2014-04-14 · redes neurais artificiais na predic˘ao das principais

Minicurso LATEX + Beamer - Aula 3 · Minicurso LATEX + Beamer - Aula 3 Prof. DSc. B arbara Quintela Cursos de Ver~ao PPGMC - 2016 1 Figuras e tabelas Inserindo imagens Inserindo tabelas

Fluxograma computacional para detec˘c~ao e an alise de ... · para facilitar minha vida, n~ao vou esquecer isso, com certeza sem sua compreens~ao teria sido muito mais dif cil completar

Mecanica dos Fluidosˆ - nldias.github.io · A Mecanica dos Fluidos forma a grande base de conhecimento para a compreensão dos Fenoˆmenos de Transporte. Esta visaõ unificada

UNIVERSIDADE FEDERAL DO CEARA a CENTRO DE CIENCIAS ...uma ferramenta de uso simples e poderosa para a compreens~ao do estudo de areas. Logo em seguida, mostraremos o Teorema de Reeve

Leonardo Mota Pinheiro Mota Pinheiro...Aminhaesposa,` Eryka, pela compreensão e paciência, até nos momentos mais´ dif´ıceis. Aos meus filhos, Luca e Sara, que apesar de não