Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia Elétrica
-
Upload
mauricio-volkweis-astiazara -
Category
Science
-
view
126 -
download
3
Transcript of Sistema Imunológico Artificial para Predição de Fraudes e Furtos de Energia Elétrica
Sistema Imunológico Artificial para Predição de Fraudes e Furtos de
Energia Elétrica
Dissertação de Mestrado
Mauricio Volkweis Astiazara
Prof. Dr. Dante Augusto Couto BaroneOrientador
Porto Alegre, junho de 2012
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Sistema Imunológico ArtificialSistema Imunológico Natural
Possíveis Aplicações
RECONHECIMENTO DE PADRÕES
VIDA ARTIFICIAL
MÉTODOS DE BUSCA E OTIMIZAÇÃO
CONTROLE E NAVEGAÇÃO AUTÔNOMA
APRENDIZAGEM DE MÁQUINAALOCAÇÃO DE TAREFAS
SISTEMAS BASEADOS EM AGENTES
CLASSIFICAÇÃOMINERAÇÃO DE DADOS
DETECÇÃO DE ANOMALIAS E FALHAS
Motivação
● SIA ainda não está tão difundido quanto outras áreas;
● Muitos trabalhos utilizando toy problems;● Qual a eficácia de um Sistema
Imunológico Artificial aplicado a um problema real?
Motivação
● Como seria a sua modelagem e adaptação ao problema de um domínio específico?
● E como ficaria seu desempenho comparado aos algoritmos mais tradicionais?
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Fraudes e Furtos de Energia Elétrica
Fraudes e Furtos de Energia Elétrica
● Exemplos de perdas não técnicas:● furtos de energia, ● erros de medição, ● erros no processo de faturamento, ● consumidores sem equipamento de medição● etc.
● ANEEL apontou em 2007 que as perdas não técnicas correspondem a 5 bilhões de reais anuais no país.
Como funciona o Faturamento de Energia Elétrica?
Como funciona o Faturamento de Energia Elétrica?
UnidadeConsumidora
Rede Elétrica
Medidor
Fraude
UnidadeConsumidora
Rede Elétrica
Medidor
Fraude
Furto 1
ConsumidorNão Cadastrado
Rede Elétrica
Furto 2
UnidadeConsumidora
Rede Elétrica
Medidor
Como combater Fraudes e Furtos?
Como combater Fraudes e Furtos?
A Ideia
Utilizar um algoritmo de Sistema Imunológico Artificial para predizer consumidores fraudadores baseados nos
seus dados.
A CEEE-D
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Conjunto de Dados
● Dados de consumidores reais de uma cidade específica;
● Inicialmente a proporção era irreal e alguns atributos não podiam ser usados;
● O conjunto final ficou com 19 atributos incluindo o rótulo.
Conjunto de Dados
854
54
Conjunto de Dados● tipo_cliente;● classe;● fases● pessoa_fisica_juridica● rotatividade_titularidade● carga_declarada● teve_corte● possui_debito_automatico● osc_consumo
● irregularidade_leitura01● irregularidade_leitura03● irregularidade_leitura04● irregularidade_leitura09● irregularidade_leitura25● irregularidade_leitura26● irregularidade_leitura43● irregularidade_leitura44● irregularidade_leitura50● resultado
Projeto
Domínio do Problema
Sis
tem
a Im
unol
ógic
o A
rtific
ial
Representação
Métricas de Afinidade
Algoritmos Imunológicos
Solução
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Expansão Clonal
Modelos
Modelos
Consumidor: array de atributos
Modelos
Detector: array de atributos
Consumidor: array de atributos
Modelos
Detector: array de atributos
Afinidade: similaridade (distância)
Consumidor: array de atributos
Algoritmo
AlgoritmoGerar uma população randômica
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
Melhor indivíduo tem afinidade >
limiar?
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
Melhor indivíduo tem afinidade >
limiar?
NãoNão
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
Melhor indivíduo tem afinidade >
limiar?
Adicioná-lo à lista de células de
memória
SimSim
NãoNão
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
Melhor indivíduo tem afinidade >
limiar?
Adicioná-lo à lista de células de
memória
Substituir piores indivíduos por
novos randômicos
NãoNão
SimSim
AlgoritmoGerar uma população randômica
Apresentar antígeno à população
Reproduzir os melhores e realizar mutação nos clones
Melhor indivíduo tem afinidade >
limiar?
Adicioná-lo à lista de células de
memória
Substituir piores indivíduos por
novos randômicos
NãoNãoPróximo antígeno
SimSim
Utilização do Classificador
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Metodologia de Validação
● Objetivos:● Avaliar se o SIA consegue predizer os
consumidores desonestos: Ganho em Precisão;
● Avaliar a eficácia: Medida-F;● Avaliar a eficácia em relação a outros
métodos: Comparação com outros algoritmos.
Medida-F
0 20 40 60 80 1000
20
40
60
80
100
Recall
Pre
cisã
o
Metodologia de Validação
● Foram realizadas 10 Validações Cruzadas Deixando Um de Fora;
● Foram calculados a Média, Desvio Padrão e Intervalo de Confiança.
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Resultados Experimentais
Métrica Média Desvio Padrão
Intervalo de Confiança (nível 95%)
Precisão 14,00% 0,86 [13,47%, 14,43%]
Recall 72,04% 4,32 [69,36%, 74,71%]
Medida-F 23,44% 1,41 [22,56%, 24,31%]
Resultados Experimentais
● A precisão randômica da amostra é 5,95%;
● O ganho em precisão do classificador ficou em 2,35.
Comparação com Outros Algoritmos# Algoritmo Precisão Recall Medida-F1 Clonalg (SIA) 13,07% 71,93% 23,39%
2 Naive Bayes 10,6% 94,44% 19,07%
3 Voting feature intervals
10,25% 90,74% 18,42%
4 KNN (K=1) 14,55% 14,81% 14,68%
5 RandomTree 10,64% 9,26% 9,9%
6 RandomForest 12,5% 3,7% 5,71%
Comparação com Outros Algoritmos
0 10 20 30 40 50 60 70 80 90 1000
10
20
30
40
50
60
Recall
Pre
cisã
o
SIASIA
Sumário
● Introdução● Fraudes e Furtos de Energia Elétrica● Modelo Proposto● Metodologia de Validação● Análise de Resultados● Conclusões e Sugestões de Trabalhos
Futuros
Conclusões (1 de 2)
● Diferente de outros trabalhos, este utilizou métrica que faz sentido no contexto do negócio em vez da acurácia de maneira simplista;
● O SIA conseguiu aprender o conceito de consumidor desonesto;
● Em termos de medida-F, o SIA ficou em primeiro lugar.
Conclusões (2 de 2)
● SIA deve ser considerado um candidato em potencial para resolver problemas de classificação;
● Os algoritmos de classificação utilizados poderão produzir resultados melhores com uma parametrização adequada.
Sugestões de Trabalhos Futuros
● Algoritmos de seleção de atributos;● Explorar outras medidas de distância para
dados categóricos;● Uso do histórico de consumo poderia ser
melhorado (série temporal);● Simplificação da parametrização.
Continuidade do Trabalho na CEEE
● Primeiros resultados com dados reais foram considerados pela CEEE muito positivos;
● CEEE solicitou continuidade com mais dados reais;
● Sugerimos palestra sobre a tarefa de classificação, suas etapas e ferramentas (ensinar a pescar).
Submissão de Artigo
International Conference on Enterprise Information Systems (ICEIS) 2012:
Aceito.
FIM
Muito obrigado pela atenção.