Artigo_Mineração de dados

download Artigo_Mineração de dados

of 8

Transcript of Artigo_Mineração de dados

  • 8/6/2019 Artigo_Minerao de dados

    1/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 1

    Anlise do perfil do usurio de servios de telefoniautilizando tcnicas de minerao de dados

    Adelir Jos Schuler Junior1, Anderson Luiz Fernandes Perez1,2,1 Faculdades Barddal

    Curso de Sistemas de InformaoTrindade - 88036-500 Florianpolis SC

    [email protected]

    2 Universidade Federal de Santa Catarina (UFSC)Departamento de Automao e Sistemas

    Curso de Ps-Graduao em Engenharia EltricaCampus Universitrio Trindade - 88040-900 Florianpolis SC

    [email protected]

    Resumo

    O prejuzo causado s operadoras de telecomunicaes pela inadimplncia cresce assustadoramente. Natentativa de minimizar esse prejuzo, o setor vem adotando algumas medidas. As tcnicas de minerao dedados para a descoberta de conhecimento trazem contribuies importantes para o setor detelecomunicaes. A minerao de dados apresenta-se como um recurso poderoso na identificao deperfis de usurios dos servios de telecomunicaes, fornecendo subsdios no combate a inadimplncia,assim, pode-se apresentar informaes que justificam a montagem de uma estratgia e uma estruturaadequada para combater a grande quantidade de fraudadores. Quanto mais rpido forem identificados estesusurios, menor ser o prejuzo da operadora de telefonia e mais recursos a empresa ter para oferecernovos servios. Este trabalho prope o emprego de tcnicas de Data Mining para analisar e identificar operfil do usurio inadimplente no setor de telecomunicaes.

    Palavras-chave: Telecomunicao, Minerao de Dados.

    Abstract

    The loss of income due to non-payment is increasing in an amazing rate to the TelecomunicationCompanies. In an attempt to minimize this loss, companies are taking some measures, like, for instance,

    Data Mining . Data Mining is a way of "mining", or reseraching, data from customers aiming to discovertraits that could help to identify bad payers. It can be a powerful resource in the profiling of thosecustomers, giving the companies important information in order to attack the origin of the loss. With DataMining we are able to present information that justify the development of an adequate strategy/structure tocombat this legion of cons. The faster these users are identified, the lesser the loss and the bigger theresources the Company will have to invest in new services. Data Mining sugests different tecniques tomaximise the data discovery, and to get the most of Data Mining you need to be familiarized with them.The aim of this work is to compare this Data Mining tecniques, which are used in the profiling of theusers, with an eye on the non-payers, in our Telecomunication sector. In some cases, a combination of tecniques may be used to get the solution.

    Key-words: Telecomunication, Data Mining.

    1 Introduo

    As operadoras de telecomunicaes tem absorvidoprejuzos considerveis causados pela inadimplncia oupela utilizao de seus recursos de forma ilcita.

    As tcnicas de minerao de dados aplicadas no setor detelecomunicaes apresentam-se como um recursopoderoso para identificar o perfil do inadimplente,fornecendo subsdios para as operadoras detelecomunicaes no combate a este problema, assim, possvel apresentar dados que do base slida para

  • 8/6/2019 Artigo_Minerao de dados

    2/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 2

    montar uma estrutura adequada para combater o grandenmero de fraudadores. Quanto mais rpido foremidentificados estes usurios, menor ser o prejuzo daoperadora de telefonia e mais recursos empresa terpara oferecer novos benefcios aos usurios.

    Alm da determinao do perfil dos usuriosinadimplentes, tcnicas de minerao de dados podemser utilizadas para apresentar dados sobre o perfil dosbons pagadores mostrando qual a preferncia nautilizao dos servios, dando embasamento para que asempresas do setor de telecomunicaes tenhamcondio de realizar campanhas de marketing paramanter e agregar bons clientes.

    O objetivo deste trabalho apresentar o uso dastcnicas de minerao de dados como: redes neurais(RNAs) e rvores de deciso, a fim de avaliar qualdessas tcnicas se torna mais eficaz para identificar o

    perfil de um usurio inadimplente.As tcnicas de minerao de dados (redes

    neurais e rvores de deciso) so aplicadas sobre osdados que as operadoras de telefonia dispe referente ausurios inadimplentes. A utilizao dessas tcnicasbusca determinar o perfil (classe) do usurioinadimplente e tambm criar regras para testar novosdados verificando se encaixam nos perfis (classes) deinadimplncia. Desta forma pode-se instituir alarmesinformativos permitindo a operadora de telefonia tomarprovidncias imediatas, evitando que a descoberta dafraude acontea somente muito tempo depois dautilizao do recurso (utilizao do telefone),diminuindo os prejuzos causados.

    2 O problema que ainadimplncia causa no setor detelecomunicaes

    Passado algum tempo das privatizaes no setor detelecomunicaes, as operadoras esto de frente para umnovo problema, o crescimento dirio da inadimplncia,que segundo algumas estimativas superam a marca deR$ 2 bilhes [4].

    Vrios motivos so atribudos a esta alta taxade inadimplncia: alta taxa de ICMS, tarifas altas,recesso econmica, o desemprego e conseqentementea queda do poder aquisitivo da populao e as fraudescausadas pelo crime organizado, so alguns dos fatoresdeterminantes para a inadimplncia. O problema dainadimplncia est diretamente relacionado ao problemaeconmico do pasError! Reference source notfound. . Diante deste cenrio, pode-se perceber que asdespesas das operadoras de telefonia com ainadimplncia so grandes, cerca de 10% da receitabrutaError! Reference source not found. .

    Na tentativa de minimizar estes custos, aANATEL tenta ajudar as operadoras com algumasregras [5] :a) nos primeiros 15 dias: a prestadora notificar ao

    assinante, dos seus direitos de contestao dodbito, em at 5 dias teis, e da possibilidade de

    suspenso parcial do servio por inadimplncia;b) a partir de 30 dias de inadimplncia: suspensoparcial do servio. A suspenso ser apenas parafazer ligaes e no para receb-las;

    c) aps 30 dias da suspenso parcial: permanecendo oassinante inadimplente, poder haver suspensototal. Neste caso no poder ser feita ligaes e nemreceb-las;

    d) dever ser comunicado ao assinante, comantecedncia mnima de 15 dias, a suspenso totaldo servio;

    e) transcorridos 30 dias de suspenso total do servioem determinada modalidade do STFC, porinadimplncia, a Prestadora pode rescindir ocontrato de prestao de servio;

    f) rescindido o contrato de prestao de servio, porinadimplncia, a prestadora pode incluir o registrode dbito em sistemas de proteo ao crdito;

    g) caso o assinante conteste os dbitos, os prazosestabelecidos estaro suspensos at que o mesmoseja notificado da deciso da Prestadora;

    h) na hiptese de contestao parcial, deve sersuspensa a cobrana da parcela impugnada eefetuado o pagamento da parte incontroversa;

    i) direito do assinante, sem qualquer custo, requerera retificao das informaes de inadimplnciarelativas a sua pessoa;

    j) a prestadora responde pelos danos de qualquernatureza em razo de informao inverdica deinadimplncia; e

    k) assinante inadimplente pode efetuar a qualquermomento o pagamento do dbito, acrescido dosencargos de mora, cabendo a prestadora retirar ainformao de inadimplncia e restabelecer oservio em at 24 horas aps a declarao oucomprovao do pagamento pelo assinante ou,ainda, do recebimento pela prestadora de

    comprovao do pagamento via sistema bancrio,se no houver sido rescindido o contrato deprestao de servio.

    Mesmo, com esse conjunto de regras, a taxa deinadimplncia continua alta, e para tentar diminuir estataxa as operadoras de telefonia vm investindo emnovos recursos tecnolgicos.

    O que muitas empresas no percebem, quebuscar uma soluo para o problema da inadimplnciapode estar mais prximo do que o imaginado. Asinformaes necessrias para entender as fraudes estno banco de dados. Ignorando isso as empresas buscamsempre solues perfeitas para seus problemasutilizando o Data WareHouse somente para gerar

  • 8/6/2019 Artigo_Minerao de dados

    3/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 3

    relatrios no trazendo desta forma muitos benefciospara a corporaoError! Reference source not found. .

    3 Minerao de Dados em uma Base

    de Dados de Chamadas TelefnicasDescobrir conhecimento em um banco de dados atravsda minerao de dados requer organizao e capacidadede escolher as caractersticas relevantes que seroutilizadas para que o aprendizado possa acontecer.

    Apresenta-se a aplicao das tcnicas: rvoresde deciso, que decompe um grande problema emsubproblemas mais simplificados tornando a anlisemais fcil, e redes neurais, que tem a capacidade deaprender a executar tarefas por meio de treinamentos.Ambas as tcnicas so aplicadas sobre um volume dedados de testes para obteno de resultados quedemonstrem o funcionamento da minerao de dados nabusca de conhecimento.

    Com o passar do tempo o volume de dadosgerados dentro das empresas aumenta. Os locais dearmazenagem so modificados para suportar essaquantidade de dados, as tecnologias de controle dearmazenagem so melhoradas, enfim, cada dia fica maisfcil armazenar grandes volumes de dados e depoisrecuper-los. A grande indagao que se tem nos dias dehoje : ser que os dados armazenados podem serutilizados com outros fins, ou seja, ser que possvelaproveitar esses dados para descobrir se existe algumconhecimento escondido? Por exemplo, uma empresaprestadora de servios em telecomunicaes pode terem seus registros informaes que apresentemtendncias de mercado ou mesmo informaes querevelam o perfil do seu cliente.

    Um supermercado pode apresentar perfis deusurios que mostrem as preferncias de consumo,baseado nisso possvel dispor as mercadorias para quefique mais fcil e confortvel a compra. Na rea damedicina pode-se realizar a busca de informaes paradiagnosticar certas doenasError! Reference sourcenot found. .

    Isto j justificativa suficiente para os esforosaplicados na busca deste conhecimento escondido queum grande volume de dados pode ter. A busca destasinformaes pode ser feita utilizando alguns tcnicasdiversificadas, o que se fala muitos nos dias de hoje atcnica de Data Mining Error! Reference source not

    found. .

    Data Mining ou minerao de dados, oprocesso de descobrir informaes relevantes, comopadres, associaes, mudanas, anomalias e estruturas,em grandes quantidades de dados armazenados embanco de dados, depsitos de dados ou outros

    repositrios de informaoError! Reference sourcenot found. .

    3.1 Formulao do problema

    O conhecimento do perfil dos inadimplentes, ou omapeamento da situao da inadimplncia no setor detelecomunicaes alvo de estudos e pesquisasconstantes. H necessidade de respaldar as operadorasde telecomunicaes com informaes que possammelhorar a confiabilidade e a qualidade das informaessobre os usurios inadimplentes.

    Utilizando-se o registro das chamadastelefnicas dos usurios inadimplentes que asoperadoras possuem, pode-se descobrir e montar regrasde classificao que permitem a definio do perfil dosusurios inadimplentes no setor de telecomunicaes.Com as regras de classificao definidas, pode-serealizar a deteco de provveis futuros inadimplentescom a aplicao da regra de classificao sobre umanova chamada registrada. Caso a chamada encaixe-seem uma das regras definidas, pode-se atribuir valoresacumulando pontuao at que tenha-se um ndice paraespecificar se o usurio tem o perfil de inadimplente.

    3.2 Dados utilizados para a realizao dostestes

    Os dados das chamadas telefnicas utilizados para arealizao dos experimentos so extrados de um SGBD

    para um arquivo texto contendo as colunas (querepresentam os campos das tabelas) separadas portabulaes. Depois da gerao do arquivo texto, dadossem significado so retirados, configurando a etapa delimpeza dos dados. Aps a limpeza, os dados sofremuma codificao que os enriquecem e os preparam parao processo de descoberta.

    Para a realizao dos experimentos foiutilizado um micro computador AMD K6-II com256MB de memria RAM e 18GB de espao em discopara analisar 63.534 registros (nmero total de registrosdisponibilizados para testes) de chamadas telefnicas do

    perodo entre 01 de setembro a 31de dezembro de 350assinantes inadimplentes de telefones fixos, com osseguintes dados: dia da semana que a chamada foiexecutada, hora inicial da chamada, destino da chamadaque ir identificar o tipo do destino (local, DDD,Celular, DDI) e durao das chamadas.

    Para os testes o atributo origem das chamadasno ser considerado, pois no interfere na obteno dopadro geral dos usurios em questo visto que nocontribui consideravelmente como atributo delimitadorde perfil geral de inadimplentes. Deve-se considerar oatributo origem no momento que especifica-se o perfilindividual do inadimplente.

    A utilizao de um nmero maior deinformaes sobre inadimplncia no foi possvel

  • 8/6/2019 Artigo_Minerao de dados

    4/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 4

    devido a este tipo de registro ser sigiloso e pontoestratgico das empresas no combate a inadimplncia.

    3.3 Transformao dos dados

    Aps a limpeza dos dados, e necessrio realizar acodificao dos mesmos, ou seja, deve-se criar padrespara representar os dados. A Tabela 1 exemplifica acodificao dos dados.

    Dia dasemana

    Hora Destino Durao Degrau

    1 2 1 1 12 1 2 2 13 3 2 3 24 5 3 4 35 6 3 5 4

    Tabela 1: Exemplo de codificao dos dados

    Os atributos foram codificados conforme segue:

    Dia da semana: esta coluna trs a data(dd/mm/aa) da realizao da chamada masfoi alterada para dia da semana (segundafeira, tera feira, etc.), para que se possasaber em qual(is) dia(s) da semana osusurios tem preferncia para utilizao dotelefone.;

    Dia da semana CodificaoDomingo 1Segunda-feira 2Tera-feira 3Quarta-feira 4Quinta-feira 5Sexta-feira 6Sbado 7

    Tabela 2: Transformao do atributo Dia da semana

    Hora em que a chamada foi realizada. Esteparmetro foi dividido em 04 partes para especificaro perodo do dia que de preferncia dos usuriospara a gerao das chamadas. No foi utilizada adiviso sugerida pelo sistema de tarifao dasoperadoras de telecomunicaes, pois este especificaperodos diferenciados de cobrana para finais desemana, feriados e dias teis;

    Hora Codificao00:00h 06:00h 106:00h 12:00h 212:00h 18:00h 318:00h 24:00h 4

    Tabela 3: Transformao do atributo Hora

    O atributo durao foi codificado paraapresentar o parmetro que permite saber qual amdia de tempo que os usurios falam durante asconversaes, foi criada uma classe para agrupar as

    chamadas que tem uma durao relativamente curta(menor que 60s), outra para representar chamadascom durao mdia (entre 61s e 120s), uma classepara definir chamadas com durao de mdia paraalta (entre 181s e 300s), e uma classe que agrupa aschamadas com longa durao (acima de 300s);

    Durao (s) Codificao00 60 161 180 2181 300 3300 9999 4

    Tabela 4: Transformao do atributo durao

    O atributo destino foi codificado paraespecificar se a chamada foi realizada para umtelefone fixo local, para um telefone celular local,para um telefone fixo interurbano, etc.

    Destino CodificaoFixo (Local) 1Celular (Local) 2Fixo (DDD) 3

    Celular (DDD) 4Fixo (DDI) 5Celular (DDI) 6Servios especiais 7

    Tabela 1: Codificao do atributo destino

    Estes dados foram todos codificados utilizandouma planilha e salvos em formato .txt com as colunasseparadas por tabulao.

    3.4 Anlise utilizando rvores de deciso

    Para anlise utilizando rvores de deciso utiliza-se osoftwareSipina Error! Reference source not found.foi selecionado para a implementao das tcnicas de

    Data Mining, porque possui licena para usoeducacional, implementa o mtodo de classificao eutiliza rvore de deciso para representar oconhecimento obtido. Foi desenvolvido para trabalharcom o sistemaWindows . um software que extrai oconhecimento a partir de dados armazenados emarquivos texto ou em formato proprietrio (arquivogerado atravs da prpria ferramenta), e a suacapacidade de aprender est relacionada quantidade equalidade dos dados.

    Durante a anlise os resultados podem servisualizados nas diferentes janelas doSipina , como a

  • 8/6/2019 Artigo_Minerao de dados

    5/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 5

    janela grfica, a matriz de classificao e as regras.Pode-se citar a capacidade da ferramenta de gerarconhecimento na forma de Regras de Produo, atravsdo aprendizado baseado em exemplos caracterizadospor dados simblicos e numricos. Tambm capaz detestar o conhecimento atravs de exemplos no

    utilizados no aprendizado e adicionar o conhecimentogerado automaticamente ao conhecimento dado por umespecialista humano e otimizar a base de conhecimentoError! Reference source not found. .

    Figura 1: Interface principal do Sipina

    Aps a limpeza e codificao dos dados, osmesmos foram importados para o softwareSipina , comomostra a Figura 2:

    Figura 2: Dados importados para o SIPINA

    Nesta etapa foram adicionadas a todos osatributos as descries de acordo com a especificao dacodificao. A Figura 3 apresenta a forma de edio das

    categorias (atributos) utilizando o softwareSipina .

    Figura 3: Edio das categorias no SIPINA

    Depois de efetuada a padronizao dos dadosno software, foram geradas algumas rvores de deciso.

    Figura 4: Exemplo de rvore de deciso gerada peloSIPINA

    3.5 Resultados obtidos com o SIPINA

    Para a gerao da rvore de deciso representada naFigura 4 foi montado o seguinte cenrio: o algoritmoutilizado foi o C4.5 para gerao da rvore de deciso, aclasse principal foi criada com o atributo dia dasemana como n principal, com a finalidade dedescobrir quais os dias da semana so preferidos dosusurios, e, os ns filhos especificados foramdeterminados com os atributos: hora e destino (tipo dachamada) para verificar qual o horrio durante os diasda semana prefere-se gerar chamadas e qual o tempoutilizado nestas conversaes. Como resultado asseguintes regras geradas pela rvore de deciso soconsiderveis.

    Regra01:

    Os dias da semana com maior nmero de chamadas so quarta equinta feira no horrio entre 06:00h 12:00h:Quarta feira: 22%Quinta feira: 31%Na sexta feira o horrio de maior trfego entre 18:00h 24:00h: 21%

    Regra02:

    Nas segundas feiras o horrio entre 12:00h e 18:00h concentrachamadas para servios especiais: 33%

    Regra03:

    Nas quartas feiras o horrio entre 12:00h e 18:00h concentrachamadas:para telefone fixo (Local): 23%para telefone celular (DDD): 22%

    Regra04:

    Nas quintas feiras o horrio entre 12:00h e 18:00h concentram-se chamadas para telefone fixo (DDI): 30%

    Regra

    05:

    Nas sextas feiras o horrio entre 12:00h e 18:00h concentram-se

    chamadas:para telefone celular (Local): 22%para telefone fixo (DDD): 24%

  • 8/6/2019 Artigo_Minerao de dados

    6/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 6

    As regras acima sugerem o perfil geral dosusurios encontrado no volume de dados avaliado. Adefinio do perfil geral determina o comportamentogeneralizado dos usurios inadimplentes. Essa definioserve de parmetro comparativo na verificao desemelhana do perfil do usurio individual com o perfil

    do grupo de inadimplentes. Quando da anlise dosdados de um usurio em especfico, pode-se comparar oresultado com as classes pr-determinadas para verificarse este usurio encaixa-se em um dos perfis jencontrados.

    Analisando os dados de um nico usuriopode-se verificar se ele pertencente a uma determinadaclasse j descoberta utilizando ndices de aproximao.

    Um usurio no pode ser consideradoinadimplente / fraudador somente devido ao seu perfilenquadrar-se em uma classe pr determinada, por isso ainterveno humana (analista de fraudes) de

    fundamental importncia. Para evitar equvocos, osdados que geram alarmes (perfil que encaixa-se nogrupo de inadimplentes) so analisados por um analistade fraudes que tem condio de realizar um estudo maisapurado sobre aquele usurio especificamente, para da sim determinar se ou no inadimplente / fraudador.

    3.6 Anlise dos dados com redes neurais

    Nesta seo ser descrito o experimento com redesneurais e para isso utilizou-se o softwareQwikNet que um simulador para redes neurais que executa diversosmtodos eficientes para treinar e testar uma rede neural.

    A rede neural executada noQ w i k N e t chamada de perceptron multi-layer , que uma redecomposta de diversas camadas. O programaQwikNet oferece uma relao flexvel e intuitiva que permiteprojetar, treinar e testar redes neurais em um ambientegrfico. Criar aplicaes feitas sob encomenda com oQwikNet fcil. Permite projetar a rede usando ainterface grfica e ento export-la em um de diversosformatos populares incluindo: C/C++, Pascal ou MatlabError! Reference source not found. .

    Caractersticas do QwikNetError! Referencesource not found. :

    Learning Rate : A taxa de aprendizado controla a taxa qual a rede aprende. Normalmente, quanto mais alta ataxa de aprendizagem, mais rpido a rede aprende. Se ataxa de aprendizado muito alta, a rede pode ficarinstvel.

    Momentum : Este parmetro controla a influncia daltima mudana de peso na atualizao de peso atual.Normalmente resulta numa aprendizagem mais rpida,mas pode causar instabilidade em alguns casos se for

    muito grande.Weights : Os campos Mnimo e Mximo permitem aousurio fixar os mais baixos e as mais altas varincias

    para cada peso. Durante o treinamento, todos os pesosso usados conforme estes parmetros.

    Hidden layers : A rede pode conter at 5 camadasescondidas, cada uma com qualquer nmero deneurnios. Cada camada escondida pode consistir de

    qualquer funo de ativao: linear,logistic , tangentehiperblica, ou Gaussian. A escolha da funo deativao depende da natureza dos dados de treinamento.

    Logistic a escolha mais comum, mas a tangente e ahiperblica podem resultar em treinamentos maisrpidos para muitos problemas. O melhor tamanho parauma rede depende do problema.

    3.6.1 Resultados obtidos com redes neurais

    Para a realizao dos testes utilizando redes neurais, osdados foram codificados conforme especificado no itemde 3.3 Transformao dosdados .

    A rede neural foi treinada utilizando umarquivo com 499 linhas de dados linhas (500 o nmeromximo de linhas permitida pelo softwareQwikNet emcarter de demonstrao) com informaes (bilhetescom os atributos dia da semana, horrio, destino dachamada, durao) de usurios inadimplentes, e, para oteste foi utilizado um arquivo com 240 linhas cominformaes de um nico usurio para visualizar se estetem um perfil semelhante ao que a rede neuralconseguiu aprender.

    O teste foi realizado com 04 (quatro neurnios) deentrada mais um neurnio de sada, a taxa deaprendizado de 0,1, momentum 0 e critrio de paradacom 25.000 pocas de treinamento. A Figura 5apresenta os resultados dos testes:

    Figura 5: Interface do QwikNet

    Do total de registros (364) submetidos aoteste, trs registros de chamadas encaixam-se no perfilaprendido pela rede. Um indicador bastante baixo para

  • 8/6/2019 Artigo_Minerao de dados

    7/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 7

    especificar que este um usurio com tendncias ainadimplncia / fraude.

    Ferramentas que utilizam redes neurais para adeteco de fraudes comeam a aparecer mais nomercado. A Br Telecom investiu em 2004 um valor

    estimado entre US$ 1,5 milho e US$ milhes em umasoluo combinada da Agilent Technologies e Cerebruspara monitorar em tempo real a sua rede local, de longadistncia e GSMError! Reference source not found. .

    As redes neurais so utilizadas para aprendercom o histrico dos usurios analisando ocomportamento de cada um em diferentes perodos dosdia. Como fazem a anlise individual do condies sempresas de descobrir em tempo real alguma atividadesuspeita. A anlise destes dados d condies deinterromper a atividade fraudulenta rapidamente,colaborando assim para o aumento da lucratividade daempresaError! Reference source not found. .

    4 Comparao de resultados entrervores de deciso e as Redes Neurais

    rvores de deciso tm uma estrutura fcil de aprendere assimilar apresentando os resultados de uma formamais clara para um analista de resultado. As rvores dedeciso apresentam os resultados em forma de rvore,facilitando a leitura. Um ponto a ser observado que arvore de deciso utiliza-se somente de um atributo paradividir cada nvel, isso solicita a escolha correta dessesatributos para que seja gerada uma rvore com umnmero reduzido de subconjuntos.

    As redes neurais so capazes de aprenderatravs de treinamentos especficos. As RNAstrabalham somente com nmeros, isso obriga atransformao de determinados tipos de dados para umpadro que a RNA possa trabalhar. A obteno doresultado muitas vezes torna-se nebulosa pois no setem a forma exata que tcnica utilizou para chegar aoresultado, alm de dispensar um tempo para treinamento/ aprendizagem da rede.

    5 ConclusoOs ndices de inadimplncia no setor de

    telecomunicaes superam a marca de R$ 2 bilhes [4],e em alguns casos esse valor perfaz em mdia 10% dareceita bruta das operadoras de telecomunicaes.

    A inadimplncia cresce mais a cada dia nosetor de telecomunicaes, com isso as empresas dosetor deixam de arrecadar recursos de grandeimportncia para a melhoria de seus servios. Com apreocupao de diminuir os ndices de inadimplncia emelhorar a qualidade de atendimento aos seus clientes,as operadoras de telecomunicaes buscam identificar o

    perfil dos usurios inadimplentes e tambm realizar umtrabalho de preveno a fraudes.

    Com a descoberta do perfil do inadimplenteas operadoras de telecomunicaes tem condies defazer um trabalho preventivo de combate a falta de

    pagamento. Com os perfis definidos, possvel realizaruma anlise sobre todas as chamadas telefnicas everificar quando uma chamada que est em cursoencaixa-se em um desses perfis, gerando alarmes para aoperadora de telecomunicaes e para o prprio usuriodo servio antes que este venha a ser suspenso. Tambmpode-se usar o conceito de definir perfil para descobriros bons clientes dando possibilidade da realizao deum trabalho de marketing direcionado essas pessoasque hoje em dia fazem do telefone uma ferramenta degrande utilidade no seu dia a dia.

    As tcnicas utilizadas para minerao dedados foram: rvores de deciso e redes neurais. Ambasmostraram-se eficientes na realizao do trabalho,porm, apresentaram alguns detalhes considerveis.

    A tcnica de rvore de deciso apresentoudados que indicam um padro de comportamento /perfil, porm, gerou um grande nmero de subdivisestornando a leitura do resultado pouco gil / demorada,mas de fcil compreenso. Tambm permite a geraodas regras que definiram o padro, isso facilita a buscapor novos padres em um novo volume de dadossubmetidos a esta tcnica.

    As RNs apresentaram um resultado um poucoopaco no dando condies de avaliar a tcnica e quaisos critrios utilizados para chegar ao resultado final.Desta forma, no pode-se especificar qual o critrio quedefiniu o padro dos usurios inadimplentes, isso deconhecimento somente da RN.

    Trabalhos futuros

    A partir deste trabalho, percebe-se que um estudo maisaprofundado pode ser dirigido para:

    -

    analisar qual a tcnica que pode serimplementada com um baixo custo computacionalpara disponibilizar o recurso para empresas menores;

    - analisar qual a contribuio que acombinao das duas tcnicas apresentadas notrabalho (rvores de deciso e redes neurais) trazempara a descoberta da inadimplncia;

    - analisar qual a contribuio que acombinao de outras tcnicas de minerao de dadostrazem para a descoberta da inadimplncia, e;

    - estudar os benefcios da anlise deinadimplente(s) / fraudadores no menor tempopossvel para as empresas de telecomunicaes.

    As respostas a estas questes, a serem abordadas emtrabalho posterior, so de fundamental importncia nadescoberta e combate aos inadimplentes.

  • 8/6/2019 Artigo_Minerao de dados

    8/8

    RESI Revista Eletrnica de Sistemas de Informao, n1, 2006 8

    Referncias

    [1] AMO, Sandra. Tcnicas de Minerao de dados.Anais do XXIV Congresso da Sociedade Brasileirade Computao. Integrao e diferenas Regionais:O papel da Computao. Volume 2. Livro texto. 31de julho a 06 de agosto de 2003. Salvador Bahia.

    [2] CARVALHO, Lus Alfredo Vital de. DATAMINING. A minerao de dados no Marketing,Medicina, Economia, Engenharia e Administrao.2 Edio. Ed. rica. 2002

    [3] DE FRANCESCHI, AnaLcia Schiaffino Morales.Aplicao de tcnicas de inteligncia artificial nodesenvolvimento de agentes para gerncia de redes.Tese de Doutorado. UFSC. 2003.

    [4] Disparada da inadimplncia mobiliza operadoras.Revista World Telecom. Ed. 44. 2002.http://worldtelecom.uol.com.br/AdPortalV3/adCmsDocumentoShow.aspx?Documento=27233.Acessado em 02/08/2005

    [5] DIREITO EM DEBATE. Direitos e Deveres sobret e l e f o n i a . A r t i g o .http://www.direitoemdebate.net/constelefonia.htmlAcessado em 02/08/2005

    [6] FLORES, Christian Feltrin. Ferramentas de DataM i n i n g . 2 0 0 3http://www.hcaa.com.br/antiga/dw/capa113123.htm.Acessado em 13/08/2005.

    [7] GONALVES, Alexandre Leopoldo. Utilizao detcnicas de minerao de dados em bases de dadosC&T: Uma anlise dos grupos de pesquisa noBrasil. Dissertao de Mestrado. UFSC. 2000

    [8] LDKE, Vitor Hugo. Redes Neurais ArtificiaisBackPropagation QwikNet. ULBRA. 2001.http://www.ulbra.tche.br/~danielnm/ia/trabs2000-1/vitor/trabg2.htm. Acessado em: 28/09/2004

    [9] NERCESSIAN, Olvia. BrT Investe em soluo decombate fraude. Telecom WEB. Artigo. 2004.http://www.telecomweb.com.br/noticias/artigo.asp?id=77560. Acessado em: 02/12/2004

    [10] NETO, Vicente Soares; CARVALHO, FranciscoTeodoro Assis. Telecomunicaes. Tecnologia decentrais telefnicas CPA-E, CPA-T, Trfego e

    Sinalizao. 1 Edio. Editora rica. 1999.[11] OLIVEIRA, Ana Paula. Br Telecom investe emredes inteligentes para combate fraudes. WorldTelecom Network World. Artigo. 2004.http://worldtelecom.uol.com.br/adCmsDocumentShow.aspx?GUID=5C3346FE-460C-4FC7-87EA-25FF62CF08F5&ChannelID=40. Acessado em:01/12/2005

    [12] OLIVEIRA, Clarissa. Empresas retomaminvestimento em tecnologia, diz pesquisa. AgnciaE s t a d o . A r t i g o . 2 0 0 4http://www.estadao.com.br/tecnologia/telecom/2004/jun/22/192.htm. Acessado em 02/08/2004.

    [13] PINHO, Paulo. Sem desperdcio de dinheiro.Revista RNT. Edio maro de 2003.http://www.rnt.com.br/edicao0305/opiniao.asp.Acessado em 31/08/2004

    [14] QWIKNET. Professional Neural Network Software.http://qwiknet.home.comcast.net. Acessado em:28/09/2005.

    [15] RAKOTOMALALA, Ricco. Sipina Overview.http://eric.univ-lyon2.fr/~ricco/sipina.html.Acessado em: 10/10/2005

    [16] ROCHA, Carlos Eduardo. . 2004. O ano daconcorrncia. Revista RNT. Anlise. 2002http://www.rnt.com.br/edicao0401_02/analise.asp.Em 29/07/2004

    [17] SOARES, Edileuza. PT Inovao disputa projetoda Vivo. Revista RNT. Notcia . .http://www.rnt.com.br/rnt/rntNoticiasMostrar.asp?id=615. Acessado em 02/08/2005

    [18] SOUSA, Mauro Srgio Ribeiro de . Minerao deDados: Uma implementao fortemente acoplada aum sistema gerenciador de banco de dados paralelo.

    Tese UFRJ . Agosto de 1998[19] WALDMAN, Hlio; YACOUB, Michel Daoud.Telecomunicaes. Princpios e Tendncias. 3Edio. Ed. rica. 1999

    [20] ZANUSSO, Maria Bernadete. Data Mining.http://www.dct.ufms.br/~mzanusso/Data_Mining.htm. Acessado em 23/11/2005