Weka – Ferramenta Livre para Mineração de Dados
-
Upload
rubens-ventura -
Category
Software
-
view
48 -
download
4
Transcript of Weka – Ferramenta Livre para Mineração de Dados
- 1. Weka Ferramenta Livre para Minerao de Dados Acadmico: Rubem Ventura
- 2. Agenda O que Weka? Introduo Vantagens de Weka Sistemas Operacionais O Livro da Weka Alguns Algortimos Formato .ARFF Weka Explorer
- 3. O que Weka?
- 4. O que Weka? Weka um Software livre do tipo open source para minerao de dados, desenvolvido em Java, dentro das especificaes da GPL (General Public License).
- 5. Introduo Desenvolvido por um grupo de pesquisadores da Universidade de Waikato, Nova Zelndia em 1993. Sigla WEKA(Waikato Environment for Knowledge Analysis) criada por Geoff Holmes . Em 1997, foi tomada a deciso de reconstruir Weka do zero em Java, incluindo implementaes de algoritmos de modelagem.
- 6. Introduo Em 2005, Weka recebeu o SIGKDD Data Mining e o prmio de servio de descoberta de conhecimento. Em 2006, Pentaho Corporation adquiriu a licena exclusiva para usar o Weka para business intelligence. Forma a minerao de dados e a componente de anlise preditiva da sute Pentaho de inteligncia empresarial. Verso Atual: 3.7.12
- 7. Introduo Seu ponto forte a tarefa de classificao, mas tambm capaz de minerar regras de associao e clusters de dados. Pode ser utilizada no modo console ou atravs da interface grfica Weka Explorer. Ao longo dos anos se consolidou como a ferramenta de data mining mais utilizada em ambiente acadmico.
- 8. Vantagens de Weka Software Livre. Portabilidade. Uma coleo completa de dados de pr- processamento e tcnicas de modelagem. Facilidade de utilizao com sua interfaces grficas de usurio.
- 9. Sistemas Operacionais Windows x86 Mac OS X Linux Link para Download http://www.cs.waikato.ac.nz/ml/weka/downloading.html
- 10. O Livro da Weka As caractersticas da Weka e as tcnicas nela implementadas so apresentadas no livro Data Mining: Practical Machine Learning Tools and Techniques. Os autores do livro so os idealizadores da ferramenta.
- 11. Alguns Algortimos Aprendizagem de mquina Classificao baseados em redes neurais Estatstica Outros
- 12. Formato .ARFF Um arquivo no formato .ARFF um arquivo de texto puro, composto de trs partes: Relao Atributos Dados
- 13. Formato .ARFF %comentrio @relation pessoa @attribute sexo {M,F} @attribute idade real @attribute doente {sim, no} @data M,17,no F,15,sim M,25,nao F,18,nao M,22,sim
- 14. Weka Explorer Interface grfica que permite a execuo dos algoritmos de data mining da Weka de forma interativa.
- 15. Weka Explorer Interface
- 16. Onde conseguir mais informaes? http://weka.pentaho.com/ http://www.cs.waikato.ac.nz/ml/weka/ Minerao de Dados - Conceitos, Aplicaes e Experimentos com Weka http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf Stio da IBM Minerao de dados com WEKA, Parte 1: Introduo e regresso http://www.ibm.com/developerworks/br/opensource/library/os-weka1/ Minerao de dados com o WEKA, Parte 2: Classificao e armazenamento em cluster http://www.ibm.com/developerworks/br/opensource/library/os-weka2/
- 17. Consideraes finais Weka uma ferramenta Flexvel Diversos Algortimos Permite a descoberta de conhecimento tanto via interface com o usurio quanto embutida na aplicao do desenvolvedor. Pode ser utilizada no somente para Data Mining.
- 18. Referncias Weka 3 - Data Mining with Open Source Machine Learning Software in Java Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition"
- 19. Obrigado =)