Transcript of Weka – Ferramenta Livre para Mineração de Dados
- 1. Weka Ferramenta Livre para Minerao de Dados Acadmico: Rubem
Ventura
- 2. Agenda O que Weka? Introduo Vantagens de Weka Sistemas
Operacionais O Livro da Weka Alguns Algortimos Formato .ARFF Weka
Explorer
- 3. O que Weka?
- 4. O que Weka? Weka um Software livre do tipo open source para
minerao de dados, desenvolvido em Java, dentro das especificaes da
GPL (General Public License).
- 5. Introduo Desenvolvido por um grupo de pesquisadores da
Universidade de Waikato, Nova Zelndia em 1993. Sigla WEKA(Waikato
Environment for Knowledge Analysis) criada por Geoff Holmes . Em
1997, foi tomada a deciso de reconstruir Weka do zero em Java,
incluindo implementaes de algoritmos de modelagem.
- 6. Introduo Em 2005, Weka recebeu o SIGKDD Data Mining e o
prmio de servio de descoberta de conhecimento. Em 2006, Pentaho
Corporation adquiriu a licena exclusiva para usar o Weka para
business intelligence. Forma a minerao de dados e a componente de
anlise preditiva da sute Pentaho de inteligncia empresarial. Verso
Atual: 3.7.12
- 7. Introduo Seu ponto forte a tarefa de classificao, mas tambm
capaz de minerar regras de associao e clusters de dados. Pode ser
utilizada no modo console ou atravs da interface grfica Weka
Explorer. Ao longo dos anos se consolidou como a ferramenta de data
mining mais utilizada em ambiente acadmico.
- 8. Vantagens de Weka Software Livre. Portabilidade. Uma coleo
completa de dados de pr- processamento e tcnicas de modelagem.
Facilidade de utilizao com sua interfaces grficas de usurio.
- 9. Sistemas Operacionais Windows x86 Mac OS X Linux Link para
Download http://www.cs.waikato.ac.nz/ml/weka/downloading.html
- 10. O Livro da Weka As caractersticas da Weka e as tcnicas nela
implementadas so apresentadas no livro Data Mining: Practical
Machine Learning Tools and Techniques. Os autores do livro so os
idealizadores da ferramenta.
- 11. Alguns Algortimos Aprendizagem de mquina Classificao
baseados em redes neurais Estatstica Outros
- 12. Formato .ARFF Um arquivo no formato .ARFF um arquivo de
texto puro, composto de trs partes: Relao Atributos Dados
- 13. Formato .ARFF %comentrio @relation pessoa @attribute sexo
{M,F} @attribute idade real @attribute doente {sim, no} @data
M,17,no F,15,sim M,25,nao F,18,nao M,22,sim
- 14. Weka Explorer Interface grfica que permite a execuo dos
algoritmos de data mining da Weka de forma interativa.
- 15. Weka Explorer Interface
- 16. Onde conseguir mais informaes? http://weka.pentaho.com/
http://www.cs.waikato.ac.nz/ml/weka/ Minerao de Dados - Conceitos,
Aplicaes e Experimentos com Weka
http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf Stio da
IBM Minerao de dados com WEKA, Parte 1: Introduo e regresso
http://www.ibm.com/developerworks/br/opensource/library/os-weka1/
Minerao de dados com o WEKA, Parte 2: Classificao e armazenamento
em cluster
http://www.ibm.com/developerworks/br/opensource/library/os-weka2/
- 17. Consideraes finais Weka uma ferramenta Flexvel Diversos
Algortimos Permite a descoberta de conhecimento tanto via interface
com o usurio quanto embutida na aplicao do desenvolvedor. Pode ser
utilizada no somente para Data Mining.
- 18. Referncias Weka 3 - Data Mining with Open Source Machine
Learning Software in Java Ian H. Witten; Eibe Frank; Mark A. Hall
(2011). "Data Mining: Practical machine learning tools and
techniques, 3rd Edition"
- 19. Obrigado =)