Data Mining com a Ferramenta Weka Diogo Fernando Veiga Pedro de Stege Cecconello.
WEKA Trabalho
description
Transcript of WEKA Trabalho
-
1
1
WEKA
Biblioteca de algoritmos de Aprendizado de Mquina implementados em Java
Paradigmas implementados: estatstico, instance-based e proposicional. Por exemplo: J48 (verso Java do C4.5), ID3, Naive Bayes, entre outros
Os algoritmos podem ser utilizados isoladamente ou por uma aplicao Java escrita pelo usurio
Pode ser conseguida em: http://www.cs.waikato.ac.nz/ml/weka
-
2
@relation lentes.symbolic @attribute idade {Jovem, Media, Senior} @attribute prescricao {Miope, Hipermiope} @attribute astigmatico {Nao, Sim} @attribute lagrimas {Normal, Reduzida} @attribute lentes {Lentes_gelatinosas, Sem_lentes,
Lentes_duras} @data Jovem,Miope,Nao,Normal,Lentes_gelatinosas Jovem,Miope,Nao,Reduzida,Sem_lentes Jovem,Miope,Sim,Normal,Lentes_duras Jovem,Miope,Sim,Reduzida,Sem_lentes Jovem,Hipermiope,Nao,Normal,Lentes_gelatinosas
Jovem,Hipermiope,Nao,Reduzida,Sem_lentes Jovem,Hipermiope,Sim,Normal,Lentes_duras Jovem,Hipermiope,Sim,Reduzida,Sem_lentes Media,Miope,Nao,Normal,Lentes_gelatinosas Media,Miope,Nao,Reduzida,Sem_lentes Media,Miope,Sim,Normal,Lentes_duras Media,Miope,Sim,Reduzida,Sem_lentes Media,Hipermiope,Nao,Normal,Lentes_gelatinosas Media,Hipermiope,Nao,Reduzida,Sem_lentes Media,Hipermiope,Sim,Normal,Sem_lentes Media,Hipermiope,Sim,Reduzida,Sem_lentes Senior,Miope,Nao,Normal,Sem_lentes Senior,Miope,Nao,Reduzida,Sem_lentes Senior,Miope,Sim,Normal,Lentes_duras Senior,Miope,Sim,Reduzida,Sem_lentes Senior,Hipermiope,Nao,Normal,Lentes_gelatinosas Senior,Hipermiope,Nao,Reduzida,Sem_lentes Senior,Hipermiope,Sim,Normal,Sem_lentes Senior,Hipermiope,Sim,Reduzida,Sem_lentes
-
3
-
4
-
5
=== Run information ===
Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2
Relation: lentes.symbolic
Instances: 24
Attributes: 5
idade
prescricao
astigmatico
lagrimas
lentes
Test mode: 10-fold cross-validation
=== Classifier model (full training set) ===
-
6
J48 pruned tree
------------------
lagrimas = Normal
| astigmatico = Nao: Lentes_gelatinosas (6.0/1.0)
| astigmatico = Sim
| | prescricao = Miope: Lentes_duras (3.0)
| | prescricao = Hipermiope: Sem_lentes (3.0/1.0)
lagrimas = Reduzida: Sem_lentes (12.0)
Number of Leaves : 4
Size of the tree : 7
Time taken to build model: 0 seconds
=== Stratified cross-validation ===
=== Summary ===
Correctly Classified Instances 20 83.3333 %
Incorrectly Classified Instances 4 16.6667 %
Kappa statistic 0.71
Mean absolute error 0.1444
Root mean squared error 0.3173
Relative absolute error 38.3858 %
Root relative squared error 73.3306 %
Total Number of Instances 24
-
7
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
1 0.053 0.833 1 0.909 0.947 Lentes_gelatinosas
0.8 0.111 0.923 0.8 0.857 0.833 Sem_lentes
0.75 0.1 0.6 0.75 0.667 0.819 Lentes_duras
Weighted Avg. 0.833 0.097 0.851 0.833 0.836 0.855
=== Confusion Matrix ===
a b c
-
8
15
Trabalho - WEKA
Grupo: at 2 alunos
Data de entrega: 30/06/2015
-
9
Utilizando a ferramenta Weka: Definir um domnio para representar os
exemplos.
Representar os exemplos no formato de arquivo do Weka.
Aplicar o algoritmo de rvores de deciso J48 do Weka para gerar modelo.
Aplicar um algoritmo de regras para gerar outro modelo.
Comparar os modelos e resultados.
Trabalho a ser entregue e a documentao necessria : Arquivo .arff
Arquivo em Word:
Capa com ttulo do trabalho e nomes dos alunos.
Definio do domnio.
Representao da rvore de deciso gerada e das regras geradas.
Apresentao dos dois modelos gerados pelo Weka, comparando resultados, mostrando e discutindo os erros obtidos.
-
10
http://archive.ics.uci.edu/ml/
https://www.lendingclub.com/info/download-data.action
http://repository.seasr.org/Datasets/UCI/arff/
FIM