Post on 07-Apr-2016
USO DA SELEÇÃO DE PROTÓTIPOS PARA OTIMIZAR A CLASSIFICAÇÃO BASEADA EM DISSIMILARIDADE
Felipe Soares Queiroga (fsq)
MOTIVAÇÃO Objetos “Similares” podem sem agrupados
com intuito de formar uma classe, uma “classe” nada mais é que um conjunto de objetos “similares”. [KIMA, 2006]
OBJETIVOS Dois Principais objetivos do Artigo:
Utilizar um PRS como uma ferramenta para minimizar o número de amostras que serão utilizados pela DBC.
Utilizar a medida de distância de Mahalanobis, associada com o algoritmo de PRS, para obter uma vantagem distinta ao implementar uma DBC.
PROTOTYPE REDUCTION SCHEMES (PRS) O que é:
Um Método de seleção de vetores de protótipos necessários para a representação de dissimilaridade.
Usado Para: Reduzir a Base de Treinamento a Protótipos Reduzir os Custos de computar, armazenar e
processar toda a base de Treinamento.
PRS’S UTILIZADOS Random:
Seleção Randômica de m Amostras a partir do Conjunto de Treinamento.
Método Mais Simples
Riscos: Como a Escolha é Aleatória, pode resultar em uma seleção de protótipos desbalanceada
Espaço de Seleção de Protótipos com a técnica Random [Duin, 2004].
PRS’S UTILIZADOS RandomC:
Seleção Randômica de mi Amostras por classe w Existente no Conjunto de Treinamento T
Soluciona o Problema de se Ter Classes Desbalanceadas que Tivemos com a Técnica Random.
Espaço de Seleção de Protótipos com a técnica RandomC [Duin, 2004].
PRS’S UTILIZADOS KCentres:
1. Seleciona randomicamente mi Amostras por Classe wi Existente no Conjunto de Treinamento T.
2. Separa as instâncias de cada classe de acordo com a proximidade de cada protótipo.
3. Calcula o centro para cada conjunto.Objeto cuja distância para os outros da classe é o valor mínimo.
4. Para cada centro, se o centro for diferente, o protótipo é substituído pelo centro e retorna para o passo 2
Espaço de Seleção de Protótipos com a técnica KCentres [Duin, 2004].
MEDIDAS DE DISSIMILARIDADE Medida Utilizada Para Quantificar a
Dissimilaridade Entre Dois Vetores.
No andamento do projeto, foram implementadas quatro formas diferentes no cálculo das dissimilaridades.
DISSIMILARIDADE USADAS
Norma de City Block:
Norma Euclidiana: Norma Max: Norma de
Minkowski:
MATRIZ DE DISSIMILARIDADE Após Selecionarmos Protótipos e definirmos a
medida de dissimilaridade, podemos construir a Matriz de Dissimilaridade:
CLASSIFICAÇÃO Reduzir d Dimensão da Matriz de
Dissimilaridade:
EXEMPLO:Exemplo de um Espaço de Dissimilaridade 2D classificador por um sub-Conjunto de dígitos escritos a mão (3 e 8). A Representação da Dissimilaridade D(T, R) é baseada na Distância Euclidiana entre as imagens binárias com suavização Gaussin. [Duin, 2004]
R é escolhido randomicamente e consiste de dois exemplos, um de cada digito. [Duin, 2004]
RESULTADOS: Utilização Do Classificador Desenvolvido
Sobre a Base Ionosphere do UCI.
DÚVIDAS?
REFERÊNCIAS: [Duin, 1997] R.P.W. Duin, D. Ridder and D.M.J. Tax, Experiments with
a featureless approach to pattern recognition, Pattern Recognition Lett. 18 (1997), pp. 1159–1166.
[Duin, 2004] R.P.W. Duin, E. Pekalska and Pavel Paclok. Prototype Selection for Dissimilarity-based Classifiers (2004).
[KIMA, 2006] Sang-Woon Kima and B. John Oommen. On using prototype reduction schemes to optimize dissimilarity-based classification. (2006).