Uma Proposta de Melhoria no Processo de Recuperação de Imagens com Base na Distribuição de Características de Baixo Nível em seus Segmentos Utilizando Índice InvertidoPatrícia Proença1, Ilmério Silva2,
Celia Barcelos3,
1 [email protected], 2 [email protected], 3 [email protected], 4
2
Objetivo
indexação de características de baixo nível de segmentos de imagens digitais mapeadas para um índice invertido:
melhoras de desempenho no processamento de consultas;
ganho na precisão no conjunto de imagens recuperadas em grandes bases de dados;
Motivação
Grande número de imagens digitais;
Necessidade de localizar imagens:
melhores algoritmos de busca, métodos de indexação e técnicas de classificação de imagens digitais;
4
Trabalhos Relacionados
crescimento da busca de imagens pelo próprio conteúdo - CBIR (Recuperação de Imagens Baseada no Conteúdo), [Datta et al, 2008]: encontrar imagens relevantes - características visuais
extraídas automaticamente das imagens;
em [Matos et al, 2008a] e [Matos et al, 2008b] - adaptação do CBIR: paradigma Índice Invertido;
índice invertido - ganho na velocidade de recuperação de documentos sem perda de qualidade na recuperação;
5
Trabalhos Relacionados
[Matos et al, 2008a] - sistema de recuperação baseado em conteúdo:
técnicas textuais - indexação e cálculo da similaridade;
termos da recuperação textual palavras presentes nos arquivos textuais - na recuperação por conteúdo :
faixas de valores extraídos da imagem através característica de baixo nível - momentos de cor;
momentos de cor - caracteriza as imagens em termos da distribuição dos canais de cores:
três medidas estatísticas: média, desvio padrão e obliqüidade;
Trabalhos Relacionados - [Matos
et al, 2008a] imagens - espaço de cor RGB para o espaço de cor
HSV e calculo dos três momentos para cada canal H, S e V – vetor com nove posições;
Imagens indexadas com os valores - cada canal de cor HSV;
similaridade - cosseno entre os vetores;
melhoria no desempenho do processamento: sem perda significativa na qualidade da recuperação
quando comparada com a busca por distância euclidiana;
7
Vetor de Característica
Tabela 1 – Descrição do vetor de característica resultante da extração de característica da imagem usando os três momentos de cor do espaço HSV, [Matos et al, 2008a].
8
Índice Invertido
Africa10: MHA...DSC...IVHFlor13: MHB...DSD...IVHAfrica12: MHB...DSD...IVHÔnibus33: MHA...DSC...IVH . . .
Imagens MHA
Vocabulário
IVHIVH
MHB
DSCDSD
Lista Invertida
áfrica10, ônibus33...áfrica12, flor13, ...
áfrica10, ônibus33...áfrica12, flor13, ...
áfrica12, ônibus33...áfrica10, flor13, ...
Índice Invertido
9
Cálculo da Similaridade –Utilizando o Índice Invertido
Imagem de Consulta:
Vetor de característica Ic =[MHA, MSB]
I1 = [MHA ,MSC]
I2 = [MHB, MSC]
I3 = [MHA,MSB]
I4 = [MHF,MSD]
Banco de dados de imagens
Lista Invertida:MHA I1, I3
MHB I2
MHC I4
MSB I3
MSC I1, I2
MSD I4
Neste caso teríamos as imagens ordenadas da seguinte forma:
I3, I1
Vetor de característica Ic =[MHA, MSB]Vetor de característica Ic =[MHA, MSB]
Lista Invertida:MHA I1, I3
MHB I2
MHC I4
MSB I3
MSC I1, I2
MSD I4
Lista Invertida:MHA I1, I3
MHB I2
MHC I4
MSB I3
MSC I1, I2
MSD I4
Lista Invertida:MHA I1, I3
MHB I2
MHC I4
MSB I3
MSC I1, I2
MSD I4
Metodologia
algoritmos de segmentação - obter uma segmentação satisfatória das imagens;
adaptar o algoritmo desenvolvido em [Matos et al, 2008a]: atribuir os termos da Tabela 1 a cada segmento
das imagens segmentadas;
vetor - termos encontrados em todos os segmentos da imagem;
Segmento 1 = [MHA, DHC, ....., IVE] Segmento 2 = [MHB, DHG, ......, IVA]
Imagem 1 = Segmento 1 + Segmento 2
Imagem 1
Imagem 1 = [MHA, MHB, DHC, DHG, ......, IVA, IVE]
Segmentação
Metodologia
importância do termo no documento:
trabalhos [Matos et al, 2008a] e [Matos et al, 2008b] - pesos de valores fixos são atribuídos as faixas de valores;
discriminação dos termos :
estudar formas de reformular esses pesos;
observando a distribuição destes termos nos segmentos;
Metodologia
experimentos - coleção referência com aproximadamente 32.000 imagens, [Datta et al, 2008];
objetivo principal - ganho no tempo de execução em grandes coleções sem perder a qualidade da recuperação;
14
Banco de dados da imagem
15
Resultados Esperados Aumentar qualitativamente e
quantitativamente a quantidade de faixas - segmentação de imagens;
Atribuição de pesos em cada faixa - uma melhor discriminação entre as faixas;
Melhorar a qualidade da precisão obtida no trabalho [Matos et al, 2008a], mantendo o ganho de desempenho no processamento da consulta;