Post on 29-Jan-2021
iCubeiCube::Um Cubo de Dados para Imagens Médicas Um Cubo de Dados para Imagens Médicas
baseado em Similaridadebaseado em Similaridade
Aluna: Luana Peixoto Annibal
Orientador: Ricardo Rodrigues Ciferri
Co-orientador: Joaquim Cezar Felipe (FFCLRP-USP)
Colaboradora: Cristina Dutra de Aguiar Ciferri (ICMC-USP)
1iCube: Cubo de Imagens Médicas
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 2
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 3
Contexto em que se insereContexto em que se insere
� Armazenamento e recuperação de imagens digitais é fundamental na área médica ◦ Filmless (Radiologia)◦◦ Rápido
� Ampla utilização de ferramentas de apoio a decisão◦ Superintendentes, diretores, líderes de equipe,
gestores◦ Obtenção de informações estratégicas
iCube: Cubo de Imagens Médicas 4
Contexto em que se insereContexto em que se insere
� Desafio da pesquisa◦ Dificuldade em processar similaridade e agregação
entre imagens� Content-Based Image Retrieval (CBIR)
� Composição do vetor de característica� Composição do vetor de característica
� Utilização de descritores semânticos relacionados a forma, textura e cor
◦ Dificuldade em recuperar as imagens em curto tempo� Métodos de Acesso Métrico (MAM) – Índice
iCube: Cubo de Imagens Médicas 5
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 6
ObjetivoObjetivo
� Investigar o armazenamento e a manipulação de imagens médicas em aplicações de DW
◦ Quais características das imagens são importantes?� Como a semântica da aplicação médica influencia a escolha do vetor de
característica?
◦ Como estas devem ser armazenadas e recuperadas no DW?� Como a semântica da aplicação médica influencia a escolha da estrutura de
armazenamento?
◦ Quais funções de agregação devem ser propostas para gerar os níveis de agregação? � Como a semântica da aplicação médica influencia a escolha das funções de
agregação propostas?
Cubo Métrico
iCube: Cubo de Imagens Médicas 7
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 8
MotivaçãoMotivação� DW para a área médica = Informação estratégica para a área◦ Análises estatísticas de determinadas doenças
� Análise de Tendência � Qual a incidência de câncer de mama em julho de 2009?
� Análise Comparativa � Qual a incidência de câncer nas diferentes faixas etárias?
� Análise de Tendência Múltipla � Análise de Tendência Múltipla � Qual a incidência de câncer de mama nos últimos 3 anos, nas diferentes faixas etárias?
iCube: Cubo de Imagens Médicas 9
MotivaçãoMotivação� Entretanto, não é possível realizar uma análise sobre imagens
médicas
◦ Por que não? � DW convencionais não realização operações baseadas em similaridade
entre imagens e nem agregação
◦ Qual a evolução da prevalência de determinadas formas da patologia nas diferentes faixas etárias?patologia nas diferentes faixas etárias?� Quantas imagens são similares?
� Quais serão as medidas?
� Como tratar medidas semi-aditivas?
� Como será o cubo?
� Cubo por paciente – fato ?
iCube: Cubo de Imagens Médicas 10
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 11
Detalhamento do TrabalhoDetalhamento do Trabalho� Ambiente de Data Warehousing◦ Dados operacionais � Informação voltada à tomada de decisão
estratégica
◦ Oferecem funcionalidades de obtenção e manipulação de dados � ETL - extração, tradução, filtragem, integração e armazenamento
� Rollup� Rollup
� Drill-down
� Slice_and_dice
� Pivô
iCube: Cubo de Imagens Médicas 12
Detalhamento do TrabalhoDetalhamento do Trabalho� Data Warehouse◦ Armazém de dados orientada, integrada, invariante, não-volátil,
utilizada na tomada de decisão organizacional
� Consultas OLAP (on-line analytical processing)◦◦ Consultas complexas
◦ Manipulam um elevado volume de dados
◦ Demandam uma grande quantidade de operações de varredura, junção e agregação
◦ Desafio - Garantir um bom desempenho no processamento destas consultas� Visões materializadas
� Índices específicos
� Fragmentação dos dados do DW
iCube: Cubo de Imagens Médicas 13
Detalhamento do TrabalhoDetalhamento do Trabalho� Método de Acesso (MA)◦ Relação de Ordem Total
� Igualdade (igual e diferente)
� Relacional (maior, maior e igual, menor, menor e igual)
� < ?
iCube: Cubo de Imagens Médicas 14
Detalhamento do TrabalhoDetalhamento do Trabalho� Métodos de Acesso Multidimensional (MAMd)◦ Consultas em que existe definição de dimensão do vetor de
característica� Vetores pequenos e de tamanho fixo
� Método de Acesso Métrico◦ Comparação entre vetores de tamanhos diferentes ◦ Comparação entre vetores de tamanhos diferentes
� Vetor adimensional e geralmente grande
◦ Características das imagens obtidas por descritores intrínsecos� CBIR – Recuperação de Imagens Baseada Conteúdo� Descritores de formas, texturas e cores, etc
◦ Função de distância - Consultas por Similaridade� Propriedade de Simetria � d(s1,s2) = d(s2,s1)
� Não negatividade � 0 < d(s1,s2) < ∞ se s1 ≠ s2� Desigualdade triangular � d(s1,s2) ≤ d(s1,s3) + d(s3, s2)
iCube: Cubo de Imagens Médicas 15
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 16
ValidaçãoValidação� Imagens médicas reais◦ ROI de câncer de mama – aproximadamente 300 imagens
� Dados sintéticos ◦ Testar características que afetam o desempenho de consultas
OLAP
� Comparação do desempenho◦ iCube X MAM
� Até o momento, são desconhecidas propostas similares ◦ Armazenamento de características de imagens em um cubo de
dados
iCube: Cubo de Imagens Médicas 17
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 18
Meios de PublicaçãoMeios de Publicação� Possíveis meios de publicação◦ Simpósio Brasileiro de Banco de Dados
◦ International Conference on Data Warehousing and Knowledge Discovery (DaWaK)
◦ ACM International Workshop on Data Warehousing and OLAP (DOLAP)(DOLAP)
◦ Computer-Based Medical System (CBMS);
◦ Congresso Brasileiro de Informática em Saúde (CBIS);
◦ Transaction on Image Processing (ACM?)
◦ ACM SAC
◦ Outros eventos de banco de dados descritos na URL
iCube: Cubo de Imagens Médicas 19
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 20
CronogramaCronograma� Esta pesquisa contará com etapas de estudo sobre:◦ Conceitos básicos de DW e OLAP
◦ Armazenamento e recuperação de imagens baseada em conteúdo
◦ Espaço métrico e similaridade
◦ Estruturas de armazenamento propostos para DW◦ Estruturas de armazenamento propostos para DW
iCube: Cubo de Imagens Médicas 21
CronogramaCronograma� Atividade 1: Cursar disciplinas do segundo semestre de 2009;
� Atividade 2: Estudos de conceitos de data warehouse e OLAP.
� Atividade 3: Estudos de conceitos sobre recuperação de imagens baseada em conteúdo, espaço métrico e similaridade, além de conceitos relacionados a identificação de características de imagens;
� Atividade 4: Levantamento bibliográfico sobre o estado da arte em estruturas de armazenamento propostos para DW;
� Atividade 5: Escrita da monografia a ser apresentada no exame de qualificação;
� Atividade 6: Preparação para o exame de qualificação;
� Atividade 7: Defesa da qualificação de mestrado;
iCube: Cubo de Imagens Médicas 22
7
6
5
4
3
2
1
ativ./meses
8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3
2009 2010 2011
CronogramaCronograma� Atividade 8: Projeto e carga de DW voltados para o estudo de imagens médicas;
� Atividade 9: Desenvolvimento da proposta do MCube;
� Atividade 10: Realização de testes e validação do MCube;
� Atividade 11: Escrita da monografia da dissertação de mestrado;
� Atividade 12: Preparação para a defesa da dissertação de mestrado;
� Atividade 13: Defesa da dissertação de mestrado; e
� Atividade 14: Escrita e submissão de artigos científicos.� Atividade 14: Escrita e submissão de artigos científicos.
iCube: Cubo de Imagens Médicas 23
14
13
12
11
10
9
8
ativ./meses
8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3
2009 2010 2011
AgendaAgenda
� Contexto em que se Insere� Objetivo� Motivação� Detalhamento do Trabalho� Detalhamento do Trabalho� Validação� Meios de Publicação� Cronograma� Bibliografia Atual
iCube: Cubo de Imagens Médicas 24
Bibliografia InicialBibliografia Inicial� BARIONI, M.C.N. (2006) Operações de consulta por similaridade em grandes bases de dados complexos. Tese
de Doutorado: ICMC/USP, Brasil.
� BELLATRECHE, L.; SCHNEIDER, M.; LORINQUER, H.; MOHANIA, M.K. Bringing Together Partitioning, Materialized Views and Indexes to Optimize Performance of Relational Data Warehouses. In: INTERNATIONAL CONFERENCE ON DATA WAREHOUSING AND KNOWLEDGE DISCOVERY, 6., 2004, Zaragoza, Spain. Proceedings… p.15-25.
� CHAUDHURI, S. and DAYAL, U. (1997). An overview of data warehousing and OLAP technology. SIGMOD Record. 26(1):65-74.
� CHÁVEZ, E., NAVARRO, G., BAEZA-YATES, R. and MARROQUÍN, J. L. (2001). Searching in metric spaces. ACM Computing Surveys, 33(3):273–321.Computing Surveys, 33(3):273–321.
� CHAUDHURI, S.; NARASAYYA, V. An Efficient Cost-Driven Index Selection Tool for Microsoft SQL Server. In: INTERNATIONAL CONFERENCE ON VERY LARGE DATABASES, 23., 1997, Athens, Greece. Proceedings… p. 146-155.
� CIFERRI, C.D.A.; CIFERRI, R.R.; FORLANI, D.T.; TRAINA, A.J.M.; SOUZA, F.F. Horizontal Fragmentation as a Technique to Improve the Performance of Drill-Down and Roll-Up Queries. In: ACM SYMPOSIUM ON APPLIED COMPUTING, 22., 2007, Seoul, Korea. Proceedings… p. 494-499.
� CIFERRI, C.D.A.; SOUZA, F.F. Data Warehousing: Estado da Arte e Direções Futuras. In: CONFERÊNCIA LATINO-AMERICANA DE INFORMÁTICA, 26., 2000, Mexico City, Mexico. Memorias... CD-ROM.
� CIFERRI, C.D.A.; SOUZA, F.F. Materialized Views in Data Warehousing Environments. In: INTERNATIONAL CONFERENCE OF THE CHILEAN COMPUTER SCIENCE SOCIETY, 21., 2001, Punta Arenas, Chile. Proceedings… p. 3-12.
� CIFERRI, C.D.A., CIFERRI, R.R., OGATA, R.J., LIMA, A.M.P. and TRAINA, A.J.M. (2006). Data warehousing na saúde: melhorando a tomada de decisão médico-analítica. In Proc. XXXII CLEI, p. 1-12.
iCube: Cubo de Imagens Médicas 25
Bibliografia InicialBibliografia Inicial� FELIPE, J. C., TRAINA, A. J. M, e TRAINA Jr., C (2005). Global warp metric distance: Boosting content-based image
retrieval through histograms. In IEEE International Symposium on Multimedia (ISM 2005), Irvine, CA, USA.
� GARCIA, A., SAMPAIO. R., XÉVEO, G., PASSOS, L.C., REIS, F., LOBO, N., XIMENES, RABELO, L. and RABELO JÚNIOR, A. (2001). FBCDataWare: um data warehouse para cardiologia, In Proc. 4th SADIO, p.1-5.
� GOLFARELLI, M.; RIZZI, S. and CELLA, I. (2004). Beyond data warehousing: what´s next in business intelligence? In Proc. 7th DOLAP Workshop, p.1-6.
� GRAY, J., BOSWORTH, A., LAYMAN, A. and PIRAHESH, H. (1996). Data cube: a relational aggregation operator generalizing group-by, cross-tab, and sub-totals. In Proc. 12th ICDE, p. 152-159.
� HAN, J., PEI, J., DONG, G. and WANG, K. (2001) Efficient computation of iceberg cubes with complex measures. � HAN, J., PEI, J., DONG, G. and WANG, K. (2001) Efficient computation of iceberg cubes with complex measures. SIGMOD Record, 30(2):1-12.
� HARINARAYAN, V.; RAJARAMAN, A.; ULLMAN, J.D. Implementing Data Cubes Efficiently. SIGMOD Record, v.25, p. 205-216, 1996.
� INMON, W.H. Building the Data Warehouse. 2.ed. John Wiley & Sons, Inc., 1996. 401p.
� KIMBALL, R. The Data Warehouse Toolkit. 1.ed. John Wiley & Sons, Inc., 1996.
� LAI, S.Y. and NICOLLET, P. (2000). A clinical data warehouse effort to support the measurable organizational patient care and health outcomes improvement initiative. In Proc. AMIA Symposium.
� MURPHY, S. N., MORGAN, M. M., BARNETT, G. O. and CHUEH, H. C. (1999). Optimizing healthcare research data warehouse design through past COSTAR query analysis. In Proc. AMIA Symposium, p. 892-896.
� POLA, I.R.V. (2005). Indexação de dados em domínios métricos generalizáveis. Dissertação de Mestrado: ICMC/USP, Brasil.
� TRAINA, A.J.M., TRAINA JÚNIOR, C., BUENO, J.M. and MARQUES, P.M.A. (2002). The metric histogram: A new and efficient approach for content based image retrieval. In Xiaofang Zhou and Pearl Pu. (Org.). Visual and Multimedia Information Management: 1:297-311.
iCube: Cubo de Imagens Médicas 26
iCubeiCube::Um Cubo de Dados para Imagens Médicas Um Cubo de Dados para Imagens Médicas
baseado em Similaridadebaseado em Similaridade
27iCube: Cubo de Imagens Médicas
Obrigada