Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que...

15
Revista Eletrônica da Faculdade Metodista Granbery http://re.granbery.edu.br - ISSN 1981 0377 Curso de Sistemas de Informação - N. 9, JUL/DEZ 2010 Processamento digital de imagens para a detecção e classificação de nódulos em mamografias Mônica de Lourdes Souza Batista 1 , Aura Conci 1 , Leonardo Motta 1 , Sérgio Muinhos Barroso Lima 2 , Patrícia Lima Quintão 2 1 Universidade Federal Fluminense – UFF Rua Passo da Pátria, 156 – Bloco E – São Domingos CEP: 24.210-240 - Niterói – RJ – Brazil 2 Faculdade Metodista Granbery – FMG Rua Batista de Oliveira, 1145 – Centro CEP: 36.010-532 - Juiz de Fora – MG – Brazil [email protected], [email protected], [email protected], [email protected], [email protected] Resumo. O objetivo deste trabalho é classificar o nódulo de uma imagem mamográfica como maligno ou benigno de forma automática, tomando-se como base a intensidade do pixel e a sua morfologia. Na etapa de pré-processamento, o fundo e os ruídos são removidos. A região de interesse é detectada e destacada. Para treinar e testar o método proposto, 20 imagens com diagnóstico confirmado foram utilizadas. Palavras- chave: processamento digital de imagens, câncer, mamografia. Abstract. The aim of this research is to classify a node from a mammography image as malignant or benignant in an automated way based at the pixel intensity and the mode morphology. At the preprocessing step, the background and the noises are removed. The note region is detected and its boundary and interior are highlighted. To train and test the method proposed, 20 images with confirmed diagnosis were used. Key-words: digital image processing, cancer, mammography.

Transcript of Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que...

Page 1: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

Revista Eletrônica da Faculdade Metodista Granbery

http://re.granbery.edu.br - ISSN 1981 0377

Curso de Sistemas de Informação - N. 9, JUL/DEZ 2010

Processamento digital de imagens para a detecção e classificação de nódulos em mamografias

Mônica de Lourdes Souza Batista1, Aura Conci1, Leonardo Motta1, Sérgio Muinhos Barroso Lima2, Patrícia Lima Quintão2

1 Universidade Federal Fluminense – UFF Rua Passo da Pátria, 156 – Bloco E – São Domingos

CEP: 24.210-240 - Niterói – RJ – Brazil

2 Faculdade Metodista Granbery – FMG Rua Batista de Oliveira, 1145 – Centro

CEP: 36.010-532 - Juiz de Fora – MG – Brazil

[email protected], [email protected], [email protected], [email protected], [email protected]

Resumo. O objetivo deste trabalho é classificar o nódulo de uma imagem mamográfica como maligno ou benigno de forma automática, tomando-se como base a intensidade do pixel e a sua morfologia. Na etapa de pré-processamento, o fundo e os ruídos são removidos. A região de interesse é detectada e destacada. Para treinar e testar o método proposto, 20 imagens com diagnóstico confirmado foram utilizadas.

Palavras- chave: processamento digital de imagens, câncer, mamografia.

Abstract. The aim of this research is to classify a node from a mammography image as malignant or benignant in an automated way based at the pixel intensity and the mode morphology. At the preprocessing step, the background and the noises are removed. The note region is detected and its boundary and interior are highlighted. To train and test the method proposed, 20 images with confirmed diagnosis were used.

Key-words: digital image processing, cancer, mammography.

Page 2: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

2

1. Introdução

Atualmente, no Brasil, o câncer de mama é responsável pela maior taxa de mortalidade

entre as mulheres. A sobrevida das pacientes depende fundamentalmente do diagnóstico

precoce.

O uso de imagem na medicina é considerado um recurso importante na elaboração dos

diagnósticos médicos. Para auxiliar estes diagnósticos, técnicas de análise auxiliadas por

computador têm sido utilizadas com o objetivo de oferecer melhores parâmetros para a

elaboração de um diagnóstico mais acurado, indicando áreas suspeitas, bem como

anormalidades mascaradas. Essas técnicas (CAD, de “computer-aided diagnosis”) têm sido

desenvolvidas por diversos grupos de pesquisas, visando auxiliar na detecção precoce do

câncer de mama. Os esquemas CAD têm proporcionado uma ferramenta importante no

auxílio ao diagnóstico médico em diversas aplicações radiológicas, sobretudo na mamografia.

Pensando na detecção de áreas suspeitas, esse trabalho consiste na aplicação de técnicas

de processamento digital de imagens que facilitem a identificação visual e automática de

nódulos em mamografias e sua classificação em benignos ou malignos. Para isso, foram

realizadas algumas técnicas de pré-processamento para que o fundo e os ruídos fossem

removidos e, finalmente, a classificação e reconhecimento do nódulo.

Para isso, o trabalho apresenta as seguintes seções: além desta introdução, é

apresentado, na seção dois, o pré-processamento da imagem e, na seção três, a classificação e

o reconhecimento. Por fim, são destacadas as considerações finais do trabalho e as referências

bibliográficas utilizadas.

2. Pré-processamento da imagem

A imagem é uma pintura bidimensional formada por pixels que estão em linhas e

colunas. Ela é representada em uma matriz de números inteiros, onde cada pixel tem uma cor,

brilho, entre outras propriedades (MANFIO, 2009).

Na etapa de pré-processamento da imagem, o fundo e os ruídos existentes foram

removidos. Este pré-processamento foi composto de duas etapas: restauração e segmentação.

Para a realização do pré-processamento utilizou-se o software Adobe Photoshop 7.0.1, e

todas as imagens foram transformadas em tons de cinza, ou seja, variando entre o preto com

menos intensidade e o branco com maior intensidade. Os histogramas de cada fase do pré-

Page 3: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

3

processamento foram analisados, pois com ele é possível identificar a distribuição dos níveis

de cinza da imagem. O histograma é representado por um gráfico que mostra o número de

pixels na imagem para cada tom de cinza. A Figura 1 mostra um exemplo de uma mamografia

que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

Figura 1: Mamografia de um tumor benigno

Figura 2: Histograma da imagem original

De acordo com o histograma da imagem original, representado na Figura 2, percebe-se

que não há pixels brancos. A imagem ficaria bem mais nítida se houvesse estes pixels

brancos.

2.1 Restauração e realce

O realce tem por objetivo destacar detalhes da imagem que são de interesse para análise,

ou seja, processar uma imagem de modo que o resultado seja mais apropriado para uma

Page 4: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

4

aplicação específica do que a imagem original. Já a técnica de restauração é utilizada quando

a imagem encontra-se deteriorada (BASTOS, 2010). No caso da mamografia utilizada no

trabalho, foram aplicadas as técnicas de Negativo e Contraste.

2.1.1 Negativo

O negativo de uma imagem digital faz com que as cores escuras fiquem claras e as

cores claras fiquem escuras (CONCI, AZEVEDO e LETA, 2008). Esta técnica faz com que o

histograma da imagem se inverta.

Figura 3a: Aplicação de técnica de negativo

Figura 3b: Histograma da imagem

Page 5: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

5

De acordo com a Figura 3, percebe-se que os vasos são melhores vistos na imagem

negativa do que na imagem original. Em relação ao nódulo, a imagem negativa não surtiu

efeito, sendo possível identificar a presença do mesmo. O histograma da imagem apenas se

inverteu, como deveria ser. Neste histograma não há pixels pretos.

2.1.2 Contraste

Contraste é uma medida da diferença de brilho entre as áreas claras e escuras de uma

cena. Com esta técnica, os detalhes da imagem são mais realçados. A finalidade do

alargamento de contraste consiste no aumento da escala dinâmica dos níveis de cinza da

imagem (SILVA, 2010).

Page 6: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

6

Figura 4: Aplicação da técnica de contraste, com o aumento do mesmo para 41

Com a aplicação desta técnica, aumentando o contraste para 41, tanto o nódulo, quanto

o fundo e os vasos ficaram mais realçados.

2.2 Segmentação

A segmentação de imagens consiste em dividir uma imagem de entrada em partes

constituintes, para uma melhor caracterização das regiões de interesse. As operações de

segmentação procuram isolar regiões de pontos da imagem pertencentes a objetos, para

posterior extração de atributos (BASTOS, 2010).

A representação por região é aquela em que o interesse se concentra em propriedades

internas, tais como textura, intensidade de brilho, cor, contraste, dentre outros.

Nas imagens mamográficas, a representação por fronteiras tem como objetivo

identificar lesões através do seu formato, possibilitando, num primeiro momento, caracterizar

uma lesão maligna ou benigna, simplesmente pela sua forma estrutural. Para a realização

deste trabalho foram aplicadas as seguintes técnicas de segmentação: limiarização,

posterização e equalização.

2.2.1 Limiarização

Esta técnica consiste na identificação confiável dos picos modais em um dado

histograma, transformando uma imagem original em uma imagem binária (2 níveis de cinza).

Page 7: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

7

Essa capacidade é importante para a seleção automática de limiar em situações em que as

características da imagem possam variar em uma larga faixa de distribuição de intensidade.

Entretanto, a limiarização não apresenta resultados satisfatórios em imagens com iluminação

não uniforme ou com baixo contraste entre as diversas regiões (BASTOS, 2010).

A Figura 5 apresenta um exemplo da técnica de limiarização na imagem mamográfica.

A implementação deste algoritmo é simples: dado o limiar x, todos os pixels que possuem

valores abaixo deste limiar vão para a cor preta; caso contrário, vão para a cor branca.

Page 8: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

8

Figura 5: A 1ª figura corresponde à imagem original. A 2ª figura corresponde à imagem

binária (limiar 128)

Observa-se na Figura 6 que, com o limiar igual a 128, é possível verificar a existência

do nódulo na imagem, mas uma parte bem pequena do nódulo foi perdida.

Figura 6: Parte pequena do nódulo que foi perdida com o limiar igual a 128

Já com o limiar igual a 110, a parte que foi perdida com o limiar igual a 128 permanece,

ou seja, o nódulo fica bem perceptível, mas aparecem também outras regiões. A Figura 7

mostra esta situação.

Page 9: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

9

Figura 7: Nódulo bem perceptível, mas algumas regiões também são mostradas

Após análise de vários limiares, o que mais permitiu a visualização da existência do

nódulo, sem também mostrar regiões que não são de interesse, foi o limiar 128.

2.2.2 Posterização

Quando ocorrem variações abruptas em tons, ao invés de transições suaves, tem-se o

efeito de posterização (BASTOS, 2010). Com a aplicação da posterização, houve uma

segmentação da imagem em três regiões, sendo que a região com o tom mais claro

corresponde à região de interesse. A melhor posterização encontrada foi a posterização com

quatro níveis, conforme visto na Figura 8.

Page 10: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

10

Figura 8: Aplicação da técnica de Posterização

2.2.3 Equalização

A técnica de equalização tem por objetivo modificar o histograma da imagem original

para que a imagem transformada tenha um histograma uniforme, onde todos os níveis de

Page 11: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

11

cinza aparecem com a mesma freqüência (BASTOS, 2010). A equalização reduz o contraste

em áreas muito claras ou muito escuras em uma imagem, para que os tons de cinza tenham a

mesma frequência.

Esta técnica também foi utilizada, mas, de acordo com a Figura 9, percebe-se que ela

não foi boa para o caso em questão, pois introduziu muitos ruídos e realçou muitas regiões.

Figura 9: Aplicação da técnica de Equalização

Utilizando-se imagens já segmentadas, torna-se possível obter dados relevantes ou

atributos das regiões ou objetos destacados. De acordo com a segmentação realizada, percebe-

se que existe na imagem um nódulo de formato arredondado.

Page 12: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

12

3. Classificação e reconhecimento

Uma vez que os descritores da imagem e dos objetos segmentados encontram-se

disponíveis, passa-se para a etapa seguinte, que consiste em distinguir objetos na imagem,

agrupando esses parâmetros de acordo com sua semelhança para cada região de pixels

encontrada. Essa é a função dos processos de classificação e reconhecimento.

De acordo com a imagem segmentada, pode-se dizer que a mesma possui um nódulo

que se classifica em um nódulo benigno, pois o nódulo possui o formato arredondado. De

acordo com a medicina, quando um nódulo tem a forma arredondada, ele se classifica em

nódulo benigno. Quando o nódulo possui o formato especular (cheio de pontas), ele é um

nódulo maligno. Estes dois nódulos são ilustrados na Figura 10. Do lado esquerdo, o nódulo

benigno, e do lado direito, o maligno.

Figura 10: Nódulo benigno (formato arredondado) e o nódulo maligno (formato

especular)

Para verificar a existência de um nódulo e classificá-lo foi desenvolvido um sistema

implementado em C e a biblioteca SDL (Simple DirectMedia Layer) foi utilizada para a

manipulação da imagem.

Page 13: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

13

3.1 Implementação

Para verificar a existência de um nódulo e classificá-lo, foi desenvolvido um sistema

implementado em C, e a biblioteca SDL (Simple Directmedia Layer) foi utilizada para a

manipulação da imagem.

As imagens utilizadas nesta pesquisa foram retiradas do banco de dados de

mamografias (MAMMOGRAPHIC DATABASE, 2009), na qual as mesmas foram

diagnosticadas e classificadas por médicos.

Para eliminar o fundo da imagem foram calculados os primeiros quatro momentos da

intensidade de uma janela ajustável.

No primeiro momento, o algoritmo calcula o valor médio. No segundo, o desvio padrão.

No terceiro, a raiz cúbica e, finalmente, no quarto, a raiz quarta (GONZALEZ e WOODS,

1993).

O software verifica a maior média encontrada no primeiro momento e altera todos os

pixels que estão abaixo da média para zero. Estes pixels representam o fundo e não a área de

interesse. A Figura 11 mostra este passo.

Figura 11: Fundo e ruídos eliminados.

Após a segmentação, a detecção de candidatos para as regiões de interesse (ROIs) é

feita com base no histograma da imagem. O valor limite é definido pelo usuário, e os pixels

com intensidade maior que o limite definido são alterados para branco, conforme visto na

Figura 12. Esses pixels são candidatos para ROIs.

Figura 12: ROI

Page 14: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

14

Depois do nódulo destacado, o software reconhece a existência de um nodo e determina

o contorno do mesmo, como ilustrado na Figura 13.

Figura 13: Detecção automática do nódulo

Com o nódulo detectado, a classificação é iniciada. A fim de realizar este passo, o

perímetro e a área da região de interesse foram calculados, contando-se o número de pixels do

contorno e do nódulo detectado.

O perímetro do nódulo foi calculado da seguinte maneira: foi verificada a cor de cada

pixel. Caso o pixel fosse branco, era verificada a cor dos pixels vizinhos. Se a cor destes

pixels vizinhos não fosse branca, incrementava-se a variável de controle. Por fim, se esta

variável fosse maior do que zero e menor do que quatro, significava que o pixel analisado era

um contorno e a variável que armazenava o valor do perímetro era incrementada de um.

A área do nódulo é calculada contando-se a quantidade de pixels brancos existentes na

imagem.

A classificação do nódulo é feita calculando a razão entre o perímetro e a área do

nódulo. Para encontrar o melhor limiar, dez imagens que tiveram o diagnóstico conhecido

foram testadas durante a fase de treinamento. Depois disso, outras dez imagens da mesma

base de dados foram testadas. A Tabela 1 mostra o percentual de sucesso usando estas

imagens.

Tabela 1: Porcentagem de sucessos e erros.

Page 15: Processamento digital de imagens para a detecção e ...re.granbery.edu.br/artigos/Mzk1.pdf · que possui um tumor benigno e a Figura 2 destaca o histograma da mesma (BASTOS, 2010).

15

4. Considerações finais

Este trabalho apresentou um método para pré-processar imagens de mamografia,

eliminando o fundo e ruídos, detectando os nódulos e, por fim, classificando-as em malignos

ou benignos. A classificação foi feita com base na razão entre o perímetro e a área do nódulo.

Para verificar a precisão da metodologia, dez imagens foram utilizadas durante o processo de

treinamento e outras dez imagens para o teste final.

De acordo com a Tabela 1, não foi encontrado nenhum falso negativo, 80% de precisão

para detectar nódulos benignos e 100% de precisão para os casos malignos.

Como trabalhos futuros, sugere-se a aplicação de outras técnicas de processamento

digital de imagens e algoritmos de inteligência artificial para encontrar padrões para auxiliar

na tomada de decisões.

5. Referências Bibliográficas

BASTOS, V. P., Técnicas de Segmentação de Imagens para Recuperação de Informações Visuais. Disponível em <http://paginas.ucpel.tche.br/~vbastos> Acessado em junho de 2010.

CONCI, A., AZEVEDO, E., LETA, F.G. Computação Gráfica: volume 2 (Processamento e Análise de Imagens Digitais), Campus/Elsevier. 2008.

LLOBET, R., SOLVES, J.A., CORTES, J.C.P., PERALES, F.R. Mammographic_Density_Classification_based_on_Local_Histograms.

MANFIO, F. Computação Gráfica. Disponível em <http://www.webaqui.com.br/felipe/arquivos/cg/2bimestre/aula02.pdf> Acessado em junho de 2010.

MASCARO, A. Segmentação de imagens de mamografias digitais. 2007. Trabalho de conclusão de curso, Universidade de Pernambuco.

SILVA, J. D. S. Realce de Imagens. Disponível em <http://www.lac.inpe.br/~demisio/univ/pdi/cjslides5.pdf> Acessado em junho de 2010.

SONKA, M., HLAVAC, V., BOYLE, R. Image Processing, Analysis and Machine Vision, 3th Edition, Thomson, 2008.

GONZALEZ, R.C., WOODS, R.E., EDDINS, S.L. Digital Image Processing Using MATLAB, Publishing House of Electronics Industry, 2005.

GONZALEZ, R. C., WOODS, R. E. Digital Image Processing, Addison Wesley Pub, 1993.

VIANNA, A., CONCI, A., TORREÃO, J., AS, MARCELLE. Mammographic Database. Disponível em <http://www.ic.uff.br/~aconci/mam/frameex1.htm> Acessado em: julho de 2009.