UNIVERSIDADE POSITIVO AMILTON CARLOS RATTMANN
Transcript of UNIVERSIDADE POSITIVO AMILTON CARLOS RATTMANN
UNIVERSIDADE POSITIVO
AMILTON CARLOS RATTMANN
PROCESSAMENTO DE IMAGENS DIGITAIS PARA IDENTIFICAÇÃO E
CONTAGEM DE NÚCLEOS NAS FASES DA MITOSE EM LÂMINAS DE TESTE
DE Allium cepa
CURITIBA
2018
AMILTON CARLOS RATTMANN
PROCESSAMENTO DE IMAGENS DIGITAIS PARA IDENTIFICAÇÃO E
CONTAGEM DE NÚCLEOS NAS FASES DA MITOSE EM LÁMINAS DE TESTE
DE Allium cepa
Dissertação apresentada como requisito parcial
para a obtenção do grau de mestre do Programa
de Pós-Graduação em Gestão Ambiental,
Universidade Positivo
Orientadora: Profª Drª. Eliane C. de Vasconcelos
CURITIBA
2018
Dados Internacionais de Catalogação na Publicação (CIP) Biblioteca da Universidade Positivo - Curitiba – PR
Elaborado pelo Bibliotecário Douglas Lenon da Silva (CRB-9/1892)
R237 Rattmann, Amilton Carlos.
Processamento de imagens digitais para identificação e contagem de núcleos nas fases da mitose em lâminas de teste de Allium cepa. / Amilton Carlos Rattmann. ― Curitiba : Universidade Positivo, 2018. 111 f. ; il. Mestrado (Dissertação) – Universidade Positivo, Programa de Pós-graduação em Gestão Ambiental, 2018.
Orientador: Profa. Dra. Eliane Carvalho de Vasconcelos.
1. Gestão ambiental. 2. Algoritmo computacional. 3. Morfologia – Matemática. 4. Processamento de imagens digitais. I. Vasconcelos, Eliane Carvalho de. II. Título.
CDU 576.31:004.51(043.3)
ESPAÇO PARA FOLHA COM DADOS DA BANCA EXAMINADORA
AGRADECIMENTOS
A Deus por me conceder esta oportunidade.
À minha orientadora, Professora Eliane Carvalho de Vasconcelos pela orientação, auxílio,
acolhimento e grande paciência.
À minha esposa, por toda energia, visão, paciência e cobrança. Foram muito importantes!
Aos meus filhos, pela compreensão, paciência e apoio.
Aos meus pais, pelos valores e pelo apoio incondicional.
À Jessica, pela gentileza de compartilhar seus dados de ensaios e lâminas de A. cepa.
Aos meus amigos e colegas do PGAMB, pelo companheirismo ao longo desta jornada.
À Universidade Positivo, pela bolsa concedida.
RESUMO
Os ensaios laboratoriais para investigação e monitoramento ambiental têm empregado
tanto organismos vegetais quanto animais na avaliação dos efeitos de substâncias
contaminantes presentes no ambiente. O emprego do Allium cepa tem sido bem aceito pela
comunidade científica nas últimas décadas para avaliação dos efeitos de substâncias nas
alterações da estrutura celular e nas alterações genéticas, em virtude da sensibilidade e
confiabilidade deste organismo nos ensaios. A proposta deste trabalho foi desenvolver um
algoritmo para o processamento das imagens digitais de lâminas de A. cepa, capturadas por
câmera de alta resolução acoplada a microscópio de laboratório, que realizasse a identificação
e a contagem das células em cada fase do ciclo mitótico, apresentando o resultado do teste de
forma automática, sem propor alterações na metodologia atualmente utilizada na preparação
das lâminas. As imagens pré-processadas por filtros de domínios espaciais e de frequência
espacial, foram submetidas à limiarização global para separação das regiões de núcleo e
citoplasma. A decisão ponderada sobre uma base tabelar estatística das propriedades
morfológicas dos núcleos celulares foi utilizada para a classificação, viabilizando a contagem
das fases nucleares e a determinação do índice mitótico por lâmina. As imagens de cada
lâmina foram processadas em torno de 60 segundos, detectando 95% dos núcleos e
classificando corretamente em média 63,8% dos núcleos, não apresentando diferenças
significativas nos índices mitóticos, ao nível de 5%, entre a contagem manual e a contagem
automática. Além dos resultados imediatos, espera-se obter padronização, maior eficiência no
uso dos recursos humanos e equipamentos, redução do tempo para obtenção dos resultados,
menor custo operacional no processo e maior confiabilidade nos resultados dos testes.
Palavras-chave: algoritmo, limiarização global, processo de classificação discreto,
morfologia matemática, descritores geométricos, monitoramento ambiental.
ABSTRACT
Laboratory tests for environmental research and monitoring have employed both plant and
animal organisms in assessing the effects of pollutants in the environment. The use of Allium
cepa has been well documented by the scientific community in recent decades for the
evaluation of the effects of substances on changes in cellular structure and genetic alterations,
due to the sensitivity and reliability of this organism in the assays. The purpose of this work
was to develop an algorithm for the processing of the digital images of A. cepa slides captured
by high resolution camera coupled to laboratory microscope, performing the identification
and counting of cells at each stage of the mitotic cycle, without proposing changes to the
method currently used in the preparation of the slides. The preprocessed images from space
and spatial frequency domain filters were subject to global thresholding to separate the
nucleus and cytoplasm regions. The decision weighted on a statistical basis of the
morphological properties of the cellular nuclei was used for the classification, allowing
counting of nuclear phases and determination of the mitotic index per slide. The images of
each slide were processed for about 60 seconds, identifying an average of 95% of the nuclei.
and correctly classified on average 63.8% of the nuclei, showing no significant differences in
mitotic indexes, at the 5% level, between manual counting and automatic counting. In
addition to the immediate results, the technique is expected to promote test standardization,
greater efficiency in the use of human resources and equipment, reduction of the time to
obtain the results, lower operational cost in the process, and greater reliability in the test
results.
Keywords: Algorithm, global thresholding, discrete classification process, mathematical
morphology, geometric descriptors, environmental monitoring.
LISTA DE FIGURAS
Figura 1 - DNA e síntese proteica. ..................................................................................... 16
Figura 2 - Fases do ciclo da divisão celular ........................................................................ 18
Figura 3 – Estágios da mitose ............................................................................................. 19
Figura 4 – Falhas na mitose. ............................................................................................... 20
Figura 5 - Pares de cromossomos do Allium cepa. (Leme, 2009) ...................................... 21
Figura 6 - Passos fundamentais do processamento de imagens. ........................................ 25
Figura 7- Modelo RGB.. ..................................................................................................... 28
Figura 8 - Círculo de Cores. ............................................................................................... 29
Figura 9 - Representação da profundidade da imagem digitalizada. .................................. 30
Figura 10- Função f(x) e resposta de F(u) no domínio da frequência.. .............................. 33
Figura 11- Espaço da transformada bidimensional de Fourier ........................................... 33
Figura 12 – Máscaras bidimensionais de filtros de imagem. ............................................. 34
Figura 13 – Aplicação da transformada exponencial em uma linha de imagem. ............... 36
Figura 14 - Transformada Euclidiana aplicada à imagem escura de ponto central. ........... 37
Figura 15 - Transformada euclidiana aplicada dentro de uma região. ............................... 37
Figura 16 - Filtro de média 3x3 .......................................................................................... 38
Figura 17- Histogramas multimodais. ................................................................................ 40
Figura 18 – Influência da iluminação não uniforme no histograma bimodal. .................... 41
Figura 19 – Operação de rotulação da função bwboundaries. ........................................... 42
Figura 20 - Ensaio com Allium cepa. ................................................................................. 47
Figura 21 - Metodologia aplicada no desenvolvimento do trabalho. ................................. 48
Figura 22 – Imagem de referência I .................................................................................... 49
Figura 23 - Imagem de referência II.. ................................................................................. 50
Figura 24 - Imagem de referência II com identificação das fases. ..................................... 50
Figura 25 – Definição da ampliação e iluminação das imagens......................................... 52
Figura 26 - Imagens de prova. ............................................................................................ 53
Figura 27 - Imagem do microscópio BX43. ....................................................................... 54
Figura 28 -Histograma dos canais R (vermelho), G (verde), B (azul), respectivamente. .. 54
Figura 29 - Aplicação da transformada de Fourier como filtro para altas frequências ...... 55
Figura 30 – Aplicação do filtro de média. .......................................................................... 55
Figura 31 – Aplicação da transformada exponencial.. ....................................................... 56
Figura 32 - Imagem segmentada dos núcleos. .................................................................... 58
Figura 33 - Aplicação dos contornos vetorizados nos núcleos das células. ....................... 59
Figura 34 - Determinação do valor D. ................................................................................ 60
Figura 35 – Esquema de decisão.. ...................................................................................... 62
Figura 36 – Comportamento dos fatores morfológicos quanto aos tipos de núcleo........... 63
Figura 37 - Procedimento para ajuste dos valores dos pesos. ............................................ 64
Figura 38- Imagem de referência com reconhecimento de todos os núcleos. .................... 67
Figura 39 - Imagem de referência (2 MP). ......................................................................... 68
Figura 40 - Imagem real de laboratório - Imagem_98. ....................................................... 70
Figura 41 - Imagem real de laboratório - Imagem_54.. ...................................................... 71
Figura 42 - Contagem manual da imagem 98.. ................................................................... 72
Figura 43 - Contagem manual da imagem 54.. ................................................................... 73
Figura 44 – Aspectos de melhorias. .................................................................................... 80
Figura 45 – Contornos da solução na lâmina. .................................................................... 81
Figura 46 - Bolhas e contorno da solução. ......................................................................... 81
Figura 47- Impurezas das lâminas. ..................................................................................... 81
Figura 48 - Algoritmo de esqueletização. ........................................................................... 82
Figura 49 - Subdivisão da mitose do A. cepa. .................................................................... 83
SUMÁRIO
1 INTRODUÇÃO 12
1.1 OBJETIVO 14
2 REVISÃO DE LITERATURA 15
2.1 AS CÉLULAS 15
2.2 CICLO CELULAR EUCARIÓTICO 17
2.3 FALHAS NA DIVISÃO CELULAR 19
2.4 Allium cepa 21
2.5 Allium cepa NO MONITORAMENTO AMBIENTAL 22
2.6 ANÁLISE E CONTAGEM 23
2.7 PROCESSAMENTO DE IMAGENS DIGITAIS (PDI) 24
2.7.1 Representação da imagem 26
2.7.2 Formato de arquivos de imagem 30
2.7.3 Pré-processamento da imagem 32
2.7.4 Segmentação 39
2.7.5 Representação e descrição 42
2.8 CONTAGENS DE CÉLULAS E TRABALHOS SEMELHANTES 44
2.9 MATLAB 45
3 DESENVOLVIMENTO 47
3.1 IMAGENS DE REFERÊNCIA 49
3.2 IMAGENS DE LÂMINAS 51
3.3 PRÉ-PROCESSAMENTO 53
3.4 SEGMENTAÇÃO 57
3.5 FASE 1 - DETECÇÃO 58
3.5.1 Representação e descrição 58
3.5.2 Reconhecimento e interpretação 59
3.6 FASE 2 - DIFERENÇAS SIGNIFICATIVAS 66
3.7 FASE 3 – RESULTADOS E DISCUSSÃO 67
3.7.1 Avaliação com as imagens de referência 67
3.7.2 Avaliação com as imagens de lâminas de Allium cepa 69
3.7.2 Discussão sobre os resultados 78
4 CONCLUSÕES 84
REFERÊNCIAS 86
APÊNDICE A – PROCEDIMENTOS E FUNÇÕES DO ALGORITMO 90
APÊNDICE B – LISTAGEM DOS CÓDIGOS EM MATLAB 91
APÊNDICE C – LÂMINAS DE Allium cepa UTILIZADAS NO TRABALHO 103
APÊNDICE D – IMAGENS PARA CALIBRAÇÃO 105
ANEXO A – FUNÇÕES DO MATLAB UTILIZADAS 107
ANEXO B – PROCEDIMENTO DE PREPARAÇÃO DAS LÂMINAS DE A.cepa
108
ANEXO C – DESCRIÇÃO DA FUNÇÃO regionprops() 109
12
1 INTRODUÇÃO
O planeta está submetido a um ritmo acelerado de crescimento da população humana
(UNWPP, 2017). Motivado pela busca na redução de custos e da maior produtividade, o
consumo de agrotóxicos cresceu no mundo quase 100% entre os anos de 2000 e 2009
(FOLGADO, 2013). No Brasil, devido à legislação, permite-se um consumo ainda maior que
na Europa (LAZZERI, 2017), o que tem trazido preocupação com os possíveis efeitos destes
novos usos no meio ambiente (MOTA, 2001). A avaliação e caracterização da extensão dos
efeitos destes agentes de compostos químicos, pesticidas e fármacos no meio ambiente são
realizadas por ensaios laboratoriais utilizando organismos-teste.
Dentre os organismos de teste empregados em ensaios ambientais, pode-se utilizar células
vegetais para determinar o nível de citotoxidade e genotoxicidade de agentes novos ou de
agentes conhecidos em novos cenários (BAGATINI et al. 2007). Os ensaios com Allium cepa
estão entre os mais utilizados no mundo. Validados pelas Nações Unidas no Programa
Internacional de Segurança Química (IPCS, OMS) e Programa Ambiental das Nações Unidas
(UNEP) (BAGATINI et al. 2007; GRANT, 1999), vêm sendo utilizados desde os anos 1940
(LEVAN, 1938).
O procedimento é realizado com a utilização das raízes deste vegetal postas em contato
com a substância cujos efeitos estão sob análise, em solução aquosa, em concentrações
diferentes conforme o objetivo do ensaio. A importância dos ensaios com Allium cepa é
verificada pela abrangência dos temas publicados em áreas que se estendem de gestão de
recursos hídricos (PEIXER, 2016; SILVA et al., 2009), passam pela avaliação da presença de
metais (FISKESJÖ, 1988), avaliação da presença de antibióticos na água (HENRIQUE,
2014), análise de pesticidas (MESI; KOPLIKU, 2013) à avaliação dos efeitos de plantas
medicinais (BAGATINI et al. 2007; FACHINETTO et al., 2007).
Os ensaios com Allium cepa são caracterizados pela facilidade na preparação das
amostras, rápido crescimento das raízes, simplicidade e pela facilidade de observação pelas
dimensões cromossômicas (GUERRA; SOUZA, 2003; SILVA et al., 2009), além da
sensibilidade da estrutura celular diante de contaminantes (SILVEIRA et al., 2017) e pela
semelhança de alguns efeitos observados em células animais (BAGATNI et al. 2007;
BIANCHI, 2008), cujos resultados poderiam ser extrapolados a partir dos testes com Allium
cepa.
13
As raízes do Allium cepa, depois de expostas ao contaminante por determinados períodos
de tempo conforme objetivo do ensaio, são lavadas, cortadas, esmagadas e recebem coloração
específica (GUERRA; SOUZA, 2003) para obter bom preparo das lâminas, permitindo
melhor visualização no microscópio. O procedimento adotado está disponível no anexo B.
Pela visualização no microscópio, são obtidos os resultados do ensaio como índice mitótico
(IM), existência de micronúcleos (MN), ocorrências de perdas cromossômicas e outras
anormalidades nucleares (GUERRA; SOUZA, 2003; LEME et al., 2009).
O índice mitótico (IM), que define a taxa de multiplicação celular, é um parâmetro
fundamental na avaliação citotóxica, obtido nos ensaios pela razão entre o total de células em
divisão e a quantidade de células observadas em interfase, cuja contagem deve ultrapassar
1000 unidades para se obter um resultado com padrão estatístico aceitável (FISKESJÖ, 1988).
Os estudos publicados envolvem quantidades entre 4.500 e 10.000 células contadas por
tratamento1, estabelecendo, de maneira geral, 500 células por lâmina (BAGATINI et al.,
2007; BIANCHI, 2008; HENRIQUE, 2014; MARTINS et al., 2016). A quantidade de células
contadas pode aumentar muito se o ensaio envolver muitas soluções na análise (MORO et al.,
2017). A determinação da ocorrência de aberrações cromossômicas como pontes, aderências e
quebras cromossômicas, além de micronúcleos e células com polinúcleos ou células
poliploides, completa a determinação dos efeitos genotóxicos (LEME et al., 2009; MARTINS
et al., 2016).
Embora os estudos não mencionem o tempo gasto no levantamento dos resultados dos
ensaios, estima-se que a contagem de 6.000 células mantenha o pesquisador envolvido por
horas neste levantamento. Considerando, por exemplo, que cada célula contada gaste um
segundo e meio ao microscópio, um tratamento com 6000 células contadas demandaria quase
três horas, sem considerar intervalo para alívio da fadiga, troca de lâminas, reposicionamento
da mesa e troca das objetivas do microscópio. A natureza da atividade exige atenção por um
longo período. Foi observado na prática, ao longo da fase das avaliações, que um pesquisador
experiente consome 20 minutos para contagem de 1000 células por lâmina.
Não foram encontrados equipamentos ou outros trabalhos que tratassem de identificação
ou de contagem automática de células ou núcleos de Allium cepa. Trabalhos que
desenvolveram processos automáticos para identificação e contagem de células humanas e
colônias de bactérias, foram utilizados como fontes de referência. A literatura apresenta a fase
1 O tratamento, neste contexto, é composto pelo conjunto de lâminas obtidas em um ensaio para uma determinada concentração da substância sob análise. Ainda neste contexto, três organismos (A. cepa) são submetidos à uma certa concentração da substância, dos quais são retirados três bulbos de cada organismo, resultando em nove lâminas obtidas deste tratamento.
14
de divisão celular eucarióticas em quatro (LODISH et al., 2014) ou cinco (ALBERTS et al.,
2011) estágios (quando inclui a prometáfase), apresentando os aspectos morfológicos típicos
de cada estágio ou fase, embora tenham sido observados, ao longo do desenvolvimento do
trabalho, vários aspectos morfológicos intermediários em cada fase ou estágio ao longo da
divisão celular, cujas características morfológicas guardam aspectos das fases ou estágios
próximos, anteriores e posteriores. Pires (2001), em seus relatórios publicados na Internet,
apresentou 13 aspectos morfológico intermediários distintos do núcleos de A. cepa,
observados em microscópio, cuja contribuição foi mencionada para trabalhos futuros. As
impurezas das lamínulas, sobreposições de núcleos e as aberrações cromossômicas ainda são
desafios para o processamento de imagem das lâminas de A. cepa e são outros desafios do
trabalho.
A proposta deste trabalho foi o desenvolvimento de um algoritmo que torne possível
reduzir o tempo de análise por um sistema automático de contagem e que realize a contagem
em minutos, ao invés de horas, proporcionando uma melhora na qualidade do trabalho, menor
estresse e possivelmente maior confiabilidade. Se isto for possível, do ponto de vista da
gestão ambiental, estar-se-ia reduzindo o uso do laboratório, do equipamento e do
profissional, naturalmente reduzindo o custo, tornando os ensaios de monitoramento
ambiental e investigação mais baratos, tanto do ponto de vista de recursos humanos quanto do
uso de energia.
O algoritmo processa imagens com resolução de 2 MP e 10,6 MP provenientes de
microscópios equipados com câmeras digitais nestas resoluções, em formato compactado com
e sem perdas, com ampliação de 40X e iluminação intermediária no condensador, realizando a
contagem a uma taxa de 1000 células por minuto, com acuraria de 63,8% na identificação da
fase correta do ciclo mitótico e, por fim, não apresentando diferenças significativas nos
valores médios do IM entre a contagem automática e a contagem manual, determinado pela
ANOVA com teste Tukey, ao nível de significância de 5%.
1.1 OBJETIVO
Desenvolver um algoritmo de processamento de imagem que seja capaz de realizar a
identificação e a contagem de núcleos nos estágios e fases da mitose do Allium cepa em
lâminas de teste.
15
2 REVISÃO DE LITERATURA
2.1 AS CÉLULAS
O termo célula é empregado de maneira genérica para definir as unidades formadoras
básicas que caracterizam os seres vivos. As células, no entanto, podem ser muito diferentes
entre si, possuindo dimensões, funções, forma e necessidades químicas diferentes, mas que
trabalham em conjunto no funcionamento de organismos complexos. Os organismos
complexos contêm órgãos, que em sua essência são compostos por tecidos. Os tecidos, por
sua vez, são constituídos por células, que são formadas e executam suas funções celulares por
meio de moléculas (LODISH et al., 2014). Embora células diferentes apresentem diferenças
funcionais externas, são fundamentalmente muito semelhantes por dentro, na sua química,
pois possuem os mesmos tipos de moléculas e realizam os mesmos tipos de reações químicas
(ALBERTS et al., 2011; LODISH et al., 2014). O ácido desorribonucleico (ADN, ou DNA –
no idioma inglês), é uma macromolécula presentes nas células de todos os organismos. O
DNA é formado por uma longa sequência de quatro monômeros, denominados de
nucleotídeos e representados pelas letras A (adenina), T (timina), C (citosina) e G (guanina),
que estão concentrados em duas longas fitas quimicamente relacionadas e estruturalmente
helicoidais, formando uma dupla-hélice, que mantém toda a codificação genética da célula e é
responsável pelo fenômeno da hereditariedade (Figura 1-A) (ALBERTS et al., 2011; LODISH
et al., 2014). Os nucleotídeos, ou bases, possuem aderência química, onde as bases A e C,
presentes em uma fita, se ligam às bases T e G, respectivamente, na outra fita, ao longo da
estrutura do DNA. As informações genéticas transportadas pelo DNA ficam armazenadas ao
longo da fita, mas em trechos específicos de sequências lineares dos nucleotídeos,
denominados genes. Os genes se dividem em duas partes, sendo uma codificadora, que
especifica a sequência de aminoácidos na formação de proteínas, e outra reguladora, que
determinam a ativação das proteínas e controlam a síntese proteica (LODISH et al., 2014). Os
Aminoácidos são compostos quaternários formados por carbono, hidrogênio, oxigênio e
nitrogênio. Existem 20 aminoácidos principais, denominados aminoácidos primários
(ALBERTS et al., 2011; LODISH et al., 2014), que se organizam em longas cadeias de
centenas ou milhares de aminoácidos, orientados pelo sequenciamento definido no gene,
formando as proteínas (Figura 1-C). As proteínas são os principais blocos construtores das
16
células e, em grande parte, definem as características como suporte estrutural, catalisação
química e motores moleculares, além da aparência e do comportamento das células
(ALBERTS et al., 2011).
Durante a reprodução celular o DNA é duplicado. A dupla-hélice é estabilizada por
ligações fracas entre as bases A e T e entre as bases C e G. Durante a duplicação, as fitas são
descompactadas e utilizadas como moldes para produzir fitas complementares, que resultam
em duas cópias do DNA original (LODISH et al., 2014) (Figura 1-A).
Nas células eucariontes o material genético fica confinado dentro do núcleo, delimitado
por uma membrana denominada carioteca. Os cromossomos existentes nos núcleos das
células eucariontes são estruturas lineares que armazenam o DNA compactado (Figura 1-B) e
proteínas. As proteínas atuam na compactação e controle do DNA (ALBERTS et al., 2011).
Todas as células de um mesmo tipo de organismo compartilham as mesmas quantidades e
comprimentos dos cromossomos, entretanto são distintos entre organismos diferentes
(LODISH et al., 2014).
Figura 1 - DNA e síntese proteica. Adaptado de Albert e coautores (2011) e Lodish e
coautores (2014)
17
2.2 CICLO CELULAR EUCARIÓTICO
A divisão celular pode ser definida por um conjunto de eventos moleculares que levam à
produção de duas células filhas na divisão celular. A divisão celular que pode ocorrer
raramente ou continuamente, dependendo da especialização da célula (LODISH et al., 2014).
Pode ocorrer ainda pelo ciclo da meiose, na qual ocorre redução cromossômica para as células
filhas, ou pela mitose, na qual a divisão celular se processa após a duplicação cromossômica,
sendo este último o processo pelo qual as raízes de A. cepa se multiplicam e no qual, portanto,
há maior interesse no presente trabalho.
A divisão celular ocorre ao longo de quatro fases cíclicas, denominadas de G1, S, G2 e M,
apresentadas na parte inferior da Figura 2 . Na fase S (síntese) ocorre a duplicação do DNA
parental. Na fase M (mitótica) ocorre a divisão do núcleo, por um processo denominado
mitose, e a divisão do citoplasma, por um processo denominado citocinese, cujos resultados
são duas novas células, onde cada qual carrega as cromátides filhas idênticas, produzidas na
fase S.
O intervalo compreendido entre o final de uma fase M e o início da próxima fase M,
composto pelas fases G1, S e G2, é denominado interfase. Durante a interfase a célula cresce
continuamente, realizando a transcrição genética e síntese de proteínas. Na fase G1 (pré-
síntese) a célula aguarda, em intensa atividade metabólica (ALBERTS et al., 2011), um
estímulo para iniciar a duplicação do DNA. Na fase S, ocorre a duplicação do DNA. Na fase
G2 (pós-síntese) os cromossomos se apresentam duplicados e a célula permanece aguardando
um novo estímulo, desde que não existam erros de duplicação ou duplicação incompleta, para
entrar na fase M e iniciar a divisão celular (ALBERTS et al., 2011; LODISH et al., 2014). A
interfase dura o tempo necessários para a duplicação de todas as organelas da célula. A fase
M, que possui duração muito menor que a interfase, é apresentada na parte superior da Figura
2.
Na fase M, durante a prófase, os centros celulares iniciam a migração para as
extremidades opostas da célula, ocorre o surgimento das fibras dos fusos, as cromátides
iniciam a condensação pelo giro da estrutura e a carioteca começa a ser degradada. Na
metáfase, os fusos estão posicionados nos hemisférios opostos, as fibras se encontram
alongadas, a carioteca já inexiste, os cromossomos estão completamente condensados e
alinhados formando a placa metafásica, esquematizado, assim como os demais estágios, na
18
parte superior da Figura 2. No estágio da anáfase, ainda na fase M, os centríolos rompem,
tracionados pelas fibras dos fusos, separando os cromossomos que iniciam a descondensação
e recomeça a formação da carioteca. Na telófase ressurgem os nucléolos, a carioteca se
apresenta formada e se inicia a citocinese, que finaliza a divisão celular (LODISH et al.,
2014).
As substâncias citotóxicas e genotóxicas quando entram em contato com as células
alteram os ciclos descritos acima, interferindo na duplicação cromossômica ou na velocidade
da divisão celular (efeito aneugênico) (LEVAN, 1938). Entre outros efeitos estão as quebras,
aderências ou rearranjos cromossômicos (efeito clastrogênico) que podem levar à ocorrência
de células haploides ou polipoides e mutações. Estas alterações serão apresentadas
brevemente na seção 2.3
Figura 2 - Fases do ciclo da divisão celular (LODISH et al., 2014)
19
2.3 FALHAS NA DIVISÃO CELULAR
Nos procedimentos laboratoriais que utilizam organismos como corpo de prova, os
ensaios são preparados para avaliar as alterações no ciclo celular para uma série de amostras
submetidas a diferentes concentrações da substância em análise (LEVAN, 1938). Esta
avaliação é realizada pela comparação entre os resultados obtidos nesses ensaios e os
resultados obtidos do mesmo tipo do organismo sem a presença da substância sob análise
(controle negativo). Substâncias com potencial citotóxico e genotóxico, em determinadas
concentrações, afetam as reações químicas de síntese, controle ou sinalização no interior da
célula, interrompendo ou impedindo os eventos esperados, produzindo os efeitos identificados
como aderências, perdas e quebras cromossômicas e outros efeitos apresentados à frente. Na
Figura 3, nos quadros A, B e C, são apresentados estágios da mitose (metáfase, anáfase,
Figura 3 – Estágios da mitose: normal: A, B e C; quebra cromossômica: A1, B2; ponte
cromossômica:B1, B2, C1, C2; metáfase-C: A2;
20
telófase) com ocorrências normais da divisão celular. Nos quadros A1, B1 e C1, são
apresentados os mesmos estágios da mitose, porém com falhas na divisão celular. No quadro
A1 há perda de uma pequena parte do cromossomo. Nos quadros B1 e C1 são apresentados
duas pontes cromossômicas, causadas por substância genotóxica, segundo Leme (2009). Nos
quadros seguintes da Figura 3, em A2, é apresentada uma metáfase-C, falha na qual ocorre a
duplicação cromossômica, mas sem ocorrência da citocinese e ausência permanente da
carioteca. Na Figura 3, nos quadros B2 e C2, são apresentadas ocorrências simultâneas de
pontes e perdas cromossômicas.
Na Figura 4 são apresentados vários efeitos clastrogênicos, como ocorrências de: perdas
cromossômicas, registrados nos quadros A3, B3, B4 e C3, nas quais partes do cromossomo se
desconectam (quebram). Há ocorrências de micronúcleos (MN), apresentados nos quadros
D3, D4 e D5, nas quais a fragmentação do cromossomo gera a formação de um pequeno
núcleo próximo ao núcleo original da célula. Há registro de células binucleadas no quadro A4,
efeito no qual não ocorre a citocinese. Aderências cromossômicas são apresentadas no quadro
A5, nos quais os cromossomos diferentes se unem parcialmente e, por fim, divisões
multipolares nos quadros B5, C4 e C5, efeito no qual se observa o surgimento de mais de dois
Figura 4 – Falhas na mitose. Perda cromossômica: A3, C3, B3 e B4; ponte cromossômica: B3
e C5; célula binucleada: A4; divisões multipolares: B5, C4 e C5; aderência cromossômica:
A5; micronúcleo: D3, D4 e D5;
21
polos que arrastam os cromossomos em direções distintas, produzindo múltiplos núcleos
incompletos no interior da célula.
Os dados obtidos dos ensaios são concentrados em: índice Mitótico, definido na seção 2.6,
e na contabilização das Aberrações Cromossômicas, Anormalidades Nucleares e ocorrências
de Micronúcleo.
2.4 Allium cepa
O Allium cepa é um organismo vegetal amplamente utilizado pela comunidade científica
na avaliação de substâncias citotóxicas e genotóxicas (SILVA et al., 2009), sendo
frequentemente utilizado no monitoramento ambiental (FISKESJÖ, 1988). O A. cepa foi
introduzido por Levan (1938) ao observar as alterações incomuns ocorridas na mitose deste
organismo ao ser submetido ao tratamento com colquicina. Nesta oportunidade, destacou a
sensibilidade do A. cepa e denominou o efeito observado de ”mitose C” (C-mitosis) (LEVAN,
1938). A utilização do A. cepa é ampla, principalmente por apresentar facilidade de obtenção,
possuir cromossomos grandes e reprodução rápida (GUERRA et al., 2003). É fácil de
armazenar e manipular e apresenta características convenientes para observação em
microscópio (FISKESJÖ, 1988). O A. cepa possui um pequeno número de cromossomos (2n
= 16) (Figura 5) que são de fácil visualização no microscópio (GUERRA et al., 2003),
contribuindo para a identificação das alterações cromossômicas (SILVEIRA et al., 2017).
Estudos publicados nas últimas décadas apontaram que o A. cepa apresenta resultados de
ensaios com significativa semelhança a resultados apresentados por células animais
(CHAUHAN et al., 1999; GRANT, 1999; SILVEIRA et al., 2017).
Figura 5 - Pares de cromossomos do Allium cepa. (Leme, 2009)
22
Os ensaios laboratoriais com A. cepa são empregados em várias áreas de estudo para a
determinação dos efeitos e na avaliação dos impactos de substâncias no meio ambiente. Os
efeitos citotóxicos se manifestam nas alterações funcionais da célula, reduzindo ou
aumentando a taxa de reprodução celular, efeito objetivo detectados por alteração do índice
mitótico (IM) (FISKESJÖ, 1988). Os efeitos genotóxicos são confirmados na presença de
aberrações cromossômicas (AC) ou nucleares, observadas na ocorrência de pontes, quebras
cromossômicas e Micronúcleos (MN), que podem se manifestar de maneiras diferentes
conforme o tipo de substância contaminante e o tempo de exposição (MARTINS et al., 2016;
MORO et al., 2017).
2.5 Allium cepa NO MONITORAMENTO AMBIENTAL
O Allium cepa aparece em vários estudos ambientais, sendo citado frequentemente como
bioindicador na avaliação dos efeitos de contaminantes presentes em vários ambientes. A
presença de cafeína nas águas do reservatório do rio Passaúna, em Curitiba/Brasil, foi
investigada apontando problemas na crescente degradação na qualidade da água. Ensaios
complementares com A. cepa apontaram a presença de contaminantes associados à cafeína,
com efeitos citotóxicos e genotóxicos (PEIXER et al., 2016). Estes autores analisaram pontos
de águas superficiais no rio e no reservatório do Passaúna durante quatro meses. Observaram
aumento no índice mitótico (IM) em 80% dos pontos coletados, além da ocorrência de
alterações cromossômicas em 20% dos pontos. As alterações cromossômicas observadas
foram perdas de cromossomos, mitose C e pontes cromossômicas no estágio da Anáfase e
aderências e perdas cromossômicas no estágio da Metáfase. A observação destas alterações
foi importante porque indicou a presença de outros contaminantes genotóxicos juntamente
com a cafeína, apresentando correlação positiva com o aumento do índice de alterações
cromossômicas (IAC). O A. cepa foi apresentado como bioindicador de primeira análise para
avaliar os efeitos de plantas conhecidas, popularmente, como medicinais (BAGATINI et al.,
2007).
A sensibilidade do A. cepa na presença de substâncias oxidativas, foi comprovada na
avaliação de hidroxilas e peróxidos, produzidas pela presença de metais pesados e compostos
fenólicos, em amostras coletadas em áreas industriais próximas a Nova Deli, na Índia
(TABREZ; AHMAD, 2011). Os pesticidas, que representam um amplo grupo de produtos
23
químicos encontrados na agricultura, veterinária e em residências, foram avaliados quantos
aos efeitos citotóxicos e genotóxicos, apresentado sob certas concentrações e tempo de
exposição, utilizando o A. cepa como organismo de teste (BIANCHI, 2008; CHAUHAN;
SAXENA; GUPTA, 1999; MESI; KOPLIKU, 2013). Ainda na avaliação ambiental, o
inseticida Malation foi testado em células vegetais e animais para comparar os efeitos nestes
dois sistemas em concentrações diferentes, utilizando nos ensaios A. cepa e células hepáticas
de ratos. Assim como apresentado anteriormente por Fiskesjö (1985), Bianchi (2008)
encontrou nos efeitos do Malation, tanto resultados coerentes entre os sistemas de teste,
quanto resultados sem relação de equivalência.
Em temas de gestão de recursos hídricos, o A. cepa foi utilizado em estudos recentes
alertaram sobre a concentração de antibióticos encontrados em corpos de água, seus possíveis
efeitos potenciais na cadeia trófica e nas consequências decorrentes nos tratamentos médicos
(HENRIQUE, 2014). A viabilidade para utilização de lodo tratado na agricultura,
provenientes de estações de tratamento de esgoto (ETE), foi avaliada neste trabalho que
evidenciou nos ensaios com A. cepa que, embora os tratamentos higienizadores do lodo
tivessem reduzido a citotoxicidade e genotoxicidade, ainda apresentava resultado positivo
para micronúcleos e recomendava cautela no uso deste recurso (MARTINS et al., 2016).
O A. cepa foi empregado na análise das águas do rio Jaru, em Rondônia, identificando, em
período de seca na região, alteração do índice mitótico e ocorrência de micronúcleos nos
pontos de coleta, sujeito a efluentes de laticínios e urbanos (FARIA, et al. 2017). O A. cepa
foi também aplicado como bioindicador na definição da toxicidade de efluentes de corantes
têxteis como contaminação direta e contínua nos ecossistemas aquáticos (RAHMAN; et al.,
2017).
2.6 ANÁLISE E CONTAGEM
Os trabalhos publicados utilizando Allium cepa apresentam quantidade elevada de
contagem de células para garantir a qualidade estatística do resultado. Bagatini e
colaboradores (2007) no seu estudo sobre plantas medicinais estabeleceram a contagem de
1.000 células por bulbo totalizando 6.000 células, incluindo as lâminas de controle. Bianchi
(2008) no seu estudo comparativo sobre os efeitos do inseticida Malation em células vegetais
e animais, preparou 20 lâminas para a contagem de 500 células por lâmina, totalizando 10.000
24
contagens por tratamento. Henrique (2014) realizou um estudo com antibióticos e avaliou os
efeitos citotóxicos e genotóxicos pela preparação de nove lâminas para a contagem de 500
células, totalizando 4.500 contagens por tratamento. Martins e colaboradores (2016) na
avaliação sobre o lodo de duas estações de tratamento de esgoto, utilizaram a contagem de
5.000 células por tratamento. Moro e colaboradores (2017) apresentaram um estudo sobre os
efeitos de drogas emergentes em 22 soluções diferentes, utilizando 4.500 células por solução,
totalizando 99.000 contagens.
O índice mitótico é definido pela equação 1.
𝐼𝑀 =
𝐶é𝑙𝑢𝑙𝑎𝑠 𝑒𝑚 𝐷𝑖𝑣𝑖𝑠ã𝑜
𝐶é𝑙𝑢𝑙𝑎𝑠 𝑇𝑜𝑡𝑎𝑖𝑠. 100 % (1)
A variação do IM pode indicar a presença de contaminante com potencial citotóxico,
quando comparado aos valores obtidos pelo tratamento de controle.
2.7 PROCESSAMENTO DE IMAGENS DIGITAIS (PDI)
A importância deste tema é apresentada por Gonzales e Woods (2000) quando afirmam
que o processamento de imagens estabeleceu uma área de pesquisa específica dentro dos
cursos de graduação e pós-graduação. O processamento de imagens é realizado aplicando-se
uma série de técnicas às imagens capturadas no intuito de melhorar a qualidade da imagem e
isolar regiões de interesse, permitindo a extração de informações para o reconhecimento e
interpretação dos objetos existentes nas cenas capturas (BACKES; SÁ JUNIOR, 2016;
GONZALEZ; WOODS, 2000). O uso das técnicas disponíveis varia conforme o caso e
depende de cada problema avaliado (GONZALEZ; WOODS, 2000). O processamento de
imagens pode ser divido em partes funcionais: aquisição da imagem, pré-processamento,
segmentação, representação e descrição e reconhecimento e interpretação, apresentados na
Figura 6. Os livros da área apresentam vários algoritmos básicos para cada fase do
processamento de imagens, que podem ser usados em conjunto e servir de base para a
construção de novos algoritmos que resolvam problemas mais específicos. A obra de
Gonzalez e Woods (2000) se encontra na quarta edição, sendo utilizada desde 1992. Os
artigos trazem frequentemente os autores desta obra como referência fundamental. A obra de
25
Backes e Sá Júnior (2016) tem uma abordagem diferente, apresentando a utilização e a
construção de algoritmos focados no MATLAB.
Figura 6 - Passos fundamentais do processamento de imagens. Fonte: adaptado de
Gonzales e Woods, 2000.
Há várias iniciativas que abordam o processamento de imagens para identificação,
caracterização e contagem de células. A identificação e contagem de cinco tipos diferentes de
leucócitos foram desenvolvidos com a utilização do MATLAB, apresentando uma acurácia de
95% nos resultados (NAZLIBILEK et al., 2014). O aplicativo CellProfiler, distribuído
gratuitamente, é uma biblioteca de recursos de processamento de imagens com capacidade
para criar uma solução para contagem de células animais e vegetais. É necessário ajustar a
sequência das funções e preencher uma grande lista de parâmetros para orientar o sistema a
detectar os alvos específicos. Por ser uma solução genérica com grande potencial de
aplicação, exige um intensivo processo de parametrização e conhecimento da base de
processamento de imagens para a extração das informações das imagens submetidas ao
algoritmo. A detecção e contagem de linfócitos quanto a presença de micronúcleos (MN) e
células binucleadas foi implementado usando o CellProfile (RAMADHANI; PURNAMI,
2013). Os resultados mostraram uma acurácia de 85,1% para células binucleares e 91,7% para
micronúcleos (MN), equiparados, mas não melhores que a contagem manual.
Fabricantes de microscópios com recursos de captura de imagem digital fornecem
programas com funções úteis para melhorar, adquirir e processar imagens, podendo separar
objetos simples e realizar medições lineares e cálculo de áreas, como o programa AxioVisio
26
da empresa Carl Zeiss e o programa Ariol da empresa Leica. Outros sistemas conseguem
adquirir, pré-processar e limiarizar a imagem para facilitar as análises laboratoriais.
Outros sistemas comerciais pesquisados apresentam especificamente contagem de MN de
células animais. O Laboratory Imaging, oferece o produto LUCIA Micronucleus. Operando
em conjunto um microscópio robotizado, que carrega lâminas automaticamente, digitaliza
imagens, encontra MN e cataloga as imagens das células isoladas, identificadas no processo.
É fornecido como parte de um sistema mais completo de diagnóstico por imagens
(IMAGING, [s.d.]).
A empresa Metasystem fornece soluções para teste cometa, cromossomos dicêntricos2 e
pontuação de micronúcleos (METASYSTEMS, [s.d.]), como parte do programa
computacional Metafer. O Metafer utiliza amostras de vários tamanhos, usa muitos métodos
de ampliações e diferentes contrastes3 para identificação de objetos diferentes.
O contador de células automatizado TC20 da Bio-rad, conta as células de mamíferos
(BIO-RAD, [s.d.]). Usando um sistema com câmera de foco automático e um algoritmo
próprio, realiza a contagem de células primárias (de tecido ou sangue) e células-tronco em
menos de 30 segundos, segundo o fabricante. O equipamento fornece a contagem total de
células e avalia a viabilidade celular pela exclusão de azul de tripano4.
2.7.1 Representação da imagem
As imagens reais enquadradas em um campo de visão ou por um dispositivo eletrônico de
captura são analógicas, possuindo níveis de iluminação refletida que variam de valores muito
baixos a valores muito elevados. Um modelo para a representação da imagem pode ser
entendido como uma função intensidade luminosa bidimensional representada por f(x,y), que
retorna a intensidade do sinal refletido nas coordenadas x e y do campo de observação. Sendo
energia, a intensidade refletida é positiva e finita, existindo dentro dos limites: 0<f(x,y)<1. As
imagens percebidas por um observador são dependentes da iluminação dos objetos da cena e
da reflexão da luz destes objetos até atingirem a retina do observador ou o sensor óptico de
2 Cromossomos com dois centrômeros que se originam do rearranjo de dois cromossomos danificados independentes. 3 Aplicado neste contexto para indicar substâncias que atuam realçando de partes das células. 4 Corante azoico usado em colorações histológicas para ensaios de viabilidade celular.
27
um dispositivo. A função iluminação pode ser descrita como um produto da iluminação (i)
pela refletância (r), descrita pela equação 2 e para os intervalos da relação 3.
f(x, y) = i(x, y). r(x, y) (2)
Onde:
0 < i(x, y) < ∞ e 0 < r(x, y) < 1 (3)
Os limites da função refletância ficam entre 0, para a absorção total, e 1, para a reflexão
total. A iluminação depende das características da fonte de luz e a refletância das
características dos objetos. Valores médios práticos de iluminação são apresentados na Tabela
1, (GONZALEZ; WOODS, 2000)
Tabela 1 - Valores médios de iluminação
Ambiente Iluminação (lm.m-²)
Dia claro com sol 96.000
Dia Nublado 10.700
Noite clara de lua cheia 0,11
Escritório comercial típico 1076
Valores de refletância típicos são apresentados na Tabela 2 (GONZALEZ; WOODS, 2000)
Tabela 2 - Valores típicos de refletância
Material Refletância
Veludo Negro 0,01
Aço inoxidável 0,65
Parede branca 0,80
Metal Prateado 0,90
Neve 0,93
O valor da função imagem fica entre os limites teóricos de Lmin e Lmax, cujas definições
são: Lmin = imin.rmin e Lmax = imax.rmax. Considerando os valores das Tabelas Tabela 1 e
Tabela 2, chega-se aos valores esperados para a função imagem entre 0,001 e 1000 lm.m-².
Para imagens monocromáticas, o intervalo [Lmin, Lmax] é denominado escala de cinza, sendo
comum aplicar um deslocamento no intervalo para [0, Lmax], produzindo imagens
monocromáticas entre 0, para o preto e Lmax, para o branco. No caso de imagens com escala
28
de cinza representada por 8 bits (28 estados), Lmax fica limitado ao valor 255, representação
utilizada para imagens monocromáticas tratadas neste trabalho.
As cenas coloridas podem utilizar diferentes modelos de cor para a representação da
imagem. No modelo RGB (Figura 7), cuja denominação é uma sigla das cores primárias
empregadas na representação das demais cores, a imagem é formada pela intensidade
combinada das cores vermelho, verde e azul, variando de preto, quando as intensidades estão
nos valores mínimos, a branco, quando as intensidades das cores estão no seu valor máximo.
Figura 7- Modelo RGB. Fonte: adaptado de Gonzales e Woods, 2000.
Uma imagem RGB pode ser convertida em imagem monocromática aplicando uma
combinação entre as cores primárias. A recomendação ITU-R BT.601-7 (ITU-R, 2011) é
sintetizada pela equação 4.
Y = 0,299. R + 0,587. G + 0,114. B (4)
A proporção apresentada na equação 4, gera o canal conhecido como luminância, Y, que
produz uma imagem monocromática equivalente à imagem original colorida.
Outros modelos de representação de cor (espaços de cor) operam diretamente com o canal
de luminância. Os modelos HSL e HSV utilizam, diferentemente do sistema cartesiano do
modelo RGB, coordenadas cilíndricas para representar a cor pura (matiz), a saturação e a
luminância. A matiz é determinada pelo ângulo formado pelas cores primárias, secundárias e
pela combinação delas. O ângulo zero graus representa a cor vermelha, passando pelo verde
29
puro em 120°, pelo azul puro em 240° retornando ao vermelho em 360°, conforme mostrado
na Figura 8 (GIMP, 2018).
Figura 8 - Círculo de Cores. (GIMP, 2018)
Na extremidade externa do disco, as cores estão na saturação máxima e no centro do disco
em saturação mínima. A saturação é definida como uma proporção relativa da participação do
branco na cor pura (GONZALEZ; WOODS, 2000). Quanto maior a saturação, menor a
participação do branco. No centro do disco residem as composições para formação dos tons
de cinza. O eixo Y que atravessa perpendicularmente o disco, pelo centro, representa a
luminância, no qual é montada a escala de cinza. O componente L, no modelo HSL, varia de 0
a 1, mas a saturação máxima ocorre no valor 0,5. Já no modelo HSV, o valor varia de 0 a 1,
ocorrendo a saturação em 1.
A imagem digital é obtida da imagem real pelo sistema informatizado, por um processo
denominado Amostragem e Quantização. A cena é dividida em pequenas partes conforme a
resolução do sensor utilizado na captura da imagem e ganha um valor que representa as
informações de cor e iluminação presentes nesta divisão. A resolução espacial é definida
como a quantidade de partes bidimensionais nas quais a cena é subdividida. A profundidade
da imagem é definida pela quantidade de valores cujas informações de cor e iluminação são
representadas (BACKES; SÁ JUNIOR, 2016; GONZALEZ; WOODS, 2000).
As imagens capturadas são tratadas como matrizes M por N, de mesma ordem que a
resolução da imagem, guardando em cada elemento f(m,n) o valor quantizado de luminância,
nas imagens monocromáticas, ou o valor dos componentes de cor, nas imagens coloridas.
30
A Figura 9 apresenta uma imagem colorida de um núcleo celular, no qual uma área
retangular, menor, está destacada, na região da borda do núcleo. Esta área expandida, na
mesma figura, apresenta os componentes de cor e o sistema de coordenadas da imagem. O
pixel com a marca vermelha, por exemplo, está na coordenada (156, 190) e possui os
componentes de cor no modelo RGB (207, 214, 198).
Figura 9 - Representação da profundidade da imagem digitalizada e do sistema de
coordenadas cartesianas.
2.7.2 Formatos de arquivos de imagem
Uma grande quantidade de dados é gerada no processo de captura da cena. Como visto na
seção 2.7.1, cada pequena parte na qual a cena é dividida, recebe uma informação de
luminância ou cor que precisa ser manipulada e armazenada. Uma imagem com uma
resolução de 1600 por 1200 pixels, capturada com uma profundidade de cor de 24 bits, na
qual cada componente de cor RGB é representada por 8 bits, ocupa cerca de 40 MB de
espaço. A compressão de imagem resolve o problema da redução da quantidade de dados,
podendo envolver perdas de informações neste processo ou não. As técnicas de compressão
aproveitam as redundâncias da imagem ou longas sequências de informações repetidas para
redução do volume de dados, mantendo a informação (GONZALEZ; WOODS, 2000). As
imagens quando são armazenadas ou transmitidas utilizam processos padronizados na
codificação empregada.
31
O formato JPEG (Joint Photographic Experts Group), desenvolvido em colaboração entre
o CCITT e ISO, é um padrão muito utilizado para imagens estáticas que realiza grande
compressão de dados, admitindo, entretanto, perdas de informação no processo. Sua
implementação padrão obrigatória utiliza o “sistema de codificação linha-base” e adota a
DCT (Transformada Cosseno Discreta), que é uma técnica utilizada na redução da quantidade
de tons contínuos de uma imagem, sem, entretanto, apresentar alterações perceptíveis ao
observador (GONZALEZ; WOODS, 2000).
O formato PNG (Portable Network Graphics) é um padrão de código aberto, utilizado
para compressão de imagens, sem perdas, suportando até 24 bits de cor (8 bits por canal), com
boa funcionalidade para palheta de cores e suporte para fundo de imagem transparente. Este
formato foi utilizado na manipulação de imagem deste trabalho.
Cada arquivo com imagens das lâminas de A. cepa ocupa, no formato JPEG, cerca de 500
kB e, no formato PNG, cerca de 2,2 MB.
Como as imagens compactadas possuem menor quantidade de tons de cinza que as
imagens originais, a determinação dos contornos dos núcleos das células de A. cepa é afetada,
alterando os valores calculados de área e perímetro, o que pode afetar o resultado da
classificação, conforme pode ser observado na Tabela 3, que apresenta dados de 13 núcleos
da mesma imagem em formatos com e sem perdas na compactação.
Tabela 3 - Parâmetros geométricos na compactação de imagem com e sem perdas.
Com perdas (JPEG) Sem perdas (PNG)
Núcleos Área Perímetro Nota Área Perímetro Nota Dif. nota
1 10210 400 7,4124 13326 445 7,4656 0,05
2 13996 425 4,5244 13963 425 4,5838 0,06
3 15861 484 6,4806 15825 485 6,4183 - 0,06
4 13271 434 5,7350 13261 435 5,9559 0,22
5 13395 422 5,1945 13384 423 5,1811 - 0,01
6 14755 458 5,8865 14738 459 6,0471 0,16
7 11323 420 8,6082 11308 422 8,4864 - 0,12
8 13351 446 7,4119 13326 445 7,2324 - 0,18
9 13186 420 5,5301 13171 419 5,5378 0,01
10 7864 349 5,5966 7846 349 5,6226 0,03
11 10260 457 5,2832 10250 457 5,2750 - 0,01
12 7687 317 4,7752 7671 316 4,7706 - 0,00
13 12092 551 4,1693 12062 552 4,2088 0,04
32
2.7.3 O Pré-processamento da imagem
processo de transformação da cena em imagem, ou digitalização, agrega pequenas
variações nos níveis de cor por sombreamento, problemas de iluminação e interferências
ópticas, entre outras fontes, introduz ruído e baixo contraste na imagem. Estas características.
interferem diretamente na possibilidade de sucesso do reconhecimento imediato de objetos de
interesse da cena, tornando-se necessário o tratamento digital da imagem antes de submetê-la
às demais partes do PDI (GONZALEZ; WOODS, 2000). Filtros digitais, transformadas e
quaisquer outros recursos aplicados nesta fase na adequação da imagem ao processamento
digital, constituem o pré-processamento. Os recursos de pré-processamento são aplicados
realizando operações lógicas ou aritméticas, lineares ou não lineares, de forma simultânea nos
dois eixos da imagem, empregando funções de duas variáveis (bidimensionais), denominados
transformações de funções bidimensionais, ou transformações bidimensionais (BACKES; SÁ
JUNIOR, 2016; GONZALEZ; WOODS, 2000). As transformações bidimensionais têm um
papel fundamental no processamento de imagem, proporcionando redução de ruído, realce de
detalhes, suavização da imagem, redução dos níveis dos componentes de cor ou dos níveis de
cinza.
2.7.3.1 Transformada rápida de Fourier
A transformada de Fourier permite decompor uma função contínua e integrável na base de
somatórios de senos e cossenos. A transformada existe na forma contínua, definida pela
equação 5, ou discreta, definida pela equação 6.
ℱ(𝑢) = ∫ 𝑓(𝑥)𝑒[−𝑗2𝜋𝑢𝑥]𝑑𝑥
+∞
−∞
(5)
ℱ(𝑢) = 1
𝑁∑ 𝑓(𝑥)𝑒[−𝑗2𝜋𝑢𝑥/𝑁]
𝑁−1
𝑥=0
(6)
A interpretação gráfica da resposta no espaço F(u) é apresentada na Figura 10, na qual a
função simples f(x), limitada em x, produz um espectro infinito em F(u). Quanto menor o
valor de X, maior a extensão de u na frequência F(u). Quando a abscissa representa tempo, o
33
espaço F(u) representa frequência. Limitando frequências elevadas no espaço F(u), altera-se a
função no tempo.
Figura 10- Função f(x) e resposta de F(u) no domínio da frequência. Adaptado de Gonzalez e
Woods (2000).
A transformada de Fourier pode ser estendida para uma função de duas variáveis
(GONZALEZ; WOODS, 2000). A representação discreta da transformada bidimensional de
Fourier é definida pela equação (7), é de grande importância no processamento de imagens. O
espaço F(u,v) da transformada é apresentado na Figura 11, gerado a partir da transformação
de uma imagem de teste com fundo preto, contendo um quadrado branco, centralizado, de
intensidade A = 1 (normalizado) e lado = X.
𝐹(𝑢) =1
𝑀𝑁∑ ∑ 𝑓(𝑥, 𝑦)
𝑁−1
𝑦=0
𝑒[−𝑗2𝜋(𝑢𝑥𝑀
+𝑣𝑦𝑁
)]
𝑀−1
𝑥=0
(7)
Figura 11- Espaço da transformada bidimensional de Fourier de um quadrado de intensidade
A e lado X. As altas frequências estão localizadas nas extremidades e as baixas frequências no
centro. Adaptado de Gonzalez e Woods (2000);
34
Na parte central da Figura 11 se concentram as baixas frequências. À medida que se afasta
do centro, as frequências aumentam. As altas frequências definem os detalhes em uma
imagem, como bordas, linhas finas e transições abruptas. As baixas frequências definem as
regiões mais homogêneas da imagem como variações suaves e detalhes de iluminação.
Imagens obtidas sem definição podem ser melhoradas pelo reforço das altas frequências.
Ruídos podem ser reduzidos pela eliminação das altas frequências. Um filtro que permite
passar baixas frequências (filtro passa-baixas) pode reduzir, ou eliminar as altas frequências
realizando uma multiplicação elemento a elemento destes valores por uma máscara binária
(compostas de zeros e uns) de mesma dimensão, adequadamente preparada para este fim
(BACKES; SÁ JUNIOR, 2016). Na Figura 12 são apresentadas três máscaras que
representariam filtros hipotéticos, na sequência, passa-baixas, passa-altas e passa-faixa.
Figura 12 – Máscaras bidimensionais de filtros de imagem. Respectivamente, máscara para
filtro passa-baixas, passa-altas e passa-faixas. Adaptado de Backes e Sá Jr. (2016)
A transformada inversa de Fourier retorna do domínio de F(u) para o domínio de f(x). A
equação 8 define a transformada inversa bidimensional de Fourier (BACKES; SÁ JUNIOR,
2016). O processo de filtragem no domínio da frequência envolve, portanto, a aplicação da
transformada de Fourier, aplicação de filtros pela multiplicação de máscaras binária no
domínio F(u) e a transformação inversa de Fourier.
𝑓(𝑥) = ∑ ∑ 𝐹(𝑢, 𝑣)
𝑁−1
𝑣=0
𝑒[𝑗2𝜋(𝑢𝑥𝑀
+𝑣𝑦𝑁
)]
𝑀−1
𝑢=0
(8)
A transformada rápida de Fourier (FFT) é obtida por um algoritmo, que evita as longas
sequências de multiplicações redundantes de números complexos e somas, pela decomposição
dada na equação 9. As operações, em quantidade proporcional a N², são reduzidas para uma
35
proporção de N.log2N na FFT. A FFT é apresentada na equação 9 e sua inversa na equação
10, com a substituição do termo apresentado na equação 11 (GONZALEZ; WOODS, 2000).
O MATLAB disponibiliza funções para transformação inversa ifft e direta fft para aplicação
de transformadas de Fourier e as funções ifft2 e fft2, para aplicação bidimensional (BACKES;
SÁ JUNIOR, 2016).
𝐹(𝑢) =1
𝑁∑ 𝑓(𝑥)𝑊𝑁
𝑢𝑥
𝑁−1
𝑥=0
(9)
𝑓(𝑥) = ∑ 𝐹(𝑢)𝑊𝑁−𝑢𝑥
𝑁−1
𝑥=0
(10)
Onde: 𝑊𝑁 = 𝑒−𝑗2𝜋/𝑁 (11)
2.7.3.2 Transformação exponencial
A transformação exponencial é aplicada na alteração de contraste. A função log provoca
uma compressão dos níveis de contraste. Por outro lado, a função exponencial produz a
expansão destes níveis de cinza, aumentando o contraste, com elevação do nível intensidade.
As duas funções podem ser aplicadas simultaneamente em trechos diferentes da escala de
cinza para produzir um deslocamento do contrate. Uma consequência desta transformação é a
amplificação do ruído que já esteja presente na imagem. A equação 12 apresenta a função de
transformação, onde S é a constante de transformação, obtida pela equação 13. O nível de
intensidade de saturação em uma imagem de tons de cinza, em 8 bits, é 255 (28-1). O nível de
saturação pode ser utilizado para eliminar os níveis mais elevados que o nível LR, que estão
fora e acima dos níveis da região de interesse. Os níveis de l(x, y) acima de L da escala de
cinza são elevados a 255, pela equação 12, cujo efeito é mostrado na Figura 13, para 0 < t <
255.
𝑡(𝑥, 𝑦) = 𝑒
𝑙(𝑥,𝑦)𝑆
+0,001
(12)
𝑆 =
𝐿𝑅
ln 𝑇𝐷
(13)
A transformada exponencial foi utilizada no processo de segmentação das imagens das
lâminas de A. cepa, para compensar principalmente as variações de iluminação e contraste
entre imagens e na superfície da própria imagem. Ao expandir os níveis próximos de interesse
36
e desloca-los para mais próximo da origem, surge um distanciamento entre os tons de cinza
dos núcleos e dos tons do fundo, formado nesta fase do processamento por citoplasma e
fundo.
Figura 13 – Aplicação da transformada exponencial em uma linha de imagem; (a) Aspecto
inicial do perfil obtida para uma linha da imagem; (b) curva exponencial utilizada; (c)
aumento de contraste.
2.7.3.3 Transformada euclidiana
A transformada euclidiana utiliza a determinação da distância euclidiana de um ponto
p(xn,yn) qualquer ao pronto de nível branco mais próximo, denotado por p(xb, yb), no espaço
binário bidimensional, e atribui este valor ao ponto p(xn,yn). Quanto mais distante do ponto
branco p(xb, yb), maior o valor inserido no ponto p do espaço bidimensional. Os resultados
dos cálculos de distância, a partir do ponto branco no centro da imagem, Figura 14(a), podem
ser observados na distribuição de valores na Figura 14(b). Os pontos distribuídos de mesmo
valor são equidistantes e podem ser interpretados como uma curva circular de raio r. Todos os
pontos com os mesmos valores formam curvas de nível sobre o quadro e podem ser utilizados
para a construção de máscaras circulares pela escolha da curva de nível adequada (BACKES;
SÁ JUNIOR, 2016).
37
Figura 14 - Transformada Euclidiana aplicada à imagem escura de ponto central branco.
Adaptado de MATLAB (2018);
A transformada euclidiana pode ser utilizada para determinar os pontos centrais de
superfícies planas (de mesmo valor), pela inversão dos valores de fundo (normalmente
escuros) pelos valores do objeto (normalmente claros), como visto na Figura 15(a). O cálculo
ocorre dentro da região de interesse, aumentando o brilho à medida que se aproxima do centro
da região (BACKES; SÁ JUNIOR, 2016), como apresentado na Figura 15(b). Estes pontos
centrais, que apresentam distâncias euclidianas maiores (valores maiores), podem ser
utilizados para separar objetos distintos aderidos na segmentação por meio do estabelecimento
de um valor limiar, acima do qual seriam determinados os pontos centrais das regiões.
Figura 15 - Transformada euclidiana aplicada dentro de uma região contínua de
citoplasma (valores iguais).
38
A transformada euclidiana apresentou bons resultados na determinação da localização dos
pontos centrais das áreas do citoplasma (centro de massa) e uma estimativa da área (raio),
mesmo em área muito densas, apresentando um nível de identificação equivalente àquela
registradas para os núcleos, certa de 95%. Como o ideal seria determinar aproximadamente os
contornos do citoplasma, necessários para determinar alterações dos núcleos com MN, ponte
e perdas cromossômicas, que são assuntos para trabalhos futuros, manteve-se nesta seção
estas informações como fonte de consulta.
2.7.3.4 Filtros de média e mediana
Os filtros são aplicados nas imagens buscando modificações que tragam algum benefício
às fases seguintes do processamento de imagem. O filtro de média desloca um bloco
(máscara) de NxN elementos, normalmente de valor pequeno N = 3, 5, 7, ..., sobre a imagem
alvo, posicionando o centro deste bloco sobre um elemento de imagem, calculando a média
dos valores na vizinhança deste elemento, que estão posicionados dentro do bloco, como
mostrado na Figura 16. O valor calculado é aplicado nas mesmas coordenadas do pixel
analisado, mas na imagem de saída do filtro. Este processo se repete ao longo de toda a
imagem. O Filtro da mediana segue um mecanismo semelhante, deslocando um bloco sobre a
imagem, mas determinando o valor mediano entre os valores sob a máscara NxN e substitui
este valor nas mesmas coordenadas da imagem de saída do filtro. A diferença entre os filtros
de média e mediana é que este último não cria novos níveis de cinza e preserva melhor as
regiões de borda.
Figura 16 - Filtro de média 3x3; Adaptado de MATLAB (2018)
39
2.7.4 Segmentação
O processo de segmentação visa isolar os objetos de interesse da cena pela divisão da
imagem em partes distintas por meio da aplicação de algum critério, adequadamente
escolhido. Um dos métodos de segmentação busca determinar os níveis limiares de tons de
cinza que permitam separar a área do fundo das áreas dos objetos. Algoritmos de limiarização
por região podem carregar partes do fundo com os objetos ou perder parte dos objetos para o
fundo. Outro método de segmentação busca determinar as bordas dos objetos, essencialmente,
pelas variações abruptas nos níveis de cinza entre pixels vizinhos. Algoritmos de detecção de
borda são sensíveis a ruído e não identificam descontinuidades de uma fronteira, não
reconhecendo, nestes casos, os contornos corretos dos núcleos. Como os formatos dos núcleos
das células de A. cepa são variados e irregulares, as técnicas de interpolação de contorno não
foram efetivas.
2.7.4.1 Limiarização
Uma transformação de limiarização aplicada à imagem em tons de cinza produz uma
imagem denominada binária, contendo informações das regiões de interesse (ROI). Um valor
T (limiar) é definido conforme um critério de interesse p(x,y) da imagem f(x,y), conforme
apresentado na equação 14 e utilizado para testar cada pixel nas coordenadas em questão (x,
y), na determinação da inclusão deste no domínio de interesse g(x,y), conforme equação 15
(GONZALEZ; WOODS, 2000).
𝑇 = 𝑇[𝑥, 𝑦, 𝑝(𝑥, 𝑦), 𝑓(𝑥, 𝑦)] (14)
𝑔(𝑥, 𝑦) {
1 𝑠𝑒 𝑓(𝑥, 𝑦) ≥ 𝑇
0 𝑠𝑒 𝑓(𝑥, 𝑦) < 𝑇
(15)
A limiarização por histograma representa uma boa técnica de limiarização na
determinação dos núcleos das células de A. cepa, devido às razoáveis regularidades de
contrate e iluminação, aplicada à imagem monocromática do canal G. O valor T a ser
determinado na limiarização pode ser obtido de maneira simples e global pelo histograma.
Nos histogramas da Figura 17, o eixo das abcissas representa os níveis de cinza da imagem,
40
crescente a partir da origem do sistema cartesiano, e o eixo das ordenadas representa a
ocorrência de cada nível de cinza. Na Figura 17(a) apresentam-se duas regiões distintas de
concentração de valores que representam o fundo e objetos iluminados. Os níveis de cinza que
compõem o fundo da imagem, representados pela concentração de níveis mais baixos de
iluminação, encontram-se bem distanciados da concentração dos níveis mais altos, que
formam os objetos iluminados, permitindo uma limiarização óbvia no ponto T. Da mesma
forma, o histograma da Figura 17(b) apresenta três níveis distintos de concentração de tons
cinza, permitindo a mesma solução, embora neste caso, o processo de limiarização seja menos
confiável (GONZALEZ; WOODS, 2000).
Figura 17- Histogramas multimodais. (a) Histograma com limiar único; (b) Histograma com
limiar múltiplo; (GONZALEZ; WOODS, 2000)
O método de Otsu é empregado na determinação do limiar ótimo para uma distribuição
bimodal. O algoritmo tenta encontrar um valor limiar T que separe a imagem em grupos de
níveis de cinza, minimizando a variância dentro dos grupos ao mesmo tempo que maximiza a
variância entre os grupos (BACKES; SÁ JUNIOR, 2016). O algoritmo calcula proporção de
cada grupo de níveis de cinza pelas equações 16 e 17, a média de valores de cada grupo de
níveis de cinza pelas equações 18 e 19, a média da imagem pela equação 20 e a variância
entre os grupos pela equação 21. O método faz uma varredura em todos os valores possíveis
de T dentro do intervalo de [0 a G-1], onde G é a maior intensidade de pixel da imagem, de
modo a maximizar a equação 21.
𝑎1 = ∑ 𝑃(𝑖)
𝑇
𝑖=0
(16)
𝑎2 = ∑ 𝑃(𝑖)
𝐺
𝑖=𝑇+1
(17)
𝜇1 = ∑ 𝑖𝑃(𝑖) 𝑎1⁄
𝑇
𝑖=0
(18)
𝜇2 = ∑ 𝑖𝑃(𝑖) 𝑎2⁄
𝐺
𝑖=𝑇+1
(19)
𝜇𝑡 = 𝑎1𝜇1 + 𝑎2𝜇2 (20) 𝜎2 = 𝑎1(𝜇1 − 𝜇𝑡)2 + 𝑎2(𝜇2 − 𝜇𝑡)2 (21)
41
Os métodos graythressh() e multithresh() do MATLAB, determinam o valor ou os valores
limiares, respectivamente, conforme o algoritmo de Otsu e apresentado na Figura 17.
A iluminação deficiente, entretanto, pode dificultar a obtenção de um limiar simples,
necessitando de tratamento adicional para o sucesso da segmentação. Na Figura 18(a) uma
imagem em tons cinza com dispersão normal está representando um objeto quadrado sobre
um fundo mais claro. Seu respectivo histograma está na Figura 18(d), que apresenta um
candidato claro ao valor limiar global, T. A Figura 18(c) apresenta o resultado da iluminação
deficiente da Figura 18(b) aplicado sobre a imagem da Figura 18(a). O histograma resultante
deste cenário, apresentado Figura 18(f) não possui mais a mesma facilidade de obtenção do
valor limiar T.
Figura 18 – Influência da iluminação não uniforme no histograma bimodal. (a) Quadro
cinza; (b) iluminação; (c) iluminação de (b) aplicado em (a); (d) histograma de (a); (e)
histograma da iluminação; (f) histograma da imagem de (c); (GONZALEZ; WOODS, 2000)
Os histogramas das imagens das lâminas de A. cepa são semelhantes ao histograma da
Figura 18(f), composto por três conjuntos de valores que representam áreas do núcleo,
citoplasma e fundo, mas com aspecto bimodal, agregando valores de citoplasma e fundo em
um pico nos tons de cinza mais claros, apresentado no desenvolvimento, na Figura 28.
42
2.7.5 Representação e descrição
A rotulação identifica regiões contínuas de interesse na imagem binária, sendo parte do
processo de segmentação da imagem, observado na Figura 19(d). As regiões encontradas
podem ser declaradas como objetos caso atendam determinados critérios no processo de
representação e descrição, como visto na Figura 19(b). A função do MATLAB,
bwboundaries(), realiza o levantamento das bordas que circundam um candidato a objeto
(BACKES; SÁ JUNIOR, 2016). O rastreamento parte da origem (1, 1) do sistema cartesiano,
de um pixel com valor 0 (valor do fundo da imagem binária), se possível, buscando pixels
com valor 1. O algoritmo busca as conexões de vizinhança de 4 ou de 8 pixels e contorna a
região até retornar às coordenadas iniciais, determinando desta forma um caminho fechado
em torno de cada região identificada. Cada região é individualmente registrada. Entre os
dados de retorno da função está o conjunto de vetores com as localizações dos pixels de borda
de cada região e a matriz contendo as regiões de interesse (ROI) e os buracos (espaços com
valor 0 dentro destas regiões) (MATHWORKS, 2018).
Figura 19 – Operação de rotulação da função bwboundaries. (a) Imagem binária; (b)
identificação de regiões; (c) exclusão de regiões de borda; (d) rotulação; Adaptado de
MATLAB (2018)
A função imclearborder() elimina todas as regiões da imagem binária que estão em
contato com a borda da imagem, evitando tratamentos posteriores com objetos incompletos
cortados pelos limites do enquadramento da cena. A função utiliza uma transformação
43
morfológica para apagar as áreas comprometidas pelos limites da imagem, cujo processo é
apresentado na Figura 19(b)(c) (MATHWORKS, 2018).
A função regionprops() do MATLAB realiza diversas operações sobre as regiões
encontradas pela função bwboundaries(), retornando características como área, perímetro,
coordenadas do centro de massa, índice de excentricidade, orientação e outras propriedades
descritas nos documentos do software (MATHWORKS, 2018), conforme mostrado na Tabela
4. As descrições dos atributos da função regionprops() foram inseridas no anexo C.
Neste trabalho foram utilizados como fatores as propriedades: área, excentricidade,
solidez, perímetro, diâmetro equivalente e área-perímetro para caracterização dos núcleos de
A. cepa.
Tabela 4 – Propriedades fornecidas pela função regionprops() do MATLAB. As
propriedades solidez, extensão e número de Euler5 são adimensionais, orientação é um ângulo
e as demais são apresentadas em pixel ou pixel². O número de Euler poderia ser usado para
diferenciar o núcleo em prófase, cuja textura normalmente produz vários buracos na
segmentação, dos núcleos em interfase, que normalmente não possuem buracos. Dados da
imagem de referência I seção 3.1.
Objeto Área Excentricidade Orientação Solidez Perímetro Área cheia Extensão
1 7249 0,7517 3 0,9417 359,8 7305 0,7681
2 11002 0,5648 13 0,8229 542,7 12299 0,6040
3 5039 0,8093 62 0,6524 586,3 5063 0,4448
4 5670 0,7142 49 0,7436 639,2 5690 0,5347
5 7708 0,8223 -30 0,5897 1.016,2 7962 0,3740
6 2122 0,8738 80 0,8827 209,2 2122 0,6669
7 2440 0,7718 65 0,8362 231,1 2440 0,5970
Objeto Num. Euler D. equivalente Área convexa Maior eixo Menor eixo M/m A1/2.P-1
1 -3 96,1 7698 119,0 78,5 1,5163 20,15
2 -21 118,4 13369 137,8 113,7 1,2118 20,27
3 -4 80,1 7724 120,6 70,9 1,7024 8,59
4 -4 85,0 7625 109,3 76,5 1,4288 8,87
5 -4 99,1 13070 155,6 88,5 1,7572 7,59
6 1 52,0 2404 77,0 37,4 2,0563 10,14
7 1 55,7 2918 71,5 45,5 1,5725 10,56
5 Número de Euler é um parâmetro geométrico que apresenta inicialmente valor um para a área do objeto, mas debita valor um para cada descontinuidade (buraco) no objeto. Caso o número de Euler seja um, o objeto não possui buracos; caso seja -3, o objeto possui 4 buracos (Anexo C).
44
2.8 CONTAGENS DE CÉLULAS E TRABALHOS SEMELHANTES
O emprego dos microscópios com câmeras digitais em laboratórios, além de permitir a
projeção dos conteúdos observados das lâminas e a captura das imagens para documentação
ou análise posterior, abre a possibilidade do emprego de outras técnicas de análise e
observação. O processamento de imagens digitais tem ocupado este espaço, extraindo
informações ou fornecendo recursos de medições de características físicas, frequentemente
fornecidos pelos próprios fabricantes de microscópios. A contagem de objetos gráficos como
colônias de bactérias, leucócitos e núcleos celulares, é exemplo comumente encontrado em
publicações que tratam deste assunto. Linguagens de programação têm sido amplamente
utilizadas na construção destes sistemas. Um sistema para identificação e registro do
crescimento de unidades formadoras de colônias de Staphylococus aureus em placas Petri foi
desenvolvido em linguagem C++ (ALVES, 2006), realizando a aquisição e processamento de
imagem. O sistema realiza a limiarização por histograma das imagens e avalia o crescimento
das colônias. Obteve uma acurácia na contagem automática equivalente àquela obtida nas
análises manuais.
Em outro trabalho, a contagem de células epiteliais foi desenvolvida pela detecção
automática de células via técnicas de morfologia matemática e processamento de imagens
(SILVA, 2015). A proposta foi aprimorar o procedimento utilizado, realizado de forma
manual, lenta e parcialmente subjetiva. A cultura celular é fixada com paraformaldeído na
superfície da placa Grid 5006 e exposta a dois marcadores biológicos específicos para destacar
o núcleo e o citoplasma, criados para serem absorvidos e concentrados por organelas celulares
distintas. O marcador DAPI (do fabricante Invitrogen, modelo D1306), reage apenas com as
proteínas da cadeia de DNA, demarcando fortemente o núcleo da célula. Já o segundo
marcador, Texas Red-C2-Maleimide (provido pela mesma empresa, mas de modelo T6008), é
absorvido por proteínas totais, evidenciando o citoplasma e, consequentemente, todo o
perímetro celular.
O procedimento de contagem automática de células brancas, explorando três padrões de
representação digital de cor (SAFUAN et al., 2017); obteve um desempenho geral do sistema
de 96,92% quando foi utilizada apenas a componente S (saturação) do padrão HSV, ao passo
que a combinação de duas bandas S-C (saturação – ciano) atingiu 96,56% de exatidão na
contagem de glóbulos brancos. Outro aspecto interessante desta publicação apontou que o uso
6 Placa de Petri é um recipiente cilíndrico, achatado, de vidro ou plástico utilizado em laboratórios para a cultura de micro-organismos.
45
de detecção baseada em núcleo foi superior à detecção baseada em citoplasma para a
contagem dos glóbulos brancos.
Em outro trabalho, as imagens de núcleos de linfócitos do sangue periférico humano
foram segmentadas por limiarização adaptativa, identificadas e classificadas com a utilização
de redes neurais artificiais (MOREIRA, 2002), apresentando uma discussão entre técnicas de
treinamento utilizando rede neural com e sem algoritmo genético.
Também envolvendo a contagem e classificação de glóbulos brancos, Nazlibilek e
colaboradores (2014) utilizam o MATLAB para processamento de imagens e a
implementação de uma rede neural para identificação de cinco tipos diferentes de leucócitos.
Apresentaram uma solução para o problema da sobreposição das células por critérios bem
específicos de dimensão, obtidos pelo treinamento da rede neural. Os resultados obtiveram
uma exatidão de 95%.
O canal verde, do plano de cor RGB, foi utilizado no levantamento da ramificação em
árvore dos vasos da retina, por apresentar maior contraste quando comparado aos demais
canais (WALTER; KLEIN, 2001). Neste artigo, os autores apresentaram algoritmos baseados
em morfologia para a detecção do disco óptico e da árvore vascular em fotografias de fundo
de olho com baixo contraste e presença de ruído. Para a detecção, os autores encontraram a
posição inicial aproximada do disco óptico e, em seguida, obtiveram os contornos exatos por
meio da “transformação de bacia hidrográfica” (Watershed Transform). A detecção dos vasos
foi obtida pela transformação THT (Top-Hat Transform), aprimorando o contraste na etapa de
pós-filtragem.
2.9 MATLAB
O MATLAB (MATrix LABoratory) é um programa computacional de análise numérica.
Combina uma interfase intuitiva com uma linguagem de programação de alto nível7. Tem
capacidade de operar matrizes e vetores, com números inteiros, reais ou imaginários,
implementar contadores e converter dados de cálculo de forma simples. Possui várias funções
embutidas para gerar gráficos e histogramas. Possui pacotes adicionais, modulares, como as
bibliotecas de processamento de sinais e imagens, simulação e controle de sistemas e outras
funcionalidades úteis para acelerar o desenvolvimento de algoritmos e soluções
(MATHWORKS, 2018). O MATLAB permite a criação de scripts e desenvolvimento de
7 Linguagem de programação com um nível relativamente alto de abstração e que se aproxima mais da
linguagem utilizada pelo homem.
46
funções pelo próprio usuário, além de permitir a criação de interfaces gráficas de usuário
(GUI – Graphical User Interface) para a operação dos scripts. O MATLAB é utilizado em
várias áreas do conhecimento, sendo frequentemente citado em trabalhos acadêmicos. Entre
as aplicações típicas encontradas em trabalhos publicados aparecem conversões e
processamento de dados, geração de gráficos para dados numéricos de equipamentos,
tratamento estatístico, no processamento de imagens digitais e de sinais. O MATLAB foi
utilizado em processamento de imagens, conversão de espaços de cor e implementação de
rede neural, em imagens aéreas obtidas por drone8, para avaliação e determinação do índice
de cobertura de folhas (LAI) (CÓRCOLES et al., 2013). Tenório e colaboradores. (2011)
empregaram o MATLAB na quantificação gráfica dos dados espectroscópicos, provenientes
de ensaios quimiométricos em extratos brutos de folhas de plantas e extratos medicinais.
Ballesteros (2016) utilizou o MATLAB para desenvolver o software FORETo, que previa a
quantidade de evaporação e otimizava o processo de irrigação, utilizando redes neurais.
Pieczywek (2014) utilizou o MATLAB para desenvolver um sistema de processamento de
imagem para avaliar o comportamento mecânico e resistência do tecido de A. cepa.
8 Avião não tripulado, controlado à distância por meios eletrônicos e computacionais, geralmente usado para fins
militares em patrulhamento de fronteiras, operações de espionagem, bombardeios etc.
47
3 DESENVOLVIMENTO
Conforme visto no Capítulo 2, o A. cepa é um organismo empregado em ensaios
ambientais, nos quais sofre os efeitos citotóxicos e genotóxicos das substâncias analisadas. O
desenvolvimento deste trabalho visa classificar e contabilizar os núcleos na fase da interfase e
nos estágios da mitose em lâminas de A. cepa submetidos aos ensaios aplicados ao
monitoramento ambiental. Visa, também, consequentemente, reduzir o tempo de
envolvimento dos pesquisadores na contagem dos núcleos regulares, mantendo, todavia, a
análise manual para a contabilização das exceções e falhas. A premissa do trabalho foi criar
uma alternativa viável sem interferir na metodologia manual, atualmente adotada nos ensaios,
sem propor alterações nos materiais, equipamentos ou procedimentos de domínio,
delimitando a interferência na obtenção das imagens.
Na preparação dos ensaios com A. cepa são necessárias pelo menos 72 horas de espera,
período no qual o organismo é mantido em contato com as substâncias de teste. Depois deste
período, as lâminas são preparadas e ficam disponíveis para uso por até 3 dias, se mantidas
em local resfriado e protegidas da luz. A Figura 20 apresenta um ensaio típico utilizando
Allium cepa (POLETTO et al., 2011). O procedimento de preparação das lâminas utilizadas
neste trabalho foi incluído no anexo B. No apêndice C foi incluída a imagem contendo as
nove lâminas de teste, utilizadas na etapa de comparação de resultados, e duas imagens das
mesmas lâminas após o período de três dias decorridos da preparação.
Figura 20 - Ensaio com Allium cepa – Fonte: (POLETTO et al., 2011)
48
O trabalho foi desenvolvido em etapas, seguindo como linha base de condução a
metodologia apresentada no diagrama da Figura 21, iniciando-se pela identificação das
formas básicas das fases nucleares do A. cepa. O ciclo de detecção foi a fase do
desenvolvimento que permitiu testar e definir os recursos para o processo de segmentação,
extração de características e algoritmos básicos prévios, necessários na identificação de cada
estágio da mitose (Figura 6). Nesta fase, até que se obtivessem as imagens digitalizadas em
laboratório, foram utilizadas imagens publicadas em trabalhos na preparação da imagem de
referência (Figura 22), utilizada nas pesquisas do tratamento morfológicos dos núcleos.
Retornando à Figura 21, na fase 2, foi empregada a imagem de referência 2, apresentada na
Figuras Figura 23 e Figura 24, elaborada a partir de recortes das imagens de lâminas reais.
Esta nova imagem se diferencia da primeira por utilizar uma coletânea de formas básicas
nucleares, na mesma imagem, contando com variações morfológicas típicas de cada fase
nuclear identificadas nas lâminas de A. cepa.
Figura 21 - Metodologia aplicada no desenvolvimento do trabalho.
Os primeiros procedimentos desenvolvidos na fase 1 foram aplicados na imagem de
referência 2. Na fase 3, tipos diferentes de avaliações foram realizados para qualificar o
algoritmo. A primeira avaliação testou a repetitividade, na qual o algoritmo deveria detectar
os mesmos elementos e apresentar o mesmo resultado em testes subsequentes da mesma
lâmina e resultados semelhantes em outras imagens. A segunda avaliação comparou os
49
resultados obtidos pelo algoritmo com os resultados apresentados pelos técnicos do
laboratório. Conforme apresentado no Capítulo 2, a contagem manual de uma grande
quantidade de células por lâmina garante um resultado confiável, segundo a metodologia
adotada. O objetivo deste trabalho é alcançar na contagem automática, a mesma exatidão do
procedimento convencional manual.
3.1 IMAGENS DE REFERÊNCIA
A primeira imagem de referência foi montada de núcleos de A. cepa coletados de Leme
(2009), contendo imagens monocromáticas bem definidas dos núcleos em cada fase,
apresentada na Figura 22(a). A identificação dos núcleos é apresentada na Figura 22(b) que
mostra também a composição e disposição dos núcleos na imagem de referência, sem a
presença do citoplasma, tratado como fundo. Na ausência inicial de imagens capturadas do
microscópio, imagens digitais foram obtidas de artigos científicos, mesmo utilizando formato
de compressão com perdas de dados, apresentaram-se úteis na identificação das formas e
contornos.
Figura 22 – Imagem de referência I. (A) Formas básicas nucleares. (B) Imagens padrão de
núcleo: (1) Interfase; (2) Prófase; (3) e (4) Anáfase; (5) Metáfase; (6) e (7) Telófase.
Adaptado de Leme (2009)
A segunda imagem de referência (Figura 23) foi produzida a partir recortes em imagens
digitais, extraindo células completas (núcleo e citoplasma), obtidas a partir de lâminas de
ensaios com A. cepa, com mesmas resoluções e contrastes semelhantes às observadas nas
imagens de prova (Figura 26). Esta imagem, com dimensões de 1876 por 930 pixels, recebeu
50
as células recortadas que foram dispostas aleatoriamente, com concentração, rotação e
espaçamentos semelhantes aos encontrados nas imagens de prova, totalizando 34 núcleos,
distribuídos em 6 em interfase, 6 em prófase, 5 em metáfase, 7 em anáfase e 10 em telófase,
cuja identificação é apresentada na Figura 24. As imagens de prova são imagens reais,
capturadas de ensaios realizados durante a execução do presente trabalho.
Figura 23 - Imagem de referência II. Contém as fase e estágios da divisão celular do A.
cepa.
Figura 24 - Imagem de referência II com identificação das fases e estágios da divisão
celular do A. cepa - Interfase (I); Prófase (P); Metáfase(M); Anáfase (A); Telófase (T).
51
3.2 IMAGENS DE LÂMINAS
As imagens iniciais das lâminas de ensaios com A. cepa foram obtidas entre outubro e
novembro de 2017. As imagens foram testadas com ampliação e iluminação diferentes, e
capturadas com resolução de 3840 por 2748 pixels (resolução fixa para modelo do sensor de
imagem), em formato com perdas. As últimas imagens foram obtidas em agosto de 2018, a
partir de outro equipamento, utilizando a mesma ampliação e mesmo critério de iluminação
das imagens iniciais, mas com resolução de 1600 por 1200 pixels e em formato sem perdas.
Novas tabelas estatísticas e valores de corte (áreas mínimas e máximas de objetos) foram
criadas para o algoritmo operar também nesta resolução. Os dados dos microscópios e câmera
utilizados neste trabalho são listados na Tabela 5. As objetivas do microscópio fornecem
ampliações padronizadas, das quais foram utilizadas as de 10X (Figura 25-A3), 40X (Figura
25-A2) e 100X (Figura 25-A1), mais comuns. Embora a intenção inicial fosse utilizar a
objetiva de 10X, para permitir a captura de área maior para processamento, optou-se pela de
40X em função do maior detalhamento da imagem (Figura 25) e por ser a objetiva utilizada
pelos pesquisadores na contagem, permitindo a comparação entre os resultados do
procedimento automático e o manual. Os aplicativos de captura instalados nos microscópios,
possuem recursos para ajuste do contraste digital, mas desassociados da abertura do
condensador9, nos modelos de equipamentos utilizados nos laboratórios, não sendo possível
estabelecer um valor objetivo para a iluminação. O controle de iluminação e contraste,
portanto, foi convencionado para uma iluminação intermediária, que produzisse imagens de
contraste também intermediário, conforme ilustra a Figura 25-B. A variação admitida no
contraste levou à utilização dos recursos de transformações intensas no pré-processamento,
para minimizar os efeitos da variação de contraste na segmentação, e à necessidade de
realização de um teste específico para este efeito, cujos resultados são apresentados na Tabela
9.
Tabela 5 - Dados dos microscópios e câmeras
Microscópio Câmera Resolução Pixels Dimensão do pixel
BX41 LC20 1600x1200 2 MP 3,3 µm
BX43 SC100 3840x2748 10,6 MP 1,67 µm
9 O Condensador é um diafragma formado por palhetas móveis que controlam o feixe que incide no campo de visão do microscópio.
52
Figura 25 – Definição da ampliação e iluminação das imagens. (A) e iluminação (B);
objetivas (A1) 100X, (A2) 40X, (A3) 10X; escolha definida pela ampliação de 40X,
assinalada pela envoltória retangular; escolha definida pela iluminação intermediária,
assinalada pela envoltória retangular.
Entre lâminas de ensaios de controle negativo e de ensaios da avaliação de substâncias,
foram obtidas 166 imagens, do equipamento BX43, em resolução de 3840x2748, em formato
de compactação com perdas (JPG), totalizando cerca de 16.000 imagens de núcleos. As
imagens obtidas mais recentemente, foram obtidas do microscópio BX41, em resolução de
1600x1200 pixels, totalizando 354 arquivos, em formato de compactação sem perdas (PNG),
distribuídas em três amostras, de três tratamentos.
Algumas imagens foram escolhidas e denominadas como imagens de prova por apresentar
detalhes, fases nucleares ou densidades celulares específicas (Figura 26), interessantes para o
desenvolvimento do trabalho. As imagens de prova são imagens capturadas normais, mas que
pelo motivo descrito no parágrafo anterior, são frequentemente revisitadas para testes de
funcionalidade.
53
Figura 26 - Imagens de prova - quatro imagens de duas lâminas com células de A. cepa,
contendo densidades de células diferentes e contornos secos na imagem.
O processo de aquisição digital é composto pela ação de divisão prática da área de
interesse da lâmina em quadrantes do tamanho do plano de visão da objetiva, pela focalização
da imagem na ocular do microscópio, pela visualização da imagem do plano de visão na tela
do aplicativo fornecido com microscópio e instalado no computador de apoio, pela captura da
imagem e pelo arquivamento em mídia digital. O tempo médio necessário para aquisição de
imagens suficientes (entre 17 e 25) para a contagem, observadas na prática, foi de,
aproximadamente, 5 minutos. As imagens, embora capturadas, não são todas necessárias para
a contagem, porque a contagem de 1000 células é obtida com cerca de seis imagens,
dependendo também da densidade da imagem que pode chegar a concentrar 400 núcleos.
3.3 PRÉ-PROCESSAMENTO
As imagens de ensaios com Allium cepa, foram obtidas inicialmente com uma câmera
modelo SC100 acoplada ao microscópio Olympus BX43, como o exemplo apresentado na
Figura 27. A câmera possui uma resolução de 10,6 MP (Megapixel) e emprega um sensor de
imagem com a medida equivalente de 1,67 µm por pixel. A imagem gerada tem uma
54
dimensão de 3840 por 2748 pixels, representando uma imagem de real estimada de 6,4 por
4,6 mm.
A conversão da imagem colorida para tons de cinza foi realizada pelo canal G do modelo
RGB. Na análise dos histogramas dos componentes de cor da imagem, apresentada na Figura
28, identifica-se que o canal 2 (Green) apresenta o maior contraste, caracterizado pela
distribuição mais larga do histograma. O uso de canais de cor de forma independente em
processamento de imagem não é incomum. O mesmo canal de cor (G) foi escolhido para o
pré-processamento de imagens de retina por apresentar menor ruído e maior contraste nas
imagens de fundo de olho na pesquisa de publicada por Oliveira e demais autores (2013).
Figura 27 - Imagem do microscópio BX43, contendo uma imagem de lâmina com células
de A. cepa.
Figura 28 -Histograma dos canais R (vermelho), G (verde), B (azul), respectivamente.
55
Para eliminar o ruído de alta frequência da imagem foi aplicado um filtro por
transformada de Fourier, com corte suave (Gaussiano), com raio de 250 pixels (Figura 29). O
resultado da aplicação do filtro pode ser observado na Figura 30.
Figura 29 - Aplicação da transformada de Fourier como filtro para altas frequências: (a)
Espectro de frequência da imagem; (b) máscara Gaussiana; (c) filtro aplicado; (d) imagem
original; (e) projeção da máscara Gaussiana; (f) imagem transformada. Adaptado de Backes e
Sá Jr. (2016)
Figura 30 – Aplicação do filtro de média: (a) histograma antes e (b) histograma após a
aplicação do filtro.
56
Para garantir a segmentação dos núcleos, compostos pelos níveis de cinza mais escuros da
imagem, foi aplicada uma transformação linear para reduzir cerca de 70% da iluminação da
imagem, que desloca o histograma no sentido da origem. Em seguida foi aplicada uma
transformação exponencial, cujo objetivo foi saturar (nível de branco) os valores de nível de
cinza acima de 166. Este efeito é obtido pela aplicação da equação 22 em cada pixel da
imagem. Estas operações conjuntas deslocaram o histograma para a origem e expandiram a
escala de valores da imagem, conforme mostrado na Figura 31.
Figura 31 – Aplicação da transformada exponencial. (A) Histograma antes da
transformação; (B) histograma após a transformação de deslocamento de expansão; (C)
histograma após aplicação dos filtros de média. O eixo das abscissas representa os níveis de
cinza e no eixo das ordenadas a quantidades de pixels.
Em seguida foram aplicados filtros de média, reduzindo a irregularidade que ocorre nas
bordas dos núcleos durante a segmentação, e facilitar a determinação dos pontos de
limiarização, localizados nos vales do histograma. O primeiro vale, apresentado na Figura 31-
C, marca a separação dos tons de cinza do núcleo para o citoplasma. O segundo vale marca a
separação dos tons de cinza do citoplasma para o fundo. Há um entrelaçamento mais evidente
entre os valores do fundo e do citoplasma, observado pelo valor mais elevado do vale,
indicando que partes do fundo passam pela limiarização do citoplasma e que partes do
citoplasma são perdidas.
𝑡(𝑥, 𝑦) = 𝑒
𝑙(𝑥,𝑦)36,5
+0,001
(22)
para 0 < t < 255,
57
3.4 SEGMENTAÇÃO
Os pontos de limiarização não são fixos, pois variam de imagem para imagem. O método
de Otsu varre o histograma e encontra os pontos mais adequados para a limiarização. O
método agrupa os valores de pixel, separando-os em dois grupos de forma que exista mínima
variância entre os valores dentro dos grupos e máxima variância entre os grupos, conforme
apresentado na seção 2.7.4.1. Nesta fronteira entre os grupos, encontra-se o valor limiar
obtido pelo método. O MATLAB implementa este método em duas funções. A função
graythresh() determina o valor limiar único para separar a imagem em duas regiões. A função
multithresh() implementa o método de Otsu para múltiplos níveis limiares, utilizada na
segmentação das imagens deste trabalho. Os valores retornados pela função multithresh()
foram aplicados na limiarização da imagem, pela utilização da função imquantize(), que
realiza a segmentação em multinível devolvendo uma imagem rotulada para cada região. O
resultado da segmentação pode ser observado na Figura 32. A segmentação atinge o objetivo,
destacando as áreas de interesse (ROI), que no caso são os núcleos. Todos os pontos menores
que aparecem na imagem segmentada, como das manchas do corante ou material nuclear que
podem ser observados na Figura 32, são eliminados pelo filtro de limite área e perímetro do
algoritmo que desconsidera regiões com áreas muito pequenas ou muito grandes baseadas nos
dados das tabelas de média e desvio padrão. Qualquer região com área ou perímetro menor
que a menor área média menos três desvios padrão (ma - 3dpa), ou maior que a maior área
obtidos da tabela de média e de desvio padrão (mA+3dpA), são desconsiderados. Estes
valores variam com os dados estatístico do classificador, mas representam quantidades da
ordem de 1000 pixels, em imagens de 2MP e 5000 pixels, em imagens de 10,6 MP. Estes
limites foram determinados a partir da observação das dimensões dos núcleos e dos
fragmentos e manchas identificadas pelo aplicativo Imagem Region Analyzer (IRA), do
MATLAB, sendo escolhido o valor de limite inferior que atendesse ao requisito.
Nas duas imagens inferiores da Figura 32 é possível observar que o contorno nos núcleos
na imagem segmentada está bastante coerente com a imagem original, facilitando o
reconhecimento morfológico do núcleo. Segundo Gonzalez e Woods (2000), o processo de
segmentação encerra quando os objetos de interesse tiverem sido isolados.
58
Figura 32 - Imagem segmentada dos núcleos.
3.5 FASE 1 – DETECÇÃO
3.5.1 Representação e descrição
Nesta fase foram usadas duas funções de tratamento de imagem do MATLAB, descritas
no item 2.7.5. A função bwboundaries() rastreia uma imagem segmentada, identificando e
rotulando regiões de interesse, devolvendo um conjunto de vetores com a descrição dos
contornos e uma cópia da imagem segmentada, porém rotulada. Estes contornos vetorizados
são utilizados para marcar os núcleos durante o processamento da imagem e na produção das
informações de saída, como poder ser visto na Figura 33, ou mais adiante, nas Figuras Figura
38, Figura 40 e Figura 41. Estes contornos são utilizados também na identificação de
possíveis núcleos sobrepostos, processados pela função avaliaDivisão(). A função
59
regionprops() do MATLAB retorna diversas propriedades morfológicas sobre as regiões de
interesse, identificadas pela função bwboundaries(), como área, perímetro, solidez e outras
descritas na documentação do MATLAB e presentes no anexo C. As propriedades área,
perímetro, índice de excentricidade, diâmetro equivalente e solidez foram utilizadas neste
trabalho no processo de identificação dos tipos de núcleos, cuja metodologia é apresentada na
seção 3.5.2. O centro de massa, outra das propriedades da função, foi utilizado para marcação
dos rótulos e dos quadros que circundam os núcleos. As demais propriedades disponíveis para
esta função não foram utilizadas neste trabalho.
Figura 33 - Aplicação dos contornos vetorizados nos núcleos das células.
3.5.2 Reconhecimento e interpretação
O processo de reconhecimento está relacionado com as características morfológicas
identificadas ou calculadas na etapa de representação e descrição. A etapa de reconhecimento
e interpretação recebe seis parâmetros morfológicos, denominados de fatores, para calcular a
nota de classificação usada na determinação do tipo de núcleo. Cada fator recebido é
60
submetido à curva normal contabilizada para este mesmo fator, mas particularizada para cada
núcleo, obtendo-se um valor “D” que representa o desvio do valor deste fator com relação à
média deste parâmetro para cada tipo de núcleo. Se o fator recebido estiver próximo à média e
dentro da região de um desvio padrão, o valor D estará entre 1,000 e 0,607, conforme
apresentado na Figura 34. Quanto mais próximo à média, maior é o valor de D e maior é sua
contribuição para a nota de classificação (equação 23). Os seis fatores são submetidos às
curvas normais dos núcleos. A maior nota é usada na classificação do núcleo e uma nota
inferior a 0,067, equivalente ao somatório de seis notas mínimas de D equivalente ao limite de
99,74% de probabilidade de ocorrência desta propriedade, é descartada, não classificando
qualquer núcleo.
Figura 34 - Determinação do valor D.
Foram utilizadas três tabelas para o cálculo da nota de classificação. As tabelas de média e
desvio padrão foram definidas utilizando-se dados morfológicos de cada tipo de núcleo,
baseadas nas imagens de referência. As medidas morfológicas destas imagens foram obtidas
pelo aplicativo Imagem Region Analyzer (IRA), incluído no ambiente do MATLAB. O IRA
abre um arquivo de imagem binário (imagem segmentada) e fornece medidas de 12
propriedades morfológicas. A propriedade área do núcleo em interfase, por exemplo, foi
obtida medindo-se as áreas de vários núcleos na mesma fase, gerando uma média e um desvio
61
padrão para esta propriedade do núcleo nesta fase. A determinação para as demais
propriedades seguiu o mesmo processo, produzindo valores para perímetro, excentricidade,
diâmetro equivalente e solidez, para cada tipo de núcleo. Como é possível que núcleos em
fases diferentes apresentem características morfológicas semelhantes em um ou mais fatores,
a tabela de peso é utilizada para reforçar determinadas características, corrigindo erros na
classificação.
A fórmula de cálculo por fator é apresentada na equação 24, sendo composta de um valor
que depende das informações estatísticas de média e desvio padrão e do peso.
Todos os fatores são calculados da mesma maneira. Os valores dos fatores são
normalizados pela equação 25 e submetidos à curva normal pela equação 26, conforme
demonstrado na Figura 35(a), obtendo-se o valor “D”. Os valores de desvio de média, “D”,
representam o afastamento dos valores dos fatores NXX medidos do objeto presente na
imagem segmentada em relação à média do grupo. O fator perímetro (PE), por exemplo,
medido do objeto sob análise, é normalizado e comparado à curva normal do perímetro da
interfase, produzindo o valor NPE que é armazenado do campo de notas na posição I. Na
sequência do cálculo da nota de classificação (NC), o fator área (AR) é normalizado e
submetido à curva normal, produzindo o valor D e a correspondente nota NAR, para a
interfase, que é adicionada à nota NPE e armazenada na mesma posição I. As demais notas são
calculas e armazenadas no mesmo campo, na mesma posição, formando a nota de
classificação da interfase (NCi = NAPi+NPEi+NEXi+NDEi+NOSi+NARi). Os mesmos fatores são
utilizados para calcular a nota de classificação para a prófase (NCp =
NAPp+NPEp+NEXp+NDEp+NOSp+NARp), da metáfase, anáfase e telófase, apresentados na Tabela
6.
Tabela 6 – Estrutura de cálculo das notas de fator e de classificação.
Finalizando o cálculo com todos os fatores, as notas acumuladas no campo de notas são
comparadas e a maior nota classifica o tipo de núcleo, conforme diagrama apresentado na
Figura 35(b).
Fator AP PE EX DE SO AR Campo de Notas
Valor Fator xAP xPE xEX xDE xSO xAR -
Interfase NAPi NPEi NEXi NDEi NSOi NARi NCi Prófase NAPp NPEp NEXp NDEp NSOp NARp NCp
Metáfase NAPm NPEm NEXm NDEm NSOm NARm NCm Anáfase NAPa NPEa NEXa NDEa NSOa NARa NCa Telófase NAPt NPEt NEXt NDEt NSOt NARt NCt
62
Figura 35 – Esquema de decisão. (a) Determinação do desvio “D” do fator com relação à
média; (b) esquema de cálculo da nota de classificação. AP: área-perímetro; PE: perímetro;
EX: excentricidade; DE: diâmetro equivalente; SO: solidez; AR: área.
𝑁𝑜𝑡𝑎𝐶𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎çã𝑜 = 𝑁𝐴𝑃 + 𝑁𝑃𝐸 + 𝑁𝐸𝑋 + 𝑁𝐷𝐸 + 𝑁𝑆𝑂 + 𝑁𝐴𝑅 (23)
𝑁𝑜𝑡𝑎𝐹𝑎𝑡𝑜𝑟 = 𝐷𝑒𝑠𝑣𝑖𝑜𝐹𝑎𝑡𝑜𝑟(𝑉𝑎𝑙𝑜𝑟𝐹𝑎𝑡𝑜𝑟) ∗ 𝑃𝑒𝑠𝑜𝐹𝑎𝑡𝑜𝑟 (24)
𝑧 =(𝑥 − 𝜇)
𝜎
(25)
𝐷 = 𝑒−𝑧2
2 (26)
Das propriedades disponíveis e presentes no anexo C, cinco foram escolhidas para a
análise de classificação por se apresentarem morfologicamente mais representativas. A Figura
36 mostra a distribuição dos valores destas propriedades para cada tipo de núcleo, em um
gráfico normalizado. As barras representam a variação dos valores de cada propriedade
(fatores) nos núcleos, representando a média, mediana, percentis e máximos e mínimos, e
como estão normalizadas permite a comparação entre as fases nucleares. Este gráfico foi
utilizado para avaliar o comportamentos das 12 propriedades morfológicas disponíveis,
identificando quais destes caracteriza individualmente um tipo de núcleo. A solidez (SO), por
exemplo, identifica unicamente a interfase porque nenhuma outra fase ou estágio nuclear
apresenta este valor tão elevado e concentrado (menor variâcia). O fator área-perímetro (AP)
identifica claramente a metáfase embora para determinados valores, mais elevados, possa
também representar a anáfase, necessitando de outras propriedades para a diferenciação entre
os estágios do núcleo. O fator AP, foi definido pela razão da raiz quadrada da área sobre o
perímetro e escolhido por representar de maneira efetiva os núcleos em metáfase e anáfase
63
que se caracterízam por possuírem perímetro (PE) grande, quando comparados à área (AR),
produzindo um fator de valor reduzido e bem característico para identificar estes núcleos. Por
outro lado, o fator AR elevado e SO reduzido são características marcantes na prófase.
Figura 36 – Comportamento dos fatores morfológicos quanto aos tipos de núcleo. Valores
médios, máximos e mínimos, normalizados. AP: área-perímetro; PE: perímetro; EX:
excentricidade; DE: diâmetro equivalente; SO: solidez; AR: área;
Os núcleos na interfase, além de apresentar SO elevada, são menores e possuem aspecto
quase circular. Núcleos em anáfase são menores que aqueles em metáfase em termos de AR,
mas mantêm perímetro (PE) elevado e SO intermediária. Os núcleos em telófase são menores,
compactos, mas menos circulares, levando ao aumento da excentricidade (EX). Estas análises
mediam a escolha de pesos, que foram obtidos experimentalmente. Os valores de média,
desvio padrão e peso estão consolidados nas Tabelas Tabela 7 e Tabela 8.
A necessidade de alteração dos pesos é definida pela execução do algoritmo nas imagens
de referência. O procedimento de ajustes dos pesos deve ser executado para cada erro de
classificação encontrado, reaplicando o processo descrito no diagrama da Figura 37. No caso
de erro de classificação na imagem de referência, avaliam-se os valores dos fatores que
levaram à classificação equivocada, identificando um fator-candidato que deve ser
64
incrementado continuamente até a correção da classificação. Pode ocorrer neste processo a
alteração na classificação de outro núcleo que estava correto. Isto indica que o valor de
correção já atingiu seu limite e deve ser reduzido para um valor intermediário entre o original
e este limite. Caso não haja correção no valor intermediário, outro parâmetro deve ser
identificado e alterado com base nos valores dos fatores. Para as imagens de 10,6 MP os
ajustes foram convergentes. Para as imagens de 2 MP os valores não convergiram e
mantiveram erros na classificação, entre 2% e 4% do total de núcleos, mesmo ampliando a
base estatística maior, ampliando de 109 núcleos para 220 núcleos, na formação das tabelas.
Procedimentos numéricos, como incrementos contínuos buscando os vales de minimização
dos erros de classificação, ou ferramentas de planilhas com soluções numéricas, não
encontraram resultados melhores que o ajustes manuais encontrados para as imagens de
referência, mas pode sugerir valores iniciais para uma tentativa manual.
Figura 37 - Procedimento para ajuste dos valores dos pesos.
Na Tabela 7 estão valores de média, desvio padrão e peso para processamentos das
imagens de 2 MP e na Tabela 8 para imagens de 10,6 MP, tanto para imagens com perdas na
compactação quanto sem perdas na compactação.
65
Tabela 7 - Valores médios, desvios padrão e pesos aplicados aos fatores para imagens de 2
MP em formato compactado sem perdas (PNG).
A tomada de decisão do esquema de classificação é processada pela escolha do maior
valor entre as notas NCx acumuladas no campo de notas. Não existe valor de guarda que
estabeleça uma ultrapassagem específica (offset) do valor. A decisão é definida diretamente
pelo maior valor presente no campo de notas (decisão abrupta). A decisão suave não foi
implementada, mas poderia ser fornecida por outras fontes de informação, como oriundas da
análise de superfície ou por algoritmos de esqueletização ou por outros recursos.
Fatores Interfase Prófase Metáfase Anáfase Telófase Interfase II
Valores das médias
AP 0,2782 0,2607 0,1395 0,1540 0,2479 0,2821
PE 223 306 542 362 196 175
EX 0,5082 0,5414 0,6558 0,6922 0,7135 0,5514
DE 70,01 89,95 83,59 61,95 54,35 54,58
SO 0,9817 0,9586 0,7208 0,7456 0,9145 0,9765
AR 3942 6370 5512 3024 2328 2368
Valores dos desvios padrão
AP 0,0092 0,0108 0,0203 0,0208 0,0231 0,0138
PE 37 18 90 51 17 28
EX 0,1536 0,1078 0,0943 0,1426 0,1114 0,1001
DE 11,04 4,63 5,82 3,67 3,31 6,28
SO 0,0095 0,0138 0,0663 0,0564 0,0489 0,0155
AR 1133 644 784 354 285 553
Valores dos pesos
AP 1 1 1 1,1 1 1
PE 1 1,5 1 1,5 1 1
EX 1 1 1 1 1 1
DE 1 1 1 1 2,5 1
SO 1 1 1 1 1,1 1
AR 1 1 1,5 2 1 1
66
Tabela 8 - Valores médios, desvios padrão e pesos aplicados aos fatores para imagens de 10,6
MP, em formato compactado com perdas (JPG) e sem perdas (PNG).
3.6 FASE 2 - DIFERENÇAS SIGNIFICATIVAS
Foram necessários ajustes cíclicos para fechar o procedimento. Há repetitividade plena da
detecção das imagens e mesmo com pequenas variações de iluminação o resultado permanece
coerente. Os núcleos em estágios estáveis e livres de interferências e ruídos, com distância
mínima de outros núcleos são detectados e classificados corretamente. Núcleos em estágios
intermediários compartilham informações morfológicas entre as fases, dificultando a
detecção, como anáfases muito próximas ou núcleos em prófase ainda com dimensões
próximas aos núcleos em interfase.
Fatores Interfase Prófase Metáfase Anáfase Telófase
Valores das médias
AP 0,2756 0,2621 0,1465 0,1614 0,2347
PE 313.3 548,4 830,4 586,6 348,7
EX 0,5611 0,5530 0,5755 0,7740 0,7155
DE 97.31 131,7 132,6 103,6 98,18
SO 0,9793 0,9682 0,7502 0,7629 0,9149
AR 7557 15820 13810 8529 6747
Valores dos desvios padrão
AP 0,0055 0,0180 0,0296 0,0223 0,0176
PE 42,96 169,5 172,8 143,1 34,83
EX 0,1798 0,1048 0,1866 0,1070 0,1087
DE 12,59 16,06 4.11 11.72 9,95
SO 0,0117 0,0164 0,0750 0,0449 0,0379
AR 1893 4353 853,7 1869 1470
Valores dos pesos
AP 2 1 1,5 1,6 1
PE 1 1 1 1,5 1
EX 1 1,2 1 1 1
DE 1 1 1 1 1
SO 2 1 1 1 1
AR 1 1,8 1 2 1
67
3.7 FASE 3 – RESULTADOS E DISCUSSÃO
3.7.1 Avaliação com as Imagens de Referência
A imagem de referência apresentada na Figura 23, de alta resolução (10,6 MP) e
compactada com perdas (JPG), foi submetida à contagem automática. Os 34 núcleos foram
localizados e classificados corretamente, conforme apresentados na Figura 38. Os valores
registrados na imagem são os fatores calculados que venceram a disputa para a determinação
da fase nuclear.
Figura 38- Imagem de referência com reconhecimento de todos os núcleos (10,6 MP).
Observação: as quantidades na parte superior da imagem se referem aos tipos de núcleos
identificados pelo algoritmo; a contagem de fases considera os dois núcleos em anáfase e os
dois núcleos em telófase como um único estágio; contornos dos objetos: verde (interfase);
ciano (prófase); magenta (metáfase); amarelo (anáfase), preto (telófase).
A limiarização dinâmica do algoritmo de segmentação, que determina o valor de corte
adequado para cada imagem, conforme descrito na seção 3.4, foi testada para validar o
reconhecimento dos núcleos diante de variações de contraste e iluminação. Foram criadas
cópias modificadas da imagem de referência (10,6 MP), com variações no contraste. Estas
imagens, que reúnem as disposições e formas encontradas para as imagens dos núcleos nas
lâminas, foram submetidas ao algoritmo de reconhecimento, obtendo sucesso nas alterações
68
de iluminação para mais e para menos em até 30% e com nível de reconhecimento de 79%
dos núcleos com redução de 50% nos níveis de tons de cinza, conforme apresentado na
Tabela 9.
Tabela 9 - Resultado do teste de robustez do algoritmo para a imagem de referência
alterada.
Iluminação Reconhecimento
Escurecida em 10% e 30% 100%
Clareada em 10% e 30% 100%
Escurecida em 50% 79%
O resultado do processamento da imagem de referência de baixa resolução em um teste de
reconhecimento é apresentado na Figura 39.
Figura 39 - Imagem de referência (2 MP) com reconhecimento parcial os núcleos.
Observação: contorno em vermelho: objeto não classificado; sem contorno: objeto
identificado, encostado na borda da imagem ou com área acima do limite; contornos em
outras cores indicam reconhecimento: verde (I); ciano (P); magenta (M); amarelo (A), preto
(T).
69
Os núcleos na parte inferior direita da imagem não foram detectados/classificados pela
extensa área formada pela sobreposição de diferentes núcleos que formam, após a
segmentação, um único objeto. O algoritmo elimina objetos com áreas e perímetros fora da
região de 99,74% da curva normal (Figura 34), equivalente a três desvios padrão para mais e
para menos da média, que resultam em áreas entre, aproximadamente, 600 e 8000 pixels, nas
imagens de baixa resolução e entre 2000 e 30000 pixels, nas imagens de alta resolução. As
áreas com contornos vermelhos são objetos que foram identificados como núcleos, mas não
foram classificados por apresentarem contornos irregulares (lateral inferior esquerda e área
superior central) ou estarem ligados por pontes, apresentando um formato de haltere ou
ampulheta (região inferior direita e superior esquerda). Nestas condições, via de regra, o
resultado do cálculo dos fatores fica abaixo do limiar de decisão.
Nesta seção estão sendo apresentados os resultados do processo de detecção de núcleos
nas imagens, mesmo com classificação incorreta. As análises referentes à avaliação do
processo de classificação são vistas na seção 3.7.2.
3.7.2 Avaliação com as imagens de lâminas de A. cepa
Para avaliação de desempenho, cinco imagens reais, em formato de compactação com
perdas, foram submetidas ao algoritmo, com medição do tempo de execução do
processamento completo do algoritmo. Os resultados são apresentados na Tabela 10,
mostrando que o pré-processamento e a segmentação consumiram cerca de 4 segundos e que
o processamento dos núcleos consumiu em torno de 25 segundos, detectando em média
93,4% dos núcleos da imagem.
Tabela 10 - Levantamento de tempo de classificação do procedimento.
Imagem
Tempo de Processamento (s) Objetos
Detectados
(OD)
Núcleos
Detectados
(ND)
ND/OD Pré-processamento Núcleo
1 3,54 25,22 77 67 87,0%
2 3,60 24,43 86 83 96,5%
3 3,95 25,34 165 148 89,7%
4 3,40 22,04 140 135 96,4%
5 3,62 24,06 156 150 96,2%
Totais 132,2 624 583 93,4%
70
As Figuras Figura 40 e Figura 41 mostram os resultados da contagem automáticas para
duas imagens de laboratório, de alta resolução (10,6 MP) em formato de compactação com
perdas (JPG), nas quais o algoritmo detectou 128 núcleos de 130 objetos identificados e 158
núcleos de 163 objetos detectados, respectivamente. Cada contorno vermelho indica um
problema na classificação de núcleo. Os valores apresentados são os resultados do cálculo dos
fatores. Pode ser observado netas figuras ainda, que parte dos núcleos não classificados são
agregações (sobreposições) de núcleos, impurezas do processo de preparação ou material
nuclear espalhado na lâmina.
Figura 40 - Imagem real de laboratório - Imagem_98. Imagem de 10,6 MP com
compactação com perdas. Na telófase (T) o valor 16 representa a quantidade de objetos com
aspectos de telófase, entretanto a telófase é contabilizada como metade inteira maior deste
valor.
Quanto aos aspectos morfológicos nas fases da mitose das células, foram evidenciados
que, embora os núcleos em prófase apresentaram maior variação na propriedade área, a razão
Área/Perímetro (AP) permanece semelhante ao longo da fase, o que permitiu o emprego desta
71
como fator de identificação. O fator AP também foi importante na metáfase que apresentou
um valor baixo ao longo de toda a evolução fase. O fator solidez (SO) mostrou-se elevado na
interfase e telófase, mas baixo nas demais fases. Embora cada fator traga apenas uma parte da
informação, o relacionamento entre os fatores permitiu uma identificação mais precisa do tipo
de núcleo.
Figura 41 - Imagem real de laboratório - Imagem_54. Imagem de 10,6 MP com
compactação com perdas. Os valores de anáfase e telófase no alto da imagem representam
objetos com aspecto classificado como anáfase e telófase. A fase é contabilizada como a
metade inteira maior destes valores.
Os procedimentos práticos do ensaio com A. cepa envolvem dois métodos de
contabilização. O primeiro, mais antigo, considera a utilização de um microscópio óptico
convencional (sem câmera) para a contagem de 50 células por imagem enquadrada no campo
de visão. Mesmo que existam mais células no enquadramento, são contadas apenas 50. O
segundo procedimento, mais recente, utiliza microscópios com câmeras para capturar a
imagem enquadrada no campo de visão, permitindo a realização a contagem pela imagem.
72
Neste caso, entretanto, todas as células da imagem capturada são contadas, não se limitando
às 50 células do primeiro procedimento. Independentemente do procedimento adotado, nos
dois métodos contam-se pelo menos 500 células por lâmina de teste. Esta quantidade mínima,
por campo de visão, é corroborada por vários trabalhos que estabelecem contagens de pelos
menos 500 núcleos por lâmina (HENRIQUE, 2014; MORO et al., 2017; PEIXER, 2016;
POLETTO et al., 2011). Desta forma, pelos procedimentos descritos, a contagem de 50
núcleos por imagem estaria compatível com procedimentos práticos adotada e aceitos nos
ensaios com A. cepa. Isto permitiria, alternativamente, aumentar o limiar de classificação do
algoritmo para melhorar a exatidão no reconhecimento, até atingir a meta de classificação
corretamente de 50 núcleos por imagem.
Figura 42 - Contagem manual da imagem 98. Verde (I), ciano (P), magenta (M), amarelo (A),
cinza (T) e vermelho (não classificado).
73
Figura 43 - Contagem manual da imagem 54. Verde (I), ciano (P), magenta (M), amarelo (A),
cinza (T) e vermelho (não classificado).
A contagem de núcleos e o índice mitótico obtidos pela contagem automáticas foram
comparados com os procedimentos manuais. O algoritmo, embora não tenha identificado
todos os núcleos na imagem, classificou mais 96% núcleos. As figuras 42 e 43 apresentam as
contagens manuais da imagem 98 e 54, respectivamente, permitindo a comparar os resultados
apresentados na Tabela 11.
Tabela 11- Comparação entre contagem manual (referência) e automática.
Interfase Prófase Metáfase Anáfase Telófase Total IM %
Manual 98 78 36 0 0 7 121 35,5
Manual 54 51 100 1 2 3 157 67,5
Total 129 136 1 2 10 278 53,6
Automática 98 88 22 2 0 8 120 26,7
Automática 54 64 56 3 1 17 141 54,6
Total 152 78 5 1 25 261 41,8
Diferença 23 58 4 1 15 101
Diferença % 17,8 42,6 400 50 150 36,3 11,8
74
Ao longo da interfase as dimensões dos núcleos nas células de A. cepa aumentam, mas
não afeta significativamente seus aspectos morfológicos. Nesta fase, entretanto, observam-se
mais distorções na forma, aparentemente, provocadas pelo processo de preparação das
lâminas. Apesar destas variações, a classificação da interfase apresenta a menor taxa de
diferença na identificação com 17,8% de variação. Os núcleos das células em prófase variam
nas dimensões e forma ao longo do estágio, dificultando a identificação, considerando que a
referência estatística é única para toda a fase, criada a partir de núcleos com parâmetros
morfológicos diferentes, pertencentes a mesma fase. A identificação apresentou uma
diferença total de 42,6% na prófase. Os núcleos nos estágios da metáfase, anáfase e telófase
ocorrem em menor quantidade e muitas vezes sobrepostos, dificultando a obtenção de valores
de diferença mais consistentes em poucas imagens.
Mesmo apresentando uma variação relativamente grande nas contagens por fase, não
foi observada uma variação muito significativa no índice mitótico (IM), observada na Tabela
11, apresentando 11,8% de variação total. Esta hipótese é confirmada pela ANOVA, com
teste Tukey, para conjunto de dados com distribuição normal, para 5% de significância (α =
0,05), aplicada ao índice mitótico. Desta forma, não foram encontradas evidências de
diferenças significativas no índice mitótico entre os procedimentos manuais e automáticos (p
= 0,060309). Os resultados estatísticos foram obtidos pelo software Statistica – Tibco
Software Inc, versão 13.4.0.18, submetendo os dados ao teste de normalidade de Shapiro-
Wilk.
A matriz de confusão, que apresenta uma forma objetiva de medição de qualidade da
classificação dos núcleos, é apresentada na Tabela 12. A tabela foi construída a partir dos
dados obtidos das imagens 54 e 98, analisadas anteriormente nesta seção. A matriz aponta que
a taxa de classificação global correta (acurácia do classificador) é de 63,8%, obtida pela razão
entre todos verdadeiros positivos (VP) e verdadeiros negativos (VN), presentes na diagonal
principal da tabela, em negrito, e pelo valor do total geral submetido ao classificador. A
diferença nos valores totais entre as Tabelas Tabela 11 e Tabela 12, ocorrem pelas relações
entre núcleo e fase, nas quais interfase, prófase e metáfase possuem a relação de 1:1 entre
núcleo e fase e anáfase e telófase possuem a relação 2:1. No falha de classificação que
determine que uma célula esteja na interfase (uma fase), estando realmente na telófase (meia
fase), surge um erro na contagem de meia fase para mais, assim como, de outra forma, surge
um erro nos totalizadores de meia fase para menos caso uma célula em interfase seja
classificada como na telófase.
75
Tabela 12 - Matriz de confusão do classificador aplicado às imagens 54 e 98.
Previsto (automático)
Fases I P M A* T* Imp** Falso Negativo
(FN)*** Total
Real
(manual)
I 94 7 0 0 14 0 21 115
P 48 68 1 1 8 2 60 128
M 0 0 1 0 0 0 0 1
A 0 0 2 0 0 0 2 2
T 10 3 0 0 3 0 13 16
Imp** 0 0 1 0 0 5 1 16,7
Falso Positivo
(FP)*** 58 10 4 1 22 2
(VP+VN)***
171
Acurácia
Geral
Total 152 78 5 1 25 7 Total Geral 268 63,8%
* Metade do valor contado, pois dois núcleos representam uma célula no ciclo celular.
** Impurezas da lâmina, lamínula ou espalhamento de material nuclear.
*** VP: verdadeiro positivo; VN: verdadeiro negativo; FP: falso positivo; FN: falso negativo.
Um teste completo com lâminas de A. cepa foram realizados com imagens de baixa
resolução (2 MP), compactadas em formato sem perdas (PNG). O algoritmo foi alterado para
suportar a resolução mais baixa, afetando as rotinas de acesso aos arquivos e as tabelas
estatísticas do classificador, geradas a partir de uma nova imagens de referência nesta
resolução, como a imagem apresentada na Figura 39. Os resultados das contagens manuais e
automáticas de nove lâminas (um tratamento) foram utilizados para realizar a análise
comparativa da acurácia do algoritmo, cujos resultados são apresentados na Tabela 13. Há
diferenças entre as quantidades de fases contabilizadas que, consequentemente, produzem
alteração do índice mitótico. A ANOVA, com teste Tukey, para dados paramétrico, com teste
de significância de 5%, não apresentou diferenças significativas entre os valores médios de
IM determinados pela contagem manual e pela contagem automática (p = 0,369778),
indicando que mesmo com os erros na classificação registrados nas tabelas, as médias dos
valores de IM são “estatisticamente iguais” com uma confiança de 95%.
O tempo empregado no processamento manual de cada lâmina encontra-se entre 40 e 120
minutos, dependendo da experiência do analista. Neste ensaio, que serviu de base comparativa
entre os procedimentos, foi considerando que o envolvimento do analista na contagem das
células empregaria um esforço de 6 a 18 horas de trabalho para chegar aos valores finais do
índice mitótico. A Tabela 13 apresenta o total de células contadas e o tempo gasto no
processamento automático que foi de 4 minutos e 24 segundos.
Não existe, em princípio, uma faixa de valores para IM, sendo sempre analisado de forma
comparativa, entre IM do mesmo tratamento ou entre IM de outros tratamentos. As alterações
nos valores de IM dependem do procedimento aplicado ao organismo, do organismo e de
76
fatores ambientais que costumam ser controlados por estufa. Os valores F1x.y são valores
para o mesmo tratamento que deveriam ser, intuitivamente, semelhantes. Entretanto, existem
variações que são compensadas pelas réplicas do teste (nove lâminas, de três organismos, com
três bulbos de cada organismo) e pelos métodos estatísticos.
Tabela 13 – Determinação dos índices mitóticos (IM) para nove lâminas de um mesmo
tratamento com ensaio utilizando A. cepa. Imagens de 2 MP com compactação sem perdas. O
prefixo M indica contagem manual e prefixo A contagem automática.
Lâminas Interfase Prófase Metáfase Anáfase Telófase Índice mitótico %
M F11.1 914 39 12 13 22 8,6
M F11.2 860 99 13 9 19 14
M F11.3 927 36 14 6 17 7,3
M F12.1 867 91 16 6 20 13,3
M F12.2 916 63 10 5 6 8,4
M F12.3 852 118 13 6 11 14,8
M F13.1 840 123 15 12 10 16
M F13.2 843 136 6 8 7 15,7
M F13.3 833 124 15 19 9 16,7
Lâmina Interfase Prófase Metáfase Anáfase Telófase Índice mitótico % Duração (s)
A F11.1 860 105 14 2 19 14.00 27.090
A F11.2 811 70 17 23 63 17.58 49.106
A F11.3 836 99 26 13 26 16.40 34.449
A F12.1 890 36 7 2 65 11.00 20.178
A F12.2 924 10 3 1 62 7.60 16.505
A F12.3 913 41 4 3 39 8.70 19.807
A F13.1 905 55 9 4 27 9.50 19.043
A F13.2 953 7 2 1 37 4.70 23.679
A F13.3 946 16 5 2 31 5.40 53.585
O conjunto de imagens das lâminas RP11 e RP12 foram originalmente obtidas em alta
resolução e em formato sem perdas. Estas mesmas imagens foram convertidas para formato
com perdas, passando a coexistir dois conjuntos iguais de imagens (mesmo conteúdo), mas
com formatos diferentes. Os dois conjuntos de imagens foram submetidos ao procedimento de
contagem automática para permitir uma comparação entre eles e com a contagem manual,
definida como controle negativo. O algoritmo foi ligeiramente modificado para apresentar o
resultado da contagem imagem a imagem, totalizando 3385 células contabilizadas. Os
resultados das contagens manuais e automáticas são apresentados nas Tabelas Tabela 14 e
Tabela 15, respectivamente. As nove imagens de cada lâmina foram processadas nesta
resolução em menos de dois minutos.
77
Tabela 14 - Contagem manual de fases das imagens das lâminas RP11 e RP12. Imagens
de 10,6 MP com compactação sem perdas.
Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM
RP11
482 63 144 3 1 2 213 70,4%
483 97 82 5 6 1 191 49,2%
484 80 105 4 2 8 199 59,8%
485 118 82 2 4 3 209 43,5%
486 168 36 2 2 2 210 20,0%
487 130 109 6 4 9 258 49,6%
488 154 148 2 5 4 313 50,8%
489 197 150 2 4 5 358 45,0%
Total 1007 856 26 28 34 1951 48,4%
RP12
427 26 55 0 0 4 85 69,4%
428 66 71 1 4 9 151 56,3%
429 92 105 2 1 2 202 54,5%
430 100 78 2 1 2 183 45,4%
431 100 20 1 1 3 125 20,0%
432 99 110 1 0 3 213 53,5%
433 154 65 2 1 4 226 31,9%
434 117 122 4 1 5 249 53,0%
Total 754 626 13 9 32 1434 47,4%
Tabela 15 - Contagem automática de fases das imagens das lâminas RP11 e RP12.
Formato sem perdas (PNG).
Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM
RP11
482 29 160 6 1 11 207 86,0%
483 52 120 4 3 8 187 72,2%
484 71 109 3 2 14 199 64,3%
485 78 100 1 2 14 195 60,0%
486 135 58 3 2 8 206 34,5%
487 170 103 8 3 25 309 45,0%
488 163 134 3 2 23 325 49,8%
489 183 139 7 2 17 348 47,4%
Total* 881 923 35 17 120 1976 55,4%
RP12
427 30 43 5 2 9 89 66,3%
428 36 63 7 4 19 129 72,1%
429 42 129 3 1 15 190 77,9%
430 52 90 4 3 23 172 69,8%
431 33 74 5 4 20 136 75,7%
432 116 78 3 3 30 230 49,6%
433 114 94 5 2 18 233 51,1%
434 84 137 4 2 18 245 65,7%
Total* 507 708 36 21 152 1424 64,4%
* Tempo de processamento da lâmina: RP11 = 01:31.659; RP12 = 01:52.231
78
Tabela 16 - Contagem automática de fases das imagens das lâminas RP11 e RP12.
Formato com perdas (JPG).
Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM 482 37 157 6 1 9 210 82,4% 483 63 114 3 4 7 191 67,0% 484 90 96 4 2 9 201 55,2% 485 63 84 3 7 19 176 64,2% 486 151 45 2 3 7 208 27,4% 487 196 84 5 4 24 313 37,4% 488 196 112 4 3 17 332 41,0% 489 216 109 7 2 16 350 38,3%
Total 1012 801 34 26 108 1981 48,9% 427 34 42 4 2 8 90 62,2% 428 51 68 4 2 14 139 63,3% 429 50 126 4 1 14 195 74,4% 430 72 83 4 4 18 181 60,2% 431 44 70 8 5 19 146 69,9% 432 144 67 4 3 20 238 39,5% 433 134 82 5 3 16 240 44,2% 434 102 125 2 2 14 245 58,4%
Total 631 663 35 22 123 1474 57,2%
* Tempo de processamento da lâmina: RP11 = 01:31.243; RP12 = 01:56.825
A ANOVA, com teste Tukey, para dados paramétricos, para 5% de significância, não
apresentaram diferenças significativas entre os pares de médias do IM entre a contagem
manual e a contagens automáticas das lâminas RP11 e RP12, ou entre os formatos de
imagem, indicando que mesmo com diferenças na classificação, não se pode descartar as
semelhança estatística dos resultados do IM, conforme apresentado na Tabela 17.
Tabela 17 – ANOVA, com teste Tukey, com nível de significância de 5%, aplicado no IM das
lâminas RP11 e RP12. Contagem manual comparada com a contagem automática. Não há
evidências de diferenças significativas entre as médias de IM entre todos grupos.
N Tratamento {1} 0,48545 {2} 0,47988 {3} 0,57402 {4} 0,66017 {5} 0,57671 {6} 0,59001
1 Manual RP11 1,000000 a 0,999261 a 0,636475 a 0,821647 a 0,723914 a
2 Manual RP12 1,000000 a
0,998080 a 0,588990 a 0,782832 a 0,678714 a
3 S5-PNG RP11 0,999261 a 0,998080 a
0,837697 a 0,951204 a 0,897797 a
4 S5-PNG RP12 0,636475 a 0,588990 a 0,837697 a
0,999549 a 0,999992 a
5 S5-JPG-RP11 0,821647 a 0,782832 a 0,951204 a 0,999549 a 0,999975 a
6 S5-JPG-RP12 0,723914 a 0,678714 a 0,897797 a 0,999992 a 0,999975 a
3.7.3 Discussão sobre os resultados.
Os resultados da contagem automática realizada pelo algoritmo apresentaram-se em
igualdade estatística com os resultados da contagem manual, tanto em imagens de baixa
79
resolução quanto em de alta resolução, tanto em imagens compactadas sem perdas (ISP)
quanto em imagens com perdas na compactação (IPC). A segmentação não consegue
encontrar sempre o valor limiar para a separação dos tons de cinza em todos as regiões da
imagem. O limiar dinâmico implementado por Otsu não encontra valor adequado em imagens
muito esparsas e o limiar dinâmico determinado pelo algoritmo de detecção de vales,
implementado em MATLAB, tem maior dificuldade nas imagens com aspecto do histograma
bimodal.
O nível de acurácia obtido da matriz de confusão em 63,8%, pode sinalizar atenção quanto
à estabilidade no reconhecimento e sugerir uma análise dobre fatores que afetam o correto
reconhecimento. Não existe neste momento um padrão rígido para a aquisição das imagens.
Alterações pouco perceptíveis aos observadores, afetam de forma muitas vezes significativa a
taxa de reconhecimento, como discutido à frente.
Torna-se necessário melhorar a robustez do classificador, sendo que alguns motivos já são
bem conhecidos como a sobreposição de núcleos. Muitos núcleos, com fases bem definidas,
são ignorados na classificação por formarem áreas maiores que os limites de corte. Atuar
nesta separação pode aumenta a taxa de acerto. Por outro lado, os tipos diferentes de
ocorrências de sobreposições são grandes, variando do tipo núcleo ao grau da sobreposição e
do ângulo de contato, ou ainda pela grande de núcleos participantes, dificultando a
determinação de ações mais efetivas.
Atuar na iluminação mais uniforme do microscópio ou na correção desta distorção pode
reduzir os problemas de segmentação que alteram os parâmetros morfológicos dos núcleos.
Na Figura 44, são apresentados alguns pontos que podem ser abordados na melhoria do
reconhecimento dos núcleos. Parte das falhas tem relação com a aquisição das imagens, outra
parte com o pré-processamento e algumas pertencem à natureza do processo de confecção das
lâminas. A proximidade entre núcleos e a sobreposição de núcleo são condições que estarão
sempre presentes na lâmina. O tratamento das situações mais simples como em E, conseguem
ser separado na pré-classificação pelo procedimento avaliaDivisão(), que encontram os
pontos de contado do contorno e traçam uma linha de valor de fundo entre eles, separando os
núcleo mas inserindo uma distorção no contorno. A taxa de sobreposição pode ser definida
pela razão da quantidade de núcleos sobrepostos pelo total de núcleos da imagem. A Tabela
18 apresenta taxas de sobreposições das imagens da lâmina RP11, antes e depois da execução
da função de divisão.
80
Tabela 18 - Taxa de sobreposição
Imagem Sobreposição original Taxa de sobreposição
original
Sobreposição após
divisão
Taxa de sobreposição
após divisão
482 6/223 2,7% 2/225 0,9%
483 6/209 2,9% 2/211 0,9%
484 5/222 2,3% 4/225 1,8%
485 4/220 1,8% 2/222 0,9%
486 18/220 8,2% 10/226 4,4%
487 70/334 21,0% 37/353 10,5%
488 160/334 47,9% 103/369 27,9%
489 163/350 46,6% 107/365 29,3%
O tratamento das situações mais simples como em E, que conseguem ser separado na pré-
classificação pelo procedimento avaliaDivisão(), resolvem metade dos casos, como pode ser
observado na Tabela 18. Outras formas de sobreposições não são tratadas e podem ser
resolvidas por transformadas aplicadas localmente. Alterações observadas em A e D,
aparentemente são mais difíceis de se identificar e de resolver. Em B, equalização ou
filtragem locais podem resolver o problema de fusão do objeto com o fundo, situação
normalmente produzida por iluminação não uniforme na imagem. Outra solução possível
seria a segmentação local gradual, avaliando as alterações na imagem pela alteração
controlada do limitar de corte, quase como o levantamento de uma curva de nível, ou por
processos de erosão ou abertura, como observado em C.
Figura 44 – Aspectos de melhorias: (A) proximidade entre dois núcleos que foram
segmentados com um único objeto; (B) núcleo mesclado com fundo; (C) ligação entre
núcleos; (D) sobreposição de núcleos; (E) contato entre núcleos.
Aspectos que precisam de atenção são bolhas e impurezas nas lâminas. Contornos da
solução (Figura 45), bolhas (Figura 46), e impurezas (Figura 47) produzem regiões que
podem ser reconhecidas como objetos, dificultando ou impedindo o correto reconhecimento e
classificação dos núcleos.
81
Figura 45 – Contornos da solução na lâmina: (a) imagem binária; (b) imagem
monocromática; (c) imagem colorida.
Figura 46 - Bolhas e contorno da solução: (a) imagem colorida; (b) transformação de alto
contraste; (c) imagem binária.
Figura 47- Impurezas das lâminas: (a) impureza entre contorno e núcleo; (b) união de
áreas pela interpretação da impureza como parte do objeto.
Outras técnicas podem contribuir de forma significativa na identificação dos núcleos e do
conjunto de impurezas. A utilização de outros canais de cor em conjunto poder solucionar
82
alguns problemas documentados, como o emprego do canal de saturação do modelo HSV
pode atenuar os efeitos das bolhas, contorno da solução e impurezas. Já algoritmos como o
esqueletização ou de afinamento podem auxiliar na discriminação dos núcleos. Na Figura 48
pode ser observado que os núcleos em prófase, mesmo com dimensões diferentes, possuem
esqueletos semelhantes. Ainda pode ser observado que o núcleo em interfase, mesmo com
dimensões intermediárias entre os dois núcleos em prófase, apresenta um esqueleto distinto.
Entretanto há um custo de processamento no emprego deste algoritmo. Foi responsável por
cerca de 70% do tempo de processamento nos testes realizados.
Figura 48 - Algoritmo de esqueletização.
A reprodução celular é um evento contínuo de crescimento e divisão, embora seja
caracterizado na literatura pelos aspectos morfológicos discretos mais representativos de cada
fase e estágio. É possível observar que os núcleos apresentam variações significativas na
forma e tamanho mesmo pertencendo às mesmas fases e estágios. Uma estratégia para
minimizar este tipo de erro seria produzir subclassificações, melhorando o reconhecimento
corretos das fases nucleares intermediária, como realizado para as imagens de 2 MP que
recebeu uma subclasse que discriminava a subfase do início de interfase, denominado
interfase II, que minimizou a classificação incorreta da interfase por telófase e permitiu atingir
nível se significância na média do IM. Os relatórios de Pires (2001) que trazem uma
subdivisão da fases da mitose do A. cepa, apresentada na Figura 49, motivam a criação de um
dicionário completo e detalhado das fases do ciclo mitótico que poderiam servir de referência
confiável para consulta, evolução ou novos desenvolvimentos de algoritmos. Este dicionário
ou gabarito poderiam ser explorados para melhorar o desempenho do algoritmo, pelo emprego
83
estatística da mais próxima de certas dimensões, tornando cálculo dos fatores mais efetivos
nestas subdivisões. A supersubdivisão pode representar um problema na especialização
elevada sobre os mesmos parâmetros estatísticos, não conseguindo distinguir entre dois tipos
de núcleo. Não foi possível obter o mesmo sucesso da interfase II, implementado no
classificador de baixa resolução, no modelo estatístico das imagens de alta resolução
implementado nas subfases F e G. A quantidade de falsos positivos aumentou muito entre
interfase (inicio de fase) e telófase. Outros aspectos morfológicos podem ser avaliados para
ajudar a distinguir entre fases, talvez combinados com analise de textura e níveis adicionais de
segmentação local para obter mais informação do objeto.
Figura 49 - Subdivisão da mitose do A. cepa. (A) interfase; (B) prófase; (B1) início da
prófase; (B2) meio da prófase; (B3) final da prófase; (C) pro-metáfase; (D) metáfase; (E)
anáfase; (E1) início da anáfase; (E2) meio da anáfase; (E3) final da anáfase;(F) telófase; (F1)
início da telófase; (F2) meio da telófase; (F3) final da telófase; (G) células filhas em interfase;
A criação de imagens de referências reais capturadas em alta e em baixa resolução, com
discriminação individual dos núcleos, retomando as Figuras Figura 42 e Figura 43, auxiliaria
incontestavelmente na criação de uma base estatística mais sólida e na avaliação da qualidade
do classificador, permitindo a comparação núcleo a núcleo para uma grande quantidade de
objetos, melhorando a qualidade da análise.
84
4 CONCLUSÕES
O algoritmo realiza o processamento das imagens das lâminas de Allium cepa,
identificando e contando núcleos nas fases da mitose, calculando e apresentando o índice
mitótico por lâmina. A classificação dos núcleos apresenta uma acurácia geral de 63,8%,
determinada por matriz de confusão para imagens de alta resolução em formato de
compactação com perdas (CCP - formato JPG). Não foram encontradas evidências de
diferenças significativas, ao nível de 5%, nos valores médios do índice mitótico (IM) entre a
contagem manual e a automática. A análises de variância (ANOVA) com teste Tukey ao nível
de 5%, foi realizada para imagens de baixa (2 MP) e alta resolução (10,6 MP), para formato
de compactação sem perdas (CSP – formato PNG) e formato CCP. Todos os conjuntos de
imagens apresentaram igualdade estatística, indicando que a contagem manual, que a
contagem sobre imagem em formatos com perdas e com formatos sem perdas, são
equivalentes. O processamento com as imagens em formato CCP apresenta adicionalmente
características interessantes como menor espaço de armazenamento (90% menor), maior
velocidade e na captura da imagem (20% menor), que provavelmente representam uma
vantagem sobre outras formas uma vez que não apresentou diferenças significativas no IM,
independentemente do formato de arquivamento da imagem.
O processamento das imagens ocorre de forma rápida, se comparado ao processo manual,
analisando as imagens de uma lâmina (1000 células) em menos de um minuto para imagens
de baixa resolução e em torno de 1 minuto e 40 segundos para imagens de alta resolução,
cerca de quarenta vezes e vinte e cinco vezes mais rápido que o processamento manual,
respectivamente. É necessário acrescentar um tempo médio de, aproximadamente, 5 minutos
para a aquisição de cerca de vinte imagens, que é uma referência prática.
A utilização do algoritmo em laboratório para ensaios ambientais pode trazer impactos
significativos nos procedimentos e na otimização de recursos, uma vez que a análise
estatística do IM apresentou semelhança estatística nos resultados com confiança de 95%,
permitindo realizar uma contagem rápida de uma atividade com muito envolvimento humano.
Entretanto, necessitará inicialmente de supervisão em função da captura manual das imagens,
que variam e podem lavar a falhas adicionais na contagem e no IM, ocasionadas por
alterações nos padrões de entrada para aquisição digital como foco, iluminação e ampliação.
Características intrínsecas da preparação das lâminas, como impurezas existentes na
lamínula e, principalmente, sobreposição celular, ainda são desafios na busca da classificação
dos núcleos envolvidos nestes problemas e, consequentemente, na eficiência geral do
85
algoritmo. A sobreposição pode chegar a 30% nas imagens densas e ficar abaixo de 4% nas
imagens esparsas. O recurso de separação de núcleos implementado no algoritmo consegue
dividir adequadamente apenas dois núcleos com padrões morfológicos mais regulares
circulares ou elípticos, moderadamente sobrepostos, reduzindo em cerca de 50% as
sobreposições existentes na imagem. Nos demais modos de sobreposição não há
reconhecimento ou se traduzem em erros na classificação.
Foram observadas muitas variações significativas para o processamento de imagens, nos
aspectos morfológicos dos núcleos ao longo das fases, além das cinco ou seis normalmente
tipificadas na literatura. Núcleos que se encontravam no início ou no final das fases ou
estágios, principalmente na prófase, interfase e telófase, que ainda guardavam características
morfológicas das fases ou estágios anteriores, registraram maior dificuldade na correta
classificação. A divisão das fases em subfases pode melhorar o reconhecimento pela
especialização do perfil morfológico. Esta subdivisão exigiria o desenvolvimento de um
dicionário ou gabarito detalhado de todos os aspectos da evolução das formas nucleares do A.
cepa na mitose, que auxiliaria maneira singular na evolução do algoritmo, em novas pesquisas
e no treinamento de alunos e equipes na técnica para observação em laboratórios. O
desempenho nas imagens de baixa resolução foi melhorado pela implementação de uma
subfase interfase nas tabelas estatísticas do classificador.
Técnicas para análise de textura e transformadas como de Hough para elipse ou
descritores de Fourier, aplicadas nas imagens monocromática, poderiam gerar um conjunto
completar de informações de significativa relevância na inferência de fase mitótica e na
correção das sobreposições nucleares.
86
REFERÊNCIAS
ALBERTS, B. et al. Fundamentos da biologia celular - 4. ed. [s.l.] Artmed, 2011.
ALVES, G. M. Método fundamentado em processamento digital de imagens para
contagem automática de unidades formadoras de colônias. 2006.
BACKES, A. R.; SÁ JUNIOR, J. J. DE M. Introdução à visão computacional usando
MATLAB - 1. ed. 1. ed. [s.l.] ALTA BOOKS, 2016.
BAGATINI, M. D.; SILVA, A. C. F. DA; TEDESCO, S. B. Uso do sistema teste de
Allium cepa como bioindicador de genotoxicidade de infusões de plantas medicinais. Rev
Bras Farmacogn, v. 17, n. 3, p. 444–447, 2007.
BALLESTEROS, R.; ORTEGA, J. F.; MORENO, M. Á. FORETo: New software for
reference evapotranspiration forecasting. Journal of Arid Environments, v. 124, p. 128–
141, 2016.
BIANCHI, J. Análise dos efeitos citotóxicos, genotóxicos e mutagênicos do inseticida
malation, utilizando os sistemas teste de Allium cepa e células de mamíferos. [s.l.]
Universidade Estadual Paulista (UNESP), 2008.
BIO-RAD. TC20TM Automated cell counter. Disponível em: <http://www.bio-
rad.com/pt-br/product/tc20-automated-cell-counter?ID=M7FBG34VY>.
CHAUHAN, L. K. S.; SAXENA, P. N.; GUPTA, S. K. Cytogenetic effects of
cypermethrin and fenvalerate on the root meristem cells of Allium cepa. Environmental and
Experimental Botany, v. 42, n. 3, p. 181–189, 1999.
CÓRCOLES, J. I. et al. Estimation of leaf area index in onion (Allium cepa L.) using an
unmanned aerial vehicle. Biosystems Engineering, v. 115, n. 1, p. 31–42, 2013.
FACHINETTO, J. M. et al. Efeito anti-proliferativo das infusões de Achyrocline
satureioides DC (Asteraceae) sobre o ciclo celular de Allium cepa. Brazilian Journal of
Pharmacognosy, v. 17, n. 1, p. 49–54, 2007.
FARIA, M. L. C. DE et al. Potencial de citotoxicidade e mutagenicidade das águas do rio
Jaru, Estado de Rondônia, em células de Allium cepa. v. 11, p. 104–114, 2017.
FISKESJÖ, G. The Allium test as a standard in environmental monitoring. Hereditas, v.
102, n. 1, p. 99–112, 1985.
FISKESJÖ, G. The Allium test - an alternative in environmental studies: the relative
toxicity of metal ions. Mutation Research - Fundamental and Molecular Mechanisms of
Mutagenesis, v. 197, n. 2, p. 243–260, 1988.
FOLGADO, C. A luta constante contra os agrotóxicos. Brasil de Fato, 2013.
87
GIMP. Glossário GIMP. Disponível em:
<https://docs.gimp.org/2.8/pt_BR/glossary.html>.
GONZALEZ, R. C.; WOODS, R. E. Processamento de imagens digitais. [s.l.] Edgard
Blucher, 2000.
GRANT, W. F. Higher plant assays for the detection of chromosomal aberrations and
gene mutations-a brief historical background on their use for screening and monitoring
environmental chemicals. Mutation Research - Fundamental and Molecular Mechanisms
of Mutagenesis, v. 426, n. 2, p. 107–112, 1999.
GUERRA, M.; SOUZA, M. J. Como observar cromossomos: um guia de técnicas em
citogenética vegetal, animal e humana. 1° Ed. ed. [s.l.] FUNPEC, 2003. v. 1
HENRIQUE, F. DOS R. Avaliação toxicológica de dois antibióticos com o uso do teste
Allium cepa. [s.l.] Universidade Positivo, 2014.
IMAGING, L. Automated Scoring of In Vitro Micronucleus Assay MicroNucleus,
[s.d.]. Disponível em: <https://www.laboratory-
imaging.com/pub/downloads/products/Lucia/lucia_micronucleus/Promotion_Materials/LUCI
A_MicroNucleus_eng.pdf>
ITU-R. Studio encoding parameters of digital television for standard 4:3 and wide-
screen 16:9 aspect ratios BT Series Broadcasting Service - BT.601-7 -Internacional
Telecomunication Union - Radiocomunication Sector, , 2011. Disponível em:
<https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.601-7-201103-I!!PDF-E.pdf>
LAZZERI, T. Agrotóxicos: Brasil libera quantidade até 5 mil vezes maior do que Europa.
Reporter Brasil, 2017.
LEME, D. M.; MARIN-MORALES, M. A. Allium cepa test in environmental monitoring:
A review on its application. Mutation Research - Reviews in Mutation Research, v. 682, n.
1, p. 71–81, 2009.
LEVAN, A. The effect of colchicine on root mitoses in Allium. Hereditas, v. 24, n. 4, p.
471–486, 1938.
LODISH, H. et al. Biologia celular e molecular - 7. ed. [s.l.] Artmed Editora, 2014.
MARTINS, M. N. C.; SOUZA, V. V. DE; SOUZA, T. DA S. Cytotoxic, genotoxic and
mutagenic effects of sewage sludge on Allium cepa. Chemosphere, v. 148, p. 481–486, 2016.
MATHWORKS. MATLAB. Disponível em:
<https://www.mathworks.com/products/matlab.html>.
MESI, A.; KOPLIKU, D. Cytotoxic and genotoxic potency screening of two pesticides on
Allium cepa. Procedia Technology, v. 8, p. 19–26, 2013.
88
METASYSTEMS. Automated micronucleus tests. Disponível em:
<https://metasystems-international.com/en/products/solutions/micronuclei/>.
MOREIRA, F. C. Reconhecimento e classificação de padrões de imagens de núcleos de
linfócitos do sangue periférico humano com a utilização de redes neurais artificiais. 2002.
MORO, T. R. et al. Adsorption of pharmaceuticals in water through lignocellulosic fibers
synergism. Chemosphere, v. 171, p. 57–65, 2017.
MOTA, J. A. O valor da natureza : economia e política dos recursos naturais. 2 Ed.
ed. [s.l.] Garamond, 2001.
NAZLIBILEK, S. et al. Automatic segmentation, counting, size determination and
classification of white blood cells. Measurement: Journal of the International
Measurement Confederation, v. 55, p. 58–65, 2014.
OLIVEIRA, A. Q. DE. Pré-processamento de imagens de fundo do olho: correção de
iluminação e de contraste para a identificação automática da rede de vasos. [s.l.]
Universidade Federal do Pampa - UNIPAMPA, 2013.
PEIXER, G. Avaliação da genotoxicidade e citotoxicidade da água do rio Passaúna
utilizando Allium cepa como bioensaio e relação com a cafeína. [s.l.] Universidade
Positivo, 2016.
PIECZYWEK, P. M.; ZDUNEK, A. Finite element modelling of the mechanical
behaviour of onion epidermis with incorporation of nonlinear properties of cell walls and real
tissue geometry. Journal of Food Engineering, v. 123, p. 50–59, 2014.
PIRES, I.; DIAS, N. G.; PEREIRA, J. A divisão celular: mitose. Disponível em:
<http://www1.ci.uc.pt/pessoal/nunogdias/biolcel/frameset10.htm>.
POLETTO, P. D. O. et al. Análise da mutagenicidade do extrato hidrosolúvel de Derris
rariflora (MART. EX BENTH. J. F. MAC BR: FABACEAE), timbó amazônico, através do
teste micronúcleo em Allium cepa. Revista Pesquisa e Criação, v. 10, n. 1, p. 163–175,
2011.
RAHMAN, M. M.; RAHMAN, M. F.; NASIRUJJAMAN, K. A study on genotoxicity of
textile dyeing industry effluents from Rajshahi, Bangladesh, by the Allium cepa test.
Chemistry and Ecology, v. 33, n. 5, p. 434–446, 28 maio 2017.
RAMADHANI, D.; PURNAMI, S. Automated detection of binucleated cell and
micronuclei using CellProfiler 2.0 software. HAYATI Journal of Biosciences, v. 20, n. 4, p.
151–156, 2013.
SAFUAN, S. N. M.; TOMARI, M. R. M.; ZAKARIA, W. N. W. White blood cell (WBC)
counting analysis in blood smear images using various color segmentation methods.
89
Measurement, 2017.
SILVA, B. S. DA. Detecção automática de células via técnicas de morfologia
matemática e processamento digital de imagens, 2015. Disponível em:
<http://monografias.poli.ufrj.br/monografias/monopoli10013465.pdf>
SILVA, G. H. DA et al. Avaliação da genotoxicidade para Allium cepa de águas de rios e
nascentes antes e após tratamento para abastecimento público . 2009.
SILVEIRA, G. L. et al. Toxic effects of environmental pollutants: Comparative
investigation using Allium cepa L. and Lactuca sativa L. Chemosphere, v. 178, p. 359–367,
2017.
TABREZ, S.; AHMAD, M. Oxidative stress-mediated genotoxicity of wastewaters
collected from two different stations in northern India. Mutation Research - Genetic
Toxicology and Environmental Mutagenesis, v. 726, n. 1, p. 15–20, 2011.
TENÓRIO, M. A. L. DOS S. Análise quimiométrica do extrato das folhas de Zeyheria
tuberculosa (VELL) BUREAU (BIGNONIACEAE), com atividade inibidora da
linfoproliferação, por ressonância magnética nuclear. [s.l.] Universidade Federal de
Alagoas, 2011.
UNWPP. World Population Prospects 2017. [s.l: s.n.]. Disponível em:
<https://esa.un.org/unpd/wpp/Graphs/Probabilistic/POP/TOT/>.
WALTER, T.; KLEIN, J.-C. Segmentation of color fundus images of the human retina:
detection of the optic disc and the vascular tree using morphological techniques. Medical
Data Analysis, p. 282–287, 2001.
90
APÊNDICE A – PROCEDIMENTOS E FUNÇÕES DO ALGORITMO
Procedimento ProcessarLamina
O procedimento abre uma tela popup para escolha do diretório que contém as imagens de
uma lâmina. Chama os procedimentos SegmentaçãoExpxx PTcell_Tabxx. Mostra o arquivo
em execução e apresenta o resultado sumarizado da lâmina.
Procedimento SegmentacaoExp ou SegmentaçãoExp10M
O procedimento executa as tarefas de segmentação. O bloco obtém a limiarização das
regiões de núcleo e das regiões de citoplasma da imagem. Realiza a transformação da imagem
colorida em imagem em tons de cinza utilizando a canal verde do modelo RGB. Realiza a
filtragem de ruído no domínio da frequência utilizando um algoritmo de Fourier em 2D, com
corte gaussiano. Realiza a transformação exponencial e elimina a nota de resolução da
imagem. Realiza a filtragem de domínio espacial e encontra os pontos de limiarização pelo
histograma. Executa a limiarização.
Procedimento PTcell_Tab_10M.m ou PTcell_Tab_1612.m
Extrai as características as propriedades da imagem segmentada dos núcleos para imagens
de alta resolução (10,6 MP)(2 MP). Realiza a classificação e identificação dos núcleos.
Processa as características morfológicas para formação de um fator para a identificação da
fase do núcleo. Realiza a contagem dos tipos de núcleos. Calcula o IM. Traça os contornos
dos núcleos e o tipo do núcleo.
Função calculaNota
Calcula o valor z, normalizado, e determina o valor da curva normal.
Função avaliaDivisão
Função que tenta encontra no contorno vetorado que recebe como parâmetro dois pontos
próximos e opostos neste contorno, que representariam os pontos extremos da sobreposição
moderada de núcleo.
Função encontraVales
Encontra os valores mais baixos de tons de cinza baseado no histograma bi ou trimodal.
91
APÊNDICE B – LISTAGEM DOS CÓDIGOS EM MATLAB
Procedimento ProcessarLamina
% -- Interface -- Seleções iniciais --------------------------------------
ContagemCelulas = app.NucleibySlideSpinner.Value; % Cont. de células por lâmina
resolucaoEntrada = app.ResolutionKnob.Value; % 1 --> 2 MP; 2 --> 10,6 MP
formatoEntrada = app.FormatKnob.Value; % 1 --> JPG; 2 --> PNG
TextoSaida = zeros(2000);
% Valores vindos da interface do CoNuMitAC
% ------------------------------------------------------------------------
formato = '*.jpg';
if strcmp(formatoEntrada,'PNG')
formato = '*.png';
end
resolucao = 2;
if strcmp(resolucaoEntrada,'10,6 MP')
resolucao = 10;
end
dname = uigetdir('../' ,sprintf(...
'Selecione a pasta com as imagens da lâmina [%s-%s]',...
formatoEntrada, resolucaoEntrada));
if isequal(dname,0)
disp('User selected Cancel');
return
else
list = dir(fullfile(dname, formato));
for lfile = 1:length(list)
if isequal(list(lfile).isdir, 0)
disp(list(lfile).name);
end
end
end
now1 = now;
DirName = strsplit(dname,'\');
DNlen = length(DirName);
TotalCelulas = 0;
TotalDivisao = 0;
AcumuladorI = 0;
AcumuladorP = 0;
AcumuladorM = 0;
AcumuladorA = 0;
AcumuladorT = 0;
dirsize = length(DirName{DNlen});
fprintf('%-8s %-15s %4s %4s %4s %4s %4s\n','Lâmina','Imagem','I','P','M','A','T');
% -- Interface -----------------------------------------------------------
TextoSaida = ['Lâmina Imagem I P M A T' newline];
% ------------------------------------------------------------------------
for imagens =1:length(list)
im = imread(fullfile(dname, list(imagens).name));
if resolucao == 10
% --- 10,6 MP JPG/PNG
SegmentacaoExp10M
PTcell_Tab_10M
elseif resolucao == 2
% --- 2 MP
SegmentacaoExp
PTcell_Tab_1612
else
break;
end
92
AcumuladorI = AcumuladorI + FaseAcc(1);
AcumuladorP = AcumuladorP + FaseAcc(2);
AcumuladorM = AcumuladorM + FaseAcc(3);
AcumuladorA = AcumuladorA + round(FaseAcc(4)/2);
AcumuladorT = AcumuladorT + round(FaseAcc(5)/2);
TotalDivisao = AcumuladorP + AcumuladorM + AcumuladorA + AcumuladorT;
TotalCelulas = TotalDivisao + AcumuladorI;
if TotalCelulas >= ContagemCelulas
break;
end
TextoSaida = [TextoSaida sprintf('%-8s %-15s ', DirName{DNlen},
list(imagens).name)];
app.OutputTextArea.Value = TextoSaida;
fprintf('%-8s %-15s ', DirName{DNlen}, list(imagens).name);
fprintf('%4d %4d %4d %4d %4d\n', ...
FaseAcc(1), FaseAcc(2), FaseAcc(3), round(FaseAcc(4)/2), round(FaseAcc(5)/2));
% -- Interface -------------------------------------------------------
TextoSaida = [TextoSaida sprintf('%4d %4d %4d %4d %4d\n', ...
FaseAcc(1), FaseAcc(2), FaseAcc(3), round(FaseAcc(4)/2), round(FaseAcc(5)/2))];
app.OutputTextArea.Value = TextoSaida;
app.CounterSlider.Value = TotalCelulas;
app.IEditField.Value = AcumuladorI;
app.PEditField.Value = AcumuladorP;
app.MEditField.Value = AcumuladorM;
app.AEditField.Value = round(AcumuladorA);
app.TEditField.Value = round(AcumuladorT);
% --------------------------------------------------------------------
end
IM = (TotalDivisao/TotalCelulas)*100;
now2 = now;
fprintf('%s Células:%d - IM:%2.2f - I:%d P:%d M:%d A:%d T:%d Duração: %s\n',...
DirName{DNlen}, TotalCelulas, IM, AcumuladorI, AcumuladorP, AcumuladorM,...
AcumuladorA, AcumuladorT, datestr(now2-now1,'MM:SS.FFF'));
% -- Interface -----------------------------------------------------------
app.IMEditField.Value = sprintf('%-9s = %5.2f',DirName{DNlen},IM);
TextoSaida = [TextoSaida newline sprintf(...
'%s Células:%d - IM:%2.2f - I:%d P:%d M:%d A:%d T:%d Duração: %s\n',...
DirName{DNlen}, TotalCelulas, IM, AcumuladorI, AcumuladorP, AcumuladorM,...
AcumuladorA, AcumuladorT, datestr(now2-now1,'MM:SS.FFF')) newline];
app.OutputTextArea.Value = TextoSaida;
app.CounterSlider.Value = 0;
app.GoButton.BackgroundColor = [0.96 0.96 0.96];
app.GoButton.Text = 'Go';
% ------------------------------------------------------------------------
TotalCelulas = 0;
Procedimento SegmentacaoExp
% -- SegmentaçãoExp
% -- Supressão da legenda da imagem
im8 = im(:,:,2);
[ny, nx] = size(im8);
if nx == 3840 % para imagem 3840 x 2748
if im8(2700, 3700) == 255
[hv, hp] = findpeaks(imhist(im8));
[hmax, hmpos] = max(hv);
im8(2622:end, 3353:end) = hp(hmpos); % Aplica nível médio de cinza
im8(2622:end, 3353) = 0;
im8(2622, 3353:end) = 0;
93
end
elseif nx == 1600 % para imagem 1600 x 1200
if im8(1170, 1570) == 255
[hv, hp] = findpeaks(imhist(im8));
[hmax, hmpos] = max(hv);
im8(1141:end, 1468:end) = hp(hmpos);
im8(1141:end, 1468) = 0;
im8(1141, 1468:end) = 0;
end
end
% -- Filtro de para alta frequência Gaussiano
im8f = LoHiGaussFFT2(im8, 250);
% -- Transformada exponencial
im8fe=uint8(exp(double(im8f)/37+0.001));
% -- filtro de média
im8fem = imboxfilt(im8fe);
im8fem = imboxfilt(im8fem);
im8fem = imboxfilt(im8fem);
% -- Limiar por Otsu
%[niveis] = multithresh(im8fem, 2);
%imn = imquantize(im8fem, niveis);
[thnucleo, thcito] = encontraVales(im8fem);
imnucleo = im8fem(:,:) < thnucleo;
imcito = im8fem(:,:) < thcito;
% -- Separação para Núcleo e Citoplasma
%imnucleo = imn < 2;
%imcito = imn > 0;
Procedimento SegmentacaoExp10M
% -- SegmentaçãoExp
% -- Supressão da legenda da imagem
im8 = im(:,:,2);
[ny, nx] = size(im8);
if nx == 3840 % para imagem 3840 x 2748
if im8(2700, 3700) == 255
[hv, hp] = findpeaks(imhist(im8));
[hmax, hmpos] = max(hv);
im8(2622:end, 3353:end) = hp(hmpos); % Aplica nível médio de cinza
im8(2622:end, 3353) = 0;
im8(2622, 3353:end) = 0;
end
elseif nx == 1600 % para imagem 1600 x 1200
if im8(1170, 1570) == 255
[hv, hp] = findpeaks(imhist(im8));
[hmax, hmpos] = max(hv);
im8(1141:end, 1468:end) = hp(hmpos);
im8(1141:end, 1468) = 0;
im8(1141, 1468:end) = 0;
end
end
% -- Filtro de para alta frequência Gaussiano
im8f = LoHiGaussFFT2(im8, 250);
% -- Transformada exponencial
im8fe=uint8(exp(double(im8f)/36.5+0.001));
% -- filtro de média
im8fem = imboxfilt(im8fe);
%im8fem = imboxfilt(im8fem);
94
%im8fem = imboxfilt(im8fem);
% -- Limiar por Otsu
%[niveis] = multithresh(im8fem, 2);
%imn = imquantize(im8fem, niveis);
[thnucleo, thcito] = encontraVales(im8fem);
imnucleo = im8fem(:,:) < thnucleo;
imcito = im8fem(:,:) < thcito;
% -- Separação para Núcleo e Citoplasma
%imnucleo = imn < 2;
%imcito = imn > 0;
Procedimento PTCell_Tab_10M
% Fatores: AR/PE (AP); Perimetro (PE); Excentricidade (EX);
% DiamEquiv (DE); Solidez (SO); Area (AR);
% Calculo: Média (u); Desvio Padrão (s); |I|P|M|A|T|
% |Interfase|Prófase|Metáfase|Anáfase |Telófase|
TabelaFase = ["Interfase", "Prófase", "Metáfase", "Anáfase", "Telófase",
"Interfase"];
TabelaFaseR = ["I", "P", "M", "A", "T", "S"];
TabelaFaseC = ["green", "cyan", "magenta", "yellow", "black", "green"];
% Imagem de Referência Geral_Std_10M (PNG)
TabelaMedia =[ 0.2756, 0.2621, 0.1465, 0.1614, 0.2347; % AP
313.3, 548.4, 830.4, 586.6, 348.7; % PE
0.5611, 0.5530, 0.5755, 0.7740, 0.7155; % EX
97.31, 131.7, 132.6, 103.6, 92.18; % DE
0.9793, 0.9682, 0.7502, 0.7629, 0.9149; % SO
7557, 15820, 13810, 8529, 6747]; % AR
TabelaDesvio = [0.0055, 0.0180, 0.0296, 0.0223, 0.0176; % AP
42.96, 169.5, 172.8, 143.1, 34.83; % PE
0.1798, 0.1048, 0.1866, 0.1070, 0.1087; % EX
12.59, 16.06, 4.11, 11.72, 9.95; % DE
0.0117, 0.0164, 0.0750, 0.0449, 0.0379; % SO
1893, 4353, 853.7 1869, 1470]; % AR
TabelaPeso = [ 2, 1, 1.5, 1.6, 1; % AP
1, 1, 1, 1.5, 1; % PE
1, 1.2, 1, 1, 1; % EX
1, 1, 1, 1, 1; % DE
2, 1, 1, 1, 1; % SO
1, 1.8, 1, 2, 1]; % AR
FaseAcc = [0, 0, 0, 0, 0, 0];
% Limites com base em 99,74% da curva normal: três desvio padrão.
AR_MAX = TabelaMedia(6,2)+3*TabelaDesvio(6,2); % Prófase
AR_MIN = TabelaMedia(6,1)-3*TabelaDesvio(6,1); % Interfase
PE_MAX = TabelaMedia(2,3)+3*TabelaDesvio(2,3); % Metáfase
PE_MIN = TabelaMedia(2,1)-3*TabelaDesvio(2,1); % Interfase
imnuc = imclearborder(imnucleo);
imdiv = avaliaDivisao(imnuc);
imdiv = avaliaDivisao(imdiv);
%imdiv = imfill(imdiv, 'holes');
[B,L] = bwboundaries(imdiv, 'holes');
cs = regionprops(L, 'Area', 'Centroid', 'ConvexHull', 'ConvexArea',...
'ConvexImage', 'BoundingBox', 'Eccentricity', 'EquivDiameter',...
'Solidity', 'Image', 'Perimeter','PixelList',...
'MajorAxisLength','MinorAxisLength');
figure(2);
imshow(im);
95
qtd = 0;
hold on
for k = 1:length(B)
AR = cs(k).Area;
PE = cs(k).Perimeter;
% Limites AR: Max: AR+3DP; Min: AR-3DP
% PE: Max: PE+3DP; Min: AR-3DP
if AR > AR_MIN && AR < AR_MAX && PE > PE_MIN && PE < PE_MAX
qtd = qtd + 1;
EX = cs(k).Eccentricity;
DE = cs(k).EquivDiameter;
SO = cs(k).Solidity;
BB = cs(k).BoundingBox;
IM = cs(k).Image;
CH = cs(k).ConvexHull;
AP = sqrt(AR)/PE;
raioM = cs(k).MajorAxisLength/2;
raiom = cs(k).MinorAxisLength/2;
boundary = B{k};
cc = cs(k).Centroid;
PL = cs(k).PixelList;
FatorTeste = [ AP, PE, EX, DE, SO, AR];
Nota = [0, 0, 0, 0, 0, 0]; % |I|P|M|A|T|
for fase = 1:5
for fator = 1:6
NotaFator = calculaNota(FatorTeste(fator), ...
TabelaMedia(fator, fase), ...
TabelaDesvio(fator, fase)) * ...
TabelaPeso(fator, fase);
% Valor limite de D para a probabilidade de 99,74% da CN.
if NotaFator < 0.01
Nota(fase) = 0;
break;
end
Nota(fase) = Nota(fase) + NotaFator;
end
end
Tipo = "";
FatorMax = 0;
for fase = 1:5
if Nota(fase) > FatorMax
FatorMax = Nota(fase);
FaseInd = fase;
end
end
% 1) Representa 99,74% de probabilidade de um núcleo qualquer estar
% dentro dentro dos valores médios até 3 desvios padrão.
% Soma de 6 valores mínimos -> 6*0,0111=0,0666
% 2) Corte para objetos alongados (muito excentricos) que fogem do padrão
if FatorMax > 0.067
if (raioM < 2.3*raiom && EX <= 0.91) || FatorMax > 3
Tipo = TabelaFaseR(FaseInd);
FaseAcc(FaseInd) = FaseAcc(FaseInd) + 1;
end
end
%plot(boundary(:,2), boundary(:,1), 'black', 'LineWidth', 1);
%plot(cc(1), cc(2),'w+');
if Tipo == ""
plot(boundary(:,2), boundary(:,1), 'red', 'LineWidth', 2);
96
plot(cc(1), cc(2),'w+');
text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.4f',Tipo,FatorMax), ...
'Color', 'black', 'FontSize', 8,'FontWeight', 'bold');
%text(boundary(1,2), boundary(1,1), ...
%sprintf('AR/%.0f AP/%.3f SO/%0.2f\nEX/%1.2f PE/%.0f', ...
%AR, AP, SO, EX, PE),...
%'Color', 'white', 'FontSize', 8, ...
%'BackgroundColor', 'blue');
else
plot(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',
2);
plot(cc(1), cc(2),'w+');
%patch(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',
1);
%rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 70, 34],
'Facecolor', 'white');
%text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.2f',Tipo,FatorMax), ...
%'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');
%rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 70, 34],
'Facecolor', 'white')
text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.2f',Tipo,FatorMax), ...
'Color', 'black', 'FontSize', 8,'FontWeight', 'bold');
end
%viscircles(cc,raioM);
%viscircles(cc,raiom);
%rectangle('Position', BB);
%fprintf('EP:%d %BP:%d \n', sep, sbp);
end
%plot(CH(:,1),CH(:,2), 'blue');
%plot(boundary);
if (TotalCelulas + sum(FaseAcc)) >= ContagemCelulas
break
end
end
title(sprintf('\\fontsize{16}{Núcleos: %d - I:%d P:%d M:%d A:%d T:%d (%d)}',
...
qtd, FaseAcc(1), FaseAcc(2), FaseAcc(3), FaseAcc(4), FaseAcc(5),
sum(FaseAcc)));
hold off
Procedimento PTCell_Tab_1612
% PTcell_Tab_1612 - Para baixa resolução 2MP
% Fatores: AR/PE (AP); Perimetro (PE); Excentricidade (EX);
% DiamEquiv (DE); Solidez (SO); Area (AR);
% Calculo: Média (u); Desvio Padrão (s); |I|P|M|A|T|
% |Interfase|Prófase|Metáfase|Anáfase |Telófase|
TabelaFase = ["Interfase", "Prófase", "Metáfase", "Anáfase", "Telófase"];
TabelaFaseR = ["I", "P", "M", "A", "T", "I"];
TabelaFaseC = ["green", "cyan", "magenta", "yellow", "black", "white"];
%-----------------| I | P | M | A | T | II |-----
TabelaMedia = [0.2782, 0.2607, 0.1395, 0.1540, 0.2479, 0.2776; % AP
223, 306, 542, 362, 184, 175; % PE
0.5082, 0.5414, 0.6558, 0.6922, 0.6794, 0.5514; % EX
70, 90, 84, 62, 51, 55; % DE
0.9817, 0.9586, 0.7208, 0.7456, 0.9162, 0.9765; % SO
3942, 6370, 5512, 3024, 2066, 2367]; % AR
% ---------------------------------------------------------------
97
TabelaDesvio = [0.0092, 0.0108, 0.0203, 0.0208, 0.0208, 0.0138; % AP
37, 18, 90, 51, 21, 28; % PE
0.1536, 0.1078, 0.0943, 0.1426, 0.1455, 0.1001; % EX
11, 5, 6, 4, 5, 6; % DE
0.0095, 0.0138, 0.0663, 0.0564, 0.0422, 0.0155; % SO
1133, 644, 784, 354, 368, 552]; % AR
% ---------------------------------------------------------------
TabelaPeso = [ 1, 1, 1, 1, 1, 1; % AP
1, 1, 1, 1, 1, 1; % PE
1, 1, 1, 1, 1, 1; % EX
1, 1, 1, 1, 1, 1; % DE
1, 1, 1, 1, 1, 1; % SO
1, 1, 1, 1, 1, 1]; % AR
%TabelaPeso = [ 1, 1, 1, 1, 2, 1; % AP
% 1, 1, 1, 1, 1.6, 1; % PE
% 1, 1, 1, 2, 1, 1; % EX
% 1, 1, 1, 1, 1, 1; % DE
% 1, 1, 1, 1, 1, 1; % SO
% 1, 1, 1, 1, 2, 1]; % AR
FaseAcc = [0, 0, 0, 0, 0, 0];
% Limites com base em 99,74% da curva normal: três desvio padrão.
AR_MAX = TabelaMedia(6,2)+3*TabelaDesvio(6,2); % Prófase
AR_MIN = TabelaMedia(6,5)-3*TabelaDesvio(6,5); % Interfase
PE_MAX = TabelaMedia(2,3)+3*TabelaDesvio(2,3); % Metáfase
PE_MIN = TabelaMedia(2,5)-3*TabelaDesvio(2,5); % Interfase
imdiv = imclearborder(imnucleo);
[B,L] = bwboundaries(imdiv, 'holes');
cs = regionprops(L, 'Area', 'Centroid', 'ConvexHull',...
'ConvexImage', 'BoundingBox', 'Eccentricity', 'EquivDiameter',...
'Solidity', 'Image', 'MinorAxisLength', 'MajorAxisLength','Perimeter');
qtd = 0;
[ccc, rrc, mmc] = imfindcircles(imdiv, [20 60]);
figure(1);
imshow(im);
hold on
for k = 1:length(B)
AR = cs(k).Area;
PE = cs(k).Perimeter;
% Limites AR: Max: AR+3DP; Min: AR-3DP
% PE: Max: PE+3DP; Min: AR-3DP
if AR > AR_MIN && AR < AR_MAX && PE > PE_MIN && PE < PE_MAX
qtd = qtd + 1;
EX = cs(k).Eccentricity;
PE = cs(k).Perimeter;
DE = cs(k).EquivDiameter;
SO = cs(k).Solidity;
BB = cs(k).BoundingBox;
IM = cs(k).Image;
CH = cs(k).ConvexHull;
raioM = cs(k).MajorAxisLength;
raiom = cs(k).MinorAxisLength;
AP = sqrt(AR)/PE;
boundary = B{k};
cc = cs(k).Centroid;
FatorTeste = [ AP, PE, EX, DE, SO, AR];
Nota = [0, 0, 0, 0, 0, 0]; % |I|P|M|A|T|i|
for fase = 1:6
for fator = 1:6
98
NotaFator = calculaNota(FatorTeste(fator), ...
TabelaMedia(fator, fase), ...
TabelaDesvio(fator, fase)) * ...
TabelaPeso(fator, fase);
% Valor limite de D para a probabilidade de 99,74% da CN.
if NotaFator < 0.01
Nota(fase) = 0;
break;
end
Nota(fase) = Nota(fase) + NotaFator;
end
end
Tipo = "";
FatorMax = 0;
for fase = 1:6
if Nota(fase) > FatorMax
FatorMax = Nota(fase);
FaseInd = fase;
end
end
% Interfase II conta como interfase
if FaseInd == 6
FaseInd = 1;
end
% 1) Representa 99,74% de probabilidade de um núcleo qualquer estar
% dentro dentro dos valores médios até 3 desvios padrão.
% Soma de 6 valores mínimos -> 6*0,0111=0,0666
% 2) Corte para objetos alongados que fogem do padrão
if FatorMax > 0.067
if (raioM < 2.3*raiom && EX <= 0.91) || FatorMax > 3
Tipo = TabelaFaseR(FaseInd);
FaseAcc(FaseInd) = FaseAcc(FaseInd) + 1;
end
end
if Tipo == ""
plot(boundary(:,2), boundary(:,1), 'red', 'LineWidth', 2);
plot(cc(1), cc(2),'w+');
rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 60, 24],
'Facecolor', 'white');
text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.2f',Tipo,FatorMax), ...
'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');
%text(boundary(1,2), boundary(1,1), ...
%sprintf('AR/%.0f AP/%.3f SO/%0.2f\nEX/%1.2f PE/%.0f', ...
%AR, AP, SO, EX, PE),...
%'Color', 'white', 'FontSize', 8, ...
%'BackgroundColor', 'blue');
else
plot(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',
2);
%plot(cc(1), cc(2),'w+');
%patch(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',
1);
%rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 70, 34],
'Facecolor', 'white');
%text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.2f',Tipo,FatorMax), ...
%'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');
rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 60, 24],
'Facecolor', 'white');
text(boundary(1,2)+20, boundary(1,1)+5,
sprintf('%s\n%.2f',Tipo,FatorMax), ...
'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');
end
99
%viscircles(cc,raioM);
%viscircles(cc,raiom);
%rectangle('Position', BB);
end
%plot(CH(:,1),CH(:,2), 'blue');
%plot(boundary);
if (TotalCelulas + sum(FaseAcc)) >= ContagemCelulas
break
end
end
title(sprintf('\\fontsize{16}{Núcleos: %d - I:%d P:%d M:%d A:%d T:%d (%d)}',
...
qtd, FaseAcc(1), FaseAcc(2), FaseAcc(3), FaseAcc(4), FaseAcc(5),
sum(FaseAcc)));
hold off
Função calculaNota
function nota = calculaNota(x, u, s)
lx = length(x);
for nx = 1:lx
z(nx) = double((x(nx)-u)/s);
nota(nx) = double(exp(-(z(nx)^2)/2));
end
end
Função avaliaDivisão()
function imdiv = avaliaDivisao(im)
imd = imclearborder(im);
div = 1;
ciclos = 0;
while (div > 0 && ciclos < 1000)
div = 0;
[B,L] = bwboundaries(imd, 'holes');
nuc = regionprops(L, 'Area', 'Centroid', 'Solidity', 'Eccentricity',
'Perimeter', 'BoundingBox','MinorAxisLength');
for k = 1:length(B)
AR = nuc(k).Area;
SO = nuc(k).Solidity;
EX = nuc(k).Eccentricity;
PE = nuc(k).Perimeter;
BB = nuc(k).BoundingBox;
ma = nuc(k).MinorAxisLength;
AP = sqrt(AR)/PE;
if (AR > 15000 && SO > 0.74 && SO < 0.98 && EX > 0.5702 && EX < 0.9883
&& PE > 384)
ciclos = ciclos + 1; % watchdog
boundary = B{k};
cc = nuc(k).Centroid;
%figure(4);
%subplot(2,2,1), plot(boundary(:,2),boundary(:,1)), hold on,
plot(cc(1,1),cc(1,2),'b+'), hold off;
%subplot(2,2,2), plot(boundary(:,2));
%subplot(2,2,3), plot(boundary(:,1));
%subplot(2,2,4);
[x1, y1, x2, y2, resp] = encontraMenorBorda2(boundary, [cc(1,2),
cc(1,1)]);
dc = distenv([y1,x1],[y2,x2]);
if resp
if dc < 0.7*ma
100
imd = fazLinhaImagem(imd, x1, y1, x2, y2);
end
end
end
end
end
imdiv = imd;
end
Função encontraMenorBorda2()
function [x1, y1, x2, y2, resp] = encontraMenorBorda2(borda, cc)
%------------------------
%figure(5);
%hold on;
%plot(borda(:,2),borda(:,1), 'b');
%plot(cx, cy, 'c+');
%------------------------
x1 = 0;
y1 = 0;
x2 = 0;
y2 = 0;
mm = distenv(borda, cc);
maxc = round(max(mm));
nn = maxc+50 - mm;
[pos,loc]=findpeaks(nn, 'MinPeakDistance',100, 'MinPeakProminence',
40,'MaxPeakWidth', 180, 'SortStr', 'descend', 'NPeaks', 2);
resp = false;
if ~isempty(pos)
if length(pos) > 1
x1 = borda(loc(1),2);
y1 = borda(loc(1),1);
x2 = borda(loc(2),2);
y2 = borda(loc(2),1);
if distenv([y1,x1],[y2,x2]) < 100
resp = true;
end
end
end
%plot(x1, y1, 'r+', x2, y2, 'r+');
%hold off;
end
Função fazLinhaImagem()
function im = fazLinhaImagem(im, x1, y1, x2, y2)
if y1 > y2
dy = y1;
dx = x1;
y1 = y2;
x1 = x2;
y2 = dy;
x2 = dx;
end
dy = abs(y2-y1);
dx = abs(x2-x1);
ix = x1;
iy = y1;
sy = 1;
sx = 1;
if x2 < x1
sx = -sx;
101
end
Adx = dx;
Ady = dy;
%hold on
while iy <= y2
im(iy-2:iy+2, ix-2:ix+2) = 0;
%plot(iy, ix, 'r+');
if Ady >= Adx
Adx = Adx + dx;
iy = iy + sy;
else
Ady = Ady + dy;
%iy = iy + sy;
ix = ix + sx;
if sx > 0
if ix > x2
break;
end
else
if ix < x2
break;
end
end
end
end
%hold off
end
Função LoHiGaussFFT2()
function imout = imfilterFFT2(imfilterin, raio)
A = fft2(double(imfilterin)); % compute FFT of the grey image
A1=fftshift(A); % frequency scaling
% Gaussian Filter Response Calculation
[M N]=size(A); % image size
R=raio; % filter size parameter
X=0:N-1;
Y=0:M-1;
[X Y]=meshgrid(X,Y);
Cx=0.5*N;
Cy=0.5*M;
Lo=exp(-((X-Cx).^2+(Y-Cy).^2)./(2*R).^2);
Hi=1-Lo; % High pass filter=1-low pass filter
% Filtered image=ifft(filter response*fft(original image))
J=A1.*Lo;
J1=ifftshift(J);
imout=abs(ifft2(J1));
Função distenv()
function env = distenv(pontos, centro)
x = length(pontos(:,1));
env(1:x) = 0;
cx = centro(1,1);
cy = centro(1,2);
for n = 1:x
xi = pontos(n,1);
102
yi = pontos(n,2);
a = (xi - cx)^2;
b = (yi - cy)^2;
env(n) = sqrt(a + b);
end
Função encontraVales()
function [vale1, vale2] = encontraVales(im)
[contagem, local] = imhist(im);
contagem2 = [contagem; 0];
local2 = [local; length(contagem)+2];
% Determina os picos do histograma
[valor, posicao] = findpeaks(contagem2, local2, ...
'MinPeakDistance', 10,...
'MinPeakWidth', 1);
pos = [0, 0, 0];
% Separa os três principais picos
for i = 1:3
[kv, kp] = max(valor);
pos(i) = posicao(kp);
valor(kp) = 0;
end
% Organiza os picos de forma crescente.
pos = sort(pos);
pmin = Inf;
for k = pos(1):pos(2)
if pmin > contagem(k+1)
pmin = contagem(k+1);
vale1 = k;
end
end
pmin = Inf;
for k = pos(2):pos(3)
if pmin > contagem(k+1)
pmin = contagem(k+1);
vale2 = k;
end
end
end
103
APÊNDICE C – LÂMINAS DE ALLIUM CEPA UTILIZADAS NO TRABALHO
104
105
APÊNDICE D – IMAGENS PARA CALIBRAÇÃO
Anáfases:
Interfases:
Metáfases:
106
Prófases:
Telófases:
107
ANEXO A – FUNÇÕES DO MATLAB UTILIZADAS
https://www.mathworks.com/help/images/ref/bwmorph.html?s_tid=srchtitle
https://www.mathworks.com/help/signal/ref/findpeaks.html#buff2uu
https://www.mathworks.com/help/images/ref/imboxfilt.html
https://www.mathworks.com/help/images/ref/bwboundaries.html
https://www.mathworks.com/help/images/ref/regionprops.html
https://www.mathworks.com/help/matlab/ref/rectangle.html
https://www.mathworks.com/help/matlab/ref/patch.html
https://www.mathworks.com/help/matlab/ref/plot.html
https://www.mathworks.com/help/matlab/ref/text.html
https://www.mathworks.com/help/images/ref/imerode.html
https://www.mathworks.com/help/images/ref/imdilate.html
https://www.mathworks.com/help/images/ref/imclose.html
https://www.mathworks.com/help/images/ref/imopen.html
https://www.mathworks.com/help/images/ref/bwdist.html
https://www.mathworks.com/help/matlab/ref/fft2.html
https://www.mathworks.com/help/matlab/ref/fftshift.html
https://www.mathworks.com/help/matlab/ref/ifft2.html
https://www.mathworks.com/help/matlab/ref/ifftshift.html
https://www.mathworks.com/help/matlab/ref/rgb2gray.html
https://www.mathworks.com/help/images/ref/medfilt2.html
https://www.mathworks.com/help/images/ref/fspecial.html
https://www.mathworks.com/help/images/ref/imregionalmax.html
108
Preparar HCl 1N com HCI 4N
Para 250mL: 98,54mL de HCI 4N
completados com água destilada.
**colocar um pouco de água no balão
antes do ácido
Preparação do carnoil: 3 medidas de
etanol para 1 de ácido acético. Essa
solução não pode ser reutilizada, sempre
deve ser feita uma nova para cada
experimento.
ANEXO B – PROCEDIMENTO DE PREPARAÇÃO DAS LÂMINAS DE Allium cepa
PASSO A PASSO PARA ANÁLISE DE TOXICIDADE EM
ALLIUM CEPA
- Cortar as raízes da cebola o mais perto do início possível, tirar as cascas;
- Colocar a cebola em um recipiente contendo as amostras realizadas e em
seguida levar para a estufa por 72h à 22°C;
- Passados as 72h cortar as raízes que cresceram e fixar o
material em carnoil (realizar preferencialmente ao meio
dia);
- Essa fixação no carnoil dura 5 minutos e depois as raízes
são colocadas no álcool 70% que deve ficar no mínimo
24h, tempo limite não foi pré-estabelecido;
- Passado no mínimo 24h no álcool 70%, lavar as raízes em água destilada e secar em um papel
(sempre usar uma água nova para cada amostra);
- Colocar as raízes lavadas em HCI 1N para hidrolisar em banho-maria por 9:30 min
em 60°C extremamente regulados (podendo variar no
máximo entre 58°C - 61°C). O HCl 1N utilizado pode ser
reutilizado até começar a aparentar uma coloração
amarelada;
- Retirar o material imediatamente do banho-maria e lavar
novamente em água destilada para cada amostra, secando as
raízes em um papel;
- Colocar as raízes em potinhos tampados para evitar a luz
contendo Shiff por 45 minutos (variamos as vezes para 50 minutos);
- Passados o tempo do shiff, lavar as raízes novamente em água destilada e colocá-las nas lâminas
secando a água dos cantos com papel;
- Cortar o meristema da célula com a lâmina desprezando a parte branca ainda com um pouco de
meristema para ter certeza que a leitura será feita só do meristema;
- Pingar uma gota de carmin e deixar reagindo por 5 minutos;
- Colocar a lamínula sobre a amostra (deixando-a bem centralizada);
- Passar a lâmina no fogo medindo a temperatura na mão;
- Esmagar o meristema com um lápis para espalhar;
- Enrolar a lâmina em vários papéis e pressionar contra a bancada para a retirada do carmin (na hora
de esmagar lembrar que a lamínula deve estar para baixo!);
- Limpar as bordas da lâmina com um papel umedecido e passar esmalte ao redor.
- A leitura da lâmina pode ser feita em até 3 dias, se for armazenada na geladeira e
coberta com papel alumínio ao abrigo de luz.
109
ANEXO C – DESCRIÇÃO DA FUNÇÃO regionprops()
Nome da propriedade Descrição
'Area' Número real de pixels na região, retornado como um escalar (esse valor
pode diferir ligeiramente do valor retornado por bwarea, que pondera
diferentes padrões de pixels de maneira diferente.)
Para encontrar o equivalente à área de um volume 3-D, use a
propriedade 'Volume' de regionprops3.
BoundingBox' O menor retângulo contendo a região, retornado como 1 por Q*2vetor,
onde Q é o número de dimensões da imagem. Por exemplo, no vetor
[ul_corner width], ul_corner especifica o canto superior esquerdo
da caixa delimitadora no formulário [x y z ...].width especifica a largura da
caixa delimitadora ao longo de cada dimensão no formulário [x_width
y_width ...].regionprops usa ndims para obter as dimensões da
matriz de rótulos ou imagem binária ndims(L), e numel para obter as
dimensões dos componentes conectados numel(CC.ImageSize),.
'Centroid' Centro de massa da região, retornado como 1 por Qvetor. O primeiro
elemento Centroid é a coordenada horizontal (ou x-coordenada) do centro
de massa. O segundo elemento é a coordenada vertical (ou y-coordenada).
Todos os outros elementos Centroid estão em ordem de dimensão. Esta
figura ilustra o centroide e a caixa delimitadora de uma região descontínua. A
região consiste nos pixels brancos; a caixa verde é a caixa delimitadora e o
ponto vermelho é o centroide.
'ConvexArea' Número de pixels em 'ConvexImage', retornados como um escalar.
'ConvexHull' O menor polígono convexo que pode conter a região, retornado como
uma matriz p-by-2. Cada linha da matriz contém as coordenadas x e y de um
vértice do polígono.
'ConvexImage' Imagem que especifica o casco convexo, com todos os pixels dentro do
casco preenchidos (definido como on), retornados como uma imagem
binária (logical). A imagem é o tamanho da caixa delimitadora da região
(para pixels que o limite do casco atravessa, regionprops usa a mesma
lógica roipoly para determinar se o pixel está dentro ou fora do casco.)
'Eccentricity' A excentricidade da elipse que possui os mesmos segundos momentos
da região retornou como escalar. A excentricidade é a relação entre a
distância entre os focos da elipse e o comprimento do seu eixo principal. O
valor está entre 0 e 1. (0 e 1 são casos degenerados. Uma elipse cuja
excentricidade é 0 é na verdade um círculo, enquanto uma elipse cuja
excentricidade é 1 é um segmento de linha.)
'EquivDiameter' Diâmetro de um círculo com a mesma área da região, retornado como
um escalar. Computado como sqrt(4*Area/pi).
'EulerNumber' Número de objetos na região menos o número de furos nesses objetos,
retornado como um escalar. Essa propriedade é suportada apenas para
matrizes de rótulo 2-D. regionprops usa conectividade 8 para calcular a
medida do número de Euler.
110
Nome da propriedade Descrição
'Extent' Proporção de pixels na região para pixels na caixa delimitadora total,
retornada como escalar. Calculado como Area dividido pela área da caixa
delimitadora.
'Extrema' Extrema indica as extremidades de uma região, retornada como uma
matriz de 8 por 2. Cada linha da matriz contém as coordenadas x e y de um
dos pontos. O formato do vetor é [top-left top-right right-top right-bottom bottom-right bottom-left left-bottom left-
top]. Esta figura ilustra os extremos de duas regiões diferentes. Na região à
esquerda, cada ponto extremo é distinto. Na região à direita, certos pontos
extremos (por exemplo, top-left e left-top) são idênticos.
'FilledArea' Número de pixels on em FilledImage, retornado como um escalar.
'FilledImage' Imagem do mesmo tamanho da caixa delimitadora da região, retornada
como uma matriz binária (logical). Os pixels on correspondem à região,
com todos os buracos preenchidos, conforme mostrado nesta figura.
'Image' Imagem do mesmo tamanho da caixa delimitadora da região, retornada
como uma matriz binária (logical). Os pixels on correspondem à região e
todos os outros pixels são off.
'MajorAxisLength' Comprimento (em pixels) do eixo principal da elipse que possui os
mesmos segundos momentos normais normalizados da região, retornado
como um escalar.
'MinorAxisLength' Comprimento (em pixels) do eixo menor da elipse que possui os mesmos
segundos momentos normais normalizados da região, retornado como
escalar.
'Orientation' O ângulo entre o eixo x e o eixo maior da elipse que tem as mesmos
segundos-momentos como a região, devolvido como um escalar. O valor é
111
Nome da propriedade Descrição
em graus, variando de -90 graus a 90 graus. Esta figura ilustra os eixos e a
orientação da elipse. O lado esquerdo da figura mostra uma região da
imagem e sua elipse correspondente. O lado direito mostra a mesma elipse
com as linhas azuis sólidas que representam os eixos. Os pontos vermelhos
são os focos. A orientação é o ângulo entre a linha pontilhada horizontal e o
eixo maior.
'Perimeter' Distância ao redor do limite da região, retornado como um escalar.
regionprops calcula o perímetro calculando a distância entre cada par
adjacente de pixels ao redor da borda da região. Se a imagem contiver
regiões não contíguas, regionprops retornará resultados inesperados.
Esta figura ilustra os pixels incluídos no cálculo do perímetro para este objeto.
'PixelIdxList' Índices lineares dos pixels na região, retornaram como um vetor p
elementar.
'PixelList' Locais de pixels na região, retornados como p -by- Q matrix. Cada linha
da matriz tem a forma [x y z ...] e especifica as coordenadas de um pixel na
região.
'Solidity' Proporção dos pixels no casco convexo que também estão na região,
retornados como um escalar. Computado como Area/ConvexArea.
'SubarrayIdx' Elementos de L dentro da caixa delimitadora de objeto, retornados como
uma matriz de células que contém índices que L(idx{:}) extraem os
elementos.