UNIVERSIDADE POSITIVO AMILTON CARLOS RATTMANN

UNIVERSIDADE POSITIVO

AMILTON CARLOS RATTMANN

PROCESSAMENTO DE IMAGENS DIGITAIS PARA IDENTIFICAÇÃO E

CONTAGEM DE NÚCLEOS NAS FASES DA MITOSE EM LÂMINAS DE TESTE

DE Allium cepa

CURITIBA

2018

AMILTON CARLOS RATTMANN

PROCESSAMENTO DE IMAGENS DIGITAIS PARA IDENTIFICAÇÃO E

CONTAGEM DE NÚCLEOS NAS FASES DA MITOSE EM LÁMINAS DE TESTE

DE Allium cepa

Dissertação apresentada como requisito parcial

para a obtenção do grau de mestre do Programa

de Pós-Graduação em Gestão Ambiental,

Universidade Positivo

Orientadora: Profª Drª. Eliane C. de Vasconcelos

CURITIBA

2018

Dados Internacionais de Catalogação na Publicação (CIP) Biblioteca da Universidade Positivo - Curitiba – PR

Elaborado pelo Bibliotecário Douglas Lenon da Silva (CRB-9/1892)

R237 Rattmann, Amilton Carlos.

Processamento de imagens digitais para identificação e contagem de núcleos nas fases da mitose em lâminas de teste de Allium cepa. / Amilton Carlos Rattmann. ― Curitiba : Universidade Positivo, 2018. 111 f. ; il. Mestrado (Dissertação) – Universidade Positivo, Programa de Pós-graduação em Gestão Ambiental, 2018.

Orientador: Profa. Dra. Eliane Carvalho de Vasconcelos.

1. Gestão ambiental. 2. Algoritmo computacional. 3. Morfologia – Matemática. 4. Processamento de imagens digitais. I. Vasconcelos, Eliane Carvalho de. II. Título.

CDU 576.31:004.51(043.3)

ESPAÇO PARA FOLHA COM DADOS DA BANCA EXAMINADORA

AGRADECIMENTOS

A Deus por me conceder esta oportunidade.

À minha orientadora, Professora Eliane Carvalho de Vasconcelos pela orientação, auxílio,

acolhimento e grande paciência.

À minha esposa, por toda energia, visão, paciência e cobrança. Foram muito importantes!

Aos meus filhos, pela compreensão, paciência e apoio.

Aos meus pais, pelos valores e pelo apoio incondicional.

À Jessica, pela gentileza de compartilhar seus dados de ensaios e lâminas de A. cepa.

Aos meus amigos e colegas do PGAMB, pelo companheirismo ao longo desta jornada.

À Universidade Positivo, pela bolsa concedida.

RESUMO

Os ensaios laboratoriais para investigação e monitoramento ambiental têm empregado

tanto organismos vegetais quanto animais na avaliação dos efeitos de substâncias

contaminantes presentes no ambiente. O emprego do Allium cepa tem sido bem aceito pela

comunidade científica nas últimas décadas para avaliação dos efeitos de substâncias nas

alterações da estrutura celular e nas alterações genéticas, em virtude da sensibilidade e

confiabilidade deste organismo nos ensaios. A proposta deste trabalho foi desenvolver um

algoritmo para o processamento das imagens digitais de lâminas de A. cepa, capturadas por

câmera de alta resolução acoplada a microscópio de laboratório, que realizasse a identificação

e a contagem das células em cada fase do ciclo mitótico, apresentando o resultado do teste de

forma automática, sem propor alterações na metodologia atualmente utilizada na preparação

das lâminas. As imagens pré-processadas por filtros de domínios espaciais e de frequência

espacial, foram submetidas à limiarização global para separação das regiões de núcleo e

citoplasma. A decisão ponderada sobre uma base tabelar estatística das propriedades

morfológicas dos núcleos celulares foi utilizada para a classificação, viabilizando a contagem

das fases nucleares e a determinação do índice mitótico por lâmina. As imagens de cada

lâmina foram processadas em torno de 60 segundos, detectando 95% dos núcleos e

classificando corretamente em média 63,8% dos núcleos, não apresentando diferenças

significativas nos índices mitóticos, ao nível de 5%, entre a contagem manual e a contagem

automática. Além dos resultados imediatos, espera-se obter padronização, maior eficiência no

uso dos recursos humanos e equipamentos, redução do tempo para obtenção dos resultados,

menor custo operacional no processo e maior confiabilidade nos resultados dos testes.

Palavras-chave: algoritmo, limiarização global, processo de classificação discreto,

morfologia matemática, descritores geométricos, monitoramento ambiental.

ABSTRACT

Laboratory tests for environmental research and monitoring have employed both plant and

animal organisms in assessing the effects of pollutants in the environment. The use of Allium

cepa has been well documented by the scientific community in recent decades for the

evaluation of the effects of substances on changes in cellular structure and genetic alterations,

due to the sensitivity and reliability of this organism in the assays. The purpose of this work

was to develop an algorithm for the processing of the digital images of A. cepa slides captured

by high resolution camera coupled to laboratory microscope, performing the identification

and counting of cells at each stage of the mitotic cycle, without proposing changes to the

method currently used in the preparation of the slides. The preprocessed images from space

and spatial frequency domain filters were subject to global thresholding to separate the

nucleus and cytoplasm regions. The decision weighted on a statistical basis of the

morphological properties of the cellular nuclei was used for the classification, allowing

counting of nuclear phases and determination of the mitotic index per slide. The images of

each slide were processed for about 60 seconds, identifying an average of 95% of the nuclei.

and correctly classified on average 63.8% of the nuclei, showing no significant differences in

mitotic indexes, at the 5% level, between manual counting and automatic counting. In

addition to the immediate results, the technique is expected to promote test standardization,

greater efficiency in the use of human resources and equipment, reduction of the time to

obtain the results, lower operational cost in the process, and greater reliability in the test

results.

Keywords: Algorithm, global thresholding, discrete classification process, mathematical

morphology, geometric descriptors, environmental monitoring.

LISTA DE FIGURAS

Figura 1 - DNA e síntese proteica. ..................................................................................... 16

Figura 2 - Fases do ciclo da divisão celular ........................................................................ 18

Figura 3 – Estágios da mitose ............................................................................................. 19

Figura 4 – Falhas na mitose. ............................................................................................... 20

Figura 5 - Pares de cromossomos do Allium cepa. (Leme, 2009) ...................................... 21

Figura 6 - Passos fundamentais do processamento de imagens. ........................................ 25

Figura 7- Modelo RGB.. ..................................................................................................... 28

Figura 8 - Círculo de Cores. ............................................................................................... 29

Figura 9 - Representação da profundidade da imagem digitalizada. .................................. 30

Figura 10- Função f(x) e resposta de F(u) no domínio da frequência.. .............................. 33

Figura 11- Espaço da transformada bidimensional de Fourier ........................................... 33

Figura 12 – Máscaras bidimensionais de filtros de imagem. ............................................. 34

Figura 13 – Aplicação da transformada exponencial em uma linha de imagem. ............... 36

Figura 14 - Transformada Euclidiana aplicada à imagem escura de ponto central. ........... 37

Figura 15 - Transformada euclidiana aplicada dentro de uma região. ............................... 37

Figura 16 - Filtro de média 3x3 .......................................................................................... 38

Figura 17- Histogramas multimodais. ................................................................................ 40

Figura 18 – Influência da iluminação não uniforme no histograma bimodal. .................... 41

Figura 19 – Operação de rotulação da função bwboundaries. ........................................... 42

Figura 20 - Ensaio com Allium cepa. ................................................................................. 47

Figura 21 - Metodologia aplicada no desenvolvimento do trabalho. ................................. 48

Figura 22 – Imagem de referência I .................................................................................... 49

Figura 23 - Imagem de referência II.. ................................................................................. 50

Figura 24 - Imagem de referência II com identificação das fases. ..................................... 50

Figura 25 – Definição da ampliação e iluminação das imagens......................................... 52

Figura 26 - Imagens de prova. ............................................................................................ 53

Figura 27 - Imagem do microscópio BX43. ....................................................................... 54

Figura 28 -Histograma dos canais R (vermelho), G (verde), B (azul), respectivamente. .. 54

Figura 29 - Aplicação da transformada de Fourier como filtro para altas frequências ...... 55

Figura 30 – Aplicação do filtro de média. .......................................................................... 55

Figura 31 – Aplicação da transformada exponencial.. ....................................................... 56

Figura 32 - Imagem segmentada dos núcleos. .................................................................... 58

Figura 33 - Aplicação dos contornos vetorizados nos núcleos das células. ....................... 59

Figura 34 - Determinação do valor D. ................................................................................ 60

Figura 35 – Esquema de decisão.. ...................................................................................... 62

Figura 36 – Comportamento dos fatores morfológicos quanto aos tipos de núcleo........... 63

Figura 37 - Procedimento para ajuste dos valores dos pesos. ............................................ 64

Figura 38- Imagem de referência com reconhecimento de todos os núcleos. .................... 67

Figura 39 - Imagem de referência (2 MP). ......................................................................... 68

Figura 40 - Imagem real de laboratório - Imagem_98. ....................................................... 70

Figura 41 - Imagem real de laboratório - Imagem_54.. ...................................................... 71

Figura 42 - Contagem manual da imagem 98.. ................................................................... 72

Figura 43 - Contagem manual da imagem 54.. ................................................................... 73

Figura 44 – Aspectos de melhorias. .................................................................................... 80

Figura 45 – Contornos da solução na lâmina. .................................................................... 81

Figura 46 - Bolhas e contorno da solução. ......................................................................... 81

Figura 47- Impurezas das lâminas. ..................................................................................... 81

Figura 48 - Algoritmo de esqueletização. ........................................................................... 82

Figura 49 - Subdivisão da mitose do A. cepa. .................................................................... 83

SUMÁRIO

1 INTRODUÇÃO 12

1.1 OBJETIVO 14

2 REVISÃO DE LITERATURA 15

2.1 AS CÉLULAS 15

2.2 CICLO CELULAR EUCARIÓTICO 17

2.3 FALHAS NA DIVISÃO CELULAR 19

2.4 Allium cepa 21

2.5 Allium cepa NO MONITORAMENTO AMBIENTAL 22

2.6 ANÁLISE E CONTAGEM 23

2.7 PROCESSAMENTO DE IMAGENS DIGITAIS (PDI) 24

2.7.1 Representação da imagem 26

2.7.2 Formato de arquivos de imagem 30

2.7.3 Pré-processamento da imagem 32

2.7.4 Segmentação 39

2.7.5 Representação e descrição 42

2.8 CONTAGENS DE CÉLULAS E TRABALHOS SEMELHANTES 44

2.9 MATLAB 45

3 DESENVOLVIMENTO 47

3.1 IMAGENS DE REFERÊNCIA 49

3.2 IMAGENS DE LÂMINAS 51

3.3 PRÉ-PROCESSAMENTO 53

3.4 SEGMENTAÇÃO 57

3.5 FASE 1 - DETECÇÃO 58

3.5.1 Representação e descrição 58

3.5.2 Reconhecimento e interpretação 59

3.6 FASE 2 - DIFERENÇAS SIGNIFICATIVAS 66

3.7 FASE 3 – RESULTADOS E DISCUSSÃO 67

3.7.1 Avaliação com as imagens de referência 67

3.7.2 Avaliação com as imagens de lâminas de Allium cepa 69

3.7.2 Discussão sobre os resultados 78

4 CONCLUSÕES 84

REFERÊNCIAS 86

APÊNDICE A – PROCEDIMENTOS E FUNÇÕES DO ALGORITMO 90

APÊNDICE B – LISTAGEM DOS CÓDIGOS EM MATLAB 91

APÊNDICE C – LÂMINAS DE Allium cepa UTILIZADAS NO TRABALHO 103

APÊNDICE D – IMAGENS PARA CALIBRAÇÃO 105

ANEXO A – FUNÇÕES DO MATLAB UTILIZADAS 107

ANEXO B – PROCEDIMENTO DE PREPARAÇÃO DAS LÂMINAS DE A.cepa

108

ANEXO C – DESCRIÇÃO DA FUNÇÃO regionprops() 109

12

1 INTRODUÇÃO

O planeta está submetido a um ritmo acelerado de crescimento da população humana

(UNWPP, 2017). Motivado pela busca na redução de custos e da maior produtividade, o

consumo de agrotóxicos cresceu no mundo quase 100% entre os anos de 2000 e 2009

(FOLGADO, 2013). No Brasil, devido à legislação, permite-se um consumo ainda maior que

na Europa (LAZZERI, 2017), o que tem trazido preocupação com os possíveis efeitos destes

novos usos no meio ambiente (MOTA, 2001). A avaliação e caracterização da extensão dos

efeitos destes agentes de compostos químicos, pesticidas e fármacos no meio ambiente são

realizadas por ensaios laboratoriais utilizando organismos-teste.

Dentre os organismos de teste empregados em ensaios ambientais, pode-se utilizar células

vegetais para determinar o nível de citotoxidade e genotoxicidade de agentes novos ou de

agentes conhecidos em novos cenários (BAGATINI et al. 2007). Os ensaios com Allium cepa

estão entre os mais utilizados no mundo. Validados pelas Nações Unidas no Programa

Internacional de Segurança Química (IPCS, OMS) e Programa Ambiental das Nações Unidas

(UNEP) (BAGATINI et al. 2007; GRANT, 1999), vêm sendo utilizados desde os anos 1940

(LEVAN, 1938).

O procedimento é realizado com a utilização das raízes deste vegetal postas em contato

com a substância cujos efeitos estão sob análise, em solução aquosa, em concentrações

diferentes conforme o objetivo do ensaio. A importância dos ensaios com Allium cepa é

verificada pela abrangência dos temas publicados em áreas que se estendem de gestão de

recursos hídricos (PEIXER, 2016; SILVA et al., 2009), passam pela avaliação da presença de

metais (FISKESJÖ, 1988), avaliação da presença de antibióticos na água (HENRIQUE,

2014), análise de pesticidas (MESI; KOPLIKU, 2013) à avaliação dos efeitos de plantas

medicinais (BAGATINI et al. 2007; FACHINETTO et al., 2007).

Os ensaios com Allium cepa são caracterizados pela facilidade na preparação das

amostras, rápido crescimento das raízes, simplicidade e pela facilidade de observação pelas

dimensões cromossômicas (GUERRA; SOUZA, 2003; SILVA et al., 2009), além da

sensibilidade da estrutura celular diante de contaminantes (SILVEIRA et al., 2017) e pela

semelhança de alguns efeitos observados em células animais (BAGATNI et al. 2007;

BIANCHI, 2008), cujos resultados poderiam ser extrapolados a partir dos testes com Allium

cepa.

13

As raízes do Allium cepa, depois de expostas ao contaminante por determinados períodos

de tempo conforme objetivo do ensaio, são lavadas, cortadas, esmagadas e recebem coloração

específica (GUERRA; SOUZA, 2003) para obter bom preparo das lâminas, permitindo

melhor visualização no microscópio. O procedimento adotado está disponível no anexo B.

Pela visualização no microscópio, são obtidos os resultados do ensaio como índice mitótico

(IM), existência de micronúcleos (MN), ocorrências de perdas cromossômicas e outras

anormalidades nucleares (GUERRA; SOUZA, 2003; LEME et al., 2009).

O índice mitótico (IM), que define a taxa de multiplicação celular, é um parâmetro

fundamental na avaliação citotóxica, obtido nos ensaios pela razão entre o total de células em

divisão e a quantidade de células observadas em interfase, cuja contagem deve ultrapassar

1000 unidades para se obter um resultado com padrão estatístico aceitável (FISKESJÖ, 1988).

Os estudos publicados envolvem quantidades entre 4.500 e 10.000 células contadas por

tratamento1, estabelecendo, de maneira geral, 500 células por lâmina (BAGATINI et al.,

2007; BIANCHI, 2008; HENRIQUE, 2014; MARTINS et al., 2016). A quantidade de células

contadas pode aumentar muito se o ensaio envolver muitas soluções na análise (MORO et al.,

2017). A determinação da ocorrência de aberrações cromossômicas como pontes, aderências e

quebras cromossômicas, além de micronúcleos e células com polinúcleos ou células

poliploides, completa a determinação dos efeitos genotóxicos (LEME et al., 2009; MARTINS

et al., 2016).

Embora os estudos não mencionem o tempo gasto no levantamento dos resultados dos

ensaios, estima-se que a contagem de 6.000 células mantenha o pesquisador envolvido por

horas neste levantamento. Considerando, por exemplo, que cada célula contada gaste um

segundo e meio ao microscópio, um tratamento com 6000 células contadas demandaria quase

três horas, sem considerar intervalo para alívio da fadiga, troca de lâminas, reposicionamento

da mesa e troca das objetivas do microscópio. A natureza da atividade exige atenção por um

longo período. Foi observado na prática, ao longo da fase das avaliações, que um pesquisador

experiente consome 20 minutos para contagem de 1000 células por lâmina.

Não foram encontrados equipamentos ou outros trabalhos que tratassem de identificação

ou de contagem automática de células ou núcleos de Allium cepa. Trabalhos que

desenvolveram processos automáticos para identificação e contagem de células humanas e

colônias de bactérias, foram utilizados como fontes de referência. A literatura apresenta a fase

1 O tratamento, neste contexto, é composto pelo conjunto de lâminas obtidas em um ensaio para uma determinada concentração da substância sob análise. Ainda neste contexto, três organismos (A. cepa) são submetidos à uma certa concentração da substância, dos quais são retirados três bulbos de cada organismo, resultando em nove lâminas obtidas deste tratamento.

14

de divisão celular eucarióticas em quatro (LODISH et al., 2014) ou cinco (ALBERTS et al.,

2011) estágios (quando inclui a prometáfase), apresentando os aspectos morfológicos típicos

de cada estágio ou fase, embora tenham sido observados, ao longo do desenvolvimento do

trabalho, vários aspectos morfológicos intermediários em cada fase ou estágio ao longo da

divisão celular, cujas características morfológicas guardam aspectos das fases ou estágios

próximos, anteriores e posteriores. Pires (2001), em seus relatórios publicados na Internet,

apresentou 13 aspectos morfológico intermediários distintos do núcleos de A. cepa,

observados em microscópio, cuja contribuição foi mencionada para trabalhos futuros. As

impurezas das lamínulas, sobreposições de núcleos e as aberrações cromossômicas ainda são

desafios para o processamento de imagem das lâminas de A. cepa e são outros desafios do

trabalho.

A proposta deste trabalho foi o desenvolvimento de um algoritmo que torne possível

reduzir o tempo de análise por um sistema automático de contagem e que realize a contagem

em minutos, ao invés de horas, proporcionando uma melhora na qualidade do trabalho, menor

estresse e possivelmente maior confiabilidade. Se isto for possível, do ponto de vista da

gestão ambiental, estar-se-ia reduzindo o uso do laboratório, do equipamento e do

profissional, naturalmente reduzindo o custo, tornando os ensaios de monitoramento

ambiental e investigação mais baratos, tanto do ponto de vista de recursos humanos quanto do

uso de energia.

O algoritmo processa imagens com resolução de 2 MP e 10,6 MP provenientes de

microscópios equipados com câmeras digitais nestas resoluções, em formato compactado com

e sem perdas, com ampliação de 40X e iluminação intermediária no condensador, realizando a

contagem a uma taxa de 1000 células por minuto, com acuraria de 63,8% na identificação da

fase correta do ciclo mitótico e, por fim, não apresentando diferenças significativas nos

valores médios do IM entre a contagem automática e a contagem manual, determinado pela

ANOVA com teste Tukey, ao nível de significância de 5%.

1.1 OBJETIVO

Desenvolver um algoritmo de processamento de imagem que seja capaz de realizar a

identificação e a contagem de núcleos nos estágios e fases da mitose do Allium cepa em

lâminas de teste.

15

2 REVISÃO DE LITERATURA

2.1 AS CÉLULAS

O termo célula é empregado de maneira genérica para definir as unidades formadoras

básicas que caracterizam os seres vivos. As células, no entanto, podem ser muito diferentes

entre si, possuindo dimensões, funções, forma e necessidades químicas diferentes, mas que

trabalham em conjunto no funcionamento de organismos complexos. Os organismos

complexos contêm órgãos, que em sua essência são compostos por tecidos. Os tecidos, por

sua vez, são constituídos por células, que são formadas e executam suas funções celulares por

meio de moléculas (LODISH et al., 2014). Embora células diferentes apresentem diferenças

funcionais externas, são fundamentalmente muito semelhantes por dentro, na sua química,

pois possuem os mesmos tipos de moléculas e realizam os mesmos tipos de reações químicas

(ALBERTS et al., 2011; LODISH et al., 2014). O ácido desorribonucleico (ADN, ou DNA –

no idioma inglês), é uma macromolécula presentes nas células de todos os organismos. O

DNA é formado por uma longa sequência de quatro monômeros, denominados de

nucleotídeos e representados pelas letras A (adenina), T (timina), C (citosina) e G (guanina),

que estão concentrados em duas longas fitas quimicamente relacionadas e estruturalmente

helicoidais, formando uma dupla-hélice, que mantém toda a codificação genética da célula e é

responsável pelo fenômeno da hereditariedade (Figura 1-A) (ALBERTS et al., 2011; LODISH

et al., 2014). Os nucleotídeos, ou bases, possuem aderência química, onde as bases A e C,

presentes em uma fita, se ligam às bases T e G, respectivamente, na outra fita, ao longo da

estrutura do DNA. As informações genéticas transportadas pelo DNA ficam armazenadas ao

longo da fita, mas em trechos específicos de sequências lineares dos nucleotídeos,

denominados genes. Os genes se dividem em duas partes, sendo uma codificadora, que

especifica a sequência de aminoácidos na formação de proteínas, e outra reguladora, que

determinam a ativação das proteínas e controlam a síntese proteica (LODISH et al., 2014). Os

Aminoácidos são compostos quaternários formados por carbono, hidrogênio, oxigênio e

nitrogênio. Existem 20 aminoácidos principais, denominados aminoácidos primários

(ALBERTS et al., 2011; LODISH et al., 2014), que se organizam em longas cadeias de

centenas ou milhares de aminoácidos, orientados pelo sequenciamento definido no gene,

formando as proteínas (Figura 1-C). As proteínas são os principais blocos construtores das

16

células e, em grande parte, definem as características como suporte estrutural, catalisação

química e motores moleculares, além da aparência e do comportamento das células

(ALBERTS et al., 2011).

Durante a reprodução celular o DNA é duplicado. A dupla-hélice é estabilizada por

ligações fracas entre as bases A e T e entre as bases C e G. Durante a duplicação, as fitas são

descompactadas e utilizadas como moldes para produzir fitas complementares, que resultam

em duas cópias do DNA original (LODISH et al., 2014) (Figura 1-A).

Nas células eucariontes o material genético fica confinado dentro do núcleo, delimitado

por uma membrana denominada carioteca. Os cromossomos existentes nos núcleos das

células eucariontes são estruturas lineares que armazenam o DNA compactado (Figura 1-B) e

proteínas. As proteínas atuam na compactação e controle do DNA (ALBERTS et al., 2011).

Todas as células de um mesmo tipo de organismo compartilham as mesmas quantidades e

comprimentos dos cromossomos, entretanto são distintos entre organismos diferentes

(LODISH et al., 2014).

Figura 1 - DNA e síntese proteica. Adaptado de Albert e coautores (2011) e Lodish e

coautores (2014)

17

2.2 CICLO CELULAR EUCARIÓTICO

A divisão celular pode ser definida por um conjunto de eventos moleculares que levam à

produção de duas células filhas na divisão celular. A divisão celular que pode ocorrer

raramente ou continuamente, dependendo da especialização da célula (LODISH et al., 2014).

Pode ocorrer ainda pelo ciclo da meiose, na qual ocorre redução cromossômica para as células

filhas, ou pela mitose, na qual a divisão celular se processa após a duplicação cromossômica,

sendo este último o processo pelo qual as raízes de A. cepa se multiplicam e no qual, portanto,

há maior interesse no presente trabalho.

A divisão celular ocorre ao longo de quatro fases cíclicas, denominadas de G1, S, G2 e M,

apresentadas na parte inferior da Figura 2 . Na fase S (síntese) ocorre a duplicação do DNA

parental. Na fase M (mitótica) ocorre a divisão do núcleo, por um processo denominado

mitose, e a divisão do citoplasma, por um processo denominado citocinese, cujos resultados

são duas novas células, onde cada qual carrega as cromátides filhas idênticas, produzidas na

fase S.

O intervalo compreendido entre o final de uma fase M e o início da próxima fase M,

composto pelas fases G1, S e G2, é denominado interfase. Durante a interfase a célula cresce

continuamente, realizando a transcrição genética e síntese de proteínas. Na fase G1 (pré-

síntese) a célula aguarda, em intensa atividade metabólica (ALBERTS et al., 2011), um

estímulo para iniciar a duplicação do DNA. Na fase S, ocorre a duplicação do DNA. Na fase

G2 (pós-síntese) os cromossomos se apresentam duplicados e a célula permanece aguardando

um novo estímulo, desde que não existam erros de duplicação ou duplicação incompleta, para

entrar na fase M e iniciar a divisão celular (ALBERTS et al., 2011; LODISH et al., 2014). A

interfase dura o tempo necessários para a duplicação de todas as organelas da célula. A fase

M, que possui duração muito menor que a interfase, é apresentada na parte superior da Figura

2.

Na fase M, durante a prófase, os centros celulares iniciam a migração para as

extremidades opostas da célula, ocorre o surgimento das fibras dos fusos, as cromátides

iniciam a condensação pelo giro da estrutura e a carioteca começa a ser degradada. Na

metáfase, os fusos estão posicionados nos hemisférios opostos, as fibras se encontram

alongadas, a carioteca já inexiste, os cromossomos estão completamente condensados e

alinhados formando a placa metafásica, esquematizado, assim como os demais estágios, na

18

parte superior da Figura 2. No estágio da anáfase, ainda na fase M, os centríolos rompem,

tracionados pelas fibras dos fusos, separando os cromossomos que iniciam a descondensação

e recomeça a formação da carioteca. Na telófase ressurgem os nucléolos, a carioteca se

apresenta formada e se inicia a citocinese, que finaliza a divisão celular (LODISH et al.,

2014).

As substâncias citotóxicas e genotóxicas quando entram em contato com as células

alteram os ciclos descritos acima, interferindo na duplicação cromossômica ou na velocidade

da divisão celular (efeito aneugênico) (LEVAN, 1938). Entre outros efeitos estão as quebras,

aderências ou rearranjos cromossômicos (efeito clastrogênico) que podem levar à ocorrência

de células haploides ou polipoides e mutações. Estas alterações serão apresentadas

brevemente na seção 2.3

Figura 2 - Fases do ciclo da divisão celular (LODISH et al., 2014)

19

2.3 FALHAS NA DIVISÃO CELULAR

Nos procedimentos laboratoriais que utilizam organismos como corpo de prova, os

ensaios são preparados para avaliar as alterações no ciclo celular para uma série de amostras

submetidas a diferentes concentrações da substância em análise (LEVAN, 1938). Esta

avaliação é realizada pela comparação entre os resultados obtidos nesses ensaios e os

resultados obtidos do mesmo tipo do organismo sem a presença da substância sob análise

(controle negativo). Substâncias com potencial citotóxico e genotóxico, em determinadas

concentrações, afetam as reações químicas de síntese, controle ou sinalização no interior da

célula, interrompendo ou impedindo os eventos esperados, produzindo os efeitos identificados

como aderências, perdas e quebras cromossômicas e outros efeitos apresentados à frente. Na

Figura 3, nos quadros A, B e C, são apresentados estágios da mitose (metáfase, anáfase,

Figura 3 – Estágios da mitose: normal: A, B e C; quebra cromossômica: A1, B2; ponte

cromossômica:B1, B2, C1, C2; metáfase-C: A2;

20

telófase) com ocorrências normais da divisão celular. Nos quadros A1, B1 e C1, são

apresentados os mesmos estágios da mitose, porém com falhas na divisão celular. No quadro

A1 há perda de uma pequena parte do cromossomo. Nos quadros B1 e C1 são apresentados

duas pontes cromossômicas, causadas por substância genotóxica, segundo Leme (2009). Nos

quadros seguintes da Figura 3, em A2, é apresentada uma metáfase-C, falha na qual ocorre a

duplicação cromossômica, mas sem ocorrência da citocinese e ausência permanente da

carioteca. Na Figura 3, nos quadros B2 e C2, são apresentadas ocorrências simultâneas de

pontes e perdas cromossômicas.

Na Figura 4 são apresentados vários efeitos clastrogênicos, como ocorrências de: perdas

cromossômicas, registrados nos quadros A3, B3, B4 e C3, nas quais partes do cromossomo se

desconectam (quebram). Há ocorrências de micronúcleos (MN), apresentados nos quadros

D3, D4 e D5, nas quais a fragmentação do cromossomo gera a formação de um pequeno

núcleo próximo ao núcleo original da célula. Há registro de células binucleadas no quadro A4,

efeito no qual não ocorre a citocinese. Aderências cromossômicas são apresentadas no quadro

A5, nos quais os cromossomos diferentes se unem parcialmente e, por fim, divisões

multipolares nos quadros B5, C4 e C5, efeito no qual se observa o surgimento de mais de dois

Figura 4 – Falhas na mitose. Perda cromossômica: A3, C3, B3 e B4; ponte cromossômica: B3

e C5; célula binucleada: A4; divisões multipolares: B5, C4 e C5; aderência cromossômica:

A5; micronúcleo: D3, D4 e D5;

21

polos que arrastam os cromossomos em direções distintas, produzindo múltiplos núcleos

incompletos no interior da célula.

Os dados obtidos dos ensaios são concentrados em: índice Mitótico, definido na seção 2.6,

e na contabilização das Aberrações Cromossômicas, Anormalidades Nucleares e ocorrências

de Micronúcleo.

2.4 Allium cepa

O Allium cepa é um organismo vegetal amplamente utilizado pela comunidade científica

na avaliação de substâncias citotóxicas e genotóxicas (SILVA et al., 2009), sendo

frequentemente utilizado no monitoramento ambiental (FISKESJÖ, 1988). O A. cepa foi

introduzido por Levan (1938) ao observar as alterações incomuns ocorridas na mitose deste

organismo ao ser submetido ao tratamento com colquicina. Nesta oportunidade, destacou a

sensibilidade do A. cepa e denominou o efeito observado de ”mitose C” (C-mitosis) (LEVAN,

1938). A utilização do A. cepa é ampla, principalmente por apresentar facilidade de obtenção,

possuir cromossomos grandes e reprodução rápida (GUERRA et al., 2003). É fácil de

armazenar e manipular e apresenta características convenientes para observação em

microscópio (FISKESJÖ, 1988). O A. cepa possui um pequeno número de cromossomos (2n

= 16) (Figura 5) que são de fácil visualização no microscópio (GUERRA et al., 2003),

contribuindo para a identificação das alterações cromossômicas (SILVEIRA et al., 2017).

Estudos publicados nas últimas décadas apontaram que o A. cepa apresenta resultados de

ensaios com significativa semelhança a resultados apresentados por células animais

(CHAUHAN et al., 1999; GRANT, 1999; SILVEIRA et al., 2017).

Figura 5 - Pares de cromossomos do Allium cepa. (Leme, 2009)

22

Os ensaios laboratoriais com A. cepa são empregados em várias áreas de estudo para a

determinação dos efeitos e na avaliação dos impactos de substâncias no meio ambiente. Os

efeitos citotóxicos se manifestam nas alterações funcionais da célula, reduzindo ou

aumentando a taxa de reprodução celular, efeito objetivo detectados por alteração do índice

mitótico (IM) (FISKESJÖ, 1988). Os efeitos genotóxicos são confirmados na presença de

aberrações cromossômicas (AC) ou nucleares, observadas na ocorrência de pontes, quebras

cromossômicas e Micronúcleos (MN), que podem se manifestar de maneiras diferentes

conforme o tipo de substância contaminante e o tempo de exposição (MARTINS et al., 2016;

MORO et al., 2017).

2.5 Allium cepa NO MONITORAMENTO AMBIENTAL

O Allium cepa aparece em vários estudos ambientais, sendo citado frequentemente como

bioindicador na avaliação dos efeitos de contaminantes presentes em vários ambientes. A

presença de cafeína nas águas do reservatório do rio Passaúna, em Curitiba/Brasil, foi

investigada apontando problemas na crescente degradação na qualidade da água. Ensaios

complementares com A. cepa apontaram a presença de contaminantes associados à cafeína,

com efeitos citotóxicos e genotóxicos (PEIXER et al., 2016). Estes autores analisaram pontos

de águas superficiais no rio e no reservatório do Passaúna durante quatro meses. Observaram

aumento no índice mitótico (IM) em 80% dos pontos coletados, além da ocorrência de

alterações cromossômicas em 20% dos pontos. As alterações cromossômicas observadas

foram perdas de cromossomos, mitose C e pontes cromossômicas no estágio da Anáfase e

aderências e perdas cromossômicas no estágio da Metáfase. A observação destas alterações

foi importante porque indicou a presença de outros contaminantes genotóxicos juntamente

com a cafeína, apresentando correlação positiva com o aumento do índice de alterações

cromossômicas (IAC). O A. cepa foi apresentado como bioindicador de primeira análise para

avaliar os efeitos de plantas conhecidas, popularmente, como medicinais (BAGATINI et al.,

2007).

A sensibilidade do A. cepa na presença de substâncias oxidativas, foi comprovada na

avaliação de hidroxilas e peróxidos, produzidas pela presença de metais pesados e compostos

fenólicos, em amostras coletadas em áreas industriais próximas a Nova Deli, na Índia

(TABREZ; AHMAD, 2011). Os pesticidas, que representam um amplo grupo de produtos

23

químicos encontrados na agricultura, veterinária e em residências, foram avaliados quantos

aos efeitos citotóxicos e genotóxicos, apresentado sob certas concentrações e tempo de

exposição, utilizando o A. cepa como organismo de teste (BIANCHI, 2008; CHAUHAN;

SAXENA; GUPTA, 1999; MESI; KOPLIKU, 2013). Ainda na avaliação ambiental, o

inseticida Malation foi testado em células vegetais e animais para comparar os efeitos nestes

dois sistemas em concentrações diferentes, utilizando nos ensaios A. cepa e células hepáticas

de ratos. Assim como apresentado anteriormente por Fiskesjö (1985), Bianchi (2008)

encontrou nos efeitos do Malation, tanto resultados coerentes entre os sistemas de teste,

quanto resultados sem relação de equivalência.

Em temas de gestão de recursos hídricos, o A. cepa foi utilizado em estudos recentes

alertaram sobre a concentração de antibióticos encontrados em corpos de água, seus possíveis

efeitos potenciais na cadeia trófica e nas consequências decorrentes nos tratamentos médicos

(HENRIQUE, 2014). A viabilidade para utilização de lodo tratado na agricultura,

provenientes de estações de tratamento de esgoto (ETE), foi avaliada neste trabalho que

evidenciou nos ensaios com A. cepa que, embora os tratamentos higienizadores do lodo

tivessem reduzido a citotoxicidade e genotoxicidade, ainda apresentava resultado positivo

para micronúcleos e recomendava cautela no uso deste recurso (MARTINS et al., 2016).

O A. cepa foi empregado na análise das águas do rio Jaru, em Rondônia, identificando, em

período de seca na região, alteração do índice mitótico e ocorrência de micronúcleos nos

pontos de coleta, sujeito a efluentes de laticínios e urbanos (FARIA, et al. 2017). O A. cepa

foi também aplicado como bioindicador na definição da toxicidade de efluentes de corantes

têxteis como contaminação direta e contínua nos ecossistemas aquáticos (RAHMAN; et al.,

2017).

2.6 ANÁLISE E CONTAGEM

Os trabalhos publicados utilizando Allium cepa apresentam quantidade elevada de

contagem de células para garantir a qualidade estatística do resultado. Bagatini e

colaboradores (2007) no seu estudo sobre plantas medicinais estabeleceram a contagem de

1.000 células por bulbo totalizando 6.000 células, incluindo as lâminas de controle. Bianchi

(2008) no seu estudo comparativo sobre os efeitos do inseticida Malation em células vegetais

e animais, preparou 20 lâminas para a contagem de 500 células por lâmina, totalizando 10.000

24

contagens por tratamento. Henrique (2014) realizou um estudo com antibióticos e avaliou os

efeitos citotóxicos e genotóxicos pela preparação de nove lâminas para a contagem de 500

células, totalizando 4.500 contagens por tratamento. Martins e colaboradores (2016) na

avaliação sobre o lodo de duas estações de tratamento de esgoto, utilizaram a contagem de

5.000 células por tratamento. Moro e colaboradores (2017) apresentaram um estudo sobre os

efeitos de drogas emergentes em 22 soluções diferentes, utilizando 4.500 células por solução,

totalizando 99.000 contagens.

O índice mitótico é definido pela equação 1.

𝐼𝑀 =

𝐶é𝑙𝑢𝑙𝑎𝑠 𝑒𝑚 𝐷𝑖𝑣𝑖𝑠ã𝑜

𝐶é𝑙𝑢𝑙𝑎𝑠 𝑇𝑜𝑡𝑎𝑖𝑠. 100 % (1)

A variação do IM pode indicar a presença de contaminante com potencial citotóxico,

quando comparado aos valores obtidos pelo tratamento de controle.

2.7 PROCESSAMENTO DE IMAGENS DIGITAIS (PDI)

A importância deste tema é apresentada por Gonzales e Woods (2000) quando afirmam

que o processamento de imagens estabeleceu uma área de pesquisa específica dentro dos

cursos de graduação e pós-graduação. O processamento de imagens é realizado aplicando-se

uma série de técnicas às imagens capturadas no intuito de melhorar a qualidade da imagem e

isolar regiões de interesse, permitindo a extração de informações para o reconhecimento e

interpretação dos objetos existentes nas cenas capturas (BACKES; SÁ JUNIOR, 2016;

GONZALEZ; WOODS, 2000). O uso das técnicas disponíveis varia conforme o caso e

depende de cada problema avaliado (GONZALEZ; WOODS, 2000). O processamento de

imagens pode ser divido em partes funcionais: aquisição da imagem, pré-processamento,

segmentação, representação e descrição e reconhecimento e interpretação, apresentados na

Figura 6. Os livros da área apresentam vários algoritmos básicos para cada fase do

processamento de imagens, que podem ser usados em conjunto e servir de base para a

construção de novos algoritmos que resolvam problemas mais específicos. A obra de

Gonzalez e Woods (2000) se encontra na quarta edição, sendo utilizada desde 1992. Os

artigos trazem frequentemente os autores desta obra como referência fundamental. A obra de

25

Backes e Sá Júnior (2016) tem uma abordagem diferente, apresentando a utilização e a

construção de algoritmos focados no MATLAB.

Figura 6 - Passos fundamentais do processamento de imagens. Fonte: adaptado de

Gonzales e Woods, 2000.

Há várias iniciativas que abordam o processamento de imagens para identificação,

caracterização e contagem de células. A identificação e contagem de cinco tipos diferentes de

leucócitos foram desenvolvidos com a utilização do MATLAB, apresentando uma acurácia de

95% nos resultados (NAZLIBILEK et al., 2014). O aplicativo CellProfiler, distribuído

gratuitamente, é uma biblioteca de recursos de processamento de imagens com capacidade

para criar uma solução para contagem de células animais e vegetais. É necessário ajustar a

sequência das funções e preencher uma grande lista de parâmetros para orientar o sistema a

detectar os alvos específicos. Por ser uma solução genérica com grande potencial de

aplicação, exige um intensivo processo de parametrização e conhecimento da base de

processamento de imagens para a extração das informações das imagens submetidas ao

algoritmo. A detecção e contagem de linfócitos quanto a presença de micronúcleos (MN) e

células binucleadas foi implementado usando o CellProfile (RAMADHANI; PURNAMI,

2013). Os resultados mostraram uma acurácia de 85,1% para células binucleares e 91,7% para

micronúcleos (MN), equiparados, mas não melhores que a contagem manual.

Fabricantes de microscópios com recursos de captura de imagem digital fornecem

programas com funções úteis para melhorar, adquirir e processar imagens, podendo separar

objetos simples e realizar medições lineares e cálculo de áreas, como o programa AxioVisio

26

da empresa Carl Zeiss e o programa Ariol da empresa Leica. Outros sistemas conseguem

adquirir, pré-processar e limiarizar a imagem para facilitar as análises laboratoriais.

Outros sistemas comerciais pesquisados apresentam especificamente contagem de MN de

células animais. O Laboratory Imaging, oferece o produto LUCIA Micronucleus. Operando

em conjunto um microscópio robotizado, que carrega lâminas automaticamente, digitaliza

imagens, encontra MN e cataloga as imagens das células isoladas, identificadas no processo.

É fornecido como parte de um sistema mais completo de diagnóstico por imagens

(IMAGING, [s.d.]).

A empresa Metasystem fornece soluções para teste cometa, cromossomos dicêntricos2 e

pontuação de micronúcleos (METASYSTEMS, [s.d.]), como parte do programa

computacional Metafer. O Metafer utiliza amostras de vários tamanhos, usa muitos métodos

de ampliações e diferentes contrastes3 para identificação de objetos diferentes.

O contador de células automatizado TC20 da Bio-rad, conta as células de mamíferos

(BIO-RAD, [s.d.]). Usando um sistema com câmera de foco automático e um algoritmo

próprio, realiza a contagem de células primárias (de tecido ou sangue) e células-tronco em

menos de 30 segundos, segundo o fabricante. O equipamento fornece a contagem total de

células e avalia a viabilidade celular pela exclusão de azul de tripano4.

2.7.1 Representação da imagem

As imagens reais enquadradas em um campo de visão ou por um dispositivo eletrônico de

captura são analógicas, possuindo níveis de iluminação refletida que variam de valores muito

baixos a valores muito elevados. Um modelo para a representação da imagem pode ser

entendido como uma função intensidade luminosa bidimensional representada por f(x,y), que

retorna a intensidade do sinal refletido nas coordenadas x e y do campo de observação. Sendo

energia, a intensidade refletida é positiva e finita, existindo dentro dos limites: 0<f(x,y)<1. As

imagens percebidas por um observador são dependentes da iluminação dos objetos da cena e

da reflexão da luz destes objetos até atingirem a retina do observador ou o sensor óptico de

2 Cromossomos com dois centrômeros que se originam do rearranjo de dois cromossomos danificados independentes. 3 Aplicado neste contexto para indicar substâncias que atuam realçando de partes das células. 4 Corante azoico usado em colorações histológicas para ensaios de viabilidade celular.

27

um dispositivo. A função iluminação pode ser descrita como um produto da iluminação (i)

pela refletância (r), descrita pela equação 2 e para os intervalos da relação 3.

f(x, y) = i(x, y). r(x, y) (2)

Onde:

0 < i(x, y) < ∞ e 0 < r(x, y) < 1 (3)

Os limites da função refletância ficam entre 0, para a absorção total, e 1, para a reflexão

total. A iluminação depende das características da fonte de luz e a refletância das

características dos objetos. Valores médios práticos de iluminação são apresentados na Tabela

1, (GONZALEZ; WOODS, 2000)

Tabela 1 - Valores médios de iluminação

Ambiente Iluminação (lm.m-²)

Dia claro com sol 96.000

Dia Nublado 10.700

Noite clara de lua cheia 0,11

Escritório comercial típico 1076

Valores de refletância típicos são apresentados na Tabela 2 (GONZALEZ; WOODS, 2000)

Tabela 2 - Valores típicos de refletância

Material Refletância

Veludo Negro 0,01

Aço inoxidável 0,65

Parede branca 0,80

Metal Prateado 0,90

Neve 0,93

O valor da função imagem fica entre os limites teóricos de Lmin e Lmax, cujas definições

são: Lmin = imin.rmin e Lmax = imax.rmax. Considerando os valores das Tabelas Tabela 1 e

Tabela 2, chega-se aos valores esperados para a função imagem entre 0,001 e 1000 lm.m-².

Para imagens monocromáticas, o intervalo [Lmin, Lmax] é denominado escala de cinza, sendo

comum aplicar um deslocamento no intervalo para [0, Lmax], produzindo imagens

monocromáticas entre 0, para o preto e Lmax, para o branco. No caso de imagens com escala

28

de cinza representada por 8 bits (28 estados), Lmax fica limitado ao valor 255, representação

utilizada para imagens monocromáticas tratadas neste trabalho.

As cenas coloridas podem utilizar diferentes modelos de cor para a representação da

imagem. No modelo RGB (Figura 7), cuja denominação é uma sigla das cores primárias

empregadas na representação das demais cores, a imagem é formada pela intensidade

combinada das cores vermelho, verde e azul, variando de preto, quando as intensidades estão

nos valores mínimos, a branco, quando as intensidades das cores estão no seu valor máximo.

Figura 7- Modelo RGB. Fonte: adaptado de Gonzales e Woods, 2000.

Uma imagem RGB pode ser convertida em imagem monocromática aplicando uma

combinação entre as cores primárias. A recomendação ITU-R BT.601-7 (ITU-R, 2011) é

sintetizada pela equação 4.

Y = 0,299. R + 0,587. G + 0,114. B (4)

A proporção apresentada na equação 4, gera o canal conhecido como luminância, Y, que

produz uma imagem monocromática equivalente à imagem original colorida.

Outros modelos de representação de cor (espaços de cor) operam diretamente com o canal

de luminância. Os modelos HSL e HSV utilizam, diferentemente do sistema cartesiano do

modelo RGB, coordenadas cilíndricas para representar a cor pura (matiz), a saturação e a

luminância. A matiz é determinada pelo ângulo formado pelas cores primárias, secundárias e

pela combinação delas. O ângulo zero graus representa a cor vermelha, passando pelo verde

29

puro em 120°, pelo azul puro em 240° retornando ao vermelho em 360°, conforme mostrado

na Figura 8 (GIMP, 2018).

Figura 8 - Círculo de Cores. (GIMP, 2018)

Na extremidade externa do disco, as cores estão na saturação máxima e no centro do disco

em saturação mínima. A saturação é definida como uma proporção relativa da participação do

branco na cor pura (GONZALEZ; WOODS, 2000). Quanto maior a saturação, menor a

participação do branco. No centro do disco residem as composições para formação dos tons

de cinza. O eixo Y que atravessa perpendicularmente o disco, pelo centro, representa a

luminância, no qual é montada a escala de cinza. O componente L, no modelo HSL, varia de 0

a 1, mas a saturação máxima ocorre no valor 0,5. Já no modelo HSV, o valor varia de 0 a 1,

ocorrendo a saturação em 1.

A imagem digital é obtida da imagem real pelo sistema informatizado, por um processo

denominado Amostragem e Quantização. A cena é dividida em pequenas partes conforme a

resolução do sensor utilizado na captura da imagem e ganha um valor que representa as

informações de cor e iluminação presentes nesta divisão. A resolução espacial é definida

como a quantidade de partes bidimensionais nas quais a cena é subdividida. A profundidade

da imagem é definida pela quantidade de valores cujas informações de cor e iluminação são

representadas (BACKES; SÁ JUNIOR, 2016; GONZALEZ; WOODS, 2000).

As imagens capturadas são tratadas como matrizes M por N, de mesma ordem que a

resolução da imagem, guardando em cada elemento f(m,n) o valor quantizado de luminância,

nas imagens monocromáticas, ou o valor dos componentes de cor, nas imagens coloridas.

30

A Figura 9 apresenta uma imagem colorida de um núcleo celular, no qual uma área

retangular, menor, está destacada, na região da borda do núcleo. Esta área expandida, na

mesma figura, apresenta os componentes de cor e o sistema de coordenadas da imagem. O

pixel com a marca vermelha, por exemplo, está na coordenada (156, 190) e possui os

componentes de cor no modelo RGB (207, 214, 198).

Figura 9 - Representação da profundidade da imagem digitalizada e do sistema de

coordenadas cartesianas.

2.7.2 Formatos de arquivos de imagem

Uma grande quantidade de dados é gerada no processo de captura da cena. Como visto na

seção 2.7.1, cada pequena parte na qual a cena é dividida, recebe uma informação de

luminância ou cor que precisa ser manipulada e armazenada. Uma imagem com uma

resolução de 1600 por 1200 pixels, capturada com uma profundidade de cor de 24 bits, na

qual cada componente de cor RGB é representada por 8 bits, ocupa cerca de 40 MB de

espaço. A compressão de imagem resolve o problema da redução da quantidade de dados,

podendo envolver perdas de informações neste processo ou não. As técnicas de compressão

aproveitam as redundâncias da imagem ou longas sequências de informações repetidas para

redução do volume de dados, mantendo a informação (GONZALEZ; WOODS, 2000). As

imagens quando são armazenadas ou transmitidas utilizam processos padronizados na

codificação empregada.

31

O formato JPEG (Joint Photographic Experts Group), desenvolvido em colaboração entre

o CCITT e ISO, é um padrão muito utilizado para imagens estáticas que realiza grande

compressão de dados, admitindo, entretanto, perdas de informação no processo. Sua

implementação padrão obrigatória utiliza o “sistema de codificação linha-base” e adota a

DCT (Transformada Cosseno Discreta), que é uma técnica utilizada na redução da quantidade

de tons contínuos de uma imagem, sem, entretanto, apresentar alterações perceptíveis ao

observador (GONZALEZ; WOODS, 2000).

O formato PNG (Portable Network Graphics) é um padrão de código aberto, utilizado

para compressão de imagens, sem perdas, suportando até 24 bits de cor (8 bits por canal), com

boa funcionalidade para palheta de cores e suporte para fundo de imagem transparente. Este

formato foi utilizado na manipulação de imagem deste trabalho.

Cada arquivo com imagens das lâminas de A. cepa ocupa, no formato JPEG, cerca de 500

kB e, no formato PNG, cerca de 2,2 MB.

Como as imagens compactadas possuem menor quantidade de tons de cinza que as

imagens originais, a determinação dos contornos dos núcleos das células de A. cepa é afetada,

alterando os valores calculados de área e perímetro, o que pode afetar o resultado da

classificação, conforme pode ser observado na Tabela 3, que apresenta dados de 13 núcleos

da mesma imagem em formatos com e sem perdas na compactação.

Tabela 3 - Parâmetros geométricos na compactação de imagem com e sem perdas.

Com perdas (JPEG) Sem perdas (PNG)

Núcleos Área Perímetro Nota Área Perímetro Nota Dif. nota

1 10210 400 7,4124 13326 445 7,4656 0,05

2 13996 425 4,5244 13963 425 4,5838 0,06

3 15861 484 6,4806 15825 485 6,4183 - 0,06

4 13271 434 5,7350 13261 435 5,9559 0,22

5 13395 422 5,1945 13384 423 5,1811 - 0,01

6 14755 458 5,8865 14738 459 6,0471 0,16

7 11323 420 8,6082 11308 422 8,4864 - 0,12

8 13351 446 7,4119 13326 445 7,2324 - 0,18

9 13186 420 5,5301 13171 419 5,5378 0,01

10 7864 349 5,5966 7846 349 5,6226 0,03

11 10260 457 5,2832 10250 457 5,2750 - 0,01

12 7687 317 4,7752 7671 316 4,7706 - 0,00

13 12092 551 4,1693 12062 552 4,2088 0,04

32

2.7.3 O Pré-processamento da imagem

processo de transformação da cena em imagem, ou digitalização, agrega pequenas

variações nos níveis de cor por sombreamento, problemas de iluminação e interferências

ópticas, entre outras fontes, introduz ruído e baixo contraste na imagem. Estas características.

interferem diretamente na possibilidade de sucesso do reconhecimento imediato de objetos de

interesse da cena, tornando-se necessário o tratamento digital da imagem antes de submetê-la

às demais partes do PDI (GONZALEZ; WOODS, 2000). Filtros digitais, transformadas e

quaisquer outros recursos aplicados nesta fase na adequação da imagem ao processamento

digital, constituem o pré-processamento. Os recursos de pré-processamento são aplicados

realizando operações lógicas ou aritméticas, lineares ou não lineares, de forma simultânea nos

dois eixos da imagem, empregando funções de duas variáveis (bidimensionais), denominados

transformações de funções bidimensionais, ou transformações bidimensionais (BACKES; SÁ

JUNIOR, 2016; GONZALEZ; WOODS, 2000). As transformações bidimensionais têm um

papel fundamental no processamento de imagem, proporcionando redução de ruído, realce de

detalhes, suavização da imagem, redução dos níveis dos componentes de cor ou dos níveis de

cinza.

2.7.3.1 Transformada rápida de Fourier

A transformada de Fourier permite decompor uma função contínua e integrável na base de

somatórios de senos e cossenos. A transformada existe na forma contínua, definida pela

equação 5, ou discreta, definida pela equação 6.

ℱ(𝑢) = ∫ 𝑓(𝑥)𝑒[−𝑗2𝜋𝑢𝑥]𝑑𝑥

+∞

−∞

(5)

ℱ(𝑢) = 1

𝑁∑ 𝑓(𝑥)𝑒[−𝑗2𝜋𝑢𝑥/𝑁]

𝑁−1

𝑥=0

(6)

A interpretação gráfica da resposta no espaço F(u) é apresentada na Figura 10, na qual a

função simples f(x), limitada em x, produz um espectro infinito em F(u). Quanto menor o

valor de X, maior a extensão de u na frequência F(u). Quando a abscissa representa tempo, o

33

espaço F(u) representa frequência. Limitando frequências elevadas no espaço F(u), altera-se a

função no tempo.

Figura 10- Função f(x) e resposta de F(u) no domínio da frequência. Adaptado de Gonzalez e

Woods (2000).

A transformada de Fourier pode ser estendida para uma função de duas variáveis

(GONZALEZ; WOODS, 2000). A representação discreta da transformada bidimensional de

Fourier é definida pela equação (7), é de grande importância no processamento de imagens. O

espaço F(u,v) da transformada é apresentado na Figura 11, gerado a partir da transformação

de uma imagem de teste com fundo preto, contendo um quadrado branco, centralizado, de

intensidade A = 1 (normalizado) e lado = X.

𝐹(𝑢) =1

𝑀𝑁∑ ∑ 𝑓(𝑥, 𝑦)

𝑁−1

𝑦=0

𝑒[−𝑗2𝜋(𝑢𝑥𝑀

+𝑣𝑦𝑁

)]

𝑀−1

𝑥=0

(7)

Figura 11- Espaço da transformada bidimensional de Fourier de um quadrado de intensidade

A e lado X. As altas frequências estão localizadas nas extremidades e as baixas frequências no

centro. Adaptado de Gonzalez e Woods (2000);

34

Na parte central da Figura 11 se concentram as baixas frequências. À medida que se afasta

do centro, as frequências aumentam. As altas frequências definem os detalhes em uma

imagem, como bordas, linhas finas e transições abruptas. As baixas frequências definem as

regiões mais homogêneas da imagem como variações suaves e detalhes de iluminação.

Imagens obtidas sem definição podem ser melhoradas pelo reforço das altas frequências.

Ruídos podem ser reduzidos pela eliminação das altas frequências. Um filtro que permite

passar baixas frequências (filtro passa-baixas) pode reduzir, ou eliminar as altas frequências

realizando uma multiplicação elemento a elemento destes valores por uma máscara binária

(compostas de zeros e uns) de mesma dimensão, adequadamente preparada para este fim

(BACKES; SÁ JUNIOR, 2016). Na Figura 12 são apresentadas três máscaras que

representariam filtros hipotéticos, na sequência, passa-baixas, passa-altas e passa-faixa.

Figura 12 – Máscaras bidimensionais de filtros de imagem. Respectivamente, máscara para

filtro passa-baixas, passa-altas e passa-faixas. Adaptado de Backes e Sá Jr. (2016)

A transformada inversa de Fourier retorna do domínio de F(u) para o domínio de f(x). A

equação 8 define a transformada inversa bidimensional de Fourier (BACKES; SÁ JUNIOR,

2016). O processo de filtragem no domínio da frequência envolve, portanto, a aplicação da

transformada de Fourier, aplicação de filtros pela multiplicação de máscaras binária no

domínio F(u) e a transformação inversa de Fourier.

𝑓(𝑥) = ∑ ∑ 𝐹(𝑢, 𝑣)

𝑁−1

𝑣=0

𝑒[𝑗2𝜋(𝑢𝑥𝑀

+𝑣𝑦𝑁

)]

𝑀−1

𝑢=0

(8)

A transformada rápida de Fourier (FFT) é obtida por um algoritmo, que evita as longas

sequências de multiplicações redundantes de números complexos e somas, pela decomposição

dada na equação 9. As operações, em quantidade proporcional a N², são reduzidas para uma

35

proporção de N.log2N na FFT. A FFT é apresentada na equação 9 e sua inversa na equação

10, com a substituição do termo apresentado na equação 11 (GONZALEZ; WOODS, 2000).

O MATLAB disponibiliza funções para transformação inversa ifft e direta fft para aplicação

de transformadas de Fourier e as funções ifft2 e fft2, para aplicação bidimensional (BACKES;

SÁ JUNIOR, 2016).

𝐹(𝑢) =1

𝑁∑ 𝑓(𝑥)𝑊𝑁

𝑢𝑥

𝑁−1

𝑥=0

(9)

𝑓(𝑥) = ∑ 𝐹(𝑢)𝑊𝑁−𝑢𝑥

𝑁−1

𝑥=0

(10)

Onde: 𝑊𝑁 = 𝑒−𝑗2𝜋/𝑁 (11)

2.7.3.2 Transformação exponencial

A transformação exponencial é aplicada na alteração de contraste. A função log provoca

uma compressão dos níveis de contraste. Por outro lado, a função exponencial produz a

expansão destes níveis de cinza, aumentando o contraste, com elevação do nível intensidade.

As duas funções podem ser aplicadas simultaneamente em trechos diferentes da escala de

cinza para produzir um deslocamento do contrate. Uma consequência desta transformação é a

amplificação do ruído que já esteja presente na imagem. A equação 12 apresenta a função de

transformação, onde S é a constante de transformação, obtida pela equação 13. O nível de

intensidade de saturação em uma imagem de tons de cinza, em 8 bits, é 255 (28-1). O nível de

saturação pode ser utilizado para eliminar os níveis mais elevados que o nível LR, que estão

fora e acima dos níveis da região de interesse. Os níveis de l(x, y) acima de L da escala de

cinza são elevados a 255, pela equação 12, cujo efeito é mostrado na Figura 13, para 0 < t <

255.

𝑡(𝑥, 𝑦) = 𝑒

𝑙(𝑥,𝑦)𝑆

+0,001

(12)

𝑆 =

𝐿𝑅

ln 𝑇𝐷

(13)

A transformada exponencial foi utilizada no processo de segmentação das imagens das

lâminas de A. cepa, para compensar principalmente as variações de iluminação e contraste

entre imagens e na superfície da própria imagem. Ao expandir os níveis próximos de interesse

36

e desloca-los para mais próximo da origem, surge um distanciamento entre os tons de cinza

dos núcleos e dos tons do fundo, formado nesta fase do processamento por citoplasma e

fundo.

Figura 13 – Aplicação da transformada exponencial em uma linha de imagem; (a) Aspecto

inicial do perfil obtida para uma linha da imagem; (b) curva exponencial utilizada; (c)

aumento de contraste.

2.7.3.3 Transformada euclidiana

A transformada euclidiana utiliza a determinação da distância euclidiana de um ponto

p(xn,yn) qualquer ao pronto de nível branco mais próximo, denotado por p(xb, yb), no espaço

binário bidimensional, e atribui este valor ao ponto p(xn,yn). Quanto mais distante do ponto

branco p(xb, yb), maior o valor inserido no ponto p do espaço bidimensional. Os resultados

dos cálculos de distância, a partir do ponto branco no centro da imagem, Figura 14(a), podem

ser observados na distribuição de valores na Figura 14(b). Os pontos distribuídos de mesmo

valor são equidistantes e podem ser interpretados como uma curva circular de raio r. Todos os

pontos com os mesmos valores formam curvas de nível sobre o quadro e podem ser utilizados

para a construção de máscaras circulares pela escolha da curva de nível adequada (BACKES;

SÁ JUNIOR, 2016).

37

Figura 14 - Transformada Euclidiana aplicada à imagem escura de ponto central branco.

Adaptado de MATLAB (2018);

A transformada euclidiana pode ser utilizada para determinar os pontos centrais de

superfícies planas (de mesmo valor), pela inversão dos valores de fundo (normalmente

escuros) pelos valores do objeto (normalmente claros), como visto na Figura 15(a). O cálculo

ocorre dentro da região de interesse, aumentando o brilho à medida que se aproxima do centro

da região (BACKES; SÁ JUNIOR, 2016), como apresentado na Figura 15(b). Estes pontos

centrais, que apresentam distâncias euclidianas maiores (valores maiores), podem ser

utilizados para separar objetos distintos aderidos na segmentação por meio do estabelecimento

de um valor limiar, acima do qual seriam determinados os pontos centrais das regiões.

Figura 15 - Transformada euclidiana aplicada dentro de uma região contínua de

citoplasma (valores iguais).

38

A transformada euclidiana apresentou bons resultados na determinação da localização dos

pontos centrais das áreas do citoplasma (centro de massa) e uma estimativa da área (raio),

mesmo em área muito densas, apresentando um nível de identificação equivalente àquela

registradas para os núcleos, certa de 95%. Como o ideal seria determinar aproximadamente os

contornos do citoplasma, necessários para determinar alterações dos núcleos com MN, ponte

e perdas cromossômicas, que são assuntos para trabalhos futuros, manteve-se nesta seção

estas informações como fonte de consulta.

2.7.3.4 Filtros de média e mediana

Os filtros são aplicados nas imagens buscando modificações que tragam algum benefício

às fases seguintes do processamento de imagem. O filtro de média desloca um bloco

(máscara) de NxN elementos, normalmente de valor pequeno N = 3, 5, 7, ..., sobre a imagem

alvo, posicionando o centro deste bloco sobre um elemento de imagem, calculando a média

dos valores na vizinhança deste elemento, que estão posicionados dentro do bloco, como

mostrado na Figura 16. O valor calculado é aplicado nas mesmas coordenadas do pixel

analisado, mas na imagem de saída do filtro. Este processo se repete ao longo de toda a

imagem. O Filtro da mediana segue um mecanismo semelhante, deslocando um bloco sobre a

imagem, mas determinando o valor mediano entre os valores sob a máscara NxN e substitui

este valor nas mesmas coordenadas da imagem de saída do filtro. A diferença entre os filtros

de média e mediana é que este último não cria novos níveis de cinza e preserva melhor as

regiões de borda.

Figura 16 - Filtro de média 3x3; Adaptado de MATLAB (2018)

39

2.7.4 Segmentação

O processo de segmentação visa isolar os objetos de interesse da cena pela divisão da

imagem em partes distintas por meio da aplicação de algum critério, adequadamente

escolhido. Um dos métodos de segmentação busca determinar os níveis limiares de tons de

cinza que permitam separar a área do fundo das áreas dos objetos. Algoritmos de limiarização

por região podem carregar partes do fundo com os objetos ou perder parte dos objetos para o

fundo. Outro método de segmentação busca determinar as bordas dos objetos, essencialmente,

pelas variações abruptas nos níveis de cinza entre pixels vizinhos. Algoritmos de detecção de

borda são sensíveis a ruído e não identificam descontinuidades de uma fronteira, não

reconhecendo, nestes casos, os contornos corretos dos núcleos. Como os formatos dos núcleos

das células de A. cepa são variados e irregulares, as técnicas de interpolação de contorno não

foram efetivas.

2.7.4.1 Limiarização

Uma transformação de limiarização aplicada à imagem em tons de cinza produz uma

imagem denominada binária, contendo informações das regiões de interesse (ROI). Um valor

T (limiar) é definido conforme um critério de interesse p(x,y) da imagem f(x,y), conforme

apresentado na equação 14 e utilizado para testar cada pixel nas coordenadas em questão (x,

y), na determinação da inclusão deste no domínio de interesse g(x,y), conforme equação 15

(GONZALEZ; WOODS, 2000).

𝑇 = 𝑇[𝑥, 𝑦, 𝑝(𝑥, 𝑦), 𝑓(𝑥, 𝑦)] (14)

𝑔(𝑥, 𝑦) {

1 𝑠𝑒 𝑓(𝑥, 𝑦) ≥ 𝑇

0 𝑠𝑒 𝑓(𝑥, 𝑦) < 𝑇

(15)

A limiarização por histograma representa uma boa técnica de limiarização na

determinação dos núcleos das células de A. cepa, devido às razoáveis regularidades de

contrate e iluminação, aplicada à imagem monocromática do canal G. O valor T a ser

determinado na limiarização pode ser obtido de maneira simples e global pelo histograma.

Nos histogramas da Figura 17, o eixo das abcissas representa os níveis de cinza da imagem,

40

crescente a partir da origem do sistema cartesiano, e o eixo das ordenadas representa a

ocorrência de cada nível de cinza. Na Figura 17(a) apresentam-se duas regiões distintas de

concentração de valores que representam o fundo e objetos iluminados. Os níveis de cinza que

compõem o fundo da imagem, representados pela concentração de níveis mais baixos de

iluminação, encontram-se bem distanciados da concentração dos níveis mais altos, que

formam os objetos iluminados, permitindo uma limiarização óbvia no ponto T. Da mesma

forma, o histograma da Figura 17(b) apresenta três níveis distintos de concentração de tons

cinza, permitindo a mesma solução, embora neste caso, o processo de limiarização seja menos

confiável (GONZALEZ; WOODS, 2000).

Figura 17- Histogramas multimodais. (a) Histograma com limiar único; (b) Histograma com

limiar múltiplo; (GONZALEZ; WOODS, 2000)

O método de Otsu é empregado na determinação do limiar ótimo para uma distribuição

bimodal. O algoritmo tenta encontrar um valor limiar T que separe a imagem em grupos de

níveis de cinza, minimizando a variância dentro dos grupos ao mesmo tempo que maximiza a

variância entre os grupos (BACKES; SÁ JUNIOR, 2016). O algoritmo calcula proporção de

cada grupo de níveis de cinza pelas equações 16 e 17, a média de valores de cada grupo de

níveis de cinza pelas equações 18 e 19, a média da imagem pela equação 20 e a variância

entre os grupos pela equação 21. O método faz uma varredura em todos os valores possíveis

de T dentro do intervalo de [0 a G-1], onde G é a maior intensidade de pixel da imagem, de

modo a maximizar a equação 21.

𝑎1 = ∑ 𝑃(𝑖)

𝑇

𝑖=0

(16)

𝑎2 = ∑ 𝑃(𝑖)

𝐺

𝑖=𝑇+1

(17)

𝜇1 = ∑ 𝑖𝑃(𝑖) 𝑎1⁄

𝑇

𝑖=0

(18)

𝜇2 = ∑ 𝑖𝑃(𝑖) 𝑎2⁄

𝐺

𝑖=𝑇+1

(19)

𝜇𝑡 = 𝑎1𝜇1 + 𝑎2𝜇2 (20) 𝜎2 = 𝑎1(𝜇1 − 𝜇𝑡)2 + 𝑎2(𝜇2 − 𝜇𝑡)2 (21)

41

Os métodos graythressh() e multithresh() do MATLAB, determinam o valor ou os valores

limiares, respectivamente, conforme o algoritmo de Otsu e apresentado na Figura 17.

A iluminação deficiente, entretanto, pode dificultar a obtenção de um limiar simples,

necessitando de tratamento adicional para o sucesso da segmentação. Na Figura 18(a) uma

imagem em tons cinza com dispersão normal está representando um objeto quadrado sobre

um fundo mais claro. Seu respectivo histograma está na Figura 18(d), que apresenta um

candidato claro ao valor limiar global, T. A Figura 18(c) apresenta o resultado da iluminação

deficiente da Figura 18(b) aplicado sobre a imagem da Figura 18(a). O histograma resultante

deste cenário, apresentado Figura 18(f) não possui mais a mesma facilidade de obtenção do

valor limiar T.

Figura 18 – Influência da iluminação não uniforme no histograma bimodal. (a) Quadro

cinza; (b) iluminação; (c) iluminação de (b) aplicado em (a); (d) histograma de (a); (e)

histograma da iluminação; (f) histograma da imagem de (c); (GONZALEZ; WOODS, 2000)

Os histogramas das imagens das lâminas de A. cepa são semelhantes ao histograma da

Figura 18(f), composto por três conjuntos de valores que representam áreas do núcleo,

citoplasma e fundo, mas com aspecto bimodal, agregando valores de citoplasma e fundo em

um pico nos tons de cinza mais claros, apresentado no desenvolvimento, na Figura 28.

42

2.7.5 Representação e descrição

A rotulação identifica regiões contínuas de interesse na imagem binária, sendo parte do

processo de segmentação da imagem, observado na Figura 19(d). As regiões encontradas

podem ser declaradas como objetos caso atendam determinados critérios no processo de

representação e descrição, como visto na Figura 19(b). A função do MATLAB,

bwboundaries(), realiza o levantamento das bordas que circundam um candidato a objeto

(BACKES; SÁ JUNIOR, 2016). O rastreamento parte da origem (1, 1) do sistema cartesiano,

de um pixel com valor 0 (valor do fundo da imagem binária), se possível, buscando pixels

com valor 1. O algoritmo busca as conexões de vizinhança de 4 ou de 8 pixels e contorna a

região até retornar às coordenadas iniciais, determinando desta forma um caminho fechado

em torno de cada região identificada. Cada região é individualmente registrada. Entre os

dados de retorno da função está o conjunto de vetores com as localizações dos pixels de borda

de cada região e a matriz contendo as regiões de interesse (ROI) e os buracos (espaços com

valor 0 dentro destas regiões) (MATHWORKS, 2018).

Figura 19 – Operação de rotulação da função bwboundaries. (a) Imagem binária; (b)

identificação de regiões; (c) exclusão de regiões de borda; (d) rotulação; Adaptado de

MATLAB (2018)

A função imclearborder() elimina todas as regiões da imagem binária que estão em

contato com a borda da imagem, evitando tratamentos posteriores com objetos incompletos

cortados pelos limites do enquadramento da cena. A função utiliza uma transformação

43

morfológica para apagar as áreas comprometidas pelos limites da imagem, cujo processo é

apresentado na Figura 19(b)(c) (MATHWORKS, 2018).

A função regionprops() do MATLAB realiza diversas operações sobre as regiões

encontradas pela função bwboundaries(), retornando características como área, perímetro,

coordenadas do centro de massa, índice de excentricidade, orientação e outras propriedades

descritas nos documentos do software (MATHWORKS, 2018), conforme mostrado na Tabela

4. As descrições dos atributos da função regionprops() foram inseridas no anexo C.

Neste trabalho foram utilizados como fatores as propriedades: área, excentricidade,

solidez, perímetro, diâmetro equivalente e área-perímetro para caracterização dos núcleos de

A. cepa.

Tabela 4 – Propriedades fornecidas pela função regionprops() do MATLAB. As

propriedades solidez, extensão e número de Euler5 são adimensionais, orientação é um ângulo

e as demais são apresentadas em pixel ou pixel². O número de Euler poderia ser usado para

diferenciar o núcleo em prófase, cuja textura normalmente produz vários buracos na

segmentação, dos núcleos em interfase, que normalmente não possuem buracos. Dados da

imagem de referência I seção 3.1.

Objeto Área Excentricidade Orientação Solidez Perímetro Área cheia Extensão

1 7249 0,7517 3 0,9417 359,8 7305 0,7681

2 11002 0,5648 13 0,8229 542,7 12299 0,6040

3 5039 0,8093 62 0,6524 586,3 5063 0,4448

4 5670 0,7142 49 0,7436 639,2 5690 0,5347

5 7708 0,8223 -30 0,5897 1.016,2 7962 0,3740

6 2122 0,8738 80 0,8827 209,2 2122 0,6669

7 2440 0,7718 65 0,8362 231,1 2440 0,5970

Objeto Num. Euler D. equivalente Área convexa Maior eixo Menor eixo M/m A1/2.P-1

1 -3 96,1 7698 119,0 78,5 1,5163 20,15

2 -21 118,4 13369 137,8 113,7 1,2118 20,27

3 -4 80,1 7724 120,6 70,9 1,7024 8,59

4 -4 85,0 7625 109,3 76,5 1,4288 8,87

5 -4 99,1 13070 155,6 88,5 1,7572 7,59

6 1 52,0 2404 77,0 37,4 2,0563 10,14

7 1 55,7 2918 71,5 45,5 1,5725 10,56

5 Número de Euler é um parâmetro geométrico que apresenta inicialmente valor um para a área do objeto, mas debita valor um para cada descontinuidade (buraco) no objeto. Caso o número de Euler seja um, o objeto não possui buracos; caso seja -3, o objeto possui 4 buracos (Anexo C).

44

2.8 CONTAGENS DE CÉLULAS E TRABALHOS SEMELHANTES

O emprego dos microscópios com câmeras digitais em laboratórios, além de permitir a

projeção dos conteúdos observados das lâminas e a captura das imagens para documentação

ou análise posterior, abre a possibilidade do emprego de outras técnicas de análise e

observação. O processamento de imagens digitais tem ocupado este espaço, extraindo

informações ou fornecendo recursos de medições de características físicas, frequentemente

fornecidos pelos próprios fabricantes de microscópios. A contagem de objetos gráficos como

colônias de bactérias, leucócitos e núcleos celulares, é exemplo comumente encontrado em

publicações que tratam deste assunto. Linguagens de programação têm sido amplamente

utilizadas na construção destes sistemas. Um sistema para identificação e registro do

crescimento de unidades formadoras de colônias de Staphylococus aureus em placas Petri foi

desenvolvido em linguagem C++ (ALVES, 2006), realizando a aquisição e processamento de

imagem. O sistema realiza a limiarização por histograma das imagens e avalia o crescimento

das colônias. Obteve uma acurácia na contagem automática equivalente àquela obtida nas

análises manuais.

Em outro trabalho, a contagem de células epiteliais foi desenvolvida pela detecção

automática de células via técnicas de morfologia matemática e processamento de imagens

(SILVA, 2015). A proposta foi aprimorar o procedimento utilizado, realizado de forma

manual, lenta e parcialmente subjetiva. A cultura celular é fixada com paraformaldeído na

superfície da placa Grid 5006 e exposta a dois marcadores biológicos específicos para destacar

o núcleo e o citoplasma, criados para serem absorvidos e concentrados por organelas celulares

distintas. O marcador DAPI (do fabricante Invitrogen, modelo D1306), reage apenas com as

proteínas da cadeia de DNA, demarcando fortemente o núcleo da célula. Já o segundo

marcador, Texas Red-C2-Maleimide (provido pela mesma empresa, mas de modelo T6008), é

absorvido por proteínas totais, evidenciando o citoplasma e, consequentemente, todo o

perímetro celular.

O procedimento de contagem automática de células brancas, explorando três padrões de

representação digital de cor (SAFUAN et al., 2017); obteve um desempenho geral do sistema

de 96,92% quando foi utilizada apenas a componente S (saturação) do padrão HSV, ao passo

que a combinação de duas bandas S-C (saturação – ciano) atingiu 96,56% de exatidão na

contagem de glóbulos brancos. Outro aspecto interessante desta publicação apontou que o uso

6 Placa de Petri é um recipiente cilíndrico, achatado, de vidro ou plástico utilizado em laboratórios para a cultura de micro-organismos.

45

de detecção baseada em núcleo foi superior à detecção baseada em citoplasma para a

contagem dos glóbulos brancos.

Em outro trabalho, as imagens de núcleos de linfócitos do sangue periférico humano

foram segmentadas por limiarização adaptativa, identificadas e classificadas com a utilização

de redes neurais artificiais (MOREIRA, 2002), apresentando uma discussão entre técnicas de

treinamento utilizando rede neural com e sem algoritmo genético.

Também envolvendo a contagem e classificação de glóbulos brancos, Nazlibilek e

colaboradores (2014) utilizam o MATLAB para processamento de imagens e a

implementação de uma rede neural para identificação de cinco tipos diferentes de leucócitos.

Apresentaram uma solução para o problema da sobreposição das células por critérios bem

específicos de dimensão, obtidos pelo treinamento da rede neural. Os resultados obtiveram

uma exatidão de 95%.

O canal verde, do plano de cor RGB, foi utilizado no levantamento da ramificação em

árvore dos vasos da retina, por apresentar maior contraste quando comparado aos demais

canais (WALTER; KLEIN, 2001). Neste artigo, os autores apresentaram algoritmos baseados

em morfologia para a detecção do disco óptico e da árvore vascular em fotografias de fundo

de olho com baixo contraste e presença de ruído. Para a detecção, os autores encontraram a

posição inicial aproximada do disco óptico e, em seguida, obtiveram os contornos exatos por

meio da “transformação de bacia hidrográfica” (Watershed Transform). A detecção dos vasos

foi obtida pela transformação THT (Top-Hat Transform), aprimorando o contraste na etapa de

pós-filtragem.

2.9 MATLAB

O MATLAB (MATrix LABoratory) é um programa computacional de análise numérica.

Combina uma interfase intuitiva com uma linguagem de programação de alto nível7. Tem

capacidade de operar matrizes e vetores, com números inteiros, reais ou imaginários,

implementar contadores e converter dados de cálculo de forma simples. Possui várias funções

embutidas para gerar gráficos e histogramas. Possui pacotes adicionais, modulares, como as

bibliotecas de processamento de sinais e imagens, simulação e controle de sistemas e outras

funcionalidades úteis para acelerar o desenvolvimento de algoritmos e soluções

(MATHWORKS, 2018). O MATLAB permite a criação de scripts e desenvolvimento de

7 Linguagem de programação com um nível relativamente alto de abstração e que se aproxima mais da

linguagem utilizada pelo homem.

46

funções pelo próprio usuário, além de permitir a criação de interfaces gráficas de usuário

(GUI – Graphical User Interface) para a operação dos scripts. O MATLAB é utilizado em

várias áreas do conhecimento, sendo frequentemente citado em trabalhos acadêmicos. Entre

as aplicações típicas encontradas em trabalhos publicados aparecem conversões e

processamento de dados, geração de gráficos para dados numéricos de equipamentos,

tratamento estatístico, no processamento de imagens digitais e de sinais. O MATLAB foi

utilizado em processamento de imagens, conversão de espaços de cor e implementação de

rede neural, em imagens aéreas obtidas por drone8, para avaliação e determinação do índice

de cobertura de folhas (LAI) (CÓRCOLES et al., 2013). Tenório e colaboradores. (2011)

empregaram o MATLAB na quantificação gráfica dos dados espectroscópicos, provenientes

de ensaios quimiométricos em extratos brutos de folhas de plantas e extratos medicinais.

Ballesteros (2016) utilizou o MATLAB para desenvolver o software FORETo, que previa a

quantidade de evaporação e otimizava o processo de irrigação, utilizando redes neurais.

Pieczywek (2014) utilizou o MATLAB para desenvolver um sistema de processamento de

imagem para avaliar o comportamento mecânico e resistência do tecido de A. cepa.

8 Avião não tripulado, controlado à distância por meios eletrônicos e computacionais, geralmente usado para fins

militares em patrulhamento de fronteiras, operações de espionagem, bombardeios etc.

47

3 DESENVOLVIMENTO

Conforme visto no Capítulo 2, o A. cepa é um organismo empregado em ensaios

ambientais, nos quais sofre os efeitos citotóxicos e genotóxicos das substâncias analisadas. O

desenvolvimento deste trabalho visa classificar e contabilizar os núcleos na fase da interfase e

nos estágios da mitose em lâminas de A. cepa submetidos aos ensaios aplicados ao

monitoramento ambiental. Visa, também, consequentemente, reduzir o tempo de

envolvimento dos pesquisadores na contagem dos núcleos regulares, mantendo, todavia, a

análise manual para a contabilização das exceções e falhas. A premissa do trabalho foi criar

uma alternativa viável sem interferir na metodologia manual, atualmente adotada nos ensaios,

sem propor alterações nos materiais, equipamentos ou procedimentos de domínio,

delimitando a interferência na obtenção das imagens.

Na preparação dos ensaios com A. cepa são necessárias pelo menos 72 horas de espera,

período no qual o organismo é mantido em contato com as substâncias de teste. Depois deste

período, as lâminas são preparadas e ficam disponíveis para uso por até 3 dias, se mantidas

em local resfriado e protegidas da luz. A Figura 20 apresenta um ensaio típico utilizando

Allium cepa (POLETTO et al., 2011). O procedimento de preparação das lâminas utilizadas

neste trabalho foi incluído no anexo B. No apêndice C foi incluída a imagem contendo as

nove lâminas de teste, utilizadas na etapa de comparação de resultados, e duas imagens das

mesmas lâminas após o período de três dias decorridos da preparação.

Figura 20 - Ensaio com Allium cepa – Fonte: (POLETTO et al., 2011)

48

O trabalho foi desenvolvido em etapas, seguindo como linha base de condução a

metodologia apresentada no diagrama da Figura 21, iniciando-se pela identificação das

formas básicas das fases nucleares do A. cepa. O ciclo de detecção foi a fase do

desenvolvimento que permitiu testar e definir os recursos para o processo de segmentação,

extração de características e algoritmos básicos prévios, necessários na identificação de cada

estágio da mitose (Figura 6). Nesta fase, até que se obtivessem as imagens digitalizadas em

laboratório, foram utilizadas imagens publicadas em trabalhos na preparação da imagem de

referência (Figura 22), utilizada nas pesquisas do tratamento morfológicos dos núcleos.

Retornando à Figura 21, na fase 2, foi empregada a imagem de referência 2, apresentada na

Figuras Figura 23 e Figura 24, elaborada a partir de recortes das imagens de lâminas reais.

Esta nova imagem se diferencia da primeira por utilizar uma coletânea de formas básicas

nucleares, na mesma imagem, contando com variações morfológicas típicas de cada fase

nuclear identificadas nas lâminas de A. cepa.

Figura 21 - Metodologia aplicada no desenvolvimento do trabalho.

Os primeiros procedimentos desenvolvidos na fase 1 foram aplicados na imagem de

referência 2. Na fase 3, tipos diferentes de avaliações foram realizados para qualificar o

algoritmo. A primeira avaliação testou a repetitividade, na qual o algoritmo deveria detectar

os mesmos elementos e apresentar o mesmo resultado em testes subsequentes da mesma

lâmina e resultados semelhantes em outras imagens. A segunda avaliação comparou os

49

resultados obtidos pelo algoritmo com os resultados apresentados pelos técnicos do

laboratório. Conforme apresentado no Capítulo 2, a contagem manual de uma grande

quantidade de células por lâmina garante um resultado confiável, segundo a metodologia

adotada. O objetivo deste trabalho é alcançar na contagem automática, a mesma exatidão do

procedimento convencional manual.

3.1 IMAGENS DE REFERÊNCIA

A primeira imagem de referência foi montada de núcleos de A. cepa coletados de Leme

(2009), contendo imagens monocromáticas bem definidas dos núcleos em cada fase,

apresentada na Figura 22(a). A identificação dos núcleos é apresentada na Figura 22(b) que

mostra também a composição e disposição dos núcleos na imagem de referência, sem a

presença do citoplasma, tratado como fundo. Na ausência inicial de imagens capturadas do

microscópio, imagens digitais foram obtidas de artigos científicos, mesmo utilizando formato

de compressão com perdas de dados, apresentaram-se úteis na identificação das formas e

contornos.

Figura 22 – Imagem de referência I. (A) Formas básicas nucleares. (B) Imagens padrão de

núcleo: (1) Interfase; (2) Prófase; (3) e (4) Anáfase; (5) Metáfase; (6) e (7) Telófase.

Adaptado de Leme (2009)

A segunda imagem de referência (Figura 23) foi produzida a partir recortes em imagens

digitais, extraindo células completas (núcleo e citoplasma), obtidas a partir de lâminas de

ensaios com A. cepa, com mesmas resoluções e contrastes semelhantes às observadas nas

imagens de prova (Figura 26). Esta imagem, com dimensões de 1876 por 930 pixels, recebeu

50

as células recortadas que foram dispostas aleatoriamente, com concentração, rotação e

espaçamentos semelhantes aos encontrados nas imagens de prova, totalizando 34 núcleos,

distribuídos em 6 em interfase, 6 em prófase, 5 em metáfase, 7 em anáfase e 10 em telófase,

cuja identificação é apresentada na Figura 24. As imagens de prova são imagens reais,

capturadas de ensaios realizados durante a execução do presente trabalho.

Figura 23 - Imagem de referência II. Contém as fase e estágios da divisão celular do A.

cepa.

Figura 24 - Imagem de referência II com identificação das fases e estágios da divisão

celular do A. cepa - Interfase (I); Prófase (P); Metáfase(M); Anáfase (A); Telófase (T).

51

3.2 IMAGENS DE LÂMINAS

As imagens iniciais das lâminas de ensaios com A. cepa foram obtidas entre outubro e

novembro de 2017. As imagens foram testadas com ampliação e iluminação diferentes, e

capturadas com resolução de 3840 por 2748 pixels (resolução fixa para modelo do sensor de

imagem), em formato com perdas. As últimas imagens foram obtidas em agosto de 2018, a

partir de outro equipamento, utilizando a mesma ampliação e mesmo critério de iluminação

das imagens iniciais, mas com resolução de 1600 por 1200 pixels e em formato sem perdas.

Novas tabelas estatísticas e valores de corte (áreas mínimas e máximas de objetos) foram

criadas para o algoritmo operar também nesta resolução. Os dados dos microscópios e câmera

utilizados neste trabalho são listados na Tabela 5. As objetivas do microscópio fornecem

ampliações padronizadas, das quais foram utilizadas as de 10X (Figura 25-A3), 40X (Figura

25-A2) e 100X (Figura 25-A1), mais comuns. Embora a intenção inicial fosse utilizar a

objetiva de 10X, para permitir a captura de área maior para processamento, optou-se pela de

40X em função do maior detalhamento da imagem (Figura 25) e por ser a objetiva utilizada

pelos pesquisadores na contagem, permitindo a comparação entre os resultados do

procedimento automático e o manual. Os aplicativos de captura instalados nos microscópios,

possuem recursos para ajuste do contraste digital, mas desassociados da abertura do

condensador9, nos modelos de equipamentos utilizados nos laboratórios, não sendo possível

estabelecer um valor objetivo para a iluminação. O controle de iluminação e contraste,

portanto, foi convencionado para uma iluminação intermediária, que produzisse imagens de

contraste também intermediário, conforme ilustra a Figura 25-B. A variação admitida no

contraste levou à utilização dos recursos de transformações intensas no pré-processamento,

para minimizar os efeitos da variação de contraste na segmentação, e à necessidade de

realização de um teste específico para este efeito, cujos resultados são apresentados na Tabela

9.

Tabela 5 - Dados dos microscópios e câmeras

Microscópio Câmera Resolução Pixels Dimensão do pixel

BX41 LC20 1600x1200 2 MP 3,3 µm

BX43 SC100 3840x2748 10,6 MP 1,67 µm

9 O Condensador é um diafragma formado por palhetas móveis que controlam o feixe que incide no campo de visão do microscópio.

52

Figura 25 – Definição da ampliação e iluminação das imagens. (A) e iluminação (B);

objetivas (A1) 100X, (A2) 40X, (A3) 10X; escolha definida pela ampliação de 40X,

assinalada pela envoltória retangular; escolha definida pela iluminação intermediária,

assinalada pela envoltória retangular.

Entre lâminas de ensaios de controle negativo e de ensaios da avaliação de substâncias,

foram obtidas 166 imagens, do equipamento BX43, em resolução de 3840x2748, em formato

de compactação com perdas (JPG), totalizando cerca de 16.000 imagens de núcleos. As

imagens obtidas mais recentemente, foram obtidas do microscópio BX41, em resolução de

1600x1200 pixels, totalizando 354 arquivos, em formato de compactação sem perdas (PNG),

distribuídas em três amostras, de três tratamentos.

Algumas imagens foram escolhidas e denominadas como imagens de prova por apresentar

detalhes, fases nucleares ou densidades celulares específicas (Figura 26), interessantes para o

desenvolvimento do trabalho. As imagens de prova são imagens capturadas normais, mas que

pelo motivo descrito no parágrafo anterior, são frequentemente revisitadas para testes de

funcionalidade.

53

Figura 26 - Imagens de prova - quatro imagens de duas lâminas com células de A. cepa,

contendo densidades de células diferentes e contornos secos na imagem.

O processo de aquisição digital é composto pela ação de divisão prática da área de

interesse da lâmina em quadrantes do tamanho do plano de visão da objetiva, pela focalização

da imagem na ocular do microscópio, pela visualização da imagem do plano de visão na tela

do aplicativo fornecido com microscópio e instalado no computador de apoio, pela captura da

imagem e pelo arquivamento em mídia digital. O tempo médio necessário para aquisição de

imagens suficientes (entre 17 e 25) para a contagem, observadas na prática, foi de,

aproximadamente, 5 minutos. As imagens, embora capturadas, não são todas necessárias para

a contagem, porque a contagem de 1000 células é obtida com cerca de seis imagens,

dependendo também da densidade da imagem que pode chegar a concentrar 400 núcleos.

3.3 PRÉ-PROCESSAMENTO

As imagens de ensaios com Allium cepa, foram obtidas inicialmente com uma câmera

modelo SC100 acoplada ao microscópio Olympus BX43, como o exemplo apresentado na

Figura 27. A câmera possui uma resolução de 10,6 MP (Megapixel) e emprega um sensor de

imagem com a medida equivalente de 1,67 µm por pixel. A imagem gerada tem uma

54

dimensão de 3840 por 2748 pixels, representando uma imagem de real estimada de 6,4 por

4,6 mm.

A conversão da imagem colorida para tons de cinza foi realizada pelo canal G do modelo

RGB. Na análise dos histogramas dos componentes de cor da imagem, apresentada na Figura

28, identifica-se que o canal 2 (Green) apresenta o maior contraste, caracterizado pela

distribuição mais larga do histograma. O uso de canais de cor de forma independente em

processamento de imagem não é incomum. O mesmo canal de cor (G) foi escolhido para o

pré-processamento de imagens de retina por apresentar menor ruído e maior contraste nas

imagens de fundo de olho na pesquisa de publicada por Oliveira e demais autores (2013).

Figura 27 - Imagem do microscópio BX43, contendo uma imagem de lâmina com células

de A. cepa.

Figura 28 -Histograma dos canais R (vermelho), G (verde), B (azul), respectivamente.

55

Para eliminar o ruído de alta frequência da imagem foi aplicado um filtro por

transformada de Fourier, com corte suave (Gaussiano), com raio de 250 pixels (Figura 29). O

resultado da aplicação do filtro pode ser observado na Figura 30.

Figura 29 - Aplicação da transformada de Fourier como filtro para altas frequências: (a)

Espectro de frequência da imagem; (b) máscara Gaussiana; (c) filtro aplicado; (d) imagem

original; (e) projeção da máscara Gaussiana; (f) imagem transformada. Adaptado de Backes e

Sá Jr. (2016)

Figura 30 – Aplicação do filtro de média: (a) histograma antes e (b) histograma após a

aplicação do filtro.

56

Para garantir a segmentação dos núcleos, compostos pelos níveis de cinza mais escuros da

imagem, foi aplicada uma transformação linear para reduzir cerca de 70% da iluminação da

imagem, que desloca o histograma no sentido da origem. Em seguida foi aplicada uma

transformação exponencial, cujo objetivo foi saturar (nível de branco) os valores de nível de

cinza acima de 166. Este efeito é obtido pela aplicação da equação 22 em cada pixel da

imagem. Estas operações conjuntas deslocaram o histograma para a origem e expandiram a

escala de valores da imagem, conforme mostrado na Figura 31.

Figura 31 – Aplicação da transformada exponencial. (A) Histograma antes da

transformação; (B) histograma após a transformação de deslocamento de expansão; (C)

histograma após aplicação dos filtros de média. O eixo das abscissas representa os níveis de

cinza e no eixo das ordenadas a quantidades de pixels.

Em seguida foram aplicados filtros de média, reduzindo a irregularidade que ocorre nas

bordas dos núcleos durante a segmentação, e facilitar a determinação dos pontos de

limiarização, localizados nos vales do histograma. O primeiro vale, apresentado na Figura 31-

C, marca a separação dos tons de cinza do núcleo para o citoplasma. O segundo vale marca a

separação dos tons de cinza do citoplasma para o fundo. Há um entrelaçamento mais evidente

entre os valores do fundo e do citoplasma, observado pelo valor mais elevado do vale,

indicando que partes do fundo passam pela limiarização do citoplasma e que partes do

citoplasma são perdidas.

𝑡(𝑥, 𝑦) = 𝑒

𝑙(𝑥,𝑦)36,5

+0,001

(22)

para 0 < t < 255,

57

3.4 SEGMENTAÇÃO

Os pontos de limiarização não são fixos, pois variam de imagem para imagem. O método

de Otsu varre o histograma e encontra os pontos mais adequados para a limiarização. O

método agrupa os valores de pixel, separando-os em dois grupos de forma que exista mínima

variância entre os valores dentro dos grupos e máxima variância entre os grupos, conforme

apresentado na seção 2.7.4.1. Nesta fronteira entre os grupos, encontra-se o valor limiar

obtido pelo método. O MATLAB implementa este método em duas funções. A função

graythresh() determina o valor limiar único para separar a imagem em duas regiões. A função

multithresh() implementa o método de Otsu para múltiplos níveis limiares, utilizada na

segmentação das imagens deste trabalho. Os valores retornados pela função multithresh()

foram aplicados na limiarização da imagem, pela utilização da função imquantize(), que

realiza a segmentação em multinível devolvendo uma imagem rotulada para cada região. O

resultado da segmentação pode ser observado na Figura 32. A segmentação atinge o objetivo,

destacando as áreas de interesse (ROI), que no caso são os núcleos. Todos os pontos menores

que aparecem na imagem segmentada, como das manchas do corante ou material nuclear que

podem ser observados na Figura 32, são eliminados pelo filtro de limite área e perímetro do

algoritmo que desconsidera regiões com áreas muito pequenas ou muito grandes baseadas nos

dados das tabelas de média e desvio padrão. Qualquer região com área ou perímetro menor

que a menor área média menos três desvios padrão (ma - 3dpa), ou maior que a maior área

obtidos da tabela de média e de desvio padrão (mA+3dpA), são desconsiderados. Estes

valores variam com os dados estatístico do classificador, mas representam quantidades da

ordem de 1000 pixels, em imagens de 2MP e 5000 pixels, em imagens de 10,6 MP. Estes

limites foram determinados a partir da observação das dimensões dos núcleos e dos

fragmentos e manchas identificadas pelo aplicativo Imagem Region Analyzer (IRA), do

MATLAB, sendo escolhido o valor de limite inferior que atendesse ao requisito.

Nas duas imagens inferiores da Figura 32 é possível observar que o contorno nos núcleos

na imagem segmentada está bastante coerente com a imagem original, facilitando o

reconhecimento morfológico do núcleo. Segundo Gonzalez e Woods (2000), o processo de

segmentação encerra quando os objetos de interesse tiverem sido isolados.

58

Figura 32 - Imagem segmentada dos núcleos.

3.5 FASE 1 – DETECÇÃO

3.5.1 Representação e descrição

Nesta fase foram usadas duas funções de tratamento de imagem do MATLAB, descritas

no item 2.7.5. A função bwboundaries() rastreia uma imagem segmentada, identificando e

rotulando regiões de interesse, devolvendo um conjunto de vetores com a descrição dos

contornos e uma cópia da imagem segmentada, porém rotulada. Estes contornos vetorizados

são utilizados para marcar os núcleos durante o processamento da imagem e na produção das

informações de saída, como poder ser visto na Figura 33, ou mais adiante, nas Figuras Figura

38, Figura 40 e Figura 41. Estes contornos são utilizados também na identificação de

possíveis núcleos sobrepostos, processados pela função avaliaDivisão(). A função

59

regionprops() do MATLAB retorna diversas propriedades morfológicas sobre as regiões de

interesse, identificadas pela função bwboundaries(), como área, perímetro, solidez e outras

descritas na documentação do MATLAB e presentes no anexo C. As propriedades área,

perímetro, índice de excentricidade, diâmetro equivalente e solidez foram utilizadas neste

trabalho no processo de identificação dos tipos de núcleos, cuja metodologia é apresentada na

seção 3.5.2. O centro de massa, outra das propriedades da função, foi utilizado para marcação

dos rótulos e dos quadros que circundam os núcleos. As demais propriedades disponíveis para

esta função não foram utilizadas neste trabalho.

Figura 33 - Aplicação dos contornos vetorizados nos núcleos das células.

3.5.2 Reconhecimento e interpretação

O processo de reconhecimento está relacionado com as características morfológicas

identificadas ou calculadas na etapa de representação e descrição. A etapa de reconhecimento

e interpretação recebe seis parâmetros morfológicos, denominados de fatores, para calcular a

nota de classificação usada na determinação do tipo de núcleo. Cada fator recebido é

60

submetido à curva normal contabilizada para este mesmo fator, mas particularizada para cada

núcleo, obtendo-se um valor “D” que representa o desvio do valor deste fator com relação à

média deste parâmetro para cada tipo de núcleo. Se o fator recebido estiver próximo à média e

dentro da região de um desvio padrão, o valor D estará entre 1,000 e 0,607, conforme

apresentado na Figura 34. Quanto mais próximo à média, maior é o valor de D e maior é sua

contribuição para a nota de classificação (equação 23). Os seis fatores são submetidos às

curvas normais dos núcleos. A maior nota é usada na classificação do núcleo e uma nota

inferior a 0,067, equivalente ao somatório de seis notas mínimas de D equivalente ao limite de

99,74% de probabilidade de ocorrência desta propriedade, é descartada, não classificando

qualquer núcleo.

Figura 34 - Determinação do valor D.

Foram utilizadas três tabelas para o cálculo da nota de classificação. As tabelas de média e

desvio padrão foram definidas utilizando-se dados morfológicos de cada tipo de núcleo,

baseadas nas imagens de referência. As medidas morfológicas destas imagens foram obtidas

pelo aplicativo Imagem Region Analyzer (IRA), incluído no ambiente do MATLAB. O IRA

abre um arquivo de imagem binário (imagem segmentada) e fornece medidas de 12

propriedades morfológicas. A propriedade área do núcleo em interfase, por exemplo, foi

obtida medindo-se as áreas de vários núcleos na mesma fase, gerando uma média e um desvio

61

padrão para esta propriedade do núcleo nesta fase. A determinação para as demais

propriedades seguiu o mesmo processo, produzindo valores para perímetro, excentricidade,

diâmetro equivalente e solidez, para cada tipo de núcleo. Como é possível que núcleos em

fases diferentes apresentem características morfológicas semelhantes em um ou mais fatores,

a tabela de peso é utilizada para reforçar determinadas características, corrigindo erros na

classificação.

A fórmula de cálculo por fator é apresentada na equação 24, sendo composta de um valor

que depende das informações estatísticas de média e desvio padrão e do peso.

Todos os fatores são calculados da mesma maneira. Os valores dos fatores são

normalizados pela equação 25 e submetidos à curva normal pela equação 26, conforme

demonstrado na Figura 35(a), obtendo-se o valor “D”. Os valores de desvio de média, “D”,

representam o afastamento dos valores dos fatores NXX medidos do objeto presente na

imagem segmentada em relação à média do grupo. O fator perímetro (PE), por exemplo,

medido do objeto sob análise, é normalizado e comparado à curva normal do perímetro da

interfase, produzindo o valor NPE que é armazenado do campo de notas na posição I. Na

sequência do cálculo da nota de classificação (NC), o fator área (AR) é normalizado e

submetido à curva normal, produzindo o valor D e a correspondente nota NAR, para a

interfase, que é adicionada à nota NPE e armazenada na mesma posição I. As demais notas são

calculas e armazenadas no mesmo campo, na mesma posição, formando a nota de

classificação da interfase (NCi = NAPi+NPEi+NEXi+NDEi+NOSi+NARi). Os mesmos fatores são

utilizados para calcular a nota de classificação para a prófase (NCp =

NAPp+NPEp+NEXp+NDEp+NOSp+NARp), da metáfase, anáfase e telófase, apresentados na Tabela

6.

Tabela 6 – Estrutura de cálculo das notas de fator e de classificação.

Finalizando o cálculo com todos os fatores, as notas acumuladas no campo de notas são

comparadas e a maior nota classifica o tipo de núcleo, conforme diagrama apresentado na

Figura 35(b).

Fator AP PE EX DE SO AR Campo de Notas

Valor Fator xAP xPE xEX xDE xSO xAR -

Interfase NAPi NPEi NEXi NDEi NSOi NARi NCi Prófase NAPp NPEp NEXp NDEp NSOp NARp NCp

Metáfase NAPm NPEm NEXm NDEm NSOm NARm NCm Anáfase NAPa NPEa NEXa NDEa NSOa NARa NCa Telófase NAPt NPEt NEXt NDEt NSOt NARt NCt

62

Figura 35 – Esquema de decisão. (a) Determinação do desvio “D” do fator com relação à

média; (b) esquema de cálculo da nota de classificação. AP: área-perímetro; PE: perímetro;

EX: excentricidade; DE: diâmetro equivalente; SO: solidez; AR: área.

𝑁𝑜𝑡𝑎𝐶𝑙𝑎𝑠𝑠𝑖𝑓𝑖𝑐𝑎çã𝑜 = 𝑁𝐴𝑃 + 𝑁𝑃𝐸 + 𝑁𝐸𝑋 + 𝑁𝐷𝐸 + 𝑁𝑆𝑂 + 𝑁𝐴𝑅 (23)

𝑁𝑜𝑡𝑎𝐹𝑎𝑡𝑜𝑟 = 𝐷𝑒𝑠𝑣𝑖𝑜𝐹𝑎𝑡𝑜𝑟(𝑉𝑎𝑙𝑜𝑟𝐹𝑎𝑡𝑜𝑟) ∗ 𝑃𝑒𝑠𝑜𝐹𝑎𝑡𝑜𝑟 (24)

𝑧 =(𝑥 − 𝜇)

𝜎

(25)

𝐷 = 𝑒−𝑧2

2 (26)

Das propriedades disponíveis e presentes no anexo C, cinco foram escolhidas para a

análise de classificação por se apresentarem morfologicamente mais representativas. A Figura

36 mostra a distribuição dos valores destas propriedades para cada tipo de núcleo, em um

gráfico normalizado. As barras representam a variação dos valores de cada propriedade

(fatores) nos núcleos, representando a média, mediana, percentis e máximos e mínimos, e

como estão normalizadas permite a comparação entre as fases nucleares. Este gráfico foi

utilizado para avaliar o comportamentos das 12 propriedades morfológicas disponíveis,

identificando quais destes caracteriza individualmente um tipo de núcleo. A solidez (SO), por

exemplo, identifica unicamente a interfase porque nenhuma outra fase ou estágio nuclear

apresenta este valor tão elevado e concentrado (menor variâcia). O fator área-perímetro (AP)

identifica claramente a metáfase embora para determinados valores, mais elevados, possa

também representar a anáfase, necessitando de outras propriedades para a diferenciação entre

os estágios do núcleo. O fator AP, foi definido pela razão da raiz quadrada da área sobre o

perímetro e escolhido por representar de maneira efetiva os núcleos em metáfase e anáfase

63

que se caracterízam por possuírem perímetro (PE) grande, quando comparados à área (AR),

produzindo um fator de valor reduzido e bem característico para identificar estes núcleos. Por

outro lado, o fator AR elevado e SO reduzido são características marcantes na prófase.

Figura 36 – Comportamento dos fatores morfológicos quanto aos tipos de núcleo. Valores

médios, máximos e mínimos, normalizados. AP: área-perímetro; PE: perímetro; EX:

excentricidade; DE: diâmetro equivalente; SO: solidez; AR: área;

Os núcleos na interfase, além de apresentar SO elevada, são menores e possuem aspecto

quase circular. Núcleos em anáfase são menores que aqueles em metáfase em termos de AR,

mas mantêm perímetro (PE) elevado e SO intermediária. Os núcleos em telófase são menores,

compactos, mas menos circulares, levando ao aumento da excentricidade (EX). Estas análises

mediam a escolha de pesos, que foram obtidos experimentalmente. Os valores de média,

desvio padrão e peso estão consolidados nas Tabelas Tabela 7 e Tabela 8.

A necessidade de alteração dos pesos é definida pela execução do algoritmo nas imagens

de referência. O procedimento de ajustes dos pesos deve ser executado para cada erro de

classificação encontrado, reaplicando o processo descrito no diagrama da Figura 37. No caso

de erro de classificação na imagem de referência, avaliam-se os valores dos fatores que

levaram à classificação equivocada, identificando um fator-candidato que deve ser

64

incrementado continuamente até a correção da classificação. Pode ocorrer neste processo a

alteração na classificação de outro núcleo que estava correto. Isto indica que o valor de

correção já atingiu seu limite e deve ser reduzido para um valor intermediário entre o original

e este limite. Caso não haja correção no valor intermediário, outro parâmetro deve ser

identificado e alterado com base nos valores dos fatores. Para as imagens de 10,6 MP os

ajustes foram convergentes. Para as imagens de 2 MP os valores não convergiram e

mantiveram erros na classificação, entre 2% e 4% do total de núcleos, mesmo ampliando a

base estatística maior, ampliando de 109 núcleos para 220 núcleos, na formação das tabelas.

Procedimentos numéricos, como incrementos contínuos buscando os vales de minimização

dos erros de classificação, ou ferramentas de planilhas com soluções numéricas, não

encontraram resultados melhores que o ajustes manuais encontrados para as imagens de

referência, mas pode sugerir valores iniciais para uma tentativa manual.

Figura 37 - Procedimento para ajuste dos valores dos pesos.

Na Tabela 7 estão valores de média, desvio padrão e peso para processamentos das

imagens de 2 MP e na Tabela 8 para imagens de 10,6 MP, tanto para imagens com perdas na

compactação quanto sem perdas na compactação.

65

Tabela 7 - Valores médios, desvios padrão e pesos aplicados aos fatores para imagens de 2

MP em formato compactado sem perdas (PNG).

A tomada de decisão do esquema de classificação é processada pela escolha do maior

valor entre as notas NCx acumuladas no campo de notas. Não existe valor de guarda que

estabeleça uma ultrapassagem específica (offset) do valor. A decisão é definida diretamente

pelo maior valor presente no campo de notas (decisão abrupta). A decisão suave não foi

implementada, mas poderia ser fornecida por outras fontes de informação, como oriundas da

análise de superfície ou por algoritmos de esqueletização ou por outros recursos.

Fatores Interfase Prófase Metáfase Anáfase Telófase Interfase II

Valores das médias

AP 0,2782 0,2607 0,1395 0,1540 0,2479 0,2821

PE 223 306 542 362 196 175

EX 0,5082 0,5414 0,6558 0,6922 0,7135 0,5514

DE 70,01 89,95 83,59 61,95 54,35 54,58

SO 0,9817 0,9586 0,7208 0,7456 0,9145 0,9765

AR 3942 6370 5512 3024 2328 2368

Valores dos desvios padrão

AP 0,0092 0,0108 0,0203 0,0208 0,0231 0,0138

PE 37 18 90 51 17 28

EX 0,1536 0,1078 0,0943 0,1426 0,1114 0,1001

DE 11,04 4,63 5,82 3,67 3,31 6,28

SO 0,0095 0,0138 0,0663 0,0564 0,0489 0,0155

AR 1133 644 784 354 285 553

Valores dos pesos

AP 1 1 1 1,1 1 1

PE 1 1,5 1 1,5 1 1

EX 1 1 1 1 1 1

DE 1 1 1 1 2,5 1

SO 1 1 1 1 1,1 1

AR 1 1 1,5 2 1 1

66

Tabela 8 - Valores médios, desvios padrão e pesos aplicados aos fatores para imagens de 10,6

MP, em formato compactado com perdas (JPG) e sem perdas (PNG).

3.6 FASE 2 - DIFERENÇAS SIGNIFICATIVAS

Foram necessários ajustes cíclicos para fechar o procedimento. Há repetitividade plena da

detecção das imagens e mesmo com pequenas variações de iluminação o resultado permanece

coerente. Os núcleos em estágios estáveis e livres de interferências e ruídos, com distância

mínima de outros núcleos são detectados e classificados corretamente. Núcleos em estágios

intermediários compartilham informações morfológicas entre as fases, dificultando a

detecção, como anáfases muito próximas ou núcleos em prófase ainda com dimensões

próximas aos núcleos em interfase.

Fatores Interfase Prófase Metáfase Anáfase Telófase

Valores das médias

AP 0,2756 0,2621 0,1465 0,1614 0,2347

PE 313.3 548,4 830,4 586,6 348,7

EX 0,5611 0,5530 0,5755 0,7740 0,7155

DE 97.31 131,7 132,6 103,6 98,18

SO 0,9793 0,9682 0,7502 0,7629 0,9149

AR 7557 15820 13810 8529 6747

Valores dos desvios padrão

AP 0,0055 0,0180 0,0296 0,0223 0,0176

PE 42,96 169,5 172,8 143,1 34,83

EX 0,1798 0,1048 0,1866 0,1070 0,1087

DE 12,59 16,06 4.11 11.72 9,95

SO 0,0117 0,0164 0,0750 0,0449 0,0379

AR 1893 4353 853,7 1869 1470

Valores dos pesos

AP 2 1 1,5 1,6 1

PE 1 1 1 1,5 1

EX 1 1,2 1 1 1

DE 1 1 1 1 1

SO 2 1 1 1 1

AR 1 1,8 1 2 1

67

3.7 FASE 3 – RESULTADOS E DISCUSSÃO

3.7.1 Avaliação com as Imagens de Referência

A imagem de referência apresentada na Figura 23, de alta resolução (10,6 MP) e

compactada com perdas (JPG), foi submetida à contagem automática. Os 34 núcleos foram

localizados e classificados corretamente, conforme apresentados na Figura 38. Os valores

registrados na imagem são os fatores calculados que venceram a disputa para a determinação

da fase nuclear.

Figura 38- Imagem de referência com reconhecimento de todos os núcleos (10,6 MP).

Observação: as quantidades na parte superior da imagem se referem aos tipos de núcleos

identificados pelo algoritmo; a contagem de fases considera os dois núcleos em anáfase e os

dois núcleos em telófase como um único estágio; contornos dos objetos: verde (interfase);

ciano (prófase); magenta (metáfase); amarelo (anáfase), preto (telófase).

A limiarização dinâmica do algoritmo de segmentação, que determina o valor de corte

adequado para cada imagem, conforme descrito na seção 3.4, foi testada para validar o

reconhecimento dos núcleos diante de variações de contraste e iluminação. Foram criadas

cópias modificadas da imagem de referência (10,6 MP), com variações no contraste. Estas

imagens, que reúnem as disposições e formas encontradas para as imagens dos núcleos nas

lâminas, foram submetidas ao algoritmo de reconhecimento, obtendo sucesso nas alterações

68

de iluminação para mais e para menos em até 30% e com nível de reconhecimento de 79%

dos núcleos com redução de 50% nos níveis de tons de cinza, conforme apresentado na

Tabela 9.

Tabela 9 - Resultado do teste de robustez do algoritmo para a imagem de referência

alterada.

Iluminação Reconhecimento

Escurecida em 10% e 30% 100%

Clareada em 10% e 30% 100%

Escurecida em 50% 79%

O resultado do processamento da imagem de referência de baixa resolução em um teste de

reconhecimento é apresentado na Figura 39.

Figura 39 - Imagem de referência (2 MP) com reconhecimento parcial os núcleos.

Observação: contorno em vermelho: objeto não classificado; sem contorno: objeto

identificado, encostado na borda da imagem ou com área acima do limite; contornos em

outras cores indicam reconhecimento: verde (I); ciano (P); magenta (M); amarelo (A), preto

(T).

69

Os núcleos na parte inferior direita da imagem não foram detectados/classificados pela

extensa área formada pela sobreposição de diferentes núcleos que formam, após a

segmentação, um único objeto. O algoritmo elimina objetos com áreas e perímetros fora da

região de 99,74% da curva normal (Figura 34), equivalente a três desvios padrão para mais e

para menos da média, que resultam em áreas entre, aproximadamente, 600 e 8000 pixels, nas

imagens de baixa resolução e entre 2000 e 30000 pixels, nas imagens de alta resolução. As

áreas com contornos vermelhos são objetos que foram identificados como núcleos, mas não

foram classificados por apresentarem contornos irregulares (lateral inferior esquerda e área

superior central) ou estarem ligados por pontes, apresentando um formato de haltere ou

ampulheta (região inferior direita e superior esquerda). Nestas condições, via de regra, o

resultado do cálculo dos fatores fica abaixo do limiar de decisão.

Nesta seção estão sendo apresentados os resultados do processo de detecção de núcleos

nas imagens, mesmo com classificação incorreta. As análises referentes à avaliação do

processo de classificação são vistas na seção 3.7.2.

3.7.2 Avaliação com as imagens de lâminas de A. cepa

Para avaliação de desempenho, cinco imagens reais, em formato de compactação com

perdas, foram submetidas ao algoritmo, com medição do tempo de execução do

processamento completo do algoritmo. Os resultados são apresentados na Tabela 10,

mostrando que o pré-processamento e a segmentação consumiram cerca de 4 segundos e que

o processamento dos núcleos consumiu em torno de 25 segundos, detectando em média

93,4% dos núcleos da imagem.

Tabela 10 - Levantamento de tempo de classificação do procedimento.

Imagem

Tempo de Processamento (s) Objetos

Detectados

(OD)

Núcleos

Detectados

(ND)

ND/OD Pré-processamento Núcleo

1 3,54 25,22 77 67 87,0%

2 3,60 24,43 86 83 96,5%

3 3,95 25,34 165 148 89,7%

4 3,40 22,04 140 135 96,4%

5 3,62 24,06 156 150 96,2%

Totais 132,2 624 583 93,4%

70

As Figuras Figura 40 e Figura 41 mostram os resultados da contagem automáticas para

duas imagens de laboratório, de alta resolução (10,6 MP) em formato de compactação com

perdas (JPG), nas quais o algoritmo detectou 128 núcleos de 130 objetos identificados e 158

núcleos de 163 objetos detectados, respectivamente. Cada contorno vermelho indica um

problema na classificação de núcleo. Os valores apresentados são os resultados do cálculo dos

fatores. Pode ser observado netas figuras ainda, que parte dos núcleos não classificados são

agregações (sobreposições) de núcleos, impurezas do processo de preparação ou material

nuclear espalhado na lâmina.

Figura 40 - Imagem real de laboratório - Imagem_98. Imagem de 10,6 MP com

compactação com perdas. Na telófase (T) o valor 16 representa a quantidade de objetos com

aspectos de telófase, entretanto a telófase é contabilizada como metade inteira maior deste

valor.

Quanto aos aspectos morfológicos nas fases da mitose das células, foram evidenciados

que, embora os núcleos em prófase apresentaram maior variação na propriedade área, a razão

Área/Perímetro (AP) permanece semelhante ao longo da fase, o que permitiu o emprego desta

71

como fator de identificação. O fator AP também foi importante na metáfase que apresentou

um valor baixo ao longo de toda a evolução fase. O fator solidez (SO) mostrou-se elevado na

interfase e telófase, mas baixo nas demais fases. Embora cada fator traga apenas uma parte da

informação, o relacionamento entre os fatores permitiu uma identificação mais precisa do tipo

de núcleo.

Figura 41 - Imagem real de laboratório - Imagem_54. Imagem de 10,6 MP com

compactação com perdas. Os valores de anáfase e telófase no alto da imagem representam

objetos com aspecto classificado como anáfase e telófase. A fase é contabilizada como a

metade inteira maior destes valores.

Os procedimentos práticos do ensaio com A. cepa envolvem dois métodos de

contabilização. O primeiro, mais antigo, considera a utilização de um microscópio óptico

convencional (sem câmera) para a contagem de 50 células por imagem enquadrada no campo

de visão. Mesmo que existam mais células no enquadramento, são contadas apenas 50. O

segundo procedimento, mais recente, utiliza microscópios com câmeras para capturar a

imagem enquadrada no campo de visão, permitindo a realização a contagem pela imagem.

72

Neste caso, entretanto, todas as células da imagem capturada são contadas, não se limitando

às 50 células do primeiro procedimento. Independentemente do procedimento adotado, nos

dois métodos contam-se pelo menos 500 células por lâmina de teste. Esta quantidade mínima,

por campo de visão, é corroborada por vários trabalhos que estabelecem contagens de pelos

menos 500 núcleos por lâmina (HENRIQUE, 2014; MORO et al., 2017; PEIXER, 2016;

POLETTO et al., 2011). Desta forma, pelos procedimentos descritos, a contagem de 50

núcleos por imagem estaria compatível com procedimentos práticos adotada e aceitos nos

ensaios com A. cepa. Isto permitiria, alternativamente, aumentar o limiar de classificação do

algoritmo para melhorar a exatidão no reconhecimento, até atingir a meta de classificação

corretamente de 50 núcleos por imagem.

Figura 42 - Contagem manual da imagem 98. Verde (I), ciano (P), magenta (M), amarelo (A),

cinza (T) e vermelho (não classificado).

73

Figura 43 - Contagem manual da imagem 54. Verde (I), ciano (P), magenta (M), amarelo (A),

cinza (T) e vermelho (não classificado).

A contagem de núcleos e o índice mitótico obtidos pela contagem automáticas foram

comparados com os procedimentos manuais. O algoritmo, embora não tenha identificado

todos os núcleos na imagem, classificou mais 96% núcleos. As figuras 42 e 43 apresentam as

contagens manuais da imagem 98 e 54, respectivamente, permitindo a comparar os resultados

apresentados na Tabela 11.

Tabela 11- Comparação entre contagem manual (referência) e automática.

Interfase Prófase Metáfase Anáfase Telófase Total IM %

Manual 98 78 36 0 0 7 121 35,5

Manual 54 51 100 1 2 3 157 67,5

Total 129 136 1 2 10 278 53,6

Automática 98 88 22 2 0 8 120 26,7

Automática 54 64 56 3 1 17 141 54,6

Total 152 78 5 1 25 261 41,8

Diferença 23 58 4 1 15 101

Diferença % 17,8 42,6 400 50 150 36,3 11,8

74

Ao longo da interfase as dimensões dos núcleos nas células de A. cepa aumentam, mas

não afeta significativamente seus aspectos morfológicos. Nesta fase, entretanto, observam-se

mais distorções na forma, aparentemente, provocadas pelo processo de preparação das

lâminas. Apesar destas variações, a classificação da interfase apresenta a menor taxa de

diferença na identificação com 17,8% de variação. Os núcleos das células em prófase variam

nas dimensões e forma ao longo do estágio, dificultando a identificação, considerando que a

referência estatística é única para toda a fase, criada a partir de núcleos com parâmetros

morfológicos diferentes, pertencentes a mesma fase. A identificação apresentou uma

diferença total de 42,6% na prófase. Os núcleos nos estágios da metáfase, anáfase e telófase

ocorrem em menor quantidade e muitas vezes sobrepostos, dificultando a obtenção de valores

de diferença mais consistentes em poucas imagens.

Mesmo apresentando uma variação relativamente grande nas contagens por fase, não

foi observada uma variação muito significativa no índice mitótico (IM), observada na Tabela

11, apresentando 11,8% de variação total. Esta hipótese é confirmada pela ANOVA, com

teste Tukey, para conjunto de dados com distribuição normal, para 5% de significância (α =

0,05), aplicada ao índice mitótico. Desta forma, não foram encontradas evidências de

diferenças significativas no índice mitótico entre os procedimentos manuais e automáticos (p

= 0,060309). Os resultados estatísticos foram obtidos pelo software Statistica – Tibco

Software Inc, versão 13.4.0.18, submetendo os dados ao teste de normalidade de Shapiro-

Wilk.

A matriz de confusão, que apresenta uma forma objetiva de medição de qualidade da

classificação dos núcleos, é apresentada na Tabela 12. A tabela foi construída a partir dos

dados obtidos das imagens 54 e 98, analisadas anteriormente nesta seção. A matriz aponta que

a taxa de classificação global correta (acurácia do classificador) é de 63,8%, obtida pela razão

entre todos verdadeiros positivos (VP) e verdadeiros negativos (VN), presentes na diagonal

principal da tabela, em negrito, e pelo valor do total geral submetido ao classificador. A

diferença nos valores totais entre as Tabelas Tabela 11 e Tabela 12, ocorrem pelas relações

entre núcleo e fase, nas quais interfase, prófase e metáfase possuem a relação de 1:1 entre

núcleo e fase e anáfase e telófase possuem a relação 2:1. No falha de classificação que

determine que uma célula esteja na interfase (uma fase), estando realmente na telófase (meia

fase), surge um erro na contagem de meia fase para mais, assim como, de outra forma, surge

um erro nos totalizadores de meia fase para menos caso uma célula em interfase seja

classificada como na telófase.

75

Tabela 12 - Matriz de confusão do classificador aplicado às imagens 54 e 98.

Previsto (automático)

Fases I P M A* T* Imp** Falso Negativo

(FN)*** Total

Real

(manual)

I 94 7 0 0 14 0 21 115

P 48 68 1 1 8 2 60 128

M 0 0 1 0 0 0 0 1

A 0 0 2 0 0 0 2 2

T 10 3 0 0 3 0 13 16

Imp** 0 0 1 0 0 5 1 16,7

Falso Positivo

(FP)*** 58 10 4 1 22 2

(VP+VN)***

171

Acurácia

Geral

Total 152 78 5 1 25 7 Total Geral 268 63,8%

* Metade do valor contado, pois dois núcleos representam uma célula no ciclo celular.

** Impurezas da lâmina, lamínula ou espalhamento de material nuclear.

*** VP: verdadeiro positivo; VN: verdadeiro negativo; FP: falso positivo; FN: falso negativo.

Um teste completo com lâminas de A. cepa foram realizados com imagens de baixa

resolução (2 MP), compactadas em formato sem perdas (PNG). O algoritmo foi alterado para

suportar a resolução mais baixa, afetando as rotinas de acesso aos arquivos e as tabelas

estatísticas do classificador, geradas a partir de uma nova imagens de referência nesta

resolução, como a imagem apresentada na Figura 39. Os resultados das contagens manuais e

automáticas de nove lâminas (um tratamento) foram utilizados para realizar a análise

comparativa da acurácia do algoritmo, cujos resultados são apresentados na Tabela 13. Há

diferenças entre as quantidades de fases contabilizadas que, consequentemente, produzem

alteração do índice mitótico. A ANOVA, com teste Tukey, para dados paramétrico, com teste

de significância de 5%, não apresentou diferenças significativas entre os valores médios de

IM determinados pela contagem manual e pela contagem automática (p = 0,369778),

indicando que mesmo com os erros na classificação registrados nas tabelas, as médias dos

valores de IM são “estatisticamente iguais” com uma confiança de 95%.

O tempo empregado no processamento manual de cada lâmina encontra-se entre 40 e 120

minutos, dependendo da experiência do analista. Neste ensaio, que serviu de base comparativa

entre os procedimentos, foi considerando que o envolvimento do analista na contagem das

células empregaria um esforço de 6 a 18 horas de trabalho para chegar aos valores finais do

índice mitótico. A Tabela 13 apresenta o total de células contadas e o tempo gasto no

processamento automático que foi de 4 minutos e 24 segundos.

Não existe, em princípio, uma faixa de valores para IM, sendo sempre analisado de forma

comparativa, entre IM do mesmo tratamento ou entre IM de outros tratamentos. As alterações

nos valores de IM dependem do procedimento aplicado ao organismo, do organismo e de

76

fatores ambientais que costumam ser controlados por estufa. Os valores F1x.y são valores

para o mesmo tratamento que deveriam ser, intuitivamente, semelhantes. Entretanto, existem

variações que são compensadas pelas réplicas do teste (nove lâminas, de três organismos, com

três bulbos de cada organismo) e pelos métodos estatísticos.

Tabela 13 – Determinação dos índices mitóticos (IM) para nove lâminas de um mesmo

tratamento com ensaio utilizando A. cepa. Imagens de 2 MP com compactação sem perdas. O

prefixo M indica contagem manual e prefixo A contagem automática.

Lâminas Interfase Prófase Metáfase Anáfase Telófase Índice mitótico %

M F11.1 914 39 12 13 22 8,6

M F11.2 860 99 13 9 19 14

M F11.3 927 36 14 6 17 7,3

M F12.1 867 91 16 6 20 13,3

M F12.2 916 63 10 5 6 8,4

M F12.3 852 118 13 6 11 14,8

M F13.1 840 123 15 12 10 16

M F13.2 843 136 6 8 7 15,7

M F13.3 833 124 15 19 9 16,7

Lâmina Interfase Prófase Metáfase Anáfase Telófase Índice mitótico % Duração (s)

A F11.1 860 105 14 2 19 14.00 27.090

A F11.2 811 70 17 23 63 17.58 49.106

A F11.3 836 99 26 13 26 16.40 34.449

A F12.1 890 36 7 2 65 11.00 20.178

A F12.2 924 10 3 1 62 7.60 16.505

A F12.3 913 41 4 3 39 8.70 19.807

A F13.1 905 55 9 4 27 9.50 19.043

A F13.2 953 7 2 1 37 4.70 23.679

A F13.3 946 16 5 2 31 5.40 53.585

O conjunto de imagens das lâminas RP11 e RP12 foram originalmente obtidas em alta

resolução e em formato sem perdas. Estas mesmas imagens foram convertidas para formato

com perdas, passando a coexistir dois conjuntos iguais de imagens (mesmo conteúdo), mas

com formatos diferentes. Os dois conjuntos de imagens foram submetidos ao procedimento de

contagem automática para permitir uma comparação entre eles e com a contagem manual,

definida como controle negativo. O algoritmo foi ligeiramente modificado para apresentar o

resultado da contagem imagem a imagem, totalizando 3385 células contabilizadas. Os

resultados das contagens manuais e automáticas são apresentados nas Tabelas Tabela 14 e

Tabela 15, respectivamente. As nove imagens de cada lâmina foram processadas nesta

resolução em menos de dois minutos.

77

Tabela 14 - Contagem manual de fases das imagens das lâminas RP11 e RP12. Imagens

de 10,6 MP com compactação sem perdas.

Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM

RP11

482 63 144 3 1 2 213 70,4%

483 97 82 5 6 1 191 49,2%

484 80 105 4 2 8 199 59,8%

485 118 82 2 4 3 209 43,5%

486 168 36 2 2 2 210 20,0%

487 130 109 6 4 9 258 49,6%

488 154 148 2 5 4 313 50,8%

489 197 150 2 4 5 358 45,0%

Total 1007 856 26 28 34 1951 48,4%

RP12

427 26 55 0 0 4 85 69,4%

428 66 71 1 4 9 151 56,3%

429 92 105 2 1 2 202 54,5%

430 100 78 2 1 2 183 45,4%

431 100 20 1 1 3 125 20,0%

432 99 110 1 0 3 213 53,5%

433 154 65 2 1 4 226 31,9%

434 117 122 4 1 5 249 53,0%

Total 754 626 13 9 32 1434 47,4%

Tabela 15 - Contagem automática de fases das imagens das lâminas RP11 e RP12.

Formato sem perdas (PNG).

Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM

RP11

482 29 160 6 1 11 207 86,0%

483 52 120 4 3 8 187 72,2%

484 71 109 3 2 14 199 64,3%

485 78 100 1 2 14 195 60,0%

486 135 58 3 2 8 206 34,5%

487 170 103 8 3 25 309 45,0%

488 163 134 3 2 23 325 49,8%

489 183 139 7 2 17 348 47,4%

Total* 881 923 35 17 120 1976 55,4%

RP12

427 30 43 5 2 9 89 66,3%

428 36 63 7 4 19 129 72,1%

429 42 129 3 1 15 190 77,9%

430 52 90 4 3 23 172 69,8%

431 33 74 5 4 20 136 75,7%

432 116 78 3 3 30 230 49,6%

433 114 94 5 2 18 233 51,1%

434 84 137 4 2 18 245 65,7%

Total* 507 708 36 21 152 1424 64,4%

* Tempo de processamento da lâmina: RP11 = 01:31.659; RP12 = 01:52.231

78

Tabela 16 - Contagem automática de fases das imagens das lâminas RP11 e RP12.

Formato com perdas (JPG).

Lâmina Imagem Interfase Prófase Metáfase Anáfase Telófase Contagem IM 482 37 157 6 1 9 210 82,4% 483 63 114 3 4 7 191 67,0% 484 90 96 4 2 9 201 55,2% 485 63 84 3 7 19 176 64,2% 486 151 45 2 3 7 208 27,4% 487 196 84 5 4 24 313 37,4% 488 196 112 4 3 17 332 41,0% 489 216 109 7 2 16 350 38,3%

Total 1012 801 34 26 108 1981 48,9% 427 34 42 4 2 8 90 62,2% 428 51 68 4 2 14 139 63,3% 429 50 126 4 1 14 195 74,4% 430 72 83 4 4 18 181 60,2% 431 44 70 8 5 19 146 69,9% 432 144 67 4 3 20 238 39,5% 433 134 82 5 3 16 240 44,2% 434 102 125 2 2 14 245 58,4%

Total 631 663 35 22 123 1474 57,2%

* Tempo de processamento da lâmina: RP11 = 01:31.243; RP12 = 01:56.825

A ANOVA, com teste Tukey, para dados paramétricos, para 5% de significância, não

apresentaram diferenças significativas entre os pares de médias do IM entre a contagem

manual e a contagens automáticas das lâminas RP11 e RP12, ou entre os formatos de

imagem, indicando que mesmo com diferenças na classificação, não se pode descartar as

semelhança estatística dos resultados do IM, conforme apresentado na Tabela 17.

Tabela 17 – ANOVA, com teste Tukey, com nível de significância de 5%, aplicado no IM das

lâminas RP11 e RP12. Contagem manual comparada com a contagem automática. Não há

evidências de diferenças significativas entre as médias de IM entre todos grupos.

N Tratamento {1} 0,48545 {2} 0,47988 {3} 0,57402 {4} 0,66017 {5} 0,57671 {6} 0,59001

1 Manual RP11 1,000000 a 0,999261 a 0,636475 a 0,821647 a 0,723914 a

2 Manual RP12 1,000000 a

0,998080 a 0,588990 a 0,782832 a 0,678714 a

3 S5-PNG RP11 0,999261 a 0,998080 a

0,837697 a 0,951204 a 0,897797 a

4 S5-PNG RP12 0,636475 a 0,588990 a 0,837697 a

0,999549 a 0,999992 a

5 S5-JPG-RP11 0,821647 a 0,782832 a 0,951204 a 0,999549 a 0,999975 a

6 S5-JPG-RP12 0,723914 a 0,678714 a 0,897797 a 0,999992 a 0,999975 a

3.7.3 Discussão sobre os resultados.

Os resultados da contagem automática realizada pelo algoritmo apresentaram-se em

igualdade estatística com os resultados da contagem manual, tanto em imagens de baixa

79

resolução quanto em de alta resolução, tanto em imagens compactadas sem perdas (ISP)

quanto em imagens com perdas na compactação (IPC). A segmentação não consegue

encontrar sempre o valor limiar para a separação dos tons de cinza em todos as regiões da

imagem. O limiar dinâmico implementado por Otsu não encontra valor adequado em imagens

muito esparsas e o limiar dinâmico determinado pelo algoritmo de detecção de vales,

implementado em MATLAB, tem maior dificuldade nas imagens com aspecto do histograma

bimodal.

O nível de acurácia obtido da matriz de confusão em 63,8%, pode sinalizar atenção quanto

à estabilidade no reconhecimento e sugerir uma análise dobre fatores que afetam o correto

reconhecimento. Não existe neste momento um padrão rígido para a aquisição das imagens.

Alterações pouco perceptíveis aos observadores, afetam de forma muitas vezes significativa a

taxa de reconhecimento, como discutido à frente.

Torna-se necessário melhorar a robustez do classificador, sendo que alguns motivos já são

bem conhecidos como a sobreposição de núcleos. Muitos núcleos, com fases bem definidas,

são ignorados na classificação por formarem áreas maiores que os limites de corte. Atuar

nesta separação pode aumenta a taxa de acerto. Por outro lado, os tipos diferentes de

ocorrências de sobreposições são grandes, variando do tipo núcleo ao grau da sobreposição e

do ângulo de contato, ou ainda pela grande de núcleos participantes, dificultando a

determinação de ações mais efetivas.

Atuar na iluminação mais uniforme do microscópio ou na correção desta distorção pode

reduzir os problemas de segmentação que alteram os parâmetros morfológicos dos núcleos.

Na Figura 44, são apresentados alguns pontos que podem ser abordados na melhoria do

reconhecimento dos núcleos. Parte das falhas tem relação com a aquisição das imagens, outra

parte com o pré-processamento e algumas pertencem à natureza do processo de confecção das

lâminas. A proximidade entre núcleos e a sobreposição de núcleo são condições que estarão

sempre presentes na lâmina. O tratamento das situações mais simples como em E, conseguem

ser separado na pré-classificação pelo procedimento avaliaDivisão(), que encontram os

pontos de contado do contorno e traçam uma linha de valor de fundo entre eles, separando os

núcleo mas inserindo uma distorção no contorno. A taxa de sobreposição pode ser definida

pela razão da quantidade de núcleos sobrepostos pelo total de núcleos da imagem. A Tabela

18 apresenta taxas de sobreposições das imagens da lâmina RP11, antes e depois da execução

da função de divisão.

80

Tabela 18 - Taxa de sobreposição

Imagem Sobreposição original Taxa de sobreposição

original

Sobreposição após

divisão

Taxa de sobreposição

após divisão

482 6/223 2,7% 2/225 0,9%

483 6/209 2,9% 2/211 0,9%

484 5/222 2,3% 4/225 1,8%

485 4/220 1,8% 2/222 0,9%

486 18/220 8,2% 10/226 4,4%

487 70/334 21,0% 37/353 10,5%

488 160/334 47,9% 103/369 27,9%

489 163/350 46,6% 107/365 29,3%

O tratamento das situações mais simples como em E, que conseguem ser separado na pré-

classificação pelo procedimento avaliaDivisão(), resolvem metade dos casos, como pode ser

observado na Tabela 18. Outras formas de sobreposições não são tratadas e podem ser

resolvidas por transformadas aplicadas localmente. Alterações observadas em A e D,

aparentemente são mais difíceis de se identificar e de resolver. Em B, equalização ou

filtragem locais podem resolver o problema de fusão do objeto com o fundo, situação

normalmente produzida por iluminação não uniforme na imagem. Outra solução possível

seria a segmentação local gradual, avaliando as alterações na imagem pela alteração

controlada do limitar de corte, quase como o levantamento de uma curva de nível, ou por

processos de erosão ou abertura, como observado em C.

Figura 44 – Aspectos de melhorias: (A) proximidade entre dois núcleos que foram

segmentados com um único objeto; (B) núcleo mesclado com fundo; (C) ligação entre

núcleos; (D) sobreposição de núcleos; (E) contato entre núcleos.

Aspectos que precisam de atenção são bolhas e impurezas nas lâminas. Contornos da

solução (Figura 45), bolhas (Figura 46), e impurezas (Figura 47) produzem regiões que

podem ser reconhecidas como objetos, dificultando ou impedindo o correto reconhecimento e

classificação dos núcleos.

81

Figura 45 – Contornos da solução na lâmina: (a) imagem binária; (b) imagem

monocromática; (c) imagem colorida.

Figura 46 - Bolhas e contorno da solução: (a) imagem colorida; (b) transformação de alto

contraste; (c) imagem binária.

Figura 47- Impurezas das lâminas: (a) impureza entre contorno e núcleo; (b) união de

áreas pela interpretação da impureza como parte do objeto.

Outras técnicas podem contribuir de forma significativa na identificação dos núcleos e do

conjunto de impurezas. A utilização de outros canais de cor em conjunto poder solucionar

82

alguns problemas documentados, como o emprego do canal de saturação do modelo HSV

pode atenuar os efeitos das bolhas, contorno da solução e impurezas. Já algoritmos como o

esqueletização ou de afinamento podem auxiliar na discriminação dos núcleos. Na Figura 48

pode ser observado que os núcleos em prófase, mesmo com dimensões diferentes, possuem

esqueletos semelhantes. Ainda pode ser observado que o núcleo em interfase, mesmo com

dimensões intermediárias entre os dois núcleos em prófase, apresenta um esqueleto distinto.

Entretanto há um custo de processamento no emprego deste algoritmo. Foi responsável por

cerca de 70% do tempo de processamento nos testes realizados.

Figura 48 - Algoritmo de esqueletização.

A reprodução celular é um evento contínuo de crescimento e divisão, embora seja

caracterizado na literatura pelos aspectos morfológicos discretos mais representativos de cada

fase e estágio. É possível observar que os núcleos apresentam variações significativas na

forma e tamanho mesmo pertencendo às mesmas fases e estágios. Uma estratégia para

minimizar este tipo de erro seria produzir subclassificações, melhorando o reconhecimento

corretos das fases nucleares intermediária, como realizado para as imagens de 2 MP que

recebeu uma subclasse que discriminava a subfase do início de interfase, denominado

interfase II, que minimizou a classificação incorreta da interfase por telófase e permitiu atingir

nível se significância na média do IM. Os relatórios de Pires (2001) que trazem uma

subdivisão da fases da mitose do A. cepa, apresentada na Figura 49, motivam a criação de um

dicionário completo e detalhado das fases do ciclo mitótico que poderiam servir de referência

confiável para consulta, evolução ou novos desenvolvimentos de algoritmos. Este dicionário

ou gabarito poderiam ser explorados para melhorar o desempenho do algoritmo, pelo emprego

83

estatística da mais próxima de certas dimensões, tornando cálculo dos fatores mais efetivos

nestas subdivisões. A supersubdivisão pode representar um problema na especialização

elevada sobre os mesmos parâmetros estatísticos, não conseguindo distinguir entre dois tipos

de núcleo. Não foi possível obter o mesmo sucesso da interfase II, implementado no

classificador de baixa resolução, no modelo estatístico das imagens de alta resolução

implementado nas subfases F e G. A quantidade de falsos positivos aumentou muito entre

interfase (inicio de fase) e telófase. Outros aspectos morfológicos podem ser avaliados para

ajudar a distinguir entre fases, talvez combinados com analise de textura e níveis adicionais de

segmentação local para obter mais informação do objeto.

Figura 49 - Subdivisão da mitose do A. cepa. (A) interfase; (B) prófase; (B1) início da

prófase; (B2) meio da prófase; (B3) final da prófase; (C) pro-metáfase; (D) metáfase; (E)

anáfase; (E1) início da anáfase; (E2) meio da anáfase; (E3) final da anáfase;(F) telófase; (F1)

início da telófase; (F2) meio da telófase; (F3) final da telófase; (G) células filhas em interfase;

A criação de imagens de referências reais capturadas em alta e em baixa resolução, com

discriminação individual dos núcleos, retomando as Figuras Figura 42 e Figura 43, auxiliaria

incontestavelmente na criação de uma base estatística mais sólida e na avaliação da qualidade

do classificador, permitindo a comparação núcleo a núcleo para uma grande quantidade de

objetos, melhorando a qualidade da análise.

84

4 CONCLUSÕES

O algoritmo realiza o processamento das imagens das lâminas de Allium cepa,

identificando e contando núcleos nas fases da mitose, calculando e apresentando o índice

mitótico por lâmina. A classificação dos núcleos apresenta uma acurácia geral de 63,8%,

determinada por matriz de confusão para imagens de alta resolução em formato de

compactação com perdas (CCP - formato JPG). Não foram encontradas evidências de

diferenças significativas, ao nível de 5%, nos valores médios do índice mitótico (IM) entre a

contagem manual e a automática. A análises de variância (ANOVA) com teste Tukey ao nível

de 5%, foi realizada para imagens de baixa (2 MP) e alta resolução (10,6 MP), para formato

de compactação sem perdas (CSP – formato PNG) e formato CCP. Todos os conjuntos de

imagens apresentaram igualdade estatística, indicando que a contagem manual, que a

contagem sobre imagem em formatos com perdas e com formatos sem perdas, são

equivalentes. O processamento com as imagens em formato CCP apresenta adicionalmente

características interessantes como menor espaço de armazenamento (90% menor), maior

velocidade e na captura da imagem (20% menor), que provavelmente representam uma

vantagem sobre outras formas uma vez que não apresentou diferenças significativas no IM,

independentemente do formato de arquivamento da imagem.

O processamento das imagens ocorre de forma rápida, se comparado ao processo manual,

analisando as imagens de uma lâmina (1000 células) em menos de um minuto para imagens

de baixa resolução e em torno de 1 minuto e 40 segundos para imagens de alta resolução,

cerca de quarenta vezes e vinte e cinco vezes mais rápido que o processamento manual,

respectivamente. É necessário acrescentar um tempo médio de, aproximadamente, 5 minutos

para a aquisição de cerca de vinte imagens, que é uma referência prática.

A utilização do algoritmo em laboratório para ensaios ambientais pode trazer impactos

significativos nos procedimentos e na otimização de recursos, uma vez que a análise

estatística do IM apresentou semelhança estatística nos resultados com confiança de 95%,

permitindo realizar uma contagem rápida de uma atividade com muito envolvimento humano.

Entretanto, necessitará inicialmente de supervisão em função da captura manual das imagens,

que variam e podem lavar a falhas adicionais na contagem e no IM, ocasionadas por

alterações nos padrões de entrada para aquisição digital como foco, iluminação e ampliação.

Características intrínsecas da preparação das lâminas, como impurezas existentes na

lamínula e, principalmente, sobreposição celular, ainda são desafios na busca da classificação

dos núcleos envolvidos nestes problemas e, consequentemente, na eficiência geral do

85

algoritmo. A sobreposição pode chegar a 30% nas imagens densas e ficar abaixo de 4% nas

imagens esparsas. O recurso de separação de núcleos implementado no algoritmo consegue

dividir adequadamente apenas dois núcleos com padrões morfológicos mais regulares

circulares ou elípticos, moderadamente sobrepostos, reduzindo em cerca de 50% as

sobreposições existentes na imagem. Nos demais modos de sobreposição não há

reconhecimento ou se traduzem em erros na classificação.

Foram observadas muitas variações significativas para o processamento de imagens, nos

aspectos morfológicos dos núcleos ao longo das fases, além das cinco ou seis normalmente

tipificadas na literatura. Núcleos que se encontravam no início ou no final das fases ou

estágios, principalmente na prófase, interfase e telófase, que ainda guardavam características

morfológicas das fases ou estágios anteriores, registraram maior dificuldade na correta

classificação. A divisão das fases em subfases pode melhorar o reconhecimento pela

especialização do perfil morfológico. Esta subdivisão exigiria o desenvolvimento de um

dicionário ou gabarito detalhado de todos os aspectos da evolução das formas nucleares do A.

cepa na mitose, que auxiliaria maneira singular na evolução do algoritmo, em novas pesquisas

e no treinamento de alunos e equipes na técnica para observação em laboratórios. O

desempenho nas imagens de baixa resolução foi melhorado pela implementação de uma

subfase interfase nas tabelas estatísticas do classificador.

Técnicas para análise de textura e transformadas como de Hough para elipse ou

descritores de Fourier, aplicadas nas imagens monocromática, poderiam gerar um conjunto

completar de informações de significativa relevância na inferência de fase mitótica e na

correção das sobreposições nucleares.

86

REFERÊNCIAS

ALBERTS, B. et al. Fundamentos da biologia celular - 4. ed. [s.l.] Artmed, 2011.

ALVES, G. M. Método fundamentado em processamento digital de imagens para

contagem automática de unidades formadoras de colônias. 2006.

BACKES, A. R.; SÁ JUNIOR, J. J. DE M. Introdução à visão computacional usando

MATLAB - 1. ed. 1. ed. [s.l.] ALTA BOOKS, 2016.

BAGATINI, M. D.; SILVA, A. C. F. DA; TEDESCO, S. B. Uso do sistema teste de

Allium cepa como bioindicador de genotoxicidade de infusões de plantas medicinais. Rev

Bras Farmacogn, v. 17, n. 3, p. 444–447, 2007.

BALLESTEROS, R.; ORTEGA, J. F.; MORENO, M. Á. FORETo: New software for

reference evapotranspiration forecasting. Journal of Arid Environments, v. 124, p. 128–

141, 2016.

BIANCHI, J. Análise dos efeitos citotóxicos, genotóxicos e mutagênicos do inseticida

malation, utilizando os sistemas teste de Allium cepa e células de mamíferos. [s.l.]

Universidade Estadual Paulista (UNESP), 2008.

BIO-RAD. TC20TM Automated cell counter. Disponível em: <http://www.bio-

rad.com/pt-br/product/tc20-automated-cell-counter?ID=M7FBG34VY>.

CHAUHAN, L. K. S.; SAXENA, P. N.; GUPTA, S. K. Cytogenetic effects of

cypermethrin and fenvalerate on the root meristem cells of Allium cepa. Environmental and

Experimental Botany, v. 42, n. 3, p. 181–189, 1999.

CÓRCOLES, J. I. et al. Estimation of leaf area index in onion (Allium cepa L.) using an

unmanned aerial vehicle. Biosystems Engineering, v. 115, n. 1, p. 31–42, 2013.

FACHINETTO, J. M. et al. Efeito anti-proliferativo das infusões de Achyrocline

satureioides DC (Asteraceae) sobre o ciclo celular de Allium cepa. Brazilian Journal of

Pharmacognosy, v. 17, n. 1, p. 49–54, 2007.

FARIA, M. L. C. DE et al. Potencial de citotoxicidade e mutagenicidade das águas do rio

Jaru, Estado de Rondônia, em células de Allium cepa. v. 11, p. 104–114, 2017.

FISKESJÖ, G. The Allium test as a standard in environmental monitoring. Hereditas, v.

102, n. 1, p. 99–112, 1985.

FISKESJÖ, G. The Allium test - an alternative in environmental studies: the relative

toxicity of metal ions. Mutation Research - Fundamental and Molecular Mechanisms of

Mutagenesis, v. 197, n. 2, p. 243–260, 1988.

FOLGADO, C. A luta constante contra os agrotóxicos. Brasil de Fato, 2013.

87

GIMP. Glossário GIMP. Disponível em:

<https://docs.gimp.org/2.8/pt_BR/glossary.html>.

GONZALEZ, R. C.; WOODS, R. E. Processamento de imagens digitais. [s.l.] Edgard

Blucher, 2000.

GRANT, W. F. Higher plant assays for the detection of chromosomal aberrations and

gene mutations-a brief historical background on their use for screening and monitoring

environmental chemicals. Mutation Research - Fundamental and Molecular Mechanisms

of Mutagenesis, v. 426, n. 2, p. 107–112, 1999.

GUERRA, M.; SOUZA, M. J. Como observar cromossomos: um guia de técnicas em

citogenética vegetal, animal e humana. 1° Ed. ed. [s.l.] FUNPEC, 2003. v. 1

HENRIQUE, F. DOS R. Avaliação toxicológica de dois antibióticos com o uso do teste

Allium cepa. [s.l.] Universidade Positivo, 2014.

IMAGING, L. Automated Scoring of In Vitro Micronucleus Assay MicroNucleus,

[s.d.]. Disponível em: <https://www.laboratory-

imaging.com/pub/downloads/products/Lucia/lucia_micronucleus/Promotion_Materials/LUCI

A_MicroNucleus_eng.pdf>

ITU-R. Studio encoding parameters of digital television for standard 4:3 and wide-

screen 16:9 aspect ratios BT Series Broadcasting Service - BT.601-7 -Internacional

Telecomunication Union - Radiocomunication Sector, , 2011. Disponível em:

<https://www.itu.int/dms_pubrec/itu-r/rec/bt/R-REC-BT.601-7-201103-I!!PDF-E.pdf>

LAZZERI, T. Agrotóxicos: Brasil libera quantidade até 5 mil vezes maior do que Europa.

Reporter Brasil, 2017.

LEME, D. M.; MARIN-MORALES, M. A. Allium cepa test in environmental monitoring:

A review on its application. Mutation Research - Reviews in Mutation Research, v. 682, n.

1, p. 71–81, 2009.

LEVAN, A. The effect of colchicine on root mitoses in Allium. Hereditas, v. 24, n. 4, p.

471–486, 1938.

LODISH, H. et al. Biologia celular e molecular - 7. ed. [s.l.] Artmed Editora, 2014.

MARTINS, M. N. C.; SOUZA, V. V. DE; SOUZA, T. DA S. Cytotoxic, genotoxic and

mutagenic effects of sewage sludge on Allium cepa. Chemosphere, v. 148, p. 481–486, 2016.

MATHWORKS. MATLAB. Disponível em:

<https://www.mathworks.com/products/matlab.html>.

MESI, A.; KOPLIKU, D. Cytotoxic and genotoxic potency screening of two pesticides on

Allium cepa. Procedia Technology, v. 8, p. 19–26, 2013.

88

METASYSTEMS. Automated micronucleus tests. Disponível em:

<https://metasystems-international.com/en/products/solutions/micronuclei/>.

MOREIRA, F. C. Reconhecimento e classificação de padrões de imagens de núcleos de

linfócitos do sangue periférico humano com a utilização de redes neurais artificiais. 2002.

MORO, T. R. et al. Adsorption of pharmaceuticals in water through lignocellulosic fibers

synergism. Chemosphere, v. 171, p. 57–65, 2017.

MOTA, J. A. O valor da natureza : economia e política dos recursos naturais. 2 Ed.

ed. [s.l.] Garamond, 2001.

NAZLIBILEK, S. et al. Automatic segmentation, counting, size determination and

classification of white blood cells. Measurement: Journal of the International

Measurement Confederation, v. 55, p. 58–65, 2014.

OLIVEIRA, A. Q. DE. Pré-processamento de imagens de fundo do olho: correção de

iluminação e de contraste para a identificação automática da rede de vasos. [s.l.]

Universidade Federal do Pampa - UNIPAMPA, 2013.

PEIXER, G. Avaliação da genotoxicidade e citotoxicidade da água do rio Passaúna

utilizando Allium cepa como bioensaio e relação com a cafeína. [s.l.] Universidade

Positivo, 2016.

PIECZYWEK, P. M.; ZDUNEK, A. Finite element modelling of the mechanical

behaviour of onion epidermis with incorporation of nonlinear properties of cell walls and real

tissue geometry. Journal of Food Engineering, v. 123, p. 50–59, 2014.

PIRES, I.; DIAS, N. G.; PEREIRA, J. A divisão celular: mitose. Disponível em:

<http://www1.ci.uc.pt/pessoal/nunogdias/biolcel/frameset10.htm>.

POLETTO, P. D. O. et al. Análise da mutagenicidade do extrato hidrosolúvel de Derris

rariflora (MART. EX BENTH. J. F. MAC BR: FABACEAE), timbó amazônico, através do

teste micronúcleo em Allium cepa. Revista Pesquisa e Criação, v. 10, n. 1, p. 163–175,

2011.

RAHMAN, M. M.; RAHMAN, M. F.; NASIRUJJAMAN, K. A study on genotoxicity of

textile dyeing industry effluents from Rajshahi, Bangladesh, by the Allium cepa test.

Chemistry and Ecology, v. 33, n. 5, p. 434–446, 28 maio 2017.

RAMADHANI, D.; PURNAMI, S. Automated detection of binucleated cell and

micronuclei using CellProfiler 2.0 software. HAYATI Journal of Biosciences, v. 20, n. 4, p.

151–156, 2013.

SAFUAN, S. N. M.; TOMARI, M. R. M.; ZAKARIA, W. N. W. White blood cell (WBC)

counting analysis in blood smear images using various color segmentation methods.

89

Measurement, 2017.

SILVA, B. S. DA. Detecção automática de células via técnicas de morfologia

matemática e processamento digital de imagens, 2015. Disponível em:

<http://monografias.poli.ufrj.br/monografias/monopoli10013465.pdf>

SILVA, G. H. DA et al. Avaliação da genotoxicidade para Allium cepa de águas de rios e

nascentes antes e após tratamento para abastecimento público . 2009.

SILVEIRA, G. L. et al. Toxic effects of environmental pollutants: Comparative

investigation using Allium cepa L. and Lactuca sativa L. Chemosphere, v. 178, p. 359–367,

2017.

TABREZ, S.; AHMAD, M. Oxidative stress-mediated genotoxicity of wastewaters

collected from two different stations in northern India. Mutation Research - Genetic

Toxicology and Environmental Mutagenesis, v. 726, n. 1, p. 15–20, 2011.

TENÓRIO, M. A. L. DOS S. Análise quimiométrica do extrato das folhas de Zeyheria

tuberculosa (VELL) BUREAU (BIGNONIACEAE), com atividade inibidora da

linfoproliferação, por ressonância magnética nuclear. [s.l.] Universidade Federal de

Alagoas, 2011.

UNWPP. World Population Prospects 2017. [s.l: s.n.]. Disponível em:

<https://esa.un.org/unpd/wpp/Graphs/Probabilistic/POP/TOT/>.

WALTER, T.; KLEIN, J.-C. Segmentation of color fundus images of the human retina:

detection of the optic disc and the vascular tree using morphological techniques. Medical

Data Analysis, p. 282–287, 2001.

90

APÊNDICE A – PROCEDIMENTOS E FUNÇÕES DO ALGORITMO

Procedimento ProcessarLamina

O procedimento abre uma tela popup para escolha do diretório que contém as imagens de

uma lâmina. Chama os procedimentos SegmentaçãoExpxx PTcell_Tabxx. Mostra o arquivo

em execução e apresenta o resultado sumarizado da lâmina.

Procedimento SegmentacaoExp ou SegmentaçãoExp10M

O procedimento executa as tarefas de segmentação. O bloco obtém a limiarização das

regiões de núcleo e das regiões de citoplasma da imagem. Realiza a transformação da imagem

colorida em imagem em tons de cinza utilizando a canal verde do modelo RGB. Realiza a

filtragem de ruído no domínio da frequência utilizando um algoritmo de Fourier em 2D, com

corte gaussiano. Realiza a transformação exponencial e elimina a nota de resolução da

imagem. Realiza a filtragem de domínio espacial e encontra os pontos de limiarização pelo

histograma. Executa a limiarização.

Procedimento PTcell_Tab_10M.m ou PTcell_Tab_1612.m

Extrai as características as propriedades da imagem segmentada dos núcleos para imagens

de alta resolução (10,6 MP)(2 MP). Realiza a classificação e identificação dos núcleos.

Processa as características morfológicas para formação de um fator para a identificação da

fase do núcleo. Realiza a contagem dos tipos de núcleos. Calcula o IM. Traça os contornos

dos núcleos e o tipo do núcleo.

Função calculaNota

Calcula o valor z, normalizado, e determina o valor da curva normal.

Função avaliaDivisão

Função que tenta encontra no contorno vetorado que recebe como parâmetro dois pontos

próximos e opostos neste contorno, que representariam os pontos extremos da sobreposição

moderada de núcleo.

Função encontraVales

Encontra os valores mais baixos de tons de cinza baseado no histograma bi ou trimodal.

91

APÊNDICE B – LISTAGEM DOS CÓDIGOS EM MATLAB

Procedimento ProcessarLamina

% -- Interface -- Seleções iniciais --------------------------------------

ContagemCelulas = app.NucleibySlideSpinner.Value; % Cont. de células por lâmina

resolucaoEntrada = app.ResolutionKnob.Value; % 1 --> 2 MP; 2 --> 10,6 MP

formatoEntrada = app.FormatKnob.Value; % 1 --> JPG; 2 --> PNG

TextoSaida = zeros(2000);

% Valores vindos da interface do CoNuMitAC

% ------------------------------------------------------------------------

formato = '*.jpg';

if strcmp(formatoEntrada,'PNG')

formato = '*.png';

end

resolucao = 2;

if strcmp(resolucaoEntrada,'10,6 MP')

resolucao = 10;

end

dname = uigetdir('../' ,sprintf(...

'Selecione a pasta com as imagens da lâmina [%s-%s]',...

formatoEntrada, resolucaoEntrada));

if isequal(dname,0)

disp('User selected Cancel');

return

else

list = dir(fullfile(dname, formato));

for lfile = 1:length(list)

if isequal(list(lfile).isdir, 0)

disp(list(lfile).name);

end

end

end

now1 = now;

DirName = strsplit(dname,'\');

DNlen = length(DirName);

TotalCelulas = 0;

TotalDivisao = 0;

AcumuladorI = 0;

AcumuladorP = 0;

AcumuladorM = 0;

AcumuladorA = 0;

AcumuladorT = 0;

dirsize = length(DirName{DNlen});

fprintf('%-8s %-15s %4s %4s %4s %4s %4s\n','Lâmina','Imagem','I','P','M','A','T');

% -- Interface -----------------------------------------------------------

TextoSaida = ['Lâmina Imagem I P M A T' newline];

% ------------------------------------------------------------------------

for imagens =1:length(list)

im = imread(fullfile(dname, list(imagens).name));

if resolucao == 10

% --- 10,6 MP JPG/PNG

SegmentacaoExp10M

PTcell_Tab_10M

elseif resolucao == 2

% --- 2 MP

SegmentacaoExp

PTcell_Tab_1612

else

break;

end

92

AcumuladorI = AcumuladorI + FaseAcc(1);

AcumuladorP = AcumuladorP + FaseAcc(2);

AcumuladorM = AcumuladorM + FaseAcc(3);

AcumuladorA = AcumuladorA + round(FaseAcc(4)/2);

AcumuladorT = AcumuladorT + round(FaseAcc(5)/2);

TotalDivisao = AcumuladorP + AcumuladorM + AcumuladorA + AcumuladorT;

TotalCelulas = TotalDivisao + AcumuladorI;

if TotalCelulas >= ContagemCelulas

break;

end

TextoSaida = [TextoSaida sprintf('%-8s %-15s ', DirName{DNlen},

list(imagens).name)];

app.OutputTextArea.Value = TextoSaida;

fprintf('%-8s %-15s ', DirName{DNlen}, list(imagens).name);

fprintf('%4d %4d %4d %4d %4d\n', ...

FaseAcc(1), FaseAcc(2), FaseAcc(3), round(FaseAcc(4)/2), round(FaseAcc(5)/2));

% -- Interface -------------------------------------------------------

TextoSaida = [TextoSaida sprintf('%4d %4d %4d %4d %4d\n', ...

FaseAcc(1), FaseAcc(2), FaseAcc(3), round(FaseAcc(4)/2), round(FaseAcc(5)/2))];


app.CounterSlider.Value = TotalCelulas;

app.IEditField.Value = AcumuladorI;

app.PEditField.Value = AcumuladorP;

app.MEditField.Value = AcumuladorM;

app.AEditField.Value = round(AcumuladorA);

app.TEditField.Value = round(AcumuladorT);

% --------------------------------------------------------------------

end

IM = (TotalDivisao/TotalCelulas)*100;

now2 = now;

fprintf('%s Células:%d - IM:%2.2f - I:%d P:%d M:%d A:%d T:%d Duração: %s\n',...

DirName{DNlen}, TotalCelulas, IM, AcumuladorI, AcumuladorP, AcumuladorM,...

AcumuladorA, AcumuladorT, datestr(now2-now1,'MM:SS.FFF'));

% -- Interface -----------------------------------------------------------

app.IMEditField.Value = sprintf('%-9s = %5.2f',DirName{DNlen},IM);

TextoSaida = [TextoSaida newline sprintf(...

'%s Células:%d - IM:%2.2f - I:%d P:%d M:%d A:%d T:%d Duração: %s\n',...

DirName{DNlen}, TotalCelulas, IM, AcumuladorI, AcumuladorP, AcumuladorM,...

AcumuladorA, AcumuladorT, datestr(now2-now1,'MM:SS.FFF')) newline];


app.CounterSlider.Value = 0;

app.GoButton.BackgroundColor = [0.96 0.96 0.96];

app.GoButton.Text = 'Go';

% ------------------------------------------------------------------------

TotalCelulas = 0;

Procedimento SegmentacaoExp

% -- SegmentaçãoExp

% -- Supressão da legenda da imagem

im8 = im(:,:,2);

[ny, nx] = size(im8);

if nx == 3840 % para imagem 3840 x 2748

if im8(2700, 3700) == 255

[hv, hp] = findpeaks(imhist(im8));

[hmax, hmpos] = max(hv);

im8(2622:end, 3353:end) = hp(hmpos); % Aplica nível médio de cinza

im8(2622:end, 3353) = 0;

im8(2622, 3353:end) = 0;

93

end

elseif nx == 1600 % para imagem 1600 x 1200

if im8(1170, 1570) == 255



im8(1141:end, 1468:end) = hp(hmpos);

im8(1141:end, 1468) = 0;

im8(1141, 1468:end) = 0;

end

end

% -- Filtro de para alta frequência Gaussiano

im8f = LoHiGaussFFT2(im8, 250);

% -- Transformada exponencial

im8fe=uint8(exp(double(im8f)/37+0.001));

% -- filtro de média

im8fem = imboxfilt(im8fe);

im8fem = imboxfilt(im8fem);

im8fem = imboxfilt(im8fem);

% -- Limiar por Otsu

%[niveis] = multithresh(im8fem, 2);

%imn = imquantize(im8fem, niveis);

[thnucleo, thcito] = encontraVales(im8fem);

imnucleo = im8fem(:,:) < thnucleo;

imcito = im8fem(:,:) < thcito;

% -- Separação para Núcleo e Citoplasma

%imnucleo = imn < 2;

%imcito = imn > 0;

Procedimento SegmentacaoExp10M

% -- SegmentaçãoExp

% -- Supressão da legenda da imagem

im8 = im(:,:,2);

[ny, nx] = size(im8);

if nx == 3840 % para imagem 3840 x 2748

if im8(2700, 3700) == 255



im8(2622:end, 3353:end) = hp(hmpos); % Aplica nível médio de cinza

im8(2622:end, 3353) = 0;

im8(2622, 3353:end) = 0;

end

elseif nx == 1600 % para imagem 1600 x 1200

if im8(1170, 1570) == 255



im8(1141:end, 1468:end) = hp(hmpos);

im8(1141:end, 1468) = 0;

im8(1141, 1468:end) = 0;

end

end

% -- Filtro de para alta frequência Gaussiano

im8f = LoHiGaussFFT2(im8, 250);

% -- Transformada exponencial

im8fe=uint8(exp(double(im8f)/36.5+0.001));

% -- filtro de média

im8fem = imboxfilt(im8fe);

%im8fem = imboxfilt(im8fem);

94

%im8fem = imboxfilt(im8fem);

% -- Limiar por Otsu

%[niveis] = multithresh(im8fem, 2);

%imn = imquantize(im8fem, niveis);

[thnucleo, thcito] = encontraVales(im8fem);

imnucleo = im8fem(:,:) < thnucleo;

imcito = im8fem(:,:) < thcito;

% -- Separação para Núcleo e Citoplasma

%imnucleo = imn < 2;

%imcito = imn > 0;

Procedimento PTCell_Tab_10M

% Fatores: AR/PE (AP); Perimetro (PE); Excentricidade (EX);

% DiamEquiv (DE); Solidez (SO); Area (AR);

% Calculo: Média (u); Desvio Padrão (s); |I|P|M|A|T|

% |Interfase|Prófase|Metáfase|Anáfase |Telófase|

TabelaFase = ["Interfase", "Prófase", "Metáfase", "Anáfase", "Telófase",

"Interfase"];

TabelaFaseR = ["I", "P", "M", "A", "T", "S"];

TabelaFaseC = ["green", "cyan", "magenta", "yellow", "black", "green"];

% Imagem de Referência Geral_Std_10M (PNG)

TabelaMedia =[ 0.2756, 0.2621, 0.1465, 0.1614, 0.2347; % AP

313.3, 548.4, 830.4, 586.6, 348.7; % PE

0.5611, 0.5530, 0.5755, 0.7740, 0.7155; % EX

97.31, 131.7, 132.6, 103.6, 92.18; % DE

0.9793, 0.9682, 0.7502, 0.7629, 0.9149; % SO

7557, 15820, 13810, 8529, 6747]; % AR

TabelaDesvio = [0.0055, 0.0180, 0.0296, 0.0223, 0.0176; % AP

42.96, 169.5, 172.8, 143.1, 34.83; % PE

0.1798, 0.1048, 0.1866, 0.1070, 0.1087; % EX

12.59, 16.06, 4.11, 11.72, 9.95; % DE

0.0117, 0.0164, 0.0750, 0.0449, 0.0379; % SO

1893, 4353, 853.7 1869, 1470]; % AR

TabelaPeso = [ 2, 1, 1.5, 1.6, 1; % AP

1, 1, 1, 1.5, 1; % PE

1, 1.2, 1, 1, 1; % EX

1, 1, 1, 1, 1; % DE

2, 1, 1, 1, 1; % SO

1, 1.8, 1, 2, 1]; % AR

FaseAcc = [0, 0, 0, 0, 0, 0];

% Limites com base em 99,74% da curva normal: três desvio padrão.

AR_MAX = TabelaMedia(6,2)+3*TabelaDesvio(6,2); % Prófase

AR_MIN = TabelaMedia(6,1)-3*TabelaDesvio(6,1); % Interfase

PE_MAX = TabelaMedia(2,3)+3*TabelaDesvio(2,3); % Metáfase

PE_MIN = TabelaMedia(2,1)-3*TabelaDesvio(2,1); % Interfase

imnuc = imclearborder(imnucleo);

imdiv = avaliaDivisao(imnuc);

imdiv = avaliaDivisao(imdiv);

%imdiv = imfill(imdiv, 'holes');

[B,L] = bwboundaries(imdiv, 'holes');

cs = regionprops(L, 'Area', 'Centroid', 'ConvexHull', 'ConvexArea',...

'ConvexImage', 'BoundingBox', 'Eccentricity', 'EquivDiameter',...

'Solidity', 'Image', 'Perimeter','PixelList',...

'MajorAxisLength','MinorAxisLength');

figure(2);

imshow(im);

95

qtd = 0;

hold on

for k = 1:length(B)

AR = cs(k).Area;

PE = cs(k).Perimeter;

% Limites AR: Max: AR+3DP; Min: AR-3DP

% PE: Max: PE+3DP; Min: AR-3DP

if AR > AR_MIN && AR < AR_MAX && PE > PE_MIN && PE < PE_MAX

qtd = qtd + 1;

EX = cs(k).Eccentricity;

DE = cs(k).EquivDiameter;

SO = cs(k).Solidity;

BB = cs(k).BoundingBox;

IM = cs(k).Image;

CH = cs(k).ConvexHull;

AP = sqrt(AR)/PE;

raioM = cs(k).MajorAxisLength/2;

raiom = cs(k).MinorAxisLength/2;

boundary = B{k};

cc = cs(k).Centroid;

PL = cs(k).PixelList;

FatorTeste = [ AP, PE, EX, DE, SO, AR];

Nota = [0, 0, 0, 0, 0, 0]; % |I|P|M|A|T|

for fase = 1:5

for fator = 1:6

NotaFator = calculaNota(FatorTeste(fator), ...

TabelaMedia(fator, fase), ...

TabelaDesvio(fator, fase)) * ...

TabelaPeso(fator, fase);

% Valor limite de D para a probabilidade de 99,74% da CN.

if NotaFator < 0.01

Nota(fase) = 0;

break;

end

Nota(fase) = Nota(fase) + NotaFator;

end

end

Tipo = "";

FatorMax = 0;

for fase = 1:5

if Nota(fase) > FatorMax

FatorMax = Nota(fase);

FaseInd = fase;

end

end

% 1) Representa 99,74% de probabilidade de um núcleo qualquer estar

% dentro dentro dos valores médios até 3 desvios padrão.

% Soma de 6 valores mínimos -> 6*0,0111=0,0666

% 2) Corte para objetos alongados (muito excentricos) que fogem do padrão

if FatorMax > 0.067

if (raioM < 2.3*raiom && EX <= 0.91) || FatorMax > 3

Tipo = TabelaFaseR(FaseInd);

FaseAcc(FaseInd) = FaseAcc(FaseInd) + 1;

end

end

%plot(boundary(:,2), boundary(:,1), 'black', 'LineWidth', 1);

%plot(cc(1), cc(2),'w+');

if Tipo == ""

plot(boundary(:,2), boundary(:,1), 'red', 'LineWidth', 2);

96

plot(cc(1), cc(2),'w+');

text(boundary(1,2)+20, boundary(1,1)+5,

sprintf('%s\n%.4f',Tipo,FatorMax), ...

'Color', 'black', 'FontSize', 8,'FontWeight', 'bold');

%text(boundary(1,2), boundary(1,1), ...

%sprintf('AR/%.0f AP/%.3f SO/%0.2f\nEX/%1.2f PE/%.0f', ...

%AR, AP, SO, EX, PE),...

%'Color', 'white', 'FontSize', 8, ...

%'BackgroundColor', 'blue');

else

plot(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',

2);

plot(cc(1), cc(2),'w+');

%patch(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',

1);

%rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 70, 34],

'Facecolor', 'white');

%text(boundary(1,2)+20, boundary(1,1)+5,


%'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');


'Facecolor', 'white')




end

%viscircles(cc,raioM);

%viscircles(cc,raiom);

%rectangle('Position', BB);

%fprintf('EP:%d %BP:%d \n', sep, sbp);

end

%plot(CH(:,1),CH(:,2), 'blue');

%plot(boundary);

if (TotalCelulas + sum(FaseAcc)) >= ContagemCelulas

break

end

end

title(sprintf('\\fontsize{16}{Núcleos: %d - I:%d P:%d M:%d A:%d T:%d (%d)}',

...

qtd, FaseAcc(1), FaseAcc(2), FaseAcc(3), FaseAcc(4), FaseAcc(5),

sum(FaseAcc)));

hold off

Procedimento PTCell_Tab_1612

% PTcell_Tab_1612 - Para baixa resolução 2MP

% Fatores: AR/PE (AP); Perimetro (PE); Excentricidade (EX);

% DiamEquiv (DE); Solidez (SO); Area (AR);

% Calculo: Média (u); Desvio Padrão (s); |I|P|M|A|T|

% |Interfase|Prófase|Metáfase|Anáfase |Telófase|

TabelaFase = ["Interfase", "Prófase", "Metáfase", "Anáfase", "Telófase"];

TabelaFaseR = ["I", "P", "M", "A", "T", "I"];

TabelaFaseC = ["green", "cyan", "magenta", "yellow", "black", "white"];

%-----------------| I | P | M | A | T | II |-----

TabelaMedia = [0.2782, 0.2607, 0.1395, 0.1540, 0.2479, 0.2776; % AP

223, 306, 542, 362, 184, 175; % PE

0.5082, 0.5414, 0.6558, 0.6922, 0.6794, 0.5514; % EX

70, 90, 84, 62, 51, 55; % DE

0.9817, 0.9586, 0.7208, 0.7456, 0.9162, 0.9765; % SO

3942, 6370, 5512, 3024, 2066, 2367]; % AR

% ---------------------------------------------------------------

97

TabelaDesvio = [0.0092, 0.0108, 0.0203, 0.0208, 0.0208, 0.0138; % AP

37, 18, 90, 51, 21, 28; % PE

0.1536, 0.1078, 0.0943, 0.1426, 0.1455, 0.1001; % EX

11, 5, 6, 4, 5, 6; % DE

0.0095, 0.0138, 0.0663, 0.0564, 0.0422, 0.0155; % SO

1133, 644, 784, 354, 368, 552]; % AR

% ---------------------------------------------------------------

TabelaPeso = [ 1, 1, 1, 1, 1, 1; % AP

1, 1, 1, 1, 1, 1; % PE

1, 1, 1, 1, 1, 1; % EX

1, 1, 1, 1, 1, 1; % DE

1, 1, 1, 1, 1, 1; % SO

1, 1, 1, 1, 1, 1]; % AR

%TabelaPeso = [ 1, 1, 1, 1, 2, 1; % AP

% 1, 1, 1, 1, 1.6, 1; % PE

% 1, 1, 1, 2, 1, 1; % EX

% 1, 1, 1, 1, 1, 1; % DE

% 1, 1, 1, 1, 1, 1; % SO

% 1, 1, 1, 1, 2, 1]; % AR

FaseAcc = [0, 0, 0, 0, 0, 0];

% Limites com base em 99,74% da curva normal: três desvio padrão.

AR_MAX = TabelaMedia(6,2)+3*TabelaDesvio(6,2); % Prófase

AR_MIN = TabelaMedia(6,5)-3*TabelaDesvio(6,5); % Interfase

PE_MAX = TabelaMedia(2,3)+3*TabelaDesvio(2,3); % Metáfase

PE_MIN = TabelaMedia(2,5)-3*TabelaDesvio(2,5); % Interfase

imdiv = imclearborder(imnucleo);

[B,L] = bwboundaries(imdiv, 'holes');

cs = regionprops(L, 'Area', 'Centroid', 'ConvexHull',...

'ConvexImage', 'BoundingBox', 'Eccentricity', 'EquivDiameter',...

'Solidity', 'Image', 'MinorAxisLength', 'MajorAxisLength','Perimeter');

qtd = 0;

[ccc, rrc, mmc] = imfindcircles(imdiv, [20 60]);

figure(1);

imshow(im);

hold on

for k = 1:length(B)

AR = cs(k).Area;


% Limites AR: Max: AR+3DP; Min: AR-3DP

% PE: Max: PE+3DP; Min: AR-3DP

if AR > AR_MIN && AR < AR_MAX && PE > PE_MIN && PE < PE_MAX

qtd = qtd + 1;

EX = cs(k).Eccentricity;


DE = cs(k).EquivDiameter;

SO = cs(k).Solidity;

BB = cs(k).BoundingBox;

IM = cs(k).Image;

CH = cs(k).ConvexHull;

raioM = cs(k).MajorAxisLength;

raiom = cs(k).MinorAxisLength;

AP = sqrt(AR)/PE;

boundary = B{k};

cc = cs(k).Centroid;

FatorTeste = [ AP, PE, EX, DE, SO, AR];

Nota = [0, 0, 0, 0, 0, 0]; % |I|P|M|A|T|i|

for fase = 1:6

for fator = 1:6

98

NotaFator = calculaNota(FatorTeste(fator), ...

TabelaMedia(fator, fase), ...

TabelaDesvio(fator, fase)) * ...

TabelaPeso(fator, fase);

% Valor limite de D para a probabilidade de 99,74% da CN.

if NotaFator < 0.01

Nota(fase) = 0;

break;

end

Nota(fase) = Nota(fase) + NotaFator;

end

end

Tipo = "";

FatorMax = 0;

for fase = 1:6

if Nota(fase) > FatorMax

FatorMax = Nota(fase);

FaseInd = fase;

end

end

% Interfase II conta como interfase

if FaseInd == 6

FaseInd = 1;

end

% 1) Representa 99,74% de probabilidade de um núcleo qualquer estar

% dentro dentro dos valores médios até 3 desvios padrão.

% Soma de 6 valores mínimos -> 6*0,0111=0,0666

% 2) Corte para objetos alongados que fogem do padrão

if FatorMax > 0.067

if (raioM < 2.3*raiom && EX <= 0.91) || FatorMax > 3

Tipo = TabelaFaseR(FaseInd);

FaseAcc(FaseInd) = FaseAcc(FaseInd) + 1;

end

end

if Tipo == ""

plot(boundary(:,2), boundary(:,1), 'red', 'LineWidth', 2);

plot(cc(1), cc(2),'w+');

rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 60, 24],





%text(boundary(1,2), boundary(1,1), ...

%sprintf('AR/%.0f AP/%.3f SO/%0.2f\nEX/%1.2f PE/%.0f', ...

%AR, AP, SO, EX, PE),...

%'Color', 'white', 'FontSize', 8, ...

%'BackgroundColor', 'blue');

else

plot(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',

2);

%plot(cc(1), cc(2),'w+');

%patch(boundary(:,2), boundary(:,1), TabelaFaseC(FaseInd), 'LineWidth',

1);



%text(boundary(1,2)+20, boundary(1,1)+5,


%'Color', 'black', 'FontSize', 12,'FontWeight', 'bold');

rectangle('Position', [boundary(1,2)+15, boundary(1,1)+10, 60, 24],





end

99

%viscircles(cc,raioM);

%viscircles(cc,raiom);

%rectangle('Position', BB);

end

%plot(CH(:,1),CH(:,2), 'blue');

%plot(boundary);

if (TotalCelulas + sum(FaseAcc)) >= ContagemCelulas

break

end

end

title(sprintf('\\fontsize{16}{Núcleos: %d - I:%d P:%d M:%d A:%d T:%d (%d)}',

...

qtd, FaseAcc(1), FaseAcc(2), FaseAcc(3), FaseAcc(4), FaseAcc(5),

sum(FaseAcc)));

hold off

Função calculaNota

function nota = calculaNota(x, u, s)

lx = length(x);

for nx = 1:lx

z(nx) = double((x(nx)-u)/s);

nota(nx) = double(exp(-(z(nx)^2)/2));

end

end

Função avaliaDivisão()

function imdiv = avaliaDivisao(im)

imd = imclearborder(im);

div = 1;

ciclos = 0;

while (div > 0 && ciclos < 1000)

div = 0;

[B,L] = bwboundaries(imd, 'holes');

nuc = regionprops(L, 'Area', 'Centroid', 'Solidity', 'Eccentricity',

'Perimeter', 'BoundingBox','MinorAxisLength');

for k = 1:length(B)

AR = nuc(k).Area;

SO = nuc(k).Solidity;

EX = nuc(k).Eccentricity;

PE = nuc(k).Perimeter;

BB = nuc(k).BoundingBox;

ma = nuc(k).MinorAxisLength;

AP = sqrt(AR)/PE;

if (AR > 15000 && SO > 0.74 && SO < 0.98 && EX > 0.5702 && EX < 0.9883

&& PE > 384)

ciclos = ciclos + 1; % watchdog

boundary = B{k};

cc = nuc(k).Centroid;

%figure(4);

%subplot(2,2,1), plot(boundary(:,2),boundary(:,1)), hold on,

plot(cc(1,1),cc(1,2),'b+'), hold off;

%subplot(2,2,2), plot(boundary(:,2));

%subplot(2,2,3), plot(boundary(:,1));

%subplot(2,2,4);

[x1, y1, x2, y2, resp] = encontraMenorBorda2(boundary, [cc(1,2),

cc(1,1)]);

dc = distenv([y1,x1],[y2,x2]);

if resp

if dc < 0.7*ma

100

imd = fazLinhaImagem(imd, x1, y1, x2, y2);

end

end

end

end

end

imdiv = imd;

end

Função encontraMenorBorda2()

function [x1, y1, x2, y2, resp] = encontraMenorBorda2(borda, cc)

%------------------------

%figure(5);

%hold on;

%plot(borda(:,2),borda(:,1), 'b');

%plot(cx, cy, 'c+');

%------------------------

x1 = 0;

y1 = 0;

x2 = 0;

y2 = 0;

mm = distenv(borda, cc);

maxc = round(max(mm));

nn = maxc+50 - mm;

[pos,loc]=findpeaks(nn, 'MinPeakDistance',100, 'MinPeakProminence',

40,'MaxPeakWidth', 180, 'SortStr', 'descend', 'NPeaks', 2);

resp = false;

if ~isempty(pos)

if length(pos) > 1

x1 = borda(loc(1),2);

y1 = borda(loc(1),1);

x2 = borda(loc(2),2);

y2 = borda(loc(2),1);

if distenv([y1,x1],[y2,x2]) < 100

resp = true;

end

end

end

%plot(x1, y1, 'r+', x2, y2, 'r+');

%hold off;

end

Função fazLinhaImagem()

function im = fazLinhaImagem(im, x1, y1, x2, y2)

if y1 > y2

dy = y1;

dx = x1;

y1 = y2;

x1 = x2;

y2 = dy;

x2 = dx;

end

dy = abs(y2-y1);

dx = abs(x2-x1);

ix = x1;

iy = y1;

sy = 1;

sx = 1;

if x2 < x1

sx = -sx;

101

end

Adx = dx;

Ady = dy;

%hold on

while iy <= y2

im(iy-2:iy+2, ix-2:ix+2) = 0;

%plot(iy, ix, 'r+');

if Ady >= Adx

Adx = Adx + dx;

iy = iy + sy;

else

Ady = Ady + dy;

%iy = iy + sy;

ix = ix + sx;

if sx > 0

if ix > x2

break;

end

else

if ix < x2

break;

end

end

end

end

%hold off

end

Função LoHiGaussFFT2()

function imout = imfilterFFT2(imfilterin, raio)

A = fft2(double(imfilterin)); % compute FFT of the grey image

A1=fftshift(A); % frequency scaling

% Gaussian Filter Response Calculation

[M N]=size(A); % image size

R=raio; % filter size parameter

X=0:N-1;

Y=0:M-1;

[X Y]=meshgrid(X,Y);

Cx=0.5*N;

Cy=0.5*M;

Lo=exp(-((X-Cx).^2+(Y-Cy).^2)./(2*R).^2);

Hi=1-Lo; % High pass filter=1-low pass filter

% Filtered image=ifft(filter response*fft(original image))

J=A1.*Lo;

J1=ifftshift(J);

imout=abs(ifft2(J1));

Função distenv()

function env = distenv(pontos, centro)

x = length(pontos(:,1));

env(1:x) = 0;

cx = centro(1,1);

cy = centro(1,2);

for n = 1:x

xi = pontos(n,1);

102

yi = pontos(n,2);

a = (xi - cx)^2;

b = (yi - cy)^2;

env(n) = sqrt(a + b);

end

Função encontraVales()

function [vale1, vale2] = encontraVales(im)

[contagem, local] = imhist(im);

contagem2 = [contagem; 0];

local2 = [local; length(contagem)+2];

% Determina os picos do histograma

[valor, posicao] = findpeaks(contagem2, local2, ...

'MinPeakDistance', 10,...

'MinPeakWidth', 1);

pos = [0, 0, 0];

% Separa os três principais picos

for i = 1:3

[kv, kp] = max(valor);

pos(i) = posicao(kp);

valor(kp) = 0;

end

% Organiza os picos de forma crescente.

pos = sort(pos);

pmin = Inf;

for k = pos(1):pos(2)

if pmin > contagem(k+1)

pmin = contagem(k+1);

vale1 = k;

end

end

pmin = Inf;

for k = pos(2):pos(3)

if pmin > contagem(k+1)

pmin = contagem(k+1);

vale2 = k;

end

end

end

103

APÊNDICE C – LÂMINAS DE ALLIUM CEPA UTILIZADAS NO TRABALHO

105

APÊNDICE D – IMAGENS PARA CALIBRAÇÃO

Anáfases:

Interfases:

Metáfases:

106

Prófases:

Telófases:

107

ANEXO A – FUNÇÕES DO MATLAB UTILIZADAS

https://www.mathworks.com/help/images/ref/bwmorph.html?s_tid=srchtitle

https://www.mathworks.com/help/signal/ref/findpeaks.html#buff2uu

https://www.mathworks.com/help/images/ref/imboxfilt.html

https://www.mathworks.com/help/images/ref/bwboundaries.html

https://www.mathworks.com/help/images/ref/regionprops.html

https://www.mathworks.com/help/matlab/ref/rectangle.html

https://www.mathworks.com/help/matlab/ref/patch.html

https://www.mathworks.com/help/matlab/ref/plot.html

https://www.mathworks.com/help/matlab/ref/text.html

https://www.mathworks.com/help/images/ref/imerode.html

https://www.mathworks.com/help/images/ref/imdilate.html

https://www.mathworks.com/help/images/ref/imclose.html

https://www.mathworks.com/help/images/ref/imopen.html

https://www.mathworks.com/help/images/ref/bwdist.html

https://www.mathworks.com/help/matlab/ref/fft2.html

https://www.mathworks.com/help/matlab/ref/fftshift.html

https://www.mathworks.com/help/matlab/ref/ifft2.html

https://www.mathworks.com/help/matlab/ref/ifftshift.html

https://www.mathworks.com/help/matlab/ref/rgb2gray.html

https://www.mathworks.com/help/images/ref/medfilt2.html

https://www.mathworks.com/help/images/ref/fspecial.html

https://www.mathworks.com/help/images/ref/imregionalmax.html

108

Preparar HCl 1N com HCI 4N

Para 250mL: 98,54mL de HCI 4N

completados com água destilada.

**colocar um pouco de água no balão

antes do ácido

Preparação do carnoil: 3 medidas de

etanol para 1 de ácido acético. Essa

solução não pode ser reutilizada, sempre

deve ser feita uma nova para cada

experimento.

ANEXO B – PROCEDIMENTO DE PREPARAÇÃO DAS LÂMINAS DE Allium cepa

PASSO A PASSO PARA ANÁLISE DE TOXICIDADE EM

ALLIUM CEPA

- Cortar as raízes da cebola o mais perto do início possível, tirar as cascas;

- Colocar a cebola em um recipiente contendo as amostras realizadas e em

seguida levar para a estufa por 72h à 22°C;

- Passados as 72h cortar as raízes que cresceram e fixar o

material em carnoil (realizar preferencialmente ao meio

dia);

- Essa fixação no carnoil dura 5 minutos e depois as raízes

são colocadas no álcool 70% que deve ficar no mínimo

24h, tempo limite não foi pré-estabelecido;

- Passado no mínimo 24h no álcool 70%, lavar as raízes em água destilada e secar em um papel

(sempre usar uma água nova para cada amostra);

- Colocar as raízes lavadas em HCI 1N para hidrolisar em banho-maria por 9:30 min

em 60°C extremamente regulados (podendo variar no

máximo entre 58°C - 61°C). O HCl 1N utilizado pode ser

reutilizado até começar a aparentar uma coloração

amarelada;

- Retirar o material imediatamente do banho-maria e lavar

novamente em água destilada para cada amostra, secando as

raízes em um papel;

- Colocar as raízes em potinhos tampados para evitar a luz

contendo Shiff por 45 minutos (variamos as vezes para 50 minutos);

- Passados o tempo do shiff, lavar as raízes novamente em água destilada e colocá-las nas lâminas

secando a água dos cantos com papel;

- Cortar o meristema da célula com a lâmina desprezando a parte branca ainda com um pouco de

meristema para ter certeza que a leitura será feita só do meristema;

- Pingar uma gota de carmin e deixar reagindo por 5 minutos;

- Colocar a lamínula sobre a amostra (deixando-a bem centralizada);

- Passar a lâmina no fogo medindo a temperatura na mão;

- Esmagar o meristema com um lápis para espalhar;

- Enrolar a lâmina em vários papéis e pressionar contra a bancada para a retirada do carmin (na hora

de esmagar lembrar que a lamínula deve estar para baixo!);

- Limpar as bordas da lâmina com um papel umedecido e passar esmalte ao redor.

- A leitura da lâmina pode ser feita em até 3 dias, se for armazenada na geladeira e

coberta com papel alumínio ao abrigo de luz.

109

ANEXO C – DESCRIÇÃO DA FUNÇÃO regionprops()

Nome da propriedade Descrição

'Area' Número real de pixels na região, retornado como um escalar (esse valor

pode diferir ligeiramente do valor retornado por bwarea, que pondera

diferentes padrões de pixels de maneira diferente.)

Para encontrar o equivalente à área de um volume 3-D, use a

propriedade 'Volume' de regionprops3.

BoundingBox' O menor retângulo contendo a região, retornado como 1 por Q*2vetor,

onde Q é o número de dimensões da imagem. Por exemplo, no vetor

[ul_corner width], ul_corner especifica o canto superior esquerdo

da caixa delimitadora no formulário [x y z ...].width especifica a largura da

caixa delimitadora ao longo de cada dimensão no formulário [x_width

y_width ...].regionprops usa ndims para obter as dimensões da

matriz de rótulos ou imagem binária ndims(L), e numel para obter as

dimensões dos componentes conectados numel(CC.ImageSize),.

'Centroid' Centro de massa da região, retornado como 1 por Qvetor. O primeiro

elemento Centroid é a coordenada horizontal (ou x-coordenada) do centro

de massa. O segundo elemento é a coordenada vertical (ou y-coordenada).

Todos os outros elementos Centroid estão em ordem de dimensão. Esta

figura ilustra o centroide e a caixa delimitadora de uma região descontínua. A

região consiste nos pixels brancos; a caixa verde é a caixa delimitadora e o

ponto vermelho é o centroide.

'ConvexArea' Número de pixels em 'ConvexImage', retornados como um escalar.

'ConvexHull' O menor polígono convexo que pode conter a região, retornado como

uma matriz p-by-2. Cada linha da matriz contém as coordenadas x e y de um

vértice do polígono.

'ConvexImage' Imagem que especifica o casco convexo, com todos os pixels dentro do

casco preenchidos (definido como on), retornados como uma imagem

binária (logical). A imagem é o tamanho da caixa delimitadora da região

(para pixels que o limite do casco atravessa, regionprops usa a mesma

lógica roipoly para determinar se o pixel está dentro ou fora do casco.)

'Eccentricity' A excentricidade da elipse que possui os mesmos segundos momentos

da região retornou como escalar. A excentricidade é a relação entre a

distância entre os focos da elipse e o comprimento do seu eixo principal. O

valor está entre 0 e 1. (0 e 1 são casos degenerados. Uma elipse cuja

excentricidade é 0 é na verdade um círculo, enquanto uma elipse cuja

excentricidade é 1 é um segmento de linha.)

'EquivDiameter' Diâmetro de um círculo com a mesma área da região, retornado como

um escalar. Computado como sqrt(4*Area/pi).

'EulerNumber' Número de objetos na região menos o número de furos nesses objetos,

retornado como um escalar. Essa propriedade é suportada apenas para

matrizes de rótulo 2-D. regionprops usa conectividade 8 para calcular a

medida do número de Euler.

110


'Extent' Proporção de pixels na região para pixels na caixa delimitadora total,

retornada como escalar. Calculado como Area dividido pela área da caixa

delimitadora.

'Extrema' Extrema indica as extremidades de uma região, retornada como uma

matriz de 8 por 2. Cada linha da matriz contém as coordenadas x e y de um

dos pontos. O formato do vetor é [top-left top-right right-top right-bottom bottom-right bottom-left left-bottom left-

top]. Esta figura ilustra os extremos de duas regiões diferentes. Na região à

esquerda, cada ponto extremo é distinto. Na região à direita, certos pontos

extremos (por exemplo, top-left e left-top) são idênticos.

'FilledArea' Número de pixels on em FilledImage, retornado como um escalar.

'FilledImage' Imagem do mesmo tamanho da caixa delimitadora da região, retornada

como uma matriz binária (logical). Os pixels on correspondem à região,

com todos os buracos preenchidos, conforme mostrado nesta figura.

'Image' Imagem do mesmo tamanho da caixa delimitadora da região, retornada

como uma matriz binária (logical). Os pixels on correspondem à região e

todos os outros pixels são off.

'MajorAxisLength' Comprimento (em pixels) do eixo principal da elipse que possui os

mesmos segundos momentos normais normalizados da região, retornado

como um escalar.

'MinorAxisLength' Comprimento (em pixels) do eixo menor da elipse que possui os mesmos

segundos momentos normais normalizados da região, retornado como

escalar.

'Orientation' O ângulo entre o eixo x e o eixo maior da elipse que tem as mesmos

segundos-momentos como a região, devolvido como um escalar. O valor é

111


em graus, variando de -90 graus a 90 graus. Esta figura ilustra os eixos e a

orientação da elipse. O lado esquerdo da figura mostra uma região da

imagem e sua elipse correspondente. O lado direito mostra a mesma elipse

com as linhas azuis sólidas que representam os eixos. Os pontos vermelhos

são os focos. A orientação é o ângulo entre a linha pontilhada horizontal e o

eixo maior.

'Perimeter' Distância ao redor do limite da região, retornado como um escalar.

regionprops calcula o perímetro calculando a distância entre cada par

adjacente de pixels ao redor da borda da região. Se a imagem contiver

regiões não contíguas, regionprops retornará resultados inesperados.

Esta figura ilustra os pixels incluídos no cálculo do perímetro para este objeto.

'PixelIdxList' Índices lineares dos pixels na região, retornaram como um vetor p

elementar.

'PixelList' Locais de pixels na região, retornados como p -by- Q matrix. Cada linha

da matriz tem a forma [x y z ...] e especifica as coordenadas de um pixel na

região.

'Solidity' Proporção dos pixels no casco convexo que também estão na região,

retornados como um escalar. Computado como Area/ConvexArea.

'SubarrayIdx' Elementos de L dentro da caixa delimitadora de objeto, retornados como

uma matriz de células que contém índices que L(idx{:}) extraem os

elementos.

UNIVERSIDADE POSITIVO AMILTON CARLOS RATTMANN

Documents

Transcript of UNIVERSIDADE POSITIVO AMILTON CARLOS RATTMANN