UM ESCORE DE GRAVIDADE PARA A POLINEUROPATIA...

UM ESCORE DE GRAVIDADE PARA A

POLINEUROPATIA AMILOIDÓTICA FAMILIAR

BASEADO EM MAPAS AUTO-ORGANIZÁVEIS

Victor Barros Costa

Projeto de Graduação apresentado ao Curso de

Engenharia Eletrônica e de Computação da Escola

Politécnica, Universidade Federal do Rio de Ja-

neiro, como parte dos requisitos necessários à ob-

tenção do título de Engenheiro.

Orientadores: José Manoel de Seixas Debora Foguel

Márcia Waddington Cruz

Rio de Janeiro

Setembro de 2018

iv

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

Escola Politécnica – Departamento de Eletrônica e de Computação

Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária

Rio de Janeiro – RJ CEP 21949-900

Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que

poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar

qualquer forma de arquivamento.

É permitida a menção, reprodução parcial ou integral e a transmissão entre

bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou

venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem

finalidade comercial e que seja feita a referência bibliográfica completa.

Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).

v

AGRADECIMENTO

Em primeiro lugar, gostaria de agradecer à minha família. O suporte, a

compreensão, os conselhos e o companheirismo da minha mãe, do meu pai, do meu irmão

e da minha namorada foram fundamentais em todos os aspectos da minha vida,

especialmente durante a minha jornada na UFRJ. Me fortaleço na certeza de que poderei

contar com vocês sempre.

Agradeço aos meus orientadores, José Manoel de Seixas, Márcia Cruz e Debora

Foguel pelo apoio, pelos ensinamentos e pela confiança em mim depositada ao longo de

todo o meu trabalho como aluno de iniciação científica no LPS. Também agradeço pela

ajuda e paciência de Felipe Machado, que me acompanhou no início deste projeto, e

Natanael Moura, com quem muito aprendi desde o meu primeiro dia no laboratório.

Aos professores Casé, Joarez e Luiz Wagner, agradeço por estarem disponíveis

para conversas longas e francas nos momentos em que precisei do seu apoio.

Por fim, agradeço a todos os amigos e amigas que me acompanharam nesses seis

anos: Pedro Gil, Marina Torres, Gabriel Alboretti, Antonio Resende, Luiz Rennó, Vitor

Cossetti, Hellen Lima, Tamine Verli, Gabriella Felgas, Renan Rotunno, Humberto Paz,

Thiago Lobo, Paulo Valente, Igor Abreu, Daniel Guimarães, Anni Skywalker e tantos

outros do GECOM e do CAEng. Com vocês consegui superar as disciplinas mais difíceis,

enfrentar os maiores desafios e realizar os projetos que trouxeram sentido aos meus anos

de graduação. Foi um prazer dividir essas experiências com vocês.

vi

RESUMO

Redes neurais artificiais são algoritmos de inteligência computacional inspirados

biologicamente, frequentemente aplicados na resolução de problemas na área de ciência

de dados. Neste trabalho, uma rede neural não supervisionada foi implementada para

desenvolver um mapa auto-organizável (SOM, da sigla em inglês) com o intuito de

encontrar agrupamentos em um conjunto de dados clínicos de pacientes portadores de

Polineuropatia Amiloidótica Familiar (PAF), uma doença hereditária, degenerativa e

multissistêmica. A considerável variedade de sintomas e suas manifestações torna

complexa a aferição do nível de avanço da PAF. Por isso, este trabalho tem como objetivo

desenvolver um escore de severidade que leve em consideração o caráter abrangente da

doença, podendo ser utilizado como ferramenta de suporte à decisão de profissionais de

saúde. Para isso, o SOM foi utilizado devido a sua capacidade de agrupar eventos de

acordo com a sua similaridade, mapeando sinais de dimensões arbitrárias em um espaço

bidimensional. Foram obtidos cinco agrupamentos, representando diferentes níveis de

severidade de PAF. O grupo 1 incluiu todos os pacientes clinicamente assintomáticos do

banco de dados. O grupo 2 foi formado por pacientes com sintomas iniciais. O grupo 3

reuniu pacientes em estágio moderado. O grupo 4 representou os pacientes em estágio

moderado-grave. Os pacientes em estágio terminal foram mapeados no grupo 5. O

histórico de sintomas de cada paciente também foi projetado no mapa, para que se pudesse

analisar o desenvolvimento da doença de acordo com suas trajetórias no mapa ao longo

do tempo. Tais análises corroboraram as características observadas em cada grupo.

Portanto, a escala proposta mostrou-se eficaz para indicar o nível de severidade dos

pacientes, satisfazendo assim os objetivos propostos.

Palavras-Chave: redes neurais artificiais, mapa auto-organizável, treinamento não

supervisionado, polineuropatia amiloidótica familiar, amiloidose.

vii

ABSTRACT

Artificial Neural Networks are computational intelligence algorithms with

biological inspiration, frequently applied in the resolution problems in data science. In

this work, a neural network was implemented in the development of a self-organizing

map (SOM), aiming to discover clusters in a dataset of clinic data from patients suffering

from Familial Amyloid Polyneuropathy (FAP), an inherited, degenerative, multisystemic

disease. It is complex to determine the severity stage of a FAP patient due to the

remarkable variety of symptoms and manifestations of this disease. Therefore, the goal

of this work is to develop a severity score that takes the comprehensive nature of FAP

into account. To accomplish this, a SOM was used because of its capability of clustering

observations according to their resemblance, mapping signals of arbitrary dimensions in

a bidimensional space. Five groups were obtained, representing different stages of FAP.

Group 1 included all patients considered clinically asymptomatic. Group 2 included

patients with symptoms usually reported in the first stages of the disease manifestation.

Group 3 clustered patients with moderate health condition. Group 4 represented patients

with moderate-severe FAP. Patients in terminal stage were clustered in group 5. The

history of symptoms of each patient was projected in the SOM, to analyze the

development of the disease according to the patient’s trajectories in the map over time.

This analysis endorses the characteristics observed in each group. Hence, the severity

score proposed in this project was effective to indicate the level of severity of the patients,

thus satisfying the proposed objectives.

Key-words: artificial neural networks, self-organizing map, unsupervised training,

familial amyloid polyneuropathy, amyloidosis.

viii

SIGLAS

BMU – Best Matching Unit

CEPARM – Centro de Estudos em Paramiloidose Antônio Rodrigues de Mello

MLP – Multi-Layer Perceptron

NYHA – New York Heart Association

PAF – Polineuropatia Amiloidótica Familiar

PCA – Principal Component Analysis

PND – Polineuropathy Disability Score

RNA – Rede Neural Artificial

SNP – Sistema Nervoso Periférico

SOM – Self Organizing Map

THAOS – Transthyretin Amyloidosis Outcomes Survey

TTR – Transtirretina

ix

Sumário

1. Introdução ..................................................................................................................... 1

1.1 – Delimitação.......................................................................................................... 1

1.2 – Justificativa .......................................................................................................... 2

1.3 – Objetivos.............................................................................................................. 2

1.4 – Método ................................................................................................................. 3

1.5 – Descrição ............................................................................................................. 3

2. Polineuropatia Amiloidótica Familiar .......................................................................... 5

2.1 – Paramiloidose no Brasil ....................................................................................... 5

2.2 – Características Clínicas ....................................................................................... 6

2.3 – Diagnóstico e Tratamento.................................................................................... 6

2.5 – Escalas de Severidade .......................................................................................... 7

2.5 – Aplicação de Redes Neurais Artificiais na Medicina .......................................... 8

3. Desenvolvimento do Modelo........................................................................................ 9

3.1 – Variáveis Incluídas .............................................................................................. 9

3.2 – Características dos Dados .................................................................................. 11

3.3 – Materiais e Métodos .......................................................................................... 12

4. Resultados ................................................................................................................... 15

4.1 – Clusterização ..................................................................................................... 15

4.2 – Mapas de Componente ...................................................................................... 16

4.3 – Análise de Classes ............................................................................................. 20

4.4 – Deslocamento de Pacientes pelo Mapa ............................................................. 26

5. Validação .................................................................................................................... 33

6. Conclusão ................................................................................................................... 39

Bibliografia ..................................................................................................................... 42

Apêndice A - Redes Neurais Artificiais ......................................................................... 45

A.1 – O Neurônio Artificial........................................................................................ 45

A.2 – Paradigmas de Aprendizado de Redes Neurais ................................................ 46

A.3 – Mapa Auto-Organizável ................................................................................... 48

A.4 – Algoritmo K-means .......................................................................................... 50

x

Lista de Figuras

Figura 3.1. Exemplo de U-Matrix .................................................................................. 14

Figura 4.1: U-Matrix ...................................................................................................... 15

Figura 4.2: Índice de Silhueta ......................................................................................... 16

Figura 4.3: (a) K-means para 5 clusters; (b) U-Matrix ................................................... 16

Figura 4.4: Herança; Mutação; Histórico Familiar ......................................................... 17

Figura 4.5: Insensibilidade a Dor e Temperatura; PND; Dor Neuropática .................... 18

Figura 4.6: Diarreia/Constipação; Diarreia; Constipação; Saciedade Precoce; Tontura;

Agulhadas ....................................................................................................................... 18

Figura 4.7: Anomalia do Equilíbrio; Incontinência Fecal; Síncope; Incontinência

Urinária; Retenção Urinária; Náusea .............................................................................. 19

Figura 4.8: Vômito; Tontura; Perda de Peso .................................................................. 19

Figura 4.9: NYHA; Parede Posterior do VE; Septo do VE; Anomalia no Ritmo;

Anomalia na Condução e Fração de Ejeção do VE ........................................................ 20

Figura 4.10: Baixa Voltagem; Disfunção Erétil; Disfunção Renal ................................ 20

Figura 4.11: Indivíduos da classe 1 afetados pelos 27 achados clínicos e de exames.... 22





Figura 4.16: Trajetória do paciente 044.......................................................................... 28







Figura 5.1: Incidência de sintomas na classe 1 no treino e na validação ....................... 34





Figura A.1: Modelo de neurônio artificial ...................................................................... 46

Figura A.2: (a) Treinamento Supervisionado; (b) Teste da Rede Neural ....................... 47

Figura A.3: Treinamento Não Supervisionado ............................................................... 48

Figura A.4: SOM bidimensional, com BMU ativada e neurônios vizinhos excitados ... 50

xi

Lista de Tabelas

Tabela 3.1. Critérios de codificação dos parâmetros extraídos do THAOS ................... 11

Tabela 4.1: Distribuição dos Pacientes por Classe ......................................................... 21

Tabela 4.2: Pontuação dos indivíduos da classe 2 na escala PND ................................. 22




Tabela 4.6: Posicionamento inicial dos pacientes com consultas após a baseline ......... 26

Tabela 4.7: Migração de pacientes entre a primeira e última consulta........................... 27

Tabela 5.1: Distribuição dos pacientes de validação entre os clusters ........................... 33

Tabela 5.2: Comparativo dos níveis de PND na classe 1 no treino e na validação ........ 33





1

1. Introdução

A informatização de dados em larga escala evidencia a importância do

desenvolvimento de sistemas capazes de auxiliar a tomada de decisão de profissionais das

mais variadas áreas de atuação. A complexidade da tarefa de analisar os dados disponíveis

torna-se ainda maior quando, além de abundantes, eles são multivariados. Na área médica,

por exemplo, o diagnóstico de um paciente pode ser determinado com base em

informações relacionadas a múltiplos sistemas do organismo. Em contextos como esse, a

habilidade de identificar padrões nos dados a partir de relações de natureza estatística e

não linear é um desafio importante e requer o uso de métodos estatísticos e

computacionais. Redes neurais artificiais (RNA) são modelos computacionais que podem

ser utilizados com este objetivo (Apêndice A).

Este trabalho propõe o desenvolvimento de um modelo baseado em uma RNA

não supervisionada que auxilie profissionais da saúde no acompanhamento de pacientes

portadores de Polineuropatia Amiloidótica Familiar (PAF), uma doença neurodegenera-

tiva e multissistêmica.

1.1 – Delimitação

Os dados utilizados no projeto são referentes a indivíduos portadores de mutação

associada ao desenvolvimento da PAF, cadastrados no banco de dados internacional

Transthyretin Amyloidosis Outcomes Survey (THAOS) [1]. O THAOS contém múltiplas

camadas de informação dos pacientes coletadas a partir de anamnese, exames clínicos e

laboratoriais. Esses dados são registrados para cada consulta do paciente ao longo do

acompanhamento da doença.

Foram extraídos do THAOS os dados referentes a 146 indivíduos brasileiros.

Trinta características foram selecionadas na primeira camada do sistema, para compor os

vetores de dados de cada paciente. Nos processos de treinamento e validação da rede

neural, as informações utilizadas correspondem somente à primeira consulta de cada

paciente, denominada baseline. Posteriormente, dados de consultas adicionais foram

considerados para estudo da progressão da PAF em cada indivíduo. Essa análise foi

realizada somente para os pacientes para os quais existiam dados de consultas posteriores

até a realização do experimento.

2

1.2 – Justificativa

Por se tratar de uma doença degenerativa e multissistêmica, aferir o nível de

avanço da PAF em cada paciente não é uma tarefa simples. Centros clínicos de diversos

países desenvolveram seus próprios índices e escores para medir o desenvolvimento da

doença, a exemplo do escore de Kumamoto e a classificação portuguesa de severidade de

PAF de Sales-Luis [2]. Apesar de sua utilidade, tais escores não são abrangentes e

enfatizam principalmente a disfunção neurológica relacionada à sensibilidade, disfunção

autonômica e capacidade da marcha, não incluindo outros achados sistêmicos que podem

ser muito precoces, como alterações cardíacas, gastrointestinais e nefrológicas. A

literatura também carece de avaliações que considerem outras particularidades relevantes

para a progressão da doença, como o tipo de mutação genética e o histórico familiar.

Nesse contexto, a proposição de um modelo baseado em uma RNA tem como

objetivo endereçar de modo eficaz a multidimensionalidade dos dados envolvidos na

verificação do avanço da PAF. O uso de um modelo não supervisionado, capaz de

identificar regularidades estatísticas nos dados sem o fornecimento de alvos, é vantajoso

neste caso, uma vez que não há conhecimento prévio de respostas alvo para os eventos

do banco de dados utilizado. O modelo escolhido foi o mapa auto-organizável, ou Self-

Organizing Map (SOM), que organiza os dados em agrupamentos, ou clusters.

Redes neurais já foram implementadas em projetos na área médica para auxiliar a

triagem e o tratamento de pacientes com tuberculose pleural. O sistema de suporte a

decisão baseado em RNA provou-se eficiente e de baixo custo, evitando procedimentos

invasivos como biópsia pleural e toracocentese [3] [4].

1.3 – Objetivos

Espera-se que os clusters obtidos pelo SOM sejam representativos dos diferentes

níveis de severidade da doença. Com isso, será possível identificar os padrões de

progressão dos pacientes entre tais níveis a partir das características mais significativas

de cada agrupamento. Desse modo, o projeto atingirá o seu objetivo: desenvolver um

escore de severidade abrangente para a PAF considerando parâmetros neurológicos,

cardiológicos, gastrointestinais, nefrológicos e genéticos.

3

1.4 – Método

A primeira etapa do projeto envolveu a extração dos dados dos pacientes

registrados no THAOS de acordo com critérios de elegibilidade definidos no estudo. Os

dados foram organizados em vetores e codificados. Valores numéricos foram associados

a variáveis categóricas com base em critérios definidos com suporte de conhecimento

especialista em PAF, para que pudessem ser aplicados como entrada para o treinamento

do SOM.

Em seguida, os resultados obtidos foram analisados. Para isso, o algoritmo k-

means [5] foi executado sobre vetores correspondentes aos neurônios do SOM. Este

algoritmo é amplamente adotado para definir a melhor clusterização em um conjunto de

dados. A partir do resultado do k-means, os agrupamentos obtidos foram examinados para

que se verificasse quais eram as características predominantes em cada cluster, de modo

a determinar quais estágios de gravidade eles representariam.

Vale lembrar que o treinamento da RNA foi realizado com os dados de baseline

dos pacientes. Em uma etapa seguinte, os dados referentes às suas consultas posteriores

foram projetados sobre a saída do SOM, com o objetivo de identificar quais seriam as

suas trajetórias pelo mapa ao longo do tempo e quais variáveis foram determinantes para

cada deslocamento.

Por fim, um conjunto de dados não utilizados no treinamento da rede foi projetado

sobre o SOM. Nessa etapa, foram extraídos do THAOS os dados de novos indivíduos

elegíveis para incorporação no banco de dados do projeto. Novamente, as variáveis

predominantes dos clusters foram analisadas objetivando validar os resultados obtidos

anteriormente.

1.5 – Descrição

Uma breve introdução sobre PAF será apresentada no Capítulo 2. O leitor encon-

trará informações sobre causas da doença, sua ocorrência geográfica, sintomas e métodos

de tratamento.

No Capítulo 3, serão descritos os dados de treinamento e validação utilizados no

projeto, os procedimentos de codificação desses dados e a definição dos parâmetros de

treinamento do SOM e de execução do k-means.

4

Os resultados do projeto serão apresentados no Capítulo 4, no qual as principais

características de cada cluster serão analisadas. Essa análise será complementada no

mesmo capítulo com a discussão sobre os deslocamentos de pacientes no mapa conforme

a evolução de seus quadros clínicos.

O Capítulo 5 demonstrará a resposta do modelo à aplicação de um conjunto de

dados de validação, confrontando-a com os resultados obtidos no treinamento do SOM.

Por fim, as conclusões do projeto e perspectivas para trabalhos futuros serão apre-

sentadas no Capítulo 6.

5

2. Polineuropatia Amiloidótica Familiar

Amiloidoses são doenças caracterizadas pela deposição de proteínas amiloides em

tecidos do organismo dos pacientes afetados. Tais doenças podem ser adquiridas ou

hereditárias. As amiloidoses hereditárias que afetam especialmente o sistema nervoso

periférico (SNP) são denominadas paramiloidose ou Polineuropatia Amiloidótica

Familiar. Todos os tipos de PAF são de herança autossômica dominante, provocados por

uma mutação genética que desestabiliza a estrutura de uma determinada proteína e causa

a sua dissociação. Entre as diversas proteínas que podem estar associadas às doenças

amiloidóticas, a Transtirretina (TTR) é a mais comum [6].

2.1 – Paramiloidose no Brasil

Apesar de ser considerada uma doença rara, há registros de ocorrência de PAF em

diversos países, com regiões endêmicas como Japão, Suécia, Portugal e Brasil [7]. A PAF

é classificada em quatro tipos de acordo com a origem étnico-geográfica dos pacientes:

tipo I, ou Português; tipo II, ou Sueco; tipo III, ou Iowa; tipo IV, ou Finlandês. Nos dois

primeiros tipos a proteína mutante é a TTR. Dentre as mutações da TTR já identificadas,

a mais comum globalmente é a Val30Met, associada ao tipo I de PAF. Nos tipos III e IV,

as mutações afetam, respectivamente, a Apolipoproteína A1 e a Gelsolina, sendo o último

caso extremamente raro [8].

No Brasil, a expressão mais comum da PAF é a do tipo I, caracterizada por danos

progressivos no SNP. A semelhança entre os achados clínicos dos brasileiros e dos

portugueses evidencia a influência de fatores genéticos no desenvolvimento da doença –

estima-se que há 25 milhões de descendentes portugueses no Brasil [9].

Em 1984, o Centro de Estudos em Paramiloidose Antônio Rodrigues de Mello

(CEPARM) [10] foi fundado na Universidade Federal do Rio de Janeiro. Referência

nacional no diagnóstico, tratamento e estudo de Paramiloidose, o CEPARM funciona

junto ao Hospital Universitário Clementino Fraga Filho [11] e presta atendimento

multidisciplinar a pacientes de todo o país. Apesar da prevalência da mutação Val30Met

na população brasileira, diagnósticos contínuos realizados no CEPARM permitiram a

descoberta de novas mutações no Brasil e uma mutação ainda não descrita no mundo [12].

6

2.2 – Características Clínicas

A idade de início dos sintomas pode variar de acordo com a mutação, sendo

possível que um indivíduo portador não venha a manifestar sintomas da doença ao longo

da vida [13]. Os portadores de PAF podem experimentar o início da manifestação dos

sintomas da doença em idades variadas, sendo mais frequente que isso ocorra entre os 25

e 35 anos. O óbito ocorre, em média, 11 anos após a manifestação da doença. O quadro

clínico também é variável, havendo indícios de influência de fatores genéticos e

ambientais no desenvolvimento da paramiloidose [6, 14].

O processo de deposição de proteínas amiloides no espaço extracelular de tecidos

e órgãos resulta no desenvolvimento de distúrbios em múltiplos sistemas do organismo.

Na doença relacionada à mutação Val30Met da TTR, os sintomas neurológicos são

predominantes e sintomas cardíacos também são registrados. A doença se manifesta

inicialmente como uma neuropatia periférica, afetando pequenas fibras nervosas nos

estágios mais precoces, quando são comuns distúrbios sensitivos nos membros inferiores

e disfunção erétil. Os pacientes também são acometidos por disfunções gastrointestinais

como diarreia, constipação, náusea e vômito. Na medida em que a PAF progride para

uma neuropatia motora, sensorial e autonômica completa, os pacientes podem ser

acometidos por distúrbios motores e sensoriais, além de problemas renais, que são raros

e geralmente vistos no estágio mais avançado da doença [15].

No sistema cardiovascular, os pacientes são frequentemente afetados por

problemas de condução e sintomas como arritmia, síncope e insuficiência cardíaca. Os

depósitos de amiloide também podem provocar espessamento da parede ventricular. A

predominância do quadro cardíaco sobre os sintomas do SNP está relacionada às

Val122Ile e Thr60Ala [2].

2.3 – Diagnóstico e Tratamento

É possível diagnosticar pacientes que apresentem sintomas clínicos por meio de

biópsia dos tecidos comprometidos, para identificação de depósitos de amiloide. Em

geral, o exame é realizado no tecido subcutâneo, glândulas salivares ou mucosa retal.

Apesar de ser mais invasiva, a biópsia de nervo pode ser adotada em alguns casos, devido

à alta sensibilidade deste tecido [2].

Por se tratar de uma doença hereditária, o histórico familiar cumpre papel determi-

nante no suporte ao diagnóstico de PAF. Mesmo não apresentando sintomas, é importante

7

que indivíduos com parentes afetados realizem exames de sequenciamento do DNA para

detectar a presença da mutação. Entretanto, é preciso salientar que a ausência aparente de

histórico de PAF na família não exclui o diagnóstico. É possível que familiares afetados

nunca tenham manifestado sintomas ou tenham falecido sem ser diagnosticados [16].

Os tratamentos disponíveis para a PAF são mais bem-sucedidos em pacientes no

estágio inicial da doença. O transplante de fígado é o tratamento mais tradicional, visto

que o órgão é responsável pela produção de 98% da TTR. A redução drástica na produção

da proteína mutante ameniza a progressão da doença. Contudo, deve-se destacar que o

transplante não cura lesões já existentes e não é eficaz em evitar a evolução dos sintomas

neurológicos a longo prazo. Portanto, este procedimento é contraindicado para pacientes

severamente acometidos pela doença ou com idade avançada [17].

Mais recentemente, medicamentos como o Tafamidis [18] têm demonstrado

capacidade de reduzir a progressão da doença, estabilizando a TTR e evitando a formação

de depósitos amiloides. O medicamento, recomendado para pacientes no primeiro estágio

da PAF, tem sido cada vez mais adotado em diversos países [17] [19].

2.5 – Escalas de Severidade

Dentre as escalas de severidade de PAF desenvolvidas, pode-se destacar o escore

de Kumamoto, criado no Japão, e o Sales-Luis, criado em Portugal. O primeiro é

estruturado em uma escala de 0 a 96 pontos, em que a pontuação aumenta conforme a

severidade da doença. O segundo é graduado em sete níveis: pacientes em nível zero são

assintomáticos, enquanto aqueles em nível 6 são confinados em leito [11].

Outro importante escore utilizado como referência na aferição da severidade da

PAF é o Polineuropathy Disability Score (PND), que leva em consideração o

comprometimento na capacidade de marcha dos pacientes. O PND é graduado em cinco

níveis: nível 0 para pacientes assintomáticos; nível I para distúrbios sensoriais que não

afetem a capacidade de marcha; nível II para casos em que a marcha é prejudicada, sem

que seja necessário auxílio para locomoção; nível IIIa quando um apoio é necessário para

andar; nível IIIb quando dois apoios são necessários para andar; nível IV para pacientes

em cadeira de rodas [6].

Apesar da diversidade de escalas de severidade existentes, a expressiva variabili-

dade clínica da PAF ainda constitui um desafio para a aferição do avanço da doença. Em

8

geral, os escores têm sua abrangência limitada a distúrbios neurológicos autonômicos e

associados à sensibilidade e dificuldade de marcha.

A escala proposta neste trabalho se diferencia por ser abrangente, levando em

consideração, além dos distúrbios anteriormente mencionados, outras características

determinantes para o desenvolvimento do quadro clínico dos pacientes, com a disfunções

cardíacas, histórico da herança familiar e tipo de mutação da TTR.

2.5 – Aplicação de Redes Neurais Artificiais na Medicina

O uso de redes neurais para suporte à triagem e diagnóstico de pacientes na área

médica pode ser verificado em trabalhos relacionados, por exemplo, à tuberculose, à

lesões intersticiais pulmonares e ao reumatismo [4, 20, 21]. Nesses casos, modelos

supervisionados como o Multi-Layer Perceptron (MLP) ou não supervisionados como o

SOM foram construídos a partir de dados relacionados à características de pacientes.

A aplicação de RNA permite que grandes volumes de dados sejam processados

muito rapidamente e auxilia o profissional de saúde na identificação de padrões e relações

entre variáveis, facilitando o diagnóstico e tomadas de decisão relacionadas ao

tratamento. Em geral, modelos baseados em RNA são de baixo custo e alta praticidade, o

que favorece a escolha desta técnica para implementação de sistemas de suporte à decisão.

9

3. Desenvolvimento do Modelo

As variáveis consideradas neste projeto foram selecionadas com o intuito de

fornecer ao modelo de RNA dados que representem a abrangência dos sintomas de PAF,

de acordo com os objetivos do trabalho. Essa seleção foi realizada com suporte de

especialistas do CEPARM, para garantir a inclusão de sintomas e características relevan-

tes para a progressão da doença. Esse conjunto de características corresponde à primeira

camada de informação disponível no sistema. Em geral, esses dados podem ser obtidos

pelo profissional de saúde durante a consulta, o que simplifica o uso prático da escala

proposta.

3.1 – Variáveis Incluídas

Trinta variáveis foram selecionadas para compor os vetores de cada paciente:

1. Possibilidades de mutação.

2. Histórico familiar: conhecida ou desconhecida.

3. Herança: paterna ou materna.

4. Sintomas neurológicos:

a. dor neuropática;

b. agulhadas;

c. dormência;

d. redução da sensibilidade à dor e temperatura;

e. alteração do equilíbrio;

f. Polyneuropathy Disability Score (PND) [22]: 0 (sem alterações), I

(sintomas sensitivos), II (dificuldade para andar, mas não necessita

de apoio), IIIa (anda, com ajuda de um apoio), IIIb (anda, com ajuda

de dois apoios) e IV (restrito à cadeira de rodas).

5. Disfunção erétil.

6. Sintomas cardiovasculares:

a. tontura;

b. síncope;

c. New York Heart Association (NYHA) [23]: I, II, III, IV.

7. Sintomas urinários:

a. retenção urinária;

b. incontinência urinária;

c. insuficiência renal.

8. Sintomas gastrointestinais:

a. saciedade precoce;

b. náusea;

c. vômito;

10

d. constipação;

e. constipação/diarreia;

f. diarreia;

g. incontinência fecal;

h. perda de peso não intencional.

9. Eletrocardiograma:

a. baixa voltagem do complexo QST;

b. anormalidade da condução;

c. anormalidade do ritmo cardíaco;

10. Ecocardiograma:

a. espessura do septo interventricular;

b. espessura da parede ventricular posterior esquerda;

c. porcentagem da fração de ejeção.

Os dados extraídos do THAOS foram organizados em 146 vetores – um para cada

paciente. Para que os vetores pudessem ser fornecidos como entrada para o treinamento

da RNA, as variáveis foram codificadas numericamente. Características que indicassem

condições agravantes de PAF receberam valor “1”. A ausência de característica agravante

foi codificada como “-1”. A definição das condições agravantes da doença foi realizada

a partir de conhecimento especialista. Ocasionalmente, alguns sintomas podem ter sido

ignorados no cadastro do paciente. Nesses casos, os dados faltantes continuam sendo

utilizados no treinamento da rede neural, sendo atribuído valor zero na sua codificação.

Para alguns parâmetros, a codificação categórica não é possível. Nesses casos,

critérios especiais foram definidos para que os valores registrados no banco de dados

fossem codificados em “1” ou “-1”. Conforme pode ser observado na Tabela 3.1, o

princípio é o mesmo já descrito: características relacionadas a quadros clínicos

potencialmente mais severos foram codificadas com valor “1”, enquanto características

que não indiquem severidade foram codificadas com “-1”. As variáveis correspondentes

a achados obtidos por ecocardiograma são originalmente expressas em valores contínuos,

de modo que a determinação das faixas de valores que representam agravamento de PAF

foi feita com suporte especialista, a partir dos valores usualmente considerados em

estudos relacionados a esta doença [6]. Campos ignorados foram codificados com zero.

11

Tabela 3.1. Critérios de codificação dos parâmetros extraídos do THAOS

PARAMÊTRO VALOR CODIFICAÇÃO

TIPO DE MUTAÇÃO Val30Met 1

outras -1

HERANÇA materna 1

paterna -1

PND I, II, IIIa, IIIb, IV 1

0 -1

NYHA I, II, III, IV 1

nenhum nível -1

FRAÇÃO DE EJEÇÃO < 55% 1

≥ 55% -1

ESPESSURA DO SEPTO INTERVENTRICULAR

≥ 11mm 1

< 11mm -1

ESPESSURA DA PAREDE VENTRICULAR ESQUERDA

≥ 11mm 1

< 11mm -1

3.2 – Características dos Dados

A incorporação de indivíduos ao banco de dados do projeto ocorreu de acordo

com critérios específicos: foram considerados somente pacientes brasileiros cadastrados

no THAOS com alguma mutação especificada. A identidade dos pacientes foi preservada

por meio da atribuição de um ID numérico. Até o final deste projeto, 146 indivíduos eram

considerados elegíveis, com ID variando de 001 a 150. Os IDs 075 e 088 foram

desconsiderados por não terem dados especificando sua mutação e os IDs 012 e 114 não

existem no registro do THAOS.

Os dados foram divididos em um conjunto de treinamento, formado por 98

pacientes, e um conjunto de validação, formado por 48 pacientes. Essa divisão foi

determinada de acordo com a disponibilidade dos dados no momento de realização de

cada etapa do projeto.

3.2.1 - Dados de Treinamento

Dentre os 98 indivíduos do conjunto de treinamento, 35 ainda não haviam

manifestado sintomas de PAF. Entretanto, 94% relataram histórico familiar da doença.

No que diz respeito à origem da herança da mutação, 46% relataram herança materna e

44% relataram herança paterna. Os 10% restantes não souberam identificar a origem da

herança. A mutação predominante no banco de dados é a Val30Met, presente em

aproximadamente 93% dos pacientes do grupo.

12

Algumas variáveis se destacaram por uma quantidade expressiva de registros

ignorados, que foram codificados com valor zero. É o caso dos sintomas detectados por

exames de ecocardiograma e eletrocardiograma: em média, 51% dos indivíduos do

conjunto de treinamento não possuíam resultados dos exames registrados no sistema.

3.2.2 - Dados de Validação

O conjunto de validação incluía 12 indivíduos assintomáticos, representando 25%

deste grupo. Dentre os 48 pacientes, 94% alegaram histórico familiar de PAF, sendo que

42% herdaram a mutação da mãe, 35% herdaram do pai e 23% não identificaram a origem

da herança. A mutação Val30Met afeta 94% dos indivíduos.

Assim como no conjunto de treinamento, as variáveis referentes aos resultados de

ecocardiograma e eletrocardiograma foram ignoradas para mais da metade das observa-

ções do grupo de validação: em média, 54%. A proporção entre homens e mulheres no

grupo de validação é de 50%.

3.3 – Materiais e Métodos

O modelo desenvolvido neste trabalho foi implementado no MATLAB R2010a

[24], com a biblioteca externa de SOM desenvolvida pelo Laboratório de Ciência da

Computação e Informação da Helsinki University of Technology [25]. Devido ao volume

de dados limitados utilizado no projeto, não foi necessário o emprego de alto poder de

computação para o treinamento da rede neural, sendo utilizada apenas uma máquina

disponível no Laboratório de Processamento de Sinais da UFRJ.

A abordagem de clusterização de dados foi considerada a mais adequada ao

objetivo do projeto. Para desenvolver uma escala de severidade utilizando dados de

observações, sem fornecer rótulos de alvo para o treinamento do modelo, os pacientes

serão agrupados com base em sua similaridade. O SOM foi o modelo de RNA escolhido

devido à sua capacidade de mapear sinais de entrada de dimensões arbitrárias em um

espaço bidimensional. Essa característica torna o SOM particularmente atrativo para este

trabalho, em que a visualização dos dados detém grande relevância para funcionar como

suporte aos profissionais de saúde. Durante o processo de aprendizado, a topografia do

mapa é gradualmente ajustada de acordo com os dados fornecidos, permitindo a desco-

berta de estruturas implícitas de similaridade entre as observações. Assim, as característi-

cas estatísticas do banco de dados são mapeadas em determinadas regiões espaciais.

13

3.3.1 – Treinamento e Clusterização do SOM

O treinamento do SOM requer a definição de parâmetros como a quantidade de

neurônios e a proporção entre largura e comprimento do mapa e o número de vizinhos

aos quais cada neurônio está conectado. Foi definido que cada neurônio está conectado a

seis neurônios vizinhos. Os demais parâmetros foram ajustados experimentalmente. O

ponto de partida para a experimentação da quantidade de neurônios do SOM é dado por:

𝑁 = 5√𝑂𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠

Equação 3.1

com N sendo o número de neurônios do SOM e Observações o número de eventos

utilizados no treinamento da rede. Com o objetivo de minimizar a quantidade de

neurônios não acionados durante o treinamento, a referência para a maior quantidade de

neurônios no mapa é o número total de observações disponíveis para treiná-lo.

Para definir a proporção ente largura e comprimento do mapa, a inicialmente

experimentada foi determinada de acordo a Principal Component Analysis (PCA) reali-

zada sobre o conjunto de dados de treinamento. A proporção entre os dois primeiros

componentes determinou a relação entre as duas dimensões do mapa [26].

A rede foi treinada por full batch training [27], que consiste em fornecer todos os

dados de entrada à rede e realizar o ajuste de pesos dentro de uma única iteração, ao invés

de introduzi-los individualmente. No total, foram realizadas três rodadas de treinamento

em lote. A função de vizinhança gaussiana foi utilizada com raio de três unidades na

primeira rodada, decrescendo para duas unidades na seguinte e para uma unidade na

última.

Após o treinamento do SOM, a topologia do mapa foi analisada por meio da

matriz de distâncias unificadas, conhecida como U-Matrix. A Figura 3.1 corresponde a

um exemplo de U-Matrix para um SOM formado por 80 neurônios, com oito unidades de

largura e dez de comprimento. Dado um neurônio 𝑗 e seu vetor de pesos 𝑊𝑗, é calculada

a distância relativa entre os neurônios vizinhos 𝑊𝑖 e 𝑊𝑗 [28, 29]. Cada hexágono

representa uma distância entre neurônios, onde cores frias indicam proximidade e cores

quentes representam afastamento. Como cada unidade do SOM possui seis unidades

adjacentes – exceto aquelas na região de borda do mapa – a imagem resultante é

constituída por 285 hexágonos.

14

Figura 3.1. Exemplo de U-Matrix

O algoritmo k-means foi empregado para determinar o particionamento ótimo do

mapa, conforme obtido pelo treinamento da rede neural. Foram realizadas clusterizações

variando o número k de clusters entre 2 e 20. O índice de Silhueta foi utilizado para aferir

a qualidade dos agrupamentos para cada valor de k, permitindo-nos selecionar a melhor

configuração para o projeto. A sua interpretação é simples: quanto mais próximo de 1,

melhor a clusterização [30].

3.3.2 – Mapeamento de Consultas Posteriores e de Validação

No conjunto de dados de treinamento, 56 pacientes possuíam registros de

consultas médicas posteriores à baseline. Os dados de cada consulta foram codificados e

organizados em vetores, em conformidade com os mesmos procedimentos adotados

previamente. Em seguida, cada vetor foi comparado aos vetores de pesos de todos os 100

neurônios do mapa para determinação do neurônio mais similar (BMU, da expressão em

inglês Best Matching Unit). Nessa etapa, os pesos da rede não foram ajustados. O objetivo

era definir a localização do neurônio acionado em cada consulta, de modo a obter as

trajetórias dos pacientes pelo mapa ao longo da progressão de seus quadros clínicos. Na

etapa de validação do projeto, o mesmo procedimento foi adotado. Cada vetor de entrada

foi comparado aos neurônios do mapa para que fosse determinada a sua BMU, sem ajustar

os pesos da rede neural.

15

4. Resultados

O método descrito no capítulo anterior resultou em um mapa formado por 100

neurônios, com 10 unidades de largura e 10 de comprimento. Para um mapa com estas

configurações, a U-Matrix correspondente tem 19 unidades de largura e 19 de

comprimento. A U-Matrix resultante do treinamento do SOM pode ser analisada na

Figura 4.1. Alguns agrupamentos destacam-se especialmente na parte superior do mapa,

indicando que os neurônios desta região foram acionados por pacientes similares. Os

cortes em vermelho na imagem representam separações entre os possíveis agrupamentos

de dados de pacientes.

Figura 4.1: U-Matrix

4.1 – Clusterização

Os valores do índice de Silhueta para cada clusterização realizada podem ser

comparados na Figura 4.2. A maior pontuação foi obtida para a divisão em dois clusters,

ou seja, com 𝑘 = 2. Contudo, tal configuração não é conveniente para o propósito do

projeto. Dada a pequena diferença registrada entre os valores de Silhueta para outros

valores de k, foi decidido dividir o mapa em cinco clusters. Dessa maneira, é possível

avaliar a escala proposta neste trabalho utilizando como referência a escala PND, também

graduada em cinco níveis.

16

Figura 4.2: Índice de Silhueta

Na Figura 4.3 podemos confrontar a configuração encontrada pelo k-means para

cinco classes com a U-Matrix. O agrupamento destacado na parte superior do mapa, por

exemplo, é completamente contido pela classe 1. A fronteira desta classe com as demais

é compatível com o corte horizontal avermelhado verificado na U-Matrix.

Figura 4.3: (a) K-means para 5 clusters; (b) U-Matrix

4.2 – Mapas de Componente

O mapa de componente é um tipo de visualização do SOM conveniente para

análise da distribuição de cada sintoma dos pacientes pelo mapa. A interpretação dessas

figuras deve ser feita de acordo com a escala de cores, onde coloração vermelha

corresponde à presença do sintoma e coloração azul indica a sua ausência.

Na Figura 4.4, podemos examinar a distribuição de características como herança,

mutação e histórico familiar, comparando-as com a configuração dos clusters determi-

nada pelo k-means. Por se tratar de uma doença genética, cuja mutação predominante no

17

banco de dados é a Val30Met, é esperado que os mapas correspondentes à mutação e

histórico familiar de PAF apresentem coloração predominantemente vermelha. A pouca

ocorrência de valores “-1” para esses achados é reforçada pela numeração associada à

escala de cores dos mapas, cujo valor mínimo é maior do que zero.

Ainda na Figura 4.4, o mapa referente à herança materna ou paterna destaca uma

característica interessante do resultado obtido pelo SOM: os pacientes com herança

materna ativaram predominantemente a região direita do mapa, marcada em vermelho.

Diferentemente dos outros mapas da Figura 4.4, os valores representados pela escala de

cores deste mapa vão de -1 a 1.

Figura 4.4: Herança; Mutação; Histórico Familiar

O espalhamento de sintomas como insensibilidade à temperatura e dor, pontuação

maior que zero na escala PND e dor neuropática podem ser analisados na Figura 4.5. É

fácil perceber que essas características estão virtualmente ausentes da classe 1 e estão

presentes nas demais regiões do mapa. Os pacientes desta região também são pouco

afetados pelos sintomas exibidos na Figura 4.6. A partir dessas observações, podemos

inferir que esta classe poderia estar relacionada ao estágio inicial da PAF, menos severo.

18

Figura 4.5: Insensibilidade a Dor e Temperatura; PND; Dor Neuropática

Figura 4.6: Diarreia/Constipação; Diarreia; Constipação; Saciedade Precoce; Tontura;

Agulhadas

Os sintomas representados nos mapas de componentes da Figura 4.7 estão, em

sua maioria, ausentes das classes 1 e 2. Incontinência fecal, incontinência urinária e

retenção urinária acionaram especialmente as regiões das classes 4 e 5, enquanto anomalia

de equilíbrio marcou com maior destaque a área entre as classes 3 e 4. Síncope e náusea

ficaram concentrados na classe 5, acionando uma pequena região da classe 2.

19

Figura 4.7: Anomalia do Equilíbrio; Incontinência Fecal; Síncope; Incontinência Urinária;

Retenção Urinária; Náusea

A Figura 4.8 mostra que poucos pacientes das classes 1, 2 e 3 são afetados por

perda de peso não intencional, que se concentra na área das classes 4 e 5. A região da

classe 5 e seu entorno também se destaca por concentrar ocorrências de vômito e tontura,

enquanto o restante do mapa parece ser pouco marcado por esses sintomas.

Figura 4.8: Vômito; Tontura; Perda de Peso

Os mapas de componente dos sintomas relacionados a achados cardiológicos

podem ser observados na Figura 4.9. Ao observar os três sintomas na parte superior da

figura, é possível notar uma concentração de casos positivos na região correspondente à

classe 3. Contudo, ao compararmos os resultados da distribuição dos demais sintomas da

Figura 4.9, não há padrões de localização específicos que eles tenham em comum. O

mesmo pode ser afirmado sobre o mapa de baixa voltagem, na Figura 4.10.

20

Figura 4.9: NYHA; Parede Posterior do VE; Septo do VE; Anomalia no Ritmo; Anomalia na

Condução e Fração de Ejeção do VE

No caso de disfunção erétil, na Figura 4.10, também não há um padrão bem

definido para a sua localização no mapa. É importante destacar que tal sintoma pode afetar

somente os homens do banco de dados.

Figura 4.10: Baixa Voltagem; Disfunção Erétil; Disfunção Renal

Com base nas inspeções realizadas sobre os mapas de componente, portanto, já

conseguimos nos familiarizar com características relevantes da estrutura do mapa antes

mesmo de analisar mais detalhadamente os resultados para cada classe.

4.3 – Análise de Classes

As características prevalentes em cada agrupamento de pacientes foram analisa-

das com o intuito de verificar a associação de cada classe a um nível de severidade de

PAF. A Tabela 4.1 traz a distribuição de indivíduos por classe, destacando em negrito

aqueles considerados clinicamente assintomáticos.

21

Tabela 4.1: Distribuição dos Pacientes por Classe

CLASSE 1 CLASSE 2 CLASSE 3 CLASSE 4 CLASSE 5

011 060 006 002 001 004

015 065 008 019 003 005

016 066 009 030 007 014

018 068 010 051 013 017

020 070 045 052 022 021

023 072 053 058 025 024

027 074 054 059 026 033

028 076 055 061 029 071

038 077 056 063 031 081

039 084 067 073 032 099

040 085 078 079 034

041 089 090 080 035

042 091 097 082 036

043 092 101 083 037

044 093 086 046

047 094 100 062

048 095 064

049 096 069

050 098 087

057

4.3.1 - Classe 1

Um dos aspectos mais notáveis da classe 1 é o fato de ter agrupado todos os

pacientes assintomáticos do conjunto de treinamento. Dos 39 pacientes da classe 1,

somente quatro são sintomáticos: 028, 068, 076 e 089. Destes, apenas os dois primeiros

apresentavam pontuação na escala PND – ambos em nível I.

A porcentagem de indivíduos da classe 1 afetados pelos 27 achados clínicos e de

exames considerados no projeto está disposta em ordem decrescente no gráfico da Figura

4.11. Em média, os sintomas exibidos no gráfico afetaram dois pacientes ou menos,

representando 5% da classe. Nenhum paciente relatou alteração do equilíbrio,

incontinência fecal, retenção urinária, vômito e insensibilidade à dor e temperatura.

Somente dois sintomas afetavam mais de 10% dos pacientes: anormalidade do ritmo

cardíaco e constipação.

22

Figura 4.11: Indivíduos da classe 1 afetados pelos 27 achados clínicos e de exames

4.3.2 - Classe 2

A classe 2 é constituída por 14 pacientes, sendo que 79% herdaram a mutação da

mãe. O contraste da pontuação PND dos pacientes desta classe e da classe 1 pode ser

observado na Tabela 4.2. Somente um paciente do grupo 2 não pontou nesta escala.

Apesar disso, 79% da classe está em nível I e não há ocorrência de nível IV.

Tabela 4.2: Pontuação dos indivíduos da classe 2 na escala PND

NO PND PND I PND II PND IIIa PND IIIb PND IV

1 paciente (7%)

11 pacientes (79%)

1 paciente (7%)

0% 1 paciente

(7%) 0%

A distribuição dos 27 achados clínicos e de exames entre os indivíduos da classe

2 (Figura 4.12) reforça a sua disparidade em relação à classe 1. Cada sintoma foi relatado,

em média, por quatro pacientes (27%). Além disso, mais de 50% dos pacientes relataram

sintomas como agulhadas, dormência, dor neuropática, náusea e insensibilidade à dor e

temperatura, sendo este último totalmente ausente da classe 1.

23


Por outro lado, deve-se ponderar que a ocorrência de 10 sintomas neste grupo não

ultrapassou 10%, sendo que anomalia de equilíbrio e incontinência urinária não foram

relatados por nenhum paciente. Essa característica, associada à predominância dos níveis

mais baixos da escala PND, sugere que a classe 2 representa o estágio inicial de

desenvolvimento de PAF.

4.3.3 - Classe 3

A classe 3 agrupou 16 pacientes, dos quais 81% atestaram herança paterna de

PAF. Todos os indivíduos deste grupo apresentaram pontuação na escala PND. Ao

comparar a Tabela 4.3 com a Tabela 4.2, notamos que a classe 3 é constituída por frações

maiores de pacientes nos níveis II, IIIa e IIIb do que a classe 2. No entanto, ainda não há

registro de pontuação no nível 4.



0% 7 pacientes

(44%) 4 pacientes

(25%) 2 pacientes

(12%) 3 pacientes

(19%) 0%

A classe 3 é a primeira a registrar sintomas com mais de 80% de ocorrência além

de PND: é o caso dos relatos de dor neuropática, agulhadas e insensibilidade à dor e

temperatura. Alteração no equilíbrio e incontinência urinária atingiram 75% e 13% dos

pacientes deste grupo – tais sintomas não estão presentes nas classes 1 e 2. A ocorrência

média dos sintomas é de 34% entre os indivíduos da classe 3 (Figura 4.13).

24


Os parâmetros cardiológicos chamaram atenção para esta classe. 19% dos

pacientes pontuam na escala NYHA e 25% possuem espessura do septo interventricular

e da parede do ventrículo esquerdo maior ou igual a 11 mm. Além disso, 31% dos pacien-

tes da classe 3 apresentaram anomalia de condução.

4.1.4 - Classe 4

A herança genética dos 19 indivíduos da classe 4 está distribuída de forma mais

homogênea: 47% de pacientes têm herança materna. Este grupo chama atenção por

apresentar pacientes com PND em nível IV, o que não ocorreu nas demais classes já

apresentadas (Tabela 4.4).



0% 6 pacientes

(32%) 5 pacientes

(26%) 3 pacientes

(16%) 1 paciente

(5%) 4 pacientes

(21%)

Todas as porcentagens de ocorrência de achados clínicos e exames entre os

indivíduos da classe 4 podem ser consultadas na Figura 4.14. Este grupo se destaca por

apresentar 10 sintomas relatados por mais de 50% de seus pacientes. Dor neuropática e

insensibilidade à dor e temperatura atingiram todos os pacientes do grupo, enquanto

dormência, agulhadas e perda de peso não intencional acometiam 95%, 89% e 84% dos

pacientes do grupo, respectivamente. A média de pacientes afetados por cada sintoma é

de 44%.

25


4.1.5 - Classe 5

Os 10 pacientes agrupados na classe 5 diferenciam-se daqueles da classe 4 no que

diz respeito à herança da mutação da TTR: 80% da classe 5 indicaram herança materna,

contra 47% do grupo anterior. A comparação entre a Tabela 4.4 e a Tabela 4.5 mostra que

as pontuações na escala PND são relativamente próximas nas duas classes, com destaque

para a proporção maior de pacientes nos níveis IIIa e IIIb, na classe 5.



0% 3 pacientes

(30%) 2 pacientes

(20%) 2 pacientes

(20%) 1 paciente

(10%) 2 pacientes

(20%)

As taxas de ocorrência dos sintomas clínicos da classe 5, representadas na Figura

4.15, são o que mais distingue este grupo dos demais. A média de pacientes afetados por

cada sintoma é de 55%. Todos os indivíduos deste grupo relataram vômito, náusea, dor

neuropática, agulhadas e dormência. Perda de peso não intencional, tontura, saciedade

precoce e insensibilidade à dor e temperatura acometiam 90% dos pacientes da classe. No

total, 16 sintomas afetavam mais de 50% do grupo, entre eles síncope, retenção e

incontinência urinária.

26


4.4 – Deslocamento de Pacientes pelo Mapa

Nesta Seção as tendências gerais de deslocamento dos pacientes pelo mapa foram

analisadas. A Tabela 4.6 indica a quantidade de pacientes de cada classe para os quais

havia registros de consultas após a baseline.

Tabela 4.6: Posicionamento inicial dos pacientes com consultas após a baseline

Classe 1 Classe 2 Classe 3 Classe 4 Classe 5

22 pacientes 11 pacientes 9 pacientes 8 pacientes 6 pacientes

4.4.1 – Tendências de Migração

A partir da Tabela 4.7, podemos observar as tendências gerais de deslocamento

dos indivíduos de cada classe. Em todos os casos, percebemos que a maior parte dos

pacientes permaneceu no mesmo grupo. Os agrupamentos das classes 1 e 5 foram os que

demonstraram comportamento mais estável entre a primeira e a última consulta.

27

Tabela 4.7: Migração de pacientes entre a primeira e última consulta

Esse resultado é compatível com a análise realizada na Seção anterior deste

capítulo. O primeiro grupo reúne indivíduos que, em sua maioria, ainda não manifestaram

os sintomas de PAF. Dado que a maioria dos pacientes da classe 1 permanecem

assintomáticos nas consultas posteriores, a sua permanência na classe era, de fato, o

resultado esperado. Também é esperado que aqueles classificados na classe 5 não se

desloquem entre classes, uma vez que esta já representaria o estágio mais severo da

doença degenerativa.

No caso dos pacientes originalmente agrupados nas classes 2, 3 e 4, as migrações

geralmente ocorrem em direção grupos que representariam estágios mais avançados de

PAF. As exceções foram: um indivíduo da classe 2, tratado com Tafamidis, que migrou

para a classe 1; dois indivíduos da classe 4, que fizeram transplante de fígado e migraram

para as classe 1 e 2. A classe 2 se destaca por ser o único grupo cujos pacientes se

deslocaram para todas as outras classes, reforçando o papel deste cluster como ponto de

partida do desenvolvimento de PAF.

4.4.2 – Análises de Caso

As trajetórias de todos os pacientes foram analisadas mais detalhadamente, para

compreensão dos fatores associados aos deslocamentos dentro do mapa. Esta seção faz

uma análise de caso para alguns dos pacientes estudados. As figuras a seguir representam

a trajetória de um dado paciente, onde o neurônio ativado na consulta de baseline foi

28

destacado em amarelo. As BMUs referentes às demais consultas foram destacadas na cor

de suas respectivas classes. O número dentro de cada BMU representa a quantidade de

consultas em que ele foi ativado, para contemplar casos em que o paciente ativou a mesma

unidade mais de uma vez.

a) Paciente 044

A trajetória deste paciente pelo mapa está representada na Figura 4.16. Em sua

visita de baseline, ele não relatou nenhum sintoma e foi mapeado na área superior da

classe 1. Ao retornar ao hospital dois anos e oito meses depois, o paciente registrava

constipação, dor neuropática, agulhadas e nível I na escala PND. Esta consulta ativou um

neurônio ainda na classe 1, porém em sua região inferior, na fronteira com a classe 3.

Após um ano, o paciente retornou para a sua terceira consulta. Além dos sintomas

da visita anterior, ele relatou insensibilidade à dor e temperatura, dormência e anomalia

no equilíbrio. Nesta ocasião, o neurônio ativado está localizado na classe 3.

Figura 4.16: Trajetória do paciente 044

a) Paciente 056

O paciente 056, tratado com Tafamidis, iniciou sua trajetória na classe 2, em

região de fronteira com a classe 1 (Figura 4.17). Nessa ocasião, relatou tontura, náusea,

anormalidade na condução, diarreia, agulhadas e vômito. Nas três consultas seguintes,

realizadas ao longo de 2 anos, o indivíduo passou a apresentar saciedade precoce e deixou

de reportar vômito, permanecendo no mesmo grupo. A partir da quinta consulta, deixou

de relatar náusea e saciedade precoce e regrediu para a classe 1. No final de sua trajetória,

o paciente 056 foi mapeado na classe 1, próximo da fronteira da classe 2.

29


b) Paciente 067

Este paciente foi mapeado na classe 2 em sua consulta de baseline, tendo relatado

tontura, diarreia, perda de peso não intencional, dor neuropática, PND nível I e disfunção

erétil (Figura 4.18). Em sua segunda consulta, após um ano e oito meses, o paciente

migrou diretamente para a classe 4. Ele relatou os mesmos sintomas acrescidos de

incontinência urinária, saciedade precoce, diarreia alternada com constipação e

agulhadas.


c) Paciente 009

Em sua primeira consulta, o paciente 009 era acometido por síncope, constipação,

dormência, vômito, náusea, agulhadas, saciedade precoce, perda de peso e tinha PND

nível II. Sendo assim, foi mapeado na classe 2, em região de fronteira com a classe 5,

conforme indicado na Figura 4.19. Ele migraria para esta classe um ano depois, quando

passou a apresentar diarreia alternada com constipação, dor neuropática e incontinência

urinária.

Nas três consultas seguintes, intercaladas ao longo de três anos, o paciente nunca

se deslocou para fora da classe 5. Ao relatar tontura e progredir para PND nível IIIa, em

sua terceira consulta, ele se deslocou para o neurônio vizinho. A mesma BMU foi ativada

30

na visita seguinte, uma vez que não foi relatada nenhuma novidade. No último retorno

registrado, o paciente se moveu para a fronteira entre as classes 2, 4 e 5. Ele não

apresentava mais síncope e perda de peso, porém seu nível de PND aumentou para IIIb.


d) Paciente 052

Em sua trajetória, o paciente 052 se deslocou entre as classes 3, 2 e 5,

respectivamente. Em sua consulta de baseline, este paciente pontuava no nível I de PND

e era acometido por constipação, dor neuropática, agulhadas, dormência e insensibilidade

à temperatura e dor. Sua segunda consulta ocorreu após um ano e nove meses, quando ele

apresentava os mesmos sintomas, além de dormência e saciedade precoce. Com isso, este

indivíduo ativou um neurônio da classe 2, na fronteira entre as classes 4 e 5.

No ano seguinte o deslocamento foi menor – ele ativou o neurônio vizinho.

Contudo, observamos na Figura 4.20 que tal neurônio já se localiza na classe 5. Em seu

relato, o paciente registrou progressão de PND para nível II, diarreia, náusea,

incontinência fecal e perda de peso, entre os sintomas já relatados nas ocasiões anteriores.


31

e) Paciente 003

O paciente 003 é um dos poucos que regrediram para a classe 1 (Figura 4.21).

Este indivíduo passou por transplante de fígado um ano antes de sua consulta de baseline.

Nesta consulta, foi mapeado na classe 4, relatando PND nível IIIa, saciedade precoce,

perda de peso, agulhadas, problemas na espessura do septo e da parede posterior do

ventrículo esquerdo, diarreia, dor neuropática, dormência, anomalia no equilíbrio e

insensibilidade à temperatura e dor. Contudo, após aproximadamente um ano e meio, o

paciente havia deixado de experimentar saciedade precoce, perda de peso, diarreia, dor

neuropática, agulhadas e dormência, migrando para uma região da classe 1 próxima da

classe 3. Na consulta seguinte, o único sintoma adicional era diarreia alternada com

constipação. O mesmo neurônio foi ativado.


f) Paciente 037

A visita de baseline do paciente 037 ativou um neurônio da classe 4 na região de

fronteira com as classes 2 e 5 (Figura 4.22). Os sintomas eram tontura, constipação,

constipação alternada com diarreia, incontinência fecal, perda de peso, dor neuropática,

incontinência urinária e PND nível II. Dois anos depois, o indivíduo ativou o neurônio

vizinho, na classe 5. Ele sofria com sintomas adicionais: agulhadas, dormência, disfunção

erétil e PND nível IIIa.

32


33

5. Validação

Para validação dos resultados do projeto, foram processados os dados de 48 novos

pacientes com ID variando de 102 a 150. Neste grupo, 12 indivíduos são portadores de

mutação da TTR considerados clinicamente assintomáticos para PAF. Nesta etapa, foi

adotado o mesmo procedimento utilizado no mapeamento de consultas posteriores. Cada

vetor de entrada foi comparado aos neurônios do mapa para que fosse determinada a sua

BMU, sem ajustar os pesos da rede neural.

A distribuição resultante dos pacientes de validação entre as classes do mapa é

fornecida na Tabela 5.1.

Tabela 5.1: Distribuição dos pacientes de validação entre os clusters

Classe 1 Classe 2 Classe 3 Classe 4 Classe 5

16 pacientes 11 pacientes 10 pacientes 6 pacientes 5 pacientes

Nas seções a seguir, as características dos indivíduos mapeados em cada classe

serão comparadas às dos pacientes que originalmente constituíram tais agrupamentos na

etapa de treinamento. Para efeito de comparação, a média da variação das incidências dos

sintomas nas etapas de treino e validação foi calculada para cada classe. Foram excluídos

do cálculo: os sintomas cardíacos dependentes de exames, por não terem sido realizados

em todos os pacientes, e a disfunção erétil, por afetar exclusivamente os pacientes do sexo

masculino.

Validação da Classe 1

Em ambas as etapas do trabalho, os pacientes da classe 1 registram predominância

de herança paterna: 64% no treino e 62% na validação. Além disso, todos os 12 indivíduos

assintomáticos foram mapeados neste grupo, assim como ocorreu no treinamento da rede.

Dentre os quatro pacientes sintomáticos que acionaram neurônios nessa região do mapa,

somente dois pontuam na escala de PND – ambos em nível I (Tabela 5.2).

Tabela 5.2: Comparativo dos níveis de PND na classe 1 no treino e na validação

MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV

TREINO 95% 5% 0% 0% 0% 0%

34

VALIDAÇÃO 88% 12% 0% 0% 0% 0%

A Figura 5.1 indica que sintomas como vômito, incontinência fecal e anomalia no

equilíbrio não se manifestaram neste cluster, tanto no treinamento da rede, quanto na

validação. A variação média das incidências de cada sintoma nas duas etapas foi de 5%.

Figura 5.1: Incidência de sintomas na classe 1 no treino e na validação


No Capítulo 4, foi destacado que 79% dos pacientes da classe 2 herdaram a doença

da mãe. Dentre os 11 pacientes do grupo de validação alocados neste cluster, este valor

cai para 45%. Ainda assim, a Tabela 5.3 e a Figura 5.2 demonstram que o perfil dos

indivíduos da classe 2 guarda importantes semelhanças entre o treino e a validação.



TREINO 7% 79% 7% 0% 7% 0%

VALIDAÇÃO 27% 64% 9% 0% 0% 0%

Os níveis de PND I e II são os únicos registrados na classe 2 tanto no treino quanto

na validação. Além disso, esta região do mapa também foi acionada por pacientes sem

pontuação nesta escala. Mais de 50% dos indivíduos mapeados neste grupo no treino e na

validação relataram dor neuropática, dormência e agulhadas, enquanto menos de 10% dos

pacientes foram afetados por incontinência fecal e urinaria, insuficiência renal e alteração

no equilíbrio. A variação média das incidências de cada sintoma nas duas etapas foi de

12%.

35



Os neurônios da classe 3 foram acionados por 10 pacientes de validação. Assim

como no treinamento da rede, todos os indivíduos mapeados neste grupo pontuam na

escala PND. A Tabela 5.4 indica coincidências nas pontuações de PND para os cenários

de treino e validação. Em ambos os casos, a maior parcela da classe registra PND nível I

e não há pacientes em nível IV ou sem PND.



TREINO 0% 44% 25% 12% 19% 0%

VALIDAÇÃO 0% 40% 20% 30% 10% 0%

No gráfico da Figura 5.3 é possível comparar as incidências dos 27 achados

clínicos e exames. Para ambos os cenários confrontados, sintomas como dormência,

agulhadas, insensibilidade à dor e temperatura, dor neuropática, alteração no equilíbrio e

constipação afetam pelo menos 75% dos pacientes. Por outro lado, menos de 15% dos

pacientes relataram incontinência fecal, incontinência e retenção urinária, insuficiência

renal, vômito, diarreia e constipação. Em média, a variação de incidência dos sintomas

entre treino e validação foi de 9% para a classe 3.

Mais uma vez, alguns parâmetros cardiológicos ganharam destaque neste grupo.

Dos pacientes de validação, 10% pontuam na escala NYHA. Anormalidade de condução

e de espessura da parede e do septo ventricular afetam, respectivamente, 50% 10% e 20%

destes indivíduos.

36



A Tabela 5.5. detalha as pontuações na escala PND dos seis pacientes de validação

agrupados na classe 4. Apesar da pequena amostra de pacientes de validação agrupada

neste cluster, notamos uma compatibilidade com os resultados obtidos no treinamento no

que diz respeito aos níveis de PND. Em ambos os cenários, a classe 4 foi a primeira a

registrar pacientes em nível IV, além de não conter nenhum paciente sem PND.



TREINO 0% 32% 26% 16% 5% 21%

VALIDAÇÃO 0% 33% 17% 0% 17% 33%

Ao analisar os demais sintomas, no gráfico da Figura 5.4, destacamos que mais

de 80% da classe 4 foi acometida por perda de peso não intencional, agulhadas,

dormência, insensibilidade à dor e temperatura e dor neuropática, tanto no treino quanto

na validação. Em nenhum dos casos foi relatado vômito, náusea e insuficiência renal. A

variação média da incidência dos sintomas entre os dois cenários foi de 14% neste grupo.

37



A classe 5 reuniu cinco pacientes do grupo de validação. As incidências de cada

nível da escala PND e dos demais sintomas constam na Tabela 5.6 e no gráfico da Figura

5.5, respectivamente.



TREINO 0% 30% 20% 20% 10% 20%

VALIDAÇÃO 0% 20% 40% 20% 20% 0%

É notável que, diferentemente do resultado obtido no treinamento, não foi

registrado paciente de validação com PND nível IV na classe 5. Contudo, é importante

levar em consideração o número relativamente pequeno de indivíduos mapeados neste

cluster. Afinal, no caso das classes 4 e 5, variações da ordem de um paciente para mais

ou para menos representam mudanças percentuais de aproximadamente 20%. Tendo feito

essa ressalva, apontamos que todos os demais níveis da escala PND se fazem presentes

na classe 5, seja na etapa de treinamento ou de validação.

Nos dois cenários, todos os pacientes do grupo são acometidos por agulhadas, dor

neuropática, dormência, náusea e vômito. Pelo menos 90% dos pacientes relataram perda

de peso não intencional, saciedade precoce, tontura e insensibilidade à dor e temperatura.

38


39

6. Conclusão

Confrontando os resultados obtidos no projeto com os registros de pontuação na

escala PND, é possível concluir que a rede neural foi bem-sucedida em diferenciar os

indivíduos sintomáticos dos considerados clinicamente assintomáticos. Tanto no

treinamento da rede quanto no processo de validação, todos os pacientes assintomáticos

foram mapeados na classe 1, ocupando toda a região superior do mapa. Por sua vez, os

sintomáticos, que constituem 10% deste grupo, apresentam sintomas de pouca severidade

para PAF. Portanto, podemos inferir que esta classe representa o estágio assintomático

ou inicial da manifestação da doença.

As outras classes foram escalonadas em ordem de severidade de acordo com a

porcentagem da presença dos sintomas em cada uma delas e sua comparação com a escala

PND. A classe 2, localizada na região centro-direita do mapa, agrupou indivíduos de

graduação leve, com presença de sintomas intermediários. Este cluster foi o único a

registrar migração de pacientes de baseline para todos os demais grupos, conforme

observado na análise das trajetórias das suas consultas posteriores. Por esses motivos, fica

evidente o caráter intermediário da classe 2.

Na classe 3, observamos um aumento na incidência de sintomas presentes no

grupo anterior, considerados moderados. Este cluster, que ocupa a área esquerda do mapa,

é majoritariamente formado por pacientes com herança paterna da mutação na TTR, em

oposição ao que ocorre na classe 2. Também é possível fazer um destaque para a presença

de indivíduos com mutação diferente de Val30Met e achados relacionados à insuficiência

cardíaca neste grupo.

Por fim, as incidências dos sintomas de PAF considerados mais severos aumentam

gradativamente nas classes 4 e 5, sendo a primeira marcada por um estágio moderado-

grave e a segunda pelo estágio mais severo. As trajetórias dos pacientes com baseline na

classe 5 mostram que nenhum deles migrou para outro grupo. Considerando a natureza

exclusivamente degenerativa da PAF, esse fato reforça a conclusão de que a classe 5

representa o maior grau de severidade da doença.

A posterior validação feita com base nos dados de 48 novos indivíduos serviu para

reforçar as conclusões elaboradas sobre cada classe. Fica evidente a consistência do mapa

produzido, uma vez que a proporção dos níveis de PND e a presença dos principais

40

sintomas de cada grupo se mantiveram estáveis, com as maiores flutuações percentuais

ocorrendo nas classes com menor quantidade de pacientes.

A análise dos resultados obtidos não ficou restrita à comparação da incidência das

30 características dos indivíduos de cada classe. Por utilizar o SOM como ferramenta de

visualização bidimensional dos dados, o projeto também se beneficia com a possibilidade

de detectar informações relevantes relacionadas ao posicionamento dos agrupamentos no

mapa e às trajetórias dos pacientes em suas consultas posteriores.

De modo geral, o incremento da severidade da doença está distribuído vertical-

mente no mapa, com a classe assintomática ocupando toda a região superior, as classes

intermediarias predominantemente na região central a as classes mais graves ocupando

praticamente toda a região inferior do mapa. Com isso, podemos inferir que

deslocamentos verticalizados pelo mapa estejam relacionados à manifestação mais

agressiva da PAF, enquanto trajetórias horizontais representariam um desenvolvimento

mais brando. Nesse sentido, as avaliações mais detalhadas da progressão de cada paciente

reforçaram as diferenças entre os clusters. Nos casos apresentados na Seção 4.2, foi

possível relacionar claramente deslocamentos nas regiões de fronteira entre classes com

mudanças significativas nos quadros clínicos relatados pelos pacientes.

Perspectivas

O trabalho desenvolvido possui perspectivas de avanço baseadas na ampliação da

base de dados e no próprio aprimoramento do modelo, com a revisão da lista de

características fornecidas como entrada à rede.

Além disso, com o acesso a dados de novos pacientes do THAOS, será possível

incorporar os 48 pacientes de validação ao treinamento da rede neural e validar os

resultados com os dados dos novos pacientes disponíveis. Inclusive, a possibilidade de

acessar informações de indivíduos de outras regiões geográficas é promissora, pois

permitirá avaliar o desempenho do modelo frente a um conjunto de dados com maior

variabilidade genética.

Paralelamente, um sistema para uso médico está em fase de desenvolvimento. O

profissional de saúde poderá registrar os dados de um paciente em consulta no sistema

para determinar de modo simples a sua posição atual no mapa, obtendo informações sobre

o cluster em que o indivíduo se localiza. Com base nessas informações e nos dados de

outros pacientes que ativaram neurônios na mesma região, o sistema auxiliaria a

41

elaboração de um prognóstico para o paciente, oferecendo suporte ao profissional médico

na tomada de decisão em relação às estratégias de tratamento.

42

Bibliografia

[1] “THAOS - Transthyretin Amyloidosis Outcomes Survey,” [Online]. Available:

https://www.thaos.net/. [Acesso em 18 agosto 2018].

[2] C. Rapezzi, “Transthyretin-Related Amiloidoses and the Heart: A Clinical

Overview,” Nature Reviews Cardiology, pp. 398-408, julho 2010.

[3] J. M. Seixas, J. Faria, J. Souza Filho, A. Vieira, A. Kritski e A. Trajman,

“Artificial neural networks models to support the diagnosis of pleural tuberculosis

in adult patients,” The International Journal of Tuberculosis and Lung Disease,

pp. 682-686, 2013.

[4] L. V. C. Cascão, “Modelos de inteligência Computacional para o apoio à triagem

de pacientes e diagnóstico clínico de tuberculose pulmonar,” em Dissertação de

M.Sc., Rio de Janeiro, 2011.

[5] The MathWorks, Inc., “k-means clustering - MATLAB kmeans,” [Online].

Available: https://www.mathworks.com/help/stats/kmeans.html#buefthh-3.

[Acesso em 5 Fevereiro 2018].

[6] S. S. C. Novis, “Aplicação das Redes Neurais Artificiais na criação de um escore

de gravidade para pacientes com Polineuropatia Amiloidótica Familiar,” em

Dissertação de M.Sc., Rio de Janeiro, 2014.

[7] S. Novis, F. Machado, V. B. Costa, D. Foguel, M. W. Cruz e J. M. d. Seixas,

“Applying an artificial neural network model for developing a severity score for

patients with hereditary amyloid polyneuropathy,” Amyloid, 18 Julho 2017.

[8] M. Nuvolone, L. Obici e G. Merlini, “Therapies, Transyhyretin-associated

Familial Amyloid Polineuropathy – Current and Emerging,” US Neurology, pp.

24-32, 2012.

[9] M. Saporta, C. Zaros, M. Cruz, C. André, M. Misrahi, C. Bonaiti-Pellié e V.

Planté-Bordeneuve, “Penetrance estimation of TTR familial amyloid

polyneuropathy (type I) in Brazilian families,” Eur J Neurol. v.13, n-3, pp. 337-

341, 2009.

[10] Centro de Estudos em Paramiloidose Antonio Rodrigues de Mello, “CEPARM,”

[Online]. Available: http://ceparm.com/. [Acesso em 08 2018].

[11] Hospital Universitário Clementino Fraga Filho, “HUCFF,” [Online]. Available:

http://www.hucff.ufrj.br/. [Acesso em 08 2018].

[12] Hospital Universitário Clementino Fraga Filho, “Introdução - CEPARM,”

[Online]. Available: http://ceparm.com/o-ceparm/introducao/. [Acesso em 6

Fevereiro 2018].

[13] Associação Brasileira de Paramiloidose, “Tipo de Amiloidoses,” 2016. [Online].

Available: http://www.paramiloidose.com.br/tipo-de-amiloidoses.html. [Acesso

em 6 Fevereiro 2018].

[14] Associação Brasileira de Paramiloidose, “Sintomas,” [Online]. Available:

http://www.paramiloidose.com.br/sintomas.html. [Acesso em 6 Fevereiro 2018].

[15] Y. Ando, T. Coelho, J. L. Berk, M. Waddington Cruz, B.-G. Ericzon, S.-i. Ikeda,

D. Lewis, L. Obici, V. Planté-Bordeneuve, C. Rapezzi, G. Said e F. Salvi,

“Guideline of transthyretin-related hereditary amyloidosis for clinicians,”

Orphanet Journal of Rare Diseases, 20 Fevereiro 2013.

43

[16] C. Andrade, “A peculiar form of peripheral neuropathy: familiar atypical

generalized amyloidosis with special involvement of the peripheral nerves,”

Brain, pp. 408-427, 1952.

[17] Associação Brasileira de Paramiloidose, “Tratamentos,” [Online]. Available:

http://www.paramiloidose.com.br/tratamentos.html. [Acesso em 6 Fevereiro

2018].

[18] DrugBank, [Online]. Available: https://www.drugbank.ca/drugs/DB11644.

[Acesso em 12 08 2018].

[19] T. Coelho, L. Maia, A. Martins da Silva, M. Waddington Cruz, V. Planté-

Bordeneuve, P. Lozeron, O. Suhr, J. Campistol, I. Conceição, H. Schimidt, P.

Trigo, J. Kelly, R. Labaudinière, J. Chan, J. Packman, A. Wilson e D. Grogan,

“Tafamidis for transthyretin familial amyloid polyneuropathy: a randomized,

controlled trial.,” Neurology, pp. 785-792, 21 Agosto 2012.

[20] P. E. Ambrósio, “Redes neurais artificiais no apoio ao diagnóstico diferencial de

lesões intersticiais pulmonares,” em Dissertação de M.Sc., Ribeirão Preto, 2002.

[21] C. G. e. Souza e L. M. T. e. Souza, “O Uso de Redes Neurais Artificiais no

Diagnóstico de Doenças Reumatológicas,” em Trabalho de Conclusão de Curso,

Florianópolis, 2004.

[22] L. W. L. K. e. a. Dyck PJ, “Variables influencing neuropathic endpoints: the

Rochester Diabetic Neuropathy Study of Healthy Subjects,” Neurology, pp. 1115-

1121, 1995.

[23] American Heart Association, Inc., “Classes of Heart Failure,” Maio 2017.

[Online]. Available:

www.heart.org/HEARTORG/Conditions/HeartFailure/AboutHeartFailure/Classes

-of-Heart-Failure_UCM_306328_Article.jsp#.WvEfU4jt42w. [Acesso em 08

Maio 2018].

[24] The MathWorks, Inc., “MATLAB - MathWorks - MATLAB & Simulink,”

[Online]. Available: https://www.mathworks.com/products/matlab.html. [Acesso

em Setembro 2018].

[25] Helsinki University of Technology, “Laboratory of Computer and Information

Science,” [Online]. Available: http://www.cis.hut.fi/. [Acesso em setembro 2018].

[26] A. Orjuela, “Apoio ao Diagnóstico de Tuberculosis Pleural e Meníngea,” em Tese

de D.Sc., Rio de Janeiro, 2105.

[27] The MathWorks, Inc., “Neural Network Training Concepts,” [Online]. Available:

https://www.mathworks.com/help/nnet/ug/neural-network-training-concepts.html.

[Acesso em 12 08 2018].

[28] T. Kohonen, Self-Organizing Maps, Springer, 2001.

[29] T. R. P. J. e. a. Aguiar FS, “Development of two artificial neural network models

to support the diagnosis of pulmonary tuberculosis in hospitalized patients in Rio

de Janeiro, Brazil,” Med Biol Eng Comput., p. 1751–1759., 2016.

[30] The MathWorks, Inc., “Silhouette plot - MATLAB silhouette,” [Online].

Available: https://www.mathworks.com/help/stats/silhouette.html. [Acesso em 08

Fevereiro 2018].

[31] B. Yegnanarayana, Artificial Neural Networks, New Delhi: Prentice Hall of India,

2006, p. 18.

[32] P. D. Wasserman, Neural computing: Theory and Practice, New York: Van

Nostrand Reinhold, 1989.

44

[33] S. Haykin, Neural Networks and Learning Methods, Upper Saddle River: Pearson

Prentice Hall, 2009.

45

Apêndice A - Redes Neurais Artificiais

Redes neurais artificiais são sistemas computacionais capazes de executar tarefas

complexas de reconhecimento de padrões, classificação e predição a partir de um con-

junto de dados de entrada. Elas recebem essa denominação por serem inspiradas nas redes

neurais biológicas, formadas por unidades fundamentais interconectadas, denominadas

neurônios.

Em sistemas nervosos biológicos, cada neurônio recebe, processa e transmite si-

nais dentro da rede. Estima-se que o cérebro humano possui aproximadamente 1011 neu-

rônios e 1015 conexões [1]. Pode-se dizer que a organização dos modelos de redes neurais

artificiais representa uma analogia ao modelo biológico. Contudo, é importante reforçar

que tais sistemas não têm a pretensão de reproduzir a complexidade da inteligência hu-

mana em sua integridade – o objetivo, na verdade, é modelar a forma como o cérebro

realiza tarefas específicas de interesse [2, pp. 1-6].

A.1 – O Neurônio Artificial

Os neurônios artificiais são modelos matemáticos projetados para processar sinais

de modo análogo a uma célula nervosa. Essencialmente, uma rede neural artificial – a

qual iremos nos referir apenas como rede neural – é formada por neurônios conectados

entre si. Cada conexão é caracterizada por um peso, também chamado de peso sináptico.

Conforme representado na Figura A.1, o neurônio recebe um conjunto de sinais

de entrada 𝓍1, 𝓍2 . . . 𝓍𝑛 para cada sinapse j. Cada entrada 𝓍𝑗 é multiplicada pelo respec-

tivo peso sináptico 𝑤𝑗. O somatório de todas as multiplicações somado a um bias (Equa-

ção 1). O resultado é processado por uma função de ativação 𝜑(∙), tipicamente não linear,

que determina o valor do sinal de saída 𝑦 (Equação 2). Portanto, o neurônio descrito pode

ser representado pelas equações [3, pp. 10-14]:

𝓊 = ∑ 𝑤𝑗𝓍𝑗

𝑛

𝑗=1

+ 𝑏

Equação 1

e

46

𝑦 = 𝜑(𝓊)

Equação 2

Figura A.1: Modelo de neurônio artificial

A.2 – Paradigmas de Aprendizado de Redes Neurais

Uma das características que diferencia redes neurais de sistemas de computação

tradicionais é sua capacidade de autoajustar seus parâmetros de acordo com o ambiente

de interesse. Esse processo é denominado aprendizado ou treinamento e demanda a apli-

cação de uma série de vetores de entrada à rede. Durante o treinamento, os pesos sinápti-

cos são ajustados de acordo com algoritmos específicos, até que venham a convergir em

um conjunto de valores que produza a saída desejada. Assim, podemos concluir que a

configuração final dos pesos sinápticos representa o conhecimento adquirido pela rede

neural [2, pp. 22-25].

Dentre os diversos algoritmos de aprendizado já desenvolvidos, é possível identi-

ficar dois importantes paradigmas. O treinamento supervisionado requer o uso de pares

de vetores de treinamento. Cada par contém dados de entrada e seus respectivos alvos,

que representam a saída desejada da rede neural. O treinamento não supervisionado, por

outro lado, emprega vetores de entrada sem fornecer alvos à rede.

Treinamento Supervisionado

Os algoritmos de treinamento supervisionado consistem na aplicação sequencial

de pares de treinamento. Os vetores de entrada são processados pela rede neural e a saída

resultante é comparada com o alvo fornecido, para que o erro possa ser determinado de

acordo com uma função performance. Para isso, frequentemente são utilizados a soma

dos erros quadráticos (Equação 3) ou o erro médio quadrático (Equação 4):

47

𝑆𝑆𝐸 = ∑(𝑡𝑖 − 𝑜𝑖)2

𝑁

𝑖 = 1

Equação 3

𝑀𝑆𝐸 =1

𝑁 ∑(𝑡𝑖 − 𝑜𝑖)

2

𝑁

𝑖 = 1

Equação 4

onde N é o número total de iterações, ti é o valor do iésimo alvo desejado e oi é o iésimo

resultado obtido pela rede.

O processo de aprendizado supervisionado é ilustrado pela Figura A.2a. O erro da

rede neural é calculado iterativamente para cada par de vetores de treinamento. Após cada

iteração, os pesos da rede são ajustados buscando minimizar o erro até que o mesmo

convirja para um valor tolerável. Quando o treinamento é concluído, é importante expor

o sistema a um conjunto de dados de teste. Nessa etapa, representada na Figura A.2b, os

pesos sinápticos não sofrem novos ajustes; o objetivo é aferir a performance da rede neu-

ral já treinada.

Figura A.2: (a) Treinamento Supervisionado; (b) Teste da Rede Neural

Treinamento Não Supervisionado

Em muitas aplicações, não temos a nossa disposição os valores de saída adequa-

dos para os dados utilizados no treinamento da rede neural. Nesses casos, são utilizados

48

algoritmos não supervisionados, que não requerem alvos para aferir o erro produzido pela

rede. Esse paradigma de treinamento apresenta um alinhamento significativo com os me-

canismos encontrados no análogo biológico das redes neurais. Afinal, as intensas ativida-

des de aprendizado realizadas nos primeiros anos de vida de uma criança, por exemplo,

ocorrem sem o fornecimento de gabaritos. O sistema nervoso se auto organiza para res-

ponder adequadamente aos estímulos do ambiente.

Figura A.3: Treinamento Não Supervisionado

Em redes neurais artificiais, o processo de treinamento não supervisionado é di-

recionado por regras de aprendizado competitivo. Durante o treinamento, os neurônios de

uma camada da rede são expostos aos dados de entrada e competem para determinar quais

deles serão ativados. A ativação dos neurônios é definida pela sua relação com as carac-

terísticas da entrada, de acordo com as regras escolhidas para o aprendizado [3, pp. 34-

37].

A.3 – Mapa Auto-Organizável

O mapa auto-organizável é um tipo de rede neural não supervisionada desenvol-

vida por Kohonen e outros em 1984. Em um SOM, os neurônios normalmente são orga-

nizados em uma estrutura com uma ou duas dimensões e a rede opera com base na mo-

dalidade de aprendizado competitivo, denominada winner takes all. Os pesos sinápticos

são ajustados na medida em que a rede recebe estímulos dos dados de entrada. Assim, o

mapa gradualmente desenvolve sua topografia de modo que determinadas regiões geo-

gráficas passam a guardar relação com características estatísticas da entrada fornecida

[4].

Para que a rede possa ser treinada adequadamente, os vetores de pesos sinápticos

são inicializados com valores aleatórios. O treinamento do SOM consiste em três etapas:

competição, determinação de vizinhança e ajuste sináptico [3, pp. 425-437].

Competição

O objetivo da etapa de competição é determinar o neurônio que será ativado para

cada vetor de entrada m-dimensional, representado por

49

𝒙 = [𝑥1, 𝑥2, … , 𝑥𝑚]𝑇

É importante destacar que os vetores dos pesos sinápticos devem ter a mesma

dimensão dos vetores de entrada. Portanto, em um mapa formado por l neurônios pode-

mos representar o vetor de pesos do neurônio j por

𝒘𝒋 = [𝑤𝑗1, 𝑤𝑗2, … , 𝑤𝑗𝑚]𝑇

O neurônio vencedor, denominado best matching unit (BMU), será aquele cujo

vetor de pesos for mais compatível com o vetor de entrada. O critério utilizado para de-

terminar essa compatibilidade é a distância euclidiana entre os vetores. Desse modo, a

BMU, denotada na Equação 5 por 𝑖(𝒙), será a unidade que tiver a menor distância eucli-

diana em direção ao vetor de entrada 𝒙.

𝑖(𝒙) = arg min‖𝒙 − 𝒘𝒋‖

Equação 5

Determinação de Vizinhança

Após a definição do neurônio vencedor, uma função de vizinhança é aplicada para

selecionar neurônios próximos à BMU, para que eles também sejam excitados e tenham

seus pesos ajustados. A função de vizinhança ℎ𝑗,𝑖 é simétrica e centrada ao redor da BMU,

representada por i. A Equação 6 corresponde à função Gaussiana, que é uma das funções

de vizinhança mais adotadas em SOM:

ℎ𝑗,𝑖 = exp (− 𝑑𝑗,𝑖

2

2𝜎2)

Equação 6

onde 𝑑𝑗,𝑖 é a distância entre um neurônio j e a BMU i.

Ao analisar a Equação 6, podemos notar que, quanto mais distante um neurônio

estiver em relação à BMU, menor é o valor da função de vizinhança. No local da BMU,

a função atinge a unidade, que é seu valor máximo.

Ajuste Sináptico

Os pesos sinápticos da BMU e de seus neurônios adjacentes são modificados em

relação ao vetor de entrada 𝒙, como indicado na Equação 7. O valor final do vetor 𝒘𝑗 no

tempo discreto n + 1 é calculado conforme a Equação 8.

50

∆𝒘𝑗 = 𝜂ℎ𝑗,𝑖(𝒙 − 𝒘𝑗)

Equação 7

onde 𝜂 é um parâmetro conhecido como taxa de aprendizado.

𝒘𝑗(𝑛 + 1) = 𝒘𝑗(𝑛) + ∆𝒘𝑗

Equação 8

A Figura A.4 ilustra uma grade bidimensional formada por 36 neurônios, onde é

possível visualizar a BMU e seus neurônios vizinhos, excitados pelo vetor de entrada e

pela função de vizinhança.

Figura A.4: SOM bidimensional, com BMU ativada e neurônios vizinhos excitados

O dégradé na coloração dos neurônios indica a intensidade do ajuste de seus pesos

sinápticos: quanto mais distante o neurônio estiver da BMU, mais suave será o ajuste.

Esse comportamento é consequência das características da função de vizinhança já dis-

cutidas, podendo ser facilmente verificado na Equação 6 e Equação 7.

A.4 – Algoritmo Kmeans

O algoritmo Kmeans tem como objetivo encontrar o particionamento ótimo para

dividir um número n de observações em k clusters, onde k é um valor inteiro previamente

definido. O procedimento ocorre da seguinte maneira [5]:

1. Inicializar os k centroides, que representam os centros de cada cluster. Eles

podem ser inicializados com valores randômicos ou com a aplicação de algo-

ritmos mais elaborados.

51

2. Para cada centroide, é calculada sua distância euclidiana em relação a todas as

observações. As observações são associadas ao cluster correspondente ao cen-

troide mais próximo.

3. Determinar as novas localizações dos centroides a partir da média das obser-

vações de cada cluster.

4. Repetir os passos 2 e 3 até que um critério de parada seja acionado, como a

convergência do algoritmo ou a execução de um número máximo de iterações.

[1] B. Yegnanarayana, Artificial Neural Networks, New Delhi: Prentice Hall of India,

2006, p. 18.

[2] P. D. Wasserman, Neural computing: Theory and Practice, New York: Van

Nostrand Reinhold, 1989.

[3] S. Haykin, Neural Networks and Learning Methods, Upper Saddle River: Pearson

Prentice Hall, 2009.

[4] T. Kohonen, Self-Organizing Maps, Springer, 2001.

[5] The MathWorks, Inc., “k-means clustering - MATLAB kmeans,” [Online].

Available: https://www.mathworks.com/help/stats/kmeans.html#buefthh-3.

[Acesso em 5 fevereiro 2018].

UM ESCORE DE GRAVIDADE PARA A POLINEUROPATIA...

Documents

Transcript of UM ESCORE DE GRAVIDADE PARA A POLINEUROPATIA...