UM ESCORE DE GRAVIDADE PARA A POLINEUROPATIA...
Transcript of UM ESCORE DE GRAVIDADE PARA A POLINEUROPATIA...
UM ESCORE DE GRAVIDADE PARA A
POLINEUROPATIA AMILOIDÓTICA FAMILIAR
BASEADO EM MAPAS AUTO-ORGANIZÁVEIS
Victor Barros Costa
Projeto de Graduação apresentado ao Curso de
Engenharia Eletrônica e de Computação da Escola
Politécnica, Universidade Federal do Rio de Ja-
neiro, como parte dos requisitos necessários à ob-
tenção do título de Engenheiro.
Orientadores: José Manoel de Seixas Debora Foguel
Márcia Waddington Cruz
Rio de Janeiro
Setembro de 2018
iv
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politécnica – Departamento de Eletrônica e de Computação
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária
Rio de Janeiro – RJ CEP 21949-900
Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que
poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar
qualquer forma de arquivamento.
É permitida a menção, reprodução parcial ou integral e a transmissão entre
bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja ou
venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem
finalidade comercial e que seja feita a referência bibliográfica completa.
Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).
v
AGRADECIMENTO
Em primeiro lugar, gostaria de agradecer à minha família. O suporte, a
compreensão, os conselhos e o companheirismo da minha mãe, do meu pai, do meu irmão
e da minha namorada foram fundamentais em todos os aspectos da minha vida,
especialmente durante a minha jornada na UFRJ. Me fortaleço na certeza de que poderei
contar com vocês sempre.
Agradeço aos meus orientadores, José Manoel de Seixas, Márcia Cruz e Debora
Foguel pelo apoio, pelos ensinamentos e pela confiança em mim depositada ao longo de
todo o meu trabalho como aluno de iniciação científica no LPS. Também agradeço pela
ajuda e paciência de Felipe Machado, que me acompanhou no início deste projeto, e
Natanael Moura, com quem muito aprendi desde o meu primeiro dia no laboratório.
Aos professores Casé, Joarez e Luiz Wagner, agradeço por estarem disponíveis
para conversas longas e francas nos momentos em que precisei do seu apoio.
Por fim, agradeço a todos os amigos e amigas que me acompanharam nesses seis
anos: Pedro Gil, Marina Torres, Gabriel Alboretti, Antonio Resende, Luiz Rennó, Vitor
Cossetti, Hellen Lima, Tamine Verli, Gabriella Felgas, Renan Rotunno, Humberto Paz,
Thiago Lobo, Paulo Valente, Igor Abreu, Daniel Guimarães, Anni Skywalker e tantos
outros do GECOM e do CAEng. Com vocês consegui superar as disciplinas mais difíceis,
enfrentar os maiores desafios e realizar os projetos que trouxeram sentido aos meus anos
de graduação. Foi um prazer dividir essas experiências com vocês.
vi
RESUMO
Redes neurais artificiais são algoritmos de inteligência computacional inspirados
biologicamente, frequentemente aplicados na resolução de problemas na área de ciência
de dados. Neste trabalho, uma rede neural não supervisionada foi implementada para
desenvolver um mapa auto-organizável (SOM, da sigla em inglês) com o intuito de
encontrar agrupamentos em um conjunto de dados clínicos de pacientes portadores de
Polineuropatia Amiloidótica Familiar (PAF), uma doença hereditária, degenerativa e
multissistêmica. A considerável variedade de sintomas e suas manifestações torna
complexa a aferição do nível de avanço da PAF. Por isso, este trabalho tem como objetivo
desenvolver um escore de severidade que leve em consideração o caráter abrangente da
doença, podendo ser utilizado como ferramenta de suporte à decisão de profissionais de
saúde. Para isso, o SOM foi utilizado devido a sua capacidade de agrupar eventos de
acordo com a sua similaridade, mapeando sinais de dimensões arbitrárias em um espaço
bidimensional. Foram obtidos cinco agrupamentos, representando diferentes níveis de
severidade de PAF. O grupo 1 incluiu todos os pacientes clinicamente assintomáticos do
banco de dados. O grupo 2 foi formado por pacientes com sintomas iniciais. O grupo 3
reuniu pacientes em estágio moderado. O grupo 4 representou os pacientes em estágio
moderado-grave. Os pacientes em estágio terminal foram mapeados no grupo 5. O
histórico de sintomas de cada paciente também foi projetado no mapa, para que se pudesse
analisar o desenvolvimento da doença de acordo com suas trajetórias no mapa ao longo
do tempo. Tais análises corroboraram as características observadas em cada grupo.
Portanto, a escala proposta mostrou-se eficaz para indicar o nível de severidade dos
pacientes, satisfazendo assim os objetivos propostos.
Palavras-Chave: redes neurais artificiais, mapa auto-organizável, treinamento não
supervisionado, polineuropatia amiloidótica familiar, amiloidose.
vii
ABSTRACT
Artificial Neural Networks are computational intelligence algorithms with
biological inspiration, frequently applied in the resolution problems in data science. In
this work, a neural network was implemented in the development of a self-organizing
map (SOM), aiming to discover clusters in a dataset of clinic data from patients suffering
from Familial Amyloid Polyneuropathy (FAP), an inherited, degenerative, multisystemic
disease. It is complex to determine the severity stage of a FAP patient due to the
remarkable variety of symptoms and manifestations of this disease. Therefore, the goal
of this work is to develop a severity score that takes the comprehensive nature of FAP
into account. To accomplish this, a SOM was used because of its capability of clustering
observations according to their resemblance, mapping signals of arbitrary dimensions in
a bidimensional space. Five groups were obtained, representing different stages of FAP.
Group 1 included all patients considered clinically asymptomatic. Group 2 included
patients with symptoms usually reported in the first stages of the disease manifestation.
Group 3 clustered patients with moderate health condition. Group 4 represented patients
with moderate-severe FAP. Patients in terminal stage were clustered in group 5. The
history of symptoms of each patient was projected in the SOM, to analyze the
development of the disease according to the patient’s trajectories in the map over time.
This analysis endorses the characteristics observed in each group. Hence, the severity
score proposed in this project was effective to indicate the level of severity of the patients,
thus satisfying the proposed objectives.
Key-words: artificial neural networks, self-organizing map, unsupervised training,
familial amyloid polyneuropathy, amyloidosis.
viii
SIGLAS
BMU – Best Matching Unit
CEPARM – Centro de Estudos em Paramiloidose Antônio Rodrigues de Mello
MLP – Multi-Layer Perceptron
NYHA – New York Heart Association
PAF – Polineuropatia Amiloidótica Familiar
PCA – Principal Component Analysis
PND – Polineuropathy Disability Score
RNA – Rede Neural Artificial
SNP – Sistema Nervoso Periférico
SOM – Self Organizing Map
THAOS – Transthyretin Amyloidosis Outcomes Survey
TTR – Transtirretina
ix
Sumário
1. Introdução ..................................................................................................................... 1
1.1 – Delimitação.......................................................................................................... 1
1.2 – Justificativa .......................................................................................................... 2
1.3 – Objetivos.............................................................................................................. 2
1.4 – Método ................................................................................................................. 3
1.5 – Descrição ............................................................................................................. 3
2. Polineuropatia Amiloidótica Familiar .......................................................................... 5
2.1 – Paramiloidose no Brasil ....................................................................................... 5
2.2 – Características Clínicas ....................................................................................... 6
2.3 – Diagnóstico e Tratamento.................................................................................... 6
2.5 – Escalas de Severidade .......................................................................................... 7
2.5 – Aplicação de Redes Neurais Artificiais na Medicina .......................................... 8
3. Desenvolvimento do Modelo........................................................................................ 9
3.1 – Variáveis Incluídas .............................................................................................. 9
3.2 – Características dos Dados .................................................................................. 11
3.3 – Materiais e Métodos .......................................................................................... 12
4. Resultados ................................................................................................................... 15
4.1 – Clusterização ..................................................................................................... 15
4.2 – Mapas de Componente ...................................................................................... 16
4.3 – Análise de Classes ............................................................................................. 20
4.4 – Deslocamento de Pacientes pelo Mapa ............................................................. 26
5. Validação .................................................................................................................... 33
6. Conclusão ................................................................................................................... 39
Bibliografia ..................................................................................................................... 42
Apêndice A - Redes Neurais Artificiais ......................................................................... 45
A.1 – O Neurônio Artificial........................................................................................ 45
A.2 – Paradigmas de Aprendizado de Redes Neurais ................................................ 46
A.3 – Mapa Auto-Organizável ................................................................................... 48
A.4 – Algoritmo K-means .......................................................................................... 50
x
Lista de Figuras
Figura 3.1. Exemplo de U-Matrix .................................................................................. 14
Figura 4.1: U-Matrix ...................................................................................................... 15
Figura 4.2: Índice de Silhueta ......................................................................................... 16
Figura 4.3: (a) K-means para 5 clusters; (b) U-Matrix ................................................... 16
Figura 4.4: Herança; Mutação; Histórico Familiar ......................................................... 17
Figura 4.5: Insensibilidade a Dor e Temperatura; PND; Dor Neuropática .................... 18
Figura 4.6: Diarreia/Constipação; Diarreia; Constipação; Saciedade Precoce; Tontura;
Agulhadas ....................................................................................................................... 18
Figura 4.7: Anomalia do Equilíbrio; Incontinência Fecal; Síncope; Incontinência
Urinária; Retenção Urinária; Náusea .............................................................................. 19
Figura 4.8: Vômito; Tontura; Perda de Peso .................................................................. 19
Figura 4.9: NYHA; Parede Posterior do VE; Septo do VE; Anomalia no Ritmo;
Anomalia na Condução e Fração de Ejeção do VE ........................................................ 20
Figura 4.10: Baixa Voltagem; Disfunção Erétil; Disfunção Renal ................................ 20
Figura 4.11: Indivíduos da classe 1 afetados pelos 27 achados clínicos e de exames.... 22
Figura 4.12: Indivíduos da classe 2 afetados pelos 27 achados clínicos e de exames.... 23
Figura 4.13: Indivíduos da classe 3 afetados pelos 27 achados clínicos e de exames.... 24
Figura 4.14: Indivíduos da classe 4 afetados pelos 27 achados clínicos e de exames.... 25
Figura 4.15: Indivíduos da classe 5 afetados pelos 27 achados clínicos e de exames.... 26
Figura 4.16: Trajetória do paciente 044.......................................................................... 28
Figura 4.17: Trajetória do paciente 056.......................................................................... 29
Figura 4.18: Trajetória do paciente 067.......................................................................... 29
Figura 4.19: Trajetória do paciente 009.......................................................................... 30
Figura 4.20: Trajetória do paciente 052.......................................................................... 30
Figura 4.21: Trajetória do paciente 003.......................................................................... 31
Figura 4.22: Trajetória do paciente 037.......................................................................... 32
Figura 5.1: Incidência de sintomas na classe 1 no treino e na validação ....................... 34
Figura 5.2: Incidência de sintomas na classe 2 no treino e na validação ....................... 35
Figura 5.3: Incidência de sintomas na classe 3 no treino e na validação ....................... 36
Figura 5.4: Incidência de sintomas na classe 4 no treino e na validação ....................... 37
Figura 5.5: Incidência de sintomas na classe 5 no treino e na validação ....................... 38
Figura A.1: Modelo de neurônio artificial ...................................................................... 46
Figura A.2: (a) Treinamento Supervisionado; (b) Teste da Rede Neural ....................... 47
Figura A.3: Treinamento Não Supervisionado ............................................................... 48
Figura A.4: SOM bidimensional, com BMU ativada e neurônios vizinhos excitados ... 50
xi
Lista de Tabelas
Tabela 3.1. Critérios de codificação dos parâmetros extraídos do THAOS ................... 11
Tabela 4.1: Distribuição dos Pacientes por Classe ......................................................... 21
Tabela 4.2: Pontuação dos indivíduos da classe 2 na escala PND ................................. 22
Tabela 4.3: Pontuação dos indivíduos da classe 3 na escala PND ................................. 23
Tabela 4.4: Pontuação dos indivíduos da classe 4 na escala PND ................................. 24
Tabela 4.5: Pontuação dos indivíduos da classe 5 na escala PND ................................. 25
Tabela 4.6: Posicionamento inicial dos pacientes com consultas após a baseline ......... 26
Tabela 4.7: Migração de pacientes entre a primeira e última consulta........................... 27
Tabela 5.1: Distribuição dos pacientes de validação entre os clusters ........................... 33
Tabela 5.2: Comparativo dos níveis de PND na classe 1 no treino e na validação ........ 33
Tabela 5.3: Comparativo dos níveis de PND na classe 2 no treino e na validação ........ 34
Tabela 5.4: Comparativo dos níveis de PND na classe 3 no treino e na validação ........ 35
Tabela 5.5: Comparativo dos níveis de PND na classe 4 no treino e na validação ........ 36
Tabela 5.6: Comparativo dos níveis de PND na classe 5 no treino e na validação ........ 37
1
1. Introdução
A informatização de dados em larga escala evidencia a importância do
desenvolvimento de sistemas capazes de auxiliar a tomada de decisão de profissionais das
mais variadas áreas de atuação. A complexidade da tarefa de analisar os dados disponíveis
torna-se ainda maior quando, além de abundantes, eles são multivariados. Na área médica,
por exemplo, o diagnóstico de um paciente pode ser determinado com base em
informações relacionadas a múltiplos sistemas do organismo. Em contextos como esse, a
habilidade de identificar padrões nos dados a partir de relações de natureza estatística e
não linear é um desafio importante e requer o uso de métodos estatísticos e
computacionais. Redes neurais artificiais (RNA) são modelos computacionais que podem
ser utilizados com este objetivo (Apêndice A).
Este trabalho propõe o desenvolvimento de um modelo baseado em uma RNA
não supervisionada que auxilie profissionais da saúde no acompanhamento de pacientes
portadores de Polineuropatia Amiloidótica Familiar (PAF), uma doença neurodegenera-
tiva e multissistêmica.
1.1 – Delimitação
Os dados utilizados no projeto são referentes a indivíduos portadores de mutação
associada ao desenvolvimento da PAF, cadastrados no banco de dados internacional
Transthyretin Amyloidosis Outcomes Survey (THAOS) [1]. O THAOS contém múltiplas
camadas de informação dos pacientes coletadas a partir de anamnese, exames clínicos e
laboratoriais. Esses dados são registrados para cada consulta do paciente ao longo do
acompanhamento da doença.
Foram extraídos do THAOS os dados referentes a 146 indivíduos brasileiros.
Trinta características foram selecionadas na primeira camada do sistema, para compor os
vetores de dados de cada paciente. Nos processos de treinamento e validação da rede
neural, as informações utilizadas correspondem somente à primeira consulta de cada
paciente, denominada baseline. Posteriormente, dados de consultas adicionais foram
considerados para estudo da progressão da PAF em cada indivíduo. Essa análise foi
realizada somente para os pacientes para os quais existiam dados de consultas posteriores
até a realização do experimento.
2
1.2 – Justificativa
Por se tratar de uma doença degenerativa e multissistêmica, aferir o nível de
avanço da PAF em cada paciente não é uma tarefa simples. Centros clínicos de diversos
países desenvolveram seus próprios índices e escores para medir o desenvolvimento da
doença, a exemplo do escore de Kumamoto e a classificação portuguesa de severidade de
PAF de Sales-Luis [2]. Apesar de sua utilidade, tais escores não são abrangentes e
enfatizam principalmente a disfunção neurológica relacionada à sensibilidade, disfunção
autonômica e capacidade da marcha, não incluindo outros achados sistêmicos que podem
ser muito precoces, como alterações cardíacas, gastrointestinais e nefrológicas. A
literatura também carece de avaliações que considerem outras particularidades relevantes
para a progressão da doença, como o tipo de mutação genética e o histórico familiar.
Nesse contexto, a proposição de um modelo baseado em uma RNA tem como
objetivo endereçar de modo eficaz a multidimensionalidade dos dados envolvidos na
verificação do avanço da PAF. O uso de um modelo não supervisionado, capaz de
identificar regularidades estatísticas nos dados sem o fornecimento de alvos, é vantajoso
neste caso, uma vez que não há conhecimento prévio de respostas alvo para os eventos
do banco de dados utilizado. O modelo escolhido foi o mapa auto-organizável, ou Self-
Organizing Map (SOM), que organiza os dados em agrupamentos, ou clusters.
Redes neurais já foram implementadas em projetos na área médica para auxiliar a
triagem e o tratamento de pacientes com tuberculose pleural. O sistema de suporte a
decisão baseado em RNA provou-se eficiente e de baixo custo, evitando procedimentos
invasivos como biópsia pleural e toracocentese [3] [4].
1.3 – Objetivos
Espera-se que os clusters obtidos pelo SOM sejam representativos dos diferentes
níveis de severidade da doença. Com isso, será possível identificar os padrões de
progressão dos pacientes entre tais níveis a partir das características mais significativas
de cada agrupamento. Desse modo, o projeto atingirá o seu objetivo: desenvolver um
escore de severidade abrangente para a PAF considerando parâmetros neurológicos,
cardiológicos, gastrointestinais, nefrológicos e genéticos.
3
1.4 – Método
A primeira etapa do projeto envolveu a extração dos dados dos pacientes
registrados no THAOS de acordo com critérios de elegibilidade definidos no estudo. Os
dados foram organizados em vetores e codificados. Valores numéricos foram associados
a variáveis categóricas com base em critérios definidos com suporte de conhecimento
especialista em PAF, para que pudessem ser aplicados como entrada para o treinamento
do SOM.
Em seguida, os resultados obtidos foram analisados. Para isso, o algoritmo k-
means [5] foi executado sobre vetores correspondentes aos neurônios do SOM. Este
algoritmo é amplamente adotado para definir a melhor clusterização em um conjunto de
dados. A partir do resultado do k-means, os agrupamentos obtidos foram examinados para
que se verificasse quais eram as características predominantes em cada cluster, de modo
a determinar quais estágios de gravidade eles representariam.
Vale lembrar que o treinamento da RNA foi realizado com os dados de baseline
dos pacientes. Em uma etapa seguinte, os dados referentes às suas consultas posteriores
foram projetados sobre a saída do SOM, com o objetivo de identificar quais seriam as
suas trajetórias pelo mapa ao longo do tempo e quais variáveis foram determinantes para
cada deslocamento.
Por fim, um conjunto de dados não utilizados no treinamento da rede foi projetado
sobre o SOM. Nessa etapa, foram extraídos do THAOS os dados de novos indivíduos
elegíveis para incorporação no banco de dados do projeto. Novamente, as variáveis
predominantes dos clusters foram analisadas objetivando validar os resultados obtidos
anteriormente.
1.5 – Descrição
Uma breve introdução sobre PAF será apresentada no Capítulo 2. O leitor encon-
trará informações sobre causas da doença, sua ocorrência geográfica, sintomas e métodos
de tratamento.
No Capítulo 3, serão descritos os dados de treinamento e validação utilizados no
projeto, os procedimentos de codificação desses dados e a definição dos parâmetros de
treinamento do SOM e de execução do k-means.
4
Os resultados do projeto serão apresentados no Capítulo 4, no qual as principais
características de cada cluster serão analisadas. Essa análise será complementada no
mesmo capítulo com a discussão sobre os deslocamentos de pacientes no mapa conforme
a evolução de seus quadros clínicos.
O Capítulo 5 demonstrará a resposta do modelo à aplicação de um conjunto de
dados de validação, confrontando-a com os resultados obtidos no treinamento do SOM.
Por fim, as conclusões do projeto e perspectivas para trabalhos futuros serão apre-
sentadas no Capítulo 6.
5
2. Polineuropatia Amiloidótica Familiar
Amiloidoses são doenças caracterizadas pela deposição de proteínas amiloides em
tecidos do organismo dos pacientes afetados. Tais doenças podem ser adquiridas ou
hereditárias. As amiloidoses hereditárias que afetam especialmente o sistema nervoso
periférico (SNP) são denominadas paramiloidose ou Polineuropatia Amiloidótica
Familiar. Todos os tipos de PAF são de herança autossômica dominante, provocados por
uma mutação genética que desestabiliza a estrutura de uma determinada proteína e causa
a sua dissociação. Entre as diversas proteínas que podem estar associadas às doenças
amiloidóticas, a Transtirretina (TTR) é a mais comum [6].
2.1 – Paramiloidose no Brasil
Apesar de ser considerada uma doença rara, há registros de ocorrência de PAF em
diversos países, com regiões endêmicas como Japão, Suécia, Portugal e Brasil [7]. A PAF
é classificada em quatro tipos de acordo com a origem étnico-geográfica dos pacientes:
tipo I, ou Português; tipo II, ou Sueco; tipo III, ou Iowa; tipo IV, ou Finlandês. Nos dois
primeiros tipos a proteína mutante é a TTR. Dentre as mutações da TTR já identificadas,
a mais comum globalmente é a Val30Met, associada ao tipo I de PAF. Nos tipos III e IV,
as mutações afetam, respectivamente, a Apolipoproteína A1 e a Gelsolina, sendo o último
caso extremamente raro [8].
No Brasil, a expressão mais comum da PAF é a do tipo I, caracterizada por danos
progressivos no SNP. A semelhança entre os achados clínicos dos brasileiros e dos
portugueses evidencia a influência de fatores genéticos no desenvolvimento da doença –
estima-se que há 25 milhões de descendentes portugueses no Brasil [9].
Em 1984, o Centro de Estudos em Paramiloidose Antônio Rodrigues de Mello
(CEPARM) [10] foi fundado na Universidade Federal do Rio de Janeiro. Referência
nacional no diagnóstico, tratamento e estudo de Paramiloidose, o CEPARM funciona
junto ao Hospital Universitário Clementino Fraga Filho [11] e presta atendimento
multidisciplinar a pacientes de todo o país. Apesar da prevalência da mutação Val30Met
na população brasileira, diagnósticos contínuos realizados no CEPARM permitiram a
descoberta de novas mutações no Brasil e uma mutação ainda não descrita no mundo [12].
6
2.2 – Características Clínicas
A idade de início dos sintomas pode variar de acordo com a mutação, sendo
possível que um indivíduo portador não venha a manifestar sintomas da doença ao longo
da vida [13]. Os portadores de PAF podem experimentar o início da manifestação dos
sintomas da doença em idades variadas, sendo mais frequente que isso ocorra entre os 25
e 35 anos. O óbito ocorre, em média, 11 anos após a manifestação da doença. O quadro
clínico também é variável, havendo indícios de influência de fatores genéticos e
ambientais no desenvolvimento da paramiloidose [6, 14].
O processo de deposição de proteínas amiloides no espaço extracelular de tecidos
e órgãos resulta no desenvolvimento de distúrbios em múltiplos sistemas do organismo.
Na doença relacionada à mutação Val30Met da TTR, os sintomas neurológicos são
predominantes e sintomas cardíacos também são registrados. A doença se manifesta
inicialmente como uma neuropatia periférica, afetando pequenas fibras nervosas nos
estágios mais precoces, quando são comuns distúrbios sensitivos nos membros inferiores
e disfunção erétil. Os pacientes também são acometidos por disfunções gastrointestinais
como diarreia, constipação, náusea e vômito. Na medida em que a PAF progride para
uma neuropatia motora, sensorial e autonômica completa, os pacientes podem ser
acometidos por distúrbios motores e sensoriais, além de problemas renais, que são raros
e geralmente vistos no estágio mais avançado da doença [15].
No sistema cardiovascular, os pacientes são frequentemente afetados por
problemas de condução e sintomas como arritmia, síncope e insuficiência cardíaca. Os
depósitos de amiloide também podem provocar espessamento da parede ventricular. A
predominância do quadro cardíaco sobre os sintomas do SNP está relacionada às
Val122Ile e Thr60Ala [2].
2.3 – Diagnóstico e Tratamento
É possível diagnosticar pacientes que apresentem sintomas clínicos por meio de
biópsia dos tecidos comprometidos, para identificação de depósitos de amiloide. Em
geral, o exame é realizado no tecido subcutâneo, glândulas salivares ou mucosa retal.
Apesar de ser mais invasiva, a biópsia de nervo pode ser adotada em alguns casos, devido
à alta sensibilidade deste tecido [2].
Por se tratar de uma doença hereditária, o histórico familiar cumpre papel determi-
nante no suporte ao diagnóstico de PAF. Mesmo não apresentando sintomas, é importante
7
que indivíduos com parentes afetados realizem exames de sequenciamento do DNA para
detectar a presença da mutação. Entretanto, é preciso salientar que a ausência aparente de
histórico de PAF na família não exclui o diagnóstico. É possível que familiares afetados
nunca tenham manifestado sintomas ou tenham falecido sem ser diagnosticados [16].
Os tratamentos disponíveis para a PAF são mais bem-sucedidos em pacientes no
estágio inicial da doença. O transplante de fígado é o tratamento mais tradicional, visto
que o órgão é responsável pela produção de 98% da TTR. A redução drástica na produção
da proteína mutante ameniza a progressão da doença. Contudo, deve-se destacar que o
transplante não cura lesões já existentes e não é eficaz em evitar a evolução dos sintomas
neurológicos a longo prazo. Portanto, este procedimento é contraindicado para pacientes
severamente acometidos pela doença ou com idade avançada [17].
Mais recentemente, medicamentos como o Tafamidis [18] têm demonstrado
capacidade de reduzir a progressão da doença, estabilizando a TTR e evitando a formação
de depósitos amiloides. O medicamento, recomendado para pacientes no primeiro estágio
da PAF, tem sido cada vez mais adotado em diversos países [17] [19].
2.5 – Escalas de Severidade
Dentre as escalas de severidade de PAF desenvolvidas, pode-se destacar o escore
de Kumamoto, criado no Japão, e o Sales-Luis, criado em Portugal. O primeiro é
estruturado em uma escala de 0 a 96 pontos, em que a pontuação aumenta conforme a
severidade da doença. O segundo é graduado em sete níveis: pacientes em nível zero são
assintomáticos, enquanto aqueles em nível 6 são confinados em leito [11].
Outro importante escore utilizado como referência na aferição da severidade da
PAF é o Polineuropathy Disability Score (PND), que leva em consideração o
comprometimento na capacidade de marcha dos pacientes. O PND é graduado em cinco
níveis: nível 0 para pacientes assintomáticos; nível I para distúrbios sensoriais que não
afetem a capacidade de marcha; nível II para casos em que a marcha é prejudicada, sem
que seja necessário auxílio para locomoção; nível IIIa quando um apoio é necessário para
andar; nível IIIb quando dois apoios são necessários para andar; nível IV para pacientes
em cadeira de rodas [6].
Apesar da diversidade de escalas de severidade existentes, a expressiva variabili-
dade clínica da PAF ainda constitui um desafio para a aferição do avanço da doença. Em
8
geral, os escores têm sua abrangência limitada a distúrbios neurológicos autonômicos e
associados à sensibilidade e dificuldade de marcha.
A escala proposta neste trabalho se diferencia por ser abrangente, levando em
consideração, além dos distúrbios anteriormente mencionados, outras características
determinantes para o desenvolvimento do quadro clínico dos pacientes, com a disfunções
cardíacas, histórico da herança familiar e tipo de mutação da TTR.
2.5 – Aplicação de Redes Neurais Artificiais na Medicina
O uso de redes neurais para suporte à triagem e diagnóstico de pacientes na área
médica pode ser verificado em trabalhos relacionados, por exemplo, à tuberculose, à
lesões intersticiais pulmonares e ao reumatismo [4, 20, 21]. Nesses casos, modelos
supervisionados como o Multi-Layer Perceptron (MLP) ou não supervisionados como o
SOM foram construídos a partir de dados relacionados à características de pacientes.
A aplicação de RNA permite que grandes volumes de dados sejam processados
muito rapidamente e auxilia o profissional de saúde na identificação de padrões e relações
entre variáveis, facilitando o diagnóstico e tomadas de decisão relacionadas ao
tratamento. Em geral, modelos baseados em RNA são de baixo custo e alta praticidade, o
que favorece a escolha desta técnica para implementação de sistemas de suporte à decisão.
9
3. Desenvolvimento do Modelo
As variáveis consideradas neste projeto foram selecionadas com o intuito de
fornecer ao modelo de RNA dados que representem a abrangência dos sintomas de PAF,
de acordo com os objetivos do trabalho. Essa seleção foi realizada com suporte de
especialistas do CEPARM, para garantir a inclusão de sintomas e características relevan-
tes para a progressão da doença. Esse conjunto de características corresponde à primeira
camada de informação disponível no sistema. Em geral, esses dados podem ser obtidos
pelo profissional de saúde durante a consulta, o que simplifica o uso prático da escala
proposta.
3.1 – Variáveis Incluídas
Trinta variáveis foram selecionadas para compor os vetores de cada paciente:
1. Possibilidades de mutação.
2. Histórico familiar: conhecida ou desconhecida.
3. Herança: paterna ou materna.
4. Sintomas neurológicos:
a. dor neuropática;
b. agulhadas;
c. dormência;
d. redução da sensibilidade à dor e temperatura;
e. alteração do equilíbrio;
f. Polyneuropathy Disability Score (PND) [22]: 0 (sem alterações), I
(sintomas sensitivos), II (dificuldade para andar, mas não necessita
de apoio), IIIa (anda, com ajuda de um apoio), IIIb (anda, com ajuda
de dois apoios) e IV (restrito à cadeira de rodas).
5. Disfunção erétil.
6. Sintomas cardiovasculares:
a. tontura;
b. síncope;
c. New York Heart Association (NYHA) [23]: I, II, III, IV.
7. Sintomas urinários:
a. retenção urinária;
b. incontinência urinária;
c. insuficiência renal.
8. Sintomas gastrointestinais:
a. saciedade precoce;
b. náusea;
c. vômito;
10
d. constipação;
e. constipação/diarreia;
f. diarreia;
g. incontinência fecal;
h. perda de peso não intencional.
9. Eletrocardiograma:
a. baixa voltagem do complexo QST;
b. anormalidade da condução;
c. anormalidade do ritmo cardíaco;
10. Ecocardiograma:
a. espessura do septo interventricular;
b. espessura da parede ventricular posterior esquerda;
c. porcentagem da fração de ejeção.
Os dados extraídos do THAOS foram organizados em 146 vetores – um para cada
paciente. Para que os vetores pudessem ser fornecidos como entrada para o treinamento
da RNA, as variáveis foram codificadas numericamente. Características que indicassem
condições agravantes de PAF receberam valor “1”. A ausência de característica agravante
foi codificada como “-1”. A definição das condições agravantes da doença foi realizada
a partir de conhecimento especialista. Ocasionalmente, alguns sintomas podem ter sido
ignorados no cadastro do paciente. Nesses casos, os dados faltantes continuam sendo
utilizados no treinamento da rede neural, sendo atribuído valor zero na sua codificação.
Para alguns parâmetros, a codificação categórica não é possível. Nesses casos,
critérios especiais foram definidos para que os valores registrados no banco de dados
fossem codificados em “1” ou “-1”. Conforme pode ser observado na Tabela 3.1, o
princípio é o mesmo já descrito: características relacionadas a quadros clínicos
potencialmente mais severos foram codificadas com valor “1”, enquanto características
que não indiquem severidade foram codificadas com “-1”. As variáveis correspondentes
a achados obtidos por ecocardiograma são originalmente expressas em valores contínuos,
de modo que a determinação das faixas de valores que representam agravamento de PAF
foi feita com suporte especialista, a partir dos valores usualmente considerados em
estudos relacionados a esta doença [6]. Campos ignorados foram codificados com zero.
11
Tabela 3.1. Critérios de codificação dos parâmetros extraídos do THAOS
PARAMÊTRO VALOR CODIFICAÇÃO
TIPO DE MUTAÇÃO Val30Met 1
outras -1
HERANÇA materna 1
paterna -1
PND I, II, IIIa, IIIb, IV 1
0 -1
NYHA I, II, III, IV 1
nenhum nível -1
FRAÇÃO DE EJEÇÃO < 55% 1
≥ 55% -1
ESPESSURA DO SEPTO INTERVENTRICULAR
≥ 11mm 1
< 11mm -1
ESPESSURA DA PAREDE VENTRICULAR ESQUERDA
≥ 11mm 1
< 11mm -1
3.2 – Características dos Dados
A incorporação de indivíduos ao banco de dados do projeto ocorreu de acordo
com critérios específicos: foram considerados somente pacientes brasileiros cadastrados
no THAOS com alguma mutação especificada. A identidade dos pacientes foi preservada
por meio da atribuição de um ID numérico. Até o final deste projeto, 146 indivíduos eram
considerados elegíveis, com ID variando de 001 a 150. Os IDs 075 e 088 foram
desconsiderados por não terem dados especificando sua mutação e os IDs 012 e 114 não
existem no registro do THAOS.
Os dados foram divididos em um conjunto de treinamento, formado por 98
pacientes, e um conjunto de validação, formado por 48 pacientes. Essa divisão foi
determinada de acordo com a disponibilidade dos dados no momento de realização de
cada etapa do projeto.
3.2.1 - Dados de Treinamento
Dentre os 98 indivíduos do conjunto de treinamento, 35 ainda não haviam
manifestado sintomas de PAF. Entretanto, 94% relataram histórico familiar da doença.
No que diz respeito à origem da herança da mutação, 46% relataram herança materna e
44% relataram herança paterna. Os 10% restantes não souberam identificar a origem da
herança. A mutação predominante no banco de dados é a Val30Met, presente em
aproximadamente 93% dos pacientes do grupo.
12
Algumas variáveis se destacaram por uma quantidade expressiva de registros
ignorados, que foram codificados com valor zero. É o caso dos sintomas detectados por
exames de ecocardiograma e eletrocardiograma: em média, 51% dos indivíduos do
conjunto de treinamento não possuíam resultados dos exames registrados no sistema.
3.2.2 - Dados de Validação
O conjunto de validação incluía 12 indivíduos assintomáticos, representando 25%
deste grupo. Dentre os 48 pacientes, 94% alegaram histórico familiar de PAF, sendo que
42% herdaram a mutação da mãe, 35% herdaram do pai e 23% não identificaram a origem
da herança. A mutação Val30Met afeta 94% dos indivíduos.
Assim como no conjunto de treinamento, as variáveis referentes aos resultados de
ecocardiograma e eletrocardiograma foram ignoradas para mais da metade das observa-
ções do grupo de validação: em média, 54%. A proporção entre homens e mulheres no
grupo de validação é de 50%.
3.3 – Materiais e Métodos
O modelo desenvolvido neste trabalho foi implementado no MATLAB R2010a
[24], com a biblioteca externa de SOM desenvolvida pelo Laboratório de Ciência da
Computação e Informação da Helsinki University of Technology [25]. Devido ao volume
de dados limitados utilizado no projeto, não foi necessário o emprego de alto poder de
computação para o treinamento da rede neural, sendo utilizada apenas uma máquina
disponível no Laboratório de Processamento de Sinais da UFRJ.
A abordagem de clusterização de dados foi considerada a mais adequada ao
objetivo do projeto. Para desenvolver uma escala de severidade utilizando dados de
observações, sem fornecer rótulos de alvo para o treinamento do modelo, os pacientes
serão agrupados com base em sua similaridade. O SOM foi o modelo de RNA escolhido
devido à sua capacidade de mapear sinais de entrada de dimensões arbitrárias em um
espaço bidimensional. Essa característica torna o SOM particularmente atrativo para este
trabalho, em que a visualização dos dados detém grande relevância para funcionar como
suporte aos profissionais de saúde. Durante o processo de aprendizado, a topografia do
mapa é gradualmente ajustada de acordo com os dados fornecidos, permitindo a desco-
berta de estruturas implícitas de similaridade entre as observações. Assim, as característi-
cas estatísticas do banco de dados são mapeadas em determinadas regiões espaciais.
13
3.3.1 – Treinamento e Clusterização do SOM
O treinamento do SOM requer a definição de parâmetros como a quantidade de
neurônios e a proporção entre largura e comprimento do mapa e o número de vizinhos
aos quais cada neurônio está conectado. Foi definido que cada neurônio está conectado a
seis neurônios vizinhos. Os demais parâmetros foram ajustados experimentalmente. O
ponto de partida para a experimentação da quantidade de neurônios do SOM é dado por:
𝑁 = 5√𝑂𝑏𝑠𝑒𝑟𝑣𝑎çõ𝑒𝑠
Equação 3.1
com N sendo o número de neurônios do SOM e Observações o número de eventos
utilizados no treinamento da rede. Com o objetivo de minimizar a quantidade de
neurônios não acionados durante o treinamento, a referência para a maior quantidade de
neurônios no mapa é o número total de observações disponíveis para treiná-lo.
Para definir a proporção ente largura e comprimento do mapa, a inicialmente
experimentada foi determinada de acordo a Principal Component Analysis (PCA) reali-
zada sobre o conjunto de dados de treinamento. A proporção entre os dois primeiros
componentes determinou a relação entre as duas dimensões do mapa [26].
A rede foi treinada por full batch training [27], que consiste em fornecer todos os
dados de entrada à rede e realizar o ajuste de pesos dentro de uma única iteração, ao invés
de introduzi-los individualmente. No total, foram realizadas três rodadas de treinamento
em lote. A função de vizinhança gaussiana foi utilizada com raio de três unidades na
primeira rodada, decrescendo para duas unidades na seguinte e para uma unidade na
última.
Após o treinamento do SOM, a topologia do mapa foi analisada por meio da
matriz de distâncias unificadas, conhecida como U-Matrix. A Figura 3.1 corresponde a
um exemplo de U-Matrix para um SOM formado por 80 neurônios, com oito unidades de
largura e dez de comprimento. Dado um neurônio 𝑗 e seu vetor de pesos 𝑊𝑗, é calculada
a distância relativa entre os neurônios vizinhos 𝑊𝑖 e 𝑊𝑗 [28, 29]. Cada hexágono
representa uma distância entre neurônios, onde cores frias indicam proximidade e cores
quentes representam afastamento. Como cada unidade do SOM possui seis unidades
adjacentes – exceto aquelas na região de borda do mapa – a imagem resultante é
constituída por 285 hexágonos.
14
Figura 3.1. Exemplo de U-Matrix
O algoritmo k-means foi empregado para determinar o particionamento ótimo do
mapa, conforme obtido pelo treinamento da rede neural. Foram realizadas clusterizações
variando o número k de clusters entre 2 e 20. O índice de Silhueta foi utilizado para aferir
a qualidade dos agrupamentos para cada valor de k, permitindo-nos selecionar a melhor
configuração para o projeto. A sua interpretação é simples: quanto mais próximo de 1,
melhor a clusterização [30].
3.3.2 – Mapeamento de Consultas Posteriores e de Validação
No conjunto de dados de treinamento, 56 pacientes possuíam registros de
consultas médicas posteriores à baseline. Os dados de cada consulta foram codificados e
organizados em vetores, em conformidade com os mesmos procedimentos adotados
previamente. Em seguida, cada vetor foi comparado aos vetores de pesos de todos os 100
neurônios do mapa para determinação do neurônio mais similar (BMU, da expressão em
inglês Best Matching Unit). Nessa etapa, os pesos da rede não foram ajustados. O objetivo
era definir a localização do neurônio acionado em cada consulta, de modo a obter as
trajetórias dos pacientes pelo mapa ao longo da progressão de seus quadros clínicos. Na
etapa de validação do projeto, o mesmo procedimento foi adotado. Cada vetor de entrada
foi comparado aos neurônios do mapa para que fosse determinada a sua BMU, sem ajustar
os pesos da rede neural.
15
4. Resultados
O método descrito no capítulo anterior resultou em um mapa formado por 100
neurônios, com 10 unidades de largura e 10 de comprimento. Para um mapa com estas
configurações, a U-Matrix correspondente tem 19 unidades de largura e 19 de
comprimento. A U-Matrix resultante do treinamento do SOM pode ser analisada na
Figura 4.1. Alguns agrupamentos destacam-se especialmente na parte superior do mapa,
indicando que os neurônios desta região foram acionados por pacientes similares. Os
cortes em vermelho na imagem representam separações entre os possíveis agrupamentos
de dados de pacientes.
Figura 4.1: U-Matrix
4.1 – Clusterização
Os valores do índice de Silhueta para cada clusterização realizada podem ser
comparados na Figura 4.2. A maior pontuação foi obtida para a divisão em dois clusters,
ou seja, com 𝑘 = 2. Contudo, tal configuração não é conveniente para o propósito do
projeto. Dada a pequena diferença registrada entre os valores de Silhueta para outros
valores de k, foi decidido dividir o mapa em cinco clusters. Dessa maneira, é possível
avaliar a escala proposta neste trabalho utilizando como referência a escala PND, também
graduada em cinco níveis.
16
Figura 4.2: Índice de Silhueta
Na Figura 4.3 podemos confrontar a configuração encontrada pelo k-means para
cinco classes com a U-Matrix. O agrupamento destacado na parte superior do mapa, por
exemplo, é completamente contido pela classe 1. A fronteira desta classe com as demais
é compatível com o corte horizontal avermelhado verificado na U-Matrix.
Figura 4.3: (a) K-means para 5 clusters; (b) U-Matrix
4.2 – Mapas de Componente
O mapa de componente é um tipo de visualização do SOM conveniente para
análise da distribuição de cada sintoma dos pacientes pelo mapa. A interpretação dessas
figuras deve ser feita de acordo com a escala de cores, onde coloração vermelha
corresponde à presença do sintoma e coloração azul indica a sua ausência.
Na Figura 4.4, podemos examinar a distribuição de características como herança,
mutação e histórico familiar, comparando-as com a configuração dos clusters determi-
nada pelo k-means. Por se tratar de uma doença genética, cuja mutação predominante no
17
banco de dados é a Val30Met, é esperado que os mapas correspondentes à mutação e
histórico familiar de PAF apresentem coloração predominantemente vermelha. A pouca
ocorrência de valores “-1” para esses achados é reforçada pela numeração associada à
escala de cores dos mapas, cujo valor mínimo é maior do que zero.
Ainda na Figura 4.4, o mapa referente à herança materna ou paterna destaca uma
característica interessante do resultado obtido pelo SOM: os pacientes com herança
materna ativaram predominantemente a região direita do mapa, marcada em vermelho.
Diferentemente dos outros mapas da Figura 4.4, os valores representados pela escala de
cores deste mapa vão de -1 a 1.
Figura 4.4: Herança; Mutação; Histórico Familiar
O espalhamento de sintomas como insensibilidade à temperatura e dor, pontuação
maior que zero na escala PND e dor neuropática podem ser analisados na Figura 4.5. É
fácil perceber que essas características estão virtualmente ausentes da classe 1 e estão
presentes nas demais regiões do mapa. Os pacientes desta região também são pouco
afetados pelos sintomas exibidos na Figura 4.6. A partir dessas observações, podemos
inferir que esta classe poderia estar relacionada ao estágio inicial da PAF, menos severo.
18
Figura 4.5: Insensibilidade a Dor e Temperatura; PND; Dor Neuropática
Figura 4.6: Diarreia/Constipação; Diarreia; Constipação; Saciedade Precoce; Tontura;
Agulhadas
Os sintomas representados nos mapas de componentes da Figura 4.7 estão, em
sua maioria, ausentes das classes 1 e 2. Incontinência fecal, incontinência urinária e
retenção urinária acionaram especialmente as regiões das classes 4 e 5, enquanto anomalia
de equilíbrio marcou com maior destaque a área entre as classes 3 e 4. Síncope e náusea
ficaram concentrados na classe 5, acionando uma pequena região da classe 2.
19
Figura 4.7: Anomalia do Equilíbrio; Incontinência Fecal; Síncope; Incontinência Urinária;
Retenção Urinária; Náusea
A Figura 4.8 mostra que poucos pacientes das classes 1, 2 e 3 são afetados por
perda de peso não intencional, que se concentra na área das classes 4 e 5. A região da
classe 5 e seu entorno também se destaca por concentrar ocorrências de vômito e tontura,
enquanto o restante do mapa parece ser pouco marcado por esses sintomas.
Figura 4.8: Vômito; Tontura; Perda de Peso
Os mapas de componente dos sintomas relacionados a achados cardiológicos
podem ser observados na Figura 4.9. Ao observar os três sintomas na parte superior da
figura, é possível notar uma concentração de casos positivos na região correspondente à
classe 3. Contudo, ao compararmos os resultados da distribuição dos demais sintomas da
Figura 4.9, não há padrões de localização específicos que eles tenham em comum. O
mesmo pode ser afirmado sobre o mapa de baixa voltagem, na Figura 4.10.
20
Figura 4.9: NYHA; Parede Posterior do VE; Septo do VE; Anomalia no Ritmo; Anomalia na
Condução e Fração de Ejeção do VE
No caso de disfunção erétil, na Figura 4.10, também não há um padrão bem
definido para a sua localização no mapa. É importante destacar que tal sintoma pode afetar
somente os homens do banco de dados.
Figura 4.10: Baixa Voltagem; Disfunção Erétil; Disfunção Renal
Com base nas inspeções realizadas sobre os mapas de componente, portanto, já
conseguimos nos familiarizar com características relevantes da estrutura do mapa antes
mesmo de analisar mais detalhadamente os resultados para cada classe.
4.3 – Análise de Classes
As características prevalentes em cada agrupamento de pacientes foram analisa-
das com o intuito de verificar a associação de cada classe a um nível de severidade de
PAF. A Tabela 4.1 traz a distribuição de indivíduos por classe, destacando em negrito
aqueles considerados clinicamente assintomáticos.
21
Tabela 4.1: Distribuição dos Pacientes por Classe
CLASSE 1 CLASSE 2 CLASSE 3 CLASSE 4 CLASSE 5
011 060 006 002 001 004
015 065 008 019 003 005
016 066 009 030 007 014
018 068 010 051 013 017
020 070 045 052 022 021
023 072 053 058 025 024
027 074 054 059 026 033
028 076 055 061 029 071
038 077 056 063 031 081
039 084 067 073 032 099
040 085 078 079 034
041 089 090 080 035
042 091 097 082 036
043 092 101 083 037
044 093 086 046
047 094 100 062
048 095 064
049 096 069
050 098 087
057
4.3.1 - Classe 1
Um dos aspectos mais notáveis da classe 1 é o fato de ter agrupado todos os
pacientes assintomáticos do conjunto de treinamento. Dos 39 pacientes da classe 1,
somente quatro são sintomáticos: 028, 068, 076 e 089. Destes, apenas os dois primeiros
apresentavam pontuação na escala PND – ambos em nível I.
A porcentagem de indivíduos da classe 1 afetados pelos 27 achados clínicos e de
exames considerados no projeto está disposta em ordem decrescente no gráfico da Figura
4.11. Em média, os sintomas exibidos no gráfico afetaram dois pacientes ou menos,
representando 5% da classe. Nenhum paciente relatou alteração do equilíbrio,
incontinência fecal, retenção urinária, vômito e insensibilidade à dor e temperatura.
Somente dois sintomas afetavam mais de 10% dos pacientes: anormalidade do ritmo
cardíaco e constipação.
22
Figura 4.11: Indivíduos da classe 1 afetados pelos 27 achados clínicos e de exames
4.3.2 - Classe 2
A classe 2 é constituída por 14 pacientes, sendo que 79% herdaram a mutação da
mãe. O contraste da pontuação PND dos pacientes desta classe e da classe 1 pode ser
observado na Tabela 4.2. Somente um paciente do grupo 2 não pontou nesta escala.
Apesar disso, 79% da classe está em nível I e não há ocorrência de nível IV.
Tabela 4.2: Pontuação dos indivíduos da classe 2 na escala PND
NO PND PND I PND II PND IIIa PND IIIb PND IV
1 paciente (7%)
11 pacientes (79%)
1 paciente (7%)
0% 1 paciente
(7%) 0%
A distribuição dos 27 achados clínicos e de exames entre os indivíduos da classe
2 (Figura 4.12) reforça a sua disparidade em relação à classe 1. Cada sintoma foi relatado,
em média, por quatro pacientes (27%). Além disso, mais de 50% dos pacientes relataram
sintomas como agulhadas, dormência, dor neuropática, náusea e insensibilidade à dor e
temperatura, sendo este último totalmente ausente da classe 1.
23
Figura 4.12: Indivíduos da classe 2 afetados pelos 27 achados clínicos e de exames
Por outro lado, deve-se ponderar que a ocorrência de 10 sintomas neste grupo não
ultrapassou 10%, sendo que anomalia de equilíbrio e incontinência urinária não foram
relatados por nenhum paciente. Essa característica, associada à predominância dos níveis
mais baixos da escala PND, sugere que a classe 2 representa o estágio inicial de
desenvolvimento de PAF.
4.3.3 - Classe 3
A classe 3 agrupou 16 pacientes, dos quais 81% atestaram herança paterna de
PAF. Todos os indivíduos deste grupo apresentaram pontuação na escala PND. Ao
comparar a Tabela 4.3 com a Tabela 4.2, notamos que a classe 3 é constituída por frações
maiores de pacientes nos níveis II, IIIa e IIIb do que a classe 2. No entanto, ainda não há
registro de pontuação no nível 4.
Tabela 4.3: Pontuação dos indivíduos da classe 3 na escala PND
NO PND PND I PND II PND IIIa PND IIIb PND IV
0% 7 pacientes
(44%) 4 pacientes
(25%) 2 pacientes
(12%) 3 pacientes
(19%) 0%
A classe 3 é a primeira a registrar sintomas com mais de 80% de ocorrência além
de PND: é o caso dos relatos de dor neuropática, agulhadas e insensibilidade à dor e
temperatura. Alteração no equilíbrio e incontinência urinária atingiram 75% e 13% dos
pacientes deste grupo – tais sintomas não estão presentes nas classes 1 e 2. A ocorrência
média dos sintomas é de 34% entre os indivíduos da classe 3 (Figura 4.13).
24
Figura 4.13: Indivíduos da classe 3 afetados pelos 27 achados clínicos e de exames
Os parâmetros cardiológicos chamaram atenção para esta classe. 19% dos
pacientes pontuam na escala NYHA e 25% possuem espessura do septo interventricular
e da parede do ventrículo esquerdo maior ou igual a 11 mm. Além disso, 31% dos pacien-
tes da classe 3 apresentaram anomalia de condução.
4.1.4 - Classe 4
A herança genética dos 19 indivíduos da classe 4 está distribuída de forma mais
homogênea: 47% de pacientes têm herança materna. Este grupo chama atenção por
apresentar pacientes com PND em nível IV, o que não ocorreu nas demais classes já
apresentadas (Tabela 4.4).
Tabela 4.4: Pontuação dos indivíduos da classe 4 na escala PND
NO PND PND I PND II PND IIIa PND IIIb PND IV
0% 6 pacientes
(32%) 5 pacientes
(26%) 3 pacientes
(16%) 1 paciente
(5%) 4 pacientes
(21%)
Todas as porcentagens de ocorrência de achados clínicos e exames entre os
indivíduos da classe 4 podem ser consultadas na Figura 4.14. Este grupo se destaca por
apresentar 10 sintomas relatados por mais de 50% de seus pacientes. Dor neuropática e
insensibilidade à dor e temperatura atingiram todos os pacientes do grupo, enquanto
dormência, agulhadas e perda de peso não intencional acometiam 95%, 89% e 84% dos
pacientes do grupo, respectivamente. A média de pacientes afetados por cada sintoma é
de 44%.
25
Figura 4.14: Indivíduos da classe 4 afetados pelos 27 achados clínicos e de exames
4.1.5 - Classe 5
Os 10 pacientes agrupados na classe 5 diferenciam-se daqueles da classe 4 no que
diz respeito à herança da mutação da TTR: 80% da classe 5 indicaram herança materna,
contra 47% do grupo anterior. A comparação entre a Tabela 4.4 e a Tabela 4.5 mostra que
as pontuações na escala PND são relativamente próximas nas duas classes, com destaque
para a proporção maior de pacientes nos níveis IIIa e IIIb, na classe 5.
Tabela 4.5: Pontuação dos indivíduos da classe 5 na escala PND
NO PND PND I PND II PND IIIa PND IIIb PND IV
0% 3 pacientes
(30%) 2 pacientes
(20%) 2 pacientes
(20%) 1 paciente
(10%) 2 pacientes
(20%)
As taxas de ocorrência dos sintomas clínicos da classe 5, representadas na Figura
4.15, são o que mais distingue este grupo dos demais. A média de pacientes afetados por
cada sintoma é de 55%. Todos os indivíduos deste grupo relataram vômito, náusea, dor
neuropática, agulhadas e dormência. Perda de peso não intencional, tontura, saciedade
precoce e insensibilidade à dor e temperatura acometiam 90% dos pacientes da classe. No
total, 16 sintomas afetavam mais de 50% do grupo, entre eles síncope, retenção e
incontinência urinária.
26
Figura 4.15: Indivíduos da classe 5 afetados pelos 27 achados clínicos e de exames
4.4 – Deslocamento de Pacientes pelo Mapa
Nesta Seção as tendências gerais de deslocamento dos pacientes pelo mapa foram
analisadas. A Tabela 4.6 indica a quantidade de pacientes de cada classe para os quais
havia registros de consultas após a baseline.
Tabela 4.6: Posicionamento inicial dos pacientes com consultas após a baseline
Classe 1 Classe 2 Classe 3 Classe 4 Classe 5
22 pacientes 11 pacientes 9 pacientes 8 pacientes 6 pacientes
4.4.1 – Tendências de Migração
A partir da Tabela 4.7, podemos observar as tendências gerais de deslocamento
dos indivíduos de cada classe. Em todos os casos, percebemos que a maior parte dos
pacientes permaneceu no mesmo grupo. Os agrupamentos das classes 1 e 5 foram os que
demonstraram comportamento mais estável entre a primeira e a última consulta.
27
Tabela 4.7: Migração de pacientes entre a primeira e última consulta
Esse resultado é compatível com a análise realizada na Seção anterior deste
capítulo. O primeiro grupo reúne indivíduos que, em sua maioria, ainda não manifestaram
os sintomas de PAF. Dado que a maioria dos pacientes da classe 1 permanecem
assintomáticos nas consultas posteriores, a sua permanência na classe era, de fato, o
resultado esperado. Também é esperado que aqueles classificados na classe 5 não se
desloquem entre classes, uma vez que esta já representaria o estágio mais severo da
doença degenerativa.
No caso dos pacientes originalmente agrupados nas classes 2, 3 e 4, as migrações
geralmente ocorrem em direção grupos que representariam estágios mais avançados de
PAF. As exceções foram: um indivíduo da classe 2, tratado com Tafamidis, que migrou
para a classe 1; dois indivíduos da classe 4, que fizeram transplante de fígado e migraram
para as classe 1 e 2. A classe 2 se destaca por ser o único grupo cujos pacientes se
deslocaram para todas as outras classes, reforçando o papel deste cluster como ponto de
partida do desenvolvimento de PAF.
4.4.2 – Análises de Caso
As trajetórias de todos os pacientes foram analisadas mais detalhadamente, para
compreensão dos fatores associados aos deslocamentos dentro do mapa. Esta seção faz
uma análise de caso para alguns dos pacientes estudados. As figuras a seguir representam
a trajetória de um dado paciente, onde o neurônio ativado na consulta de baseline foi
28
destacado em amarelo. As BMUs referentes às demais consultas foram destacadas na cor
de suas respectivas classes. O número dentro de cada BMU representa a quantidade de
consultas em que ele foi ativado, para contemplar casos em que o paciente ativou a mesma
unidade mais de uma vez.
a) Paciente 044
A trajetória deste paciente pelo mapa está representada na Figura 4.16. Em sua
visita de baseline, ele não relatou nenhum sintoma e foi mapeado na área superior da
classe 1. Ao retornar ao hospital dois anos e oito meses depois, o paciente registrava
constipação, dor neuropática, agulhadas e nível I na escala PND. Esta consulta ativou um
neurônio ainda na classe 1, porém em sua região inferior, na fronteira com a classe 3.
Após um ano, o paciente retornou para a sua terceira consulta. Além dos sintomas
da visita anterior, ele relatou insensibilidade à dor e temperatura, dormência e anomalia
no equilíbrio. Nesta ocasião, o neurônio ativado está localizado na classe 3.
Figura 4.16: Trajetória do paciente 044
a) Paciente 056
O paciente 056, tratado com Tafamidis, iniciou sua trajetória na classe 2, em
região de fronteira com a classe 1 (Figura 4.17). Nessa ocasião, relatou tontura, náusea,
anormalidade na condução, diarreia, agulhadas e vômito. Nas três consultas seguintes,
realizadas ao longo de 2 anos, o indivíduo passou a apresentar saciedade precoce e deixou
de reportar vômito, permanecendo no mesmo grupo. A partir da quinta consulta, deixou
de relatar náusea e saciedade precoce e regrediu para a classe 1. No final de sua trajetória,
o paciente 056 foi mapeado na classe 1, próximo da fronteira da classe 2.
29
Figura 4.17: Trajetória do paciente 056
b) Paciente 067
Este paciente foi mapeado na classe 2 em sua consulta de baseline, tendo relatado
tontura, diarreia, perda de peso não intencional, dor neuropática, PND nível I e disfunção
erétil (Figura 4.18). Em sua segunda consulta, após um ano e oito meses, o paciente
migrou diretamente para a classe 4. Ele relatou os mesmos sintomas acrescidos de
incontinência urinária, saciedade precoce, diarreia alternada com constipação e
agulhadas.
Figura 4.18: Trajetória do paciente 067
c) Paciente 009
Em sua primeira consulta, o paciente 009 era acometido por síncope, constipação,
dormência, vômito, náusea, agulhadas, saciedade precoce, perda de peso e tinha PND
nível II. Sendo assim, foi mapeado na classe 2, em região de fronteira com a classe 5,
conforme indicado na Figura 4.19. Ele migraria para esta classe um ano depois, quando
passou a apresentar diarreia alternada com constipação, dor neuropática e incontinência
urinária.
Nas três consultas seguintes, intercaladas ao longo de três anos, o paciente nunca
se deslocou para fora da classe 5. Ao relatar tontura e progredir para PND nível IIIa, em
sua terceira consulta, ele se deslocou para o neurônio vizinho. A mesma BMU foi ativada
30
na visita seguinte, uma vez que não foi relatada nenhuma novidade. No último retorno
registrado, o paciente se moveu para a fronteira entre as classes 2, 4 e 5. Ele não
apresentava mais síncope e perda de peso, porém seu nível de PND aumentou para IIIb.
Figura 4.19: Trajetória do paciente 009
d) Paciente 052
Em sua trajetória, o paciente 052 se deslocou entre as classes 3, 2 e 5,
respectivamente. Em sua consulta de baseline, este paciente pontuava no nível I de PND
e era acometido por constipação, dor neuropática, agulhadas, dormência e insensibilidade
à temperatura e dor. Sua segunda consulta ocorreu após um ano e nove meses, quando ele
apresentava os mesmos sintomas, além de dormência e saciedade precoce. Com isso, este
indivíduo ativou um neurônio da classe 2, na fronteira entre as classes 4 e 5.
No ano seguinte o deslocamento foi menor – ele ativou o neurônio vizinho.
Contudo, observamos na Figura 4.20 que tal neurônio já se localiza na classe 5. Em seu
relato, o paciente registrou progressão de PND para nível II, diarreia, náusea,
incontinência fecal e perda de peso, entre os sintomas já relatados nas ocasiões anteriores.
Figura 4.20: Trajetória do paciente 052
31
e) Paciente 003
O paciente 003 é um dos poucos que regrediram para a classe 1 (Figura 4.21).
Este indivíduo passou por transplante de fígado um ano antes de sua consulta de baseline.
Nesta consulta, foi mapeado na classe 4, relatando PND nível IIIa, saciedade precoce,
perda de peso, agulhadas, problemas na espessura do septo e da parede posterior do
ventrículo esquerdo, diarreia, dor neuropática, dormência, anomalia no equilíbrio e
insensibilidade à temperatura e dor. Contudo, após aproximadamente um ano e meio, o
paciente havia deixado de experimentar saciedade precoce, perda de peso, diarreia, dor
neuropática, agulhadas e dormência, migrando para uma região da classe 1 próxima da
classe 3. Na consulta seguinte, o único sintoma adicional era diarreia alternada com
constipação. O mesmo neurônio foi ativado.
Figura 4.21: Trajetória do paciente 003
f) Paciente 037
A visita de baseline do paciente 037 ativou um neurônio da classe 4 na região de
fronteira com as classes 2 e 5 (Figura 4.22). Os sintomas eram tontura, constipação,
constipação alternada com diarreia, incontinência fecal, perda de peso, dor neuropática,
incontinência urinária e PND nível II. Dois anos depois, o indivíduo ativou o neurônio
vizinho, na classe 5. Ele sofria com sintomas adicionais: agulhadas, dormência, disfunção
erétil e PND nível IIIa.
33
5. Validação
Para validação dos resultados do projeto, foram processados os dados de 48 novos
pacientes com ID variando de 102 a 150. Neste grupo, 12 indivíduos são portadores de
mutação da TTR considerados clinicamente assintomáticos para PAF. Nesta etapa, foi
adotado o mesmo procedimento utilizado no mapeamento de consultas posteriores. Cada
vetor de entrada foi comparado aos neurônios do mapa para que fosse determinada a sua
BMU, sem ajustar os pesos da rede neural.
A distribuição resultante dos pacientes de validação entre as classes do mapa é
fornecida na Tabela 5.1.
Tabela 5.1: Distribuição dos pacientes de validação entre os clusters
Classe 1 Classe 2 Classe 3 Classe 4 Classe 5
16 pacientes 11 pacientes 10 pacientes 6 pacientes 5 pacientes
Nas seções a seguir, as características dos indivíduos mapeados em cada classe
serão comparadas às dos pacientes que originalmente constituíram tais agrupamentos na
etapa de treinamento. Para efeito de comparação, a média da variação das incidências dos
sintomas nas etapas de treino e validação foi calculada para cada classe. Foram excluídos
do cálculo: os sintomas cardíacos dependentes de exames, por não terem sido realizados
em todos os pacientes, e a disfunção erétil, por afetar exclusivamente os pacientes do sexo
masculino.
Validação da Classe 1
Em ambas as etapas do trabalho, os pacientes da classe 1 registram predominância
de herança paterna: 64% no treino e 62% na validação. Além disso, todos os 12 indivíduos
assintomáticos foram mapeados neste grupo, assim como ocorreu no treinamento da rede.
Dentre os quatro pacientes sintomáticos que acionaram neurônios nessa região do mapa,
somente dois pontuam na escala de PND – ambos em nível I (Tabela 5.2).
Tabela 5.2: Comparativo dos níveis de PND na classe 1 no treino e na validação
MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV
TREINO 95% 5% 0% 0% 0% 0%
34
VALIDAÇÃO 88% 12% 0% 0% 0% 0%
A Figura 5.1 indica que sintomas como vômito, incontinência fecal e anomalia no
equilíbrio não se manifestaram neste cluster, tanto no treinamento da rede, quanto na
validação. A variação média das incidências de cada sintoma nas duas etapas foi de 5%.
Figura 5.1: Incidência de sintomas na classe 1 no treino e na validação
Validação da Classe 2
No Capítulo 4, foi destacado que 79% dos pacientes da classe 2 herdaram a doença
da mãe. Dentre os 11 pacientes do grupo de validação alocados neste cluster, este valor
cai para 45%. Ainda assim, a Tabela 5.3 e a Figura 5.2 demonstram que o perfil dos
indivíduos da classe 2 guarda importantes semelhanças entre o treino e a validação.
Tabela 5.3: Comparativo dos níveis de PND na classe 2 no treino e na validação
MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV
TREINO 7% 79% 7% 0% 7% 0%
VALIDAÇÃO 27% 64% 9% 0% 0% 0%
Os níveis de PND I e II são os únicos registrados na classe 2 tanto no treino quanto
na validação. Além disso, esta região do mapa também foi acionada por pacientes sem
pontuação nesta escala. Mais de 50% dos indivíduos mapeados neste grupo no treino e na
validação relataram dor neuropática, dormência e agulhadas, enquanto menos de 10% dos
pacientes foram afetados por incontinência fecal e urinaria, insuficiência renal e alteração
no equilíbrio. A variação média das incidências de cada sintoma nas duas etapas foi de
12%.
35
Figura 5.2: Incidência de sintomas na classe 2 no treino e na validação
Validação da Classe 3
Os neurônios da classe 3 foram acionados por 10 pacientes de validação. Assim
como no treinamento da rede, todos os indivíduos mapeados neste grupo pontuam na
escala PND. A Tabela 5.4 indica coincidências nas pontuações de PND para os cenários
de treino e validação. Em ambos os casos, a maior parcela da classe registra PND nível I
e não há pacientes em nível IV ou sem PND.
Tabela 5.4: Comparativo dos níveis de PND na classe 3 no treino e na validação
MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV
TREINO 0% 44% 25% 12% 19% 0%
VALIDAÇÃO 0% 40% 20% 30% 10% 0%
No gráfico da Figura 5.3 é possível comparar as incidências dos 27 achados
clínicos e exames. Para ambos os cenários confrontados, sintomas como dormência,
agulhadas, insensibilidade à dor e temperatura, dor neuropática, alteração no equilíbrio e
constipação afetam pelo menos 75% dos pacientes. Por outro lado, menos de 15% dos
pacientes relataram incontinência fecal, incontinência e retenção urinária, insuficiência
renal, vômito, diarreia e constipação. Em média, a variação de incidência dos sintomas
entre treino e validação foi de 9% para a classe 3.
Mais uma vez, alguns parâmetros cardiológicos ganharam destaque neste grupo.
Dos pacientes de validação, 10% pontuam na escala NYHA. Anormalidade de condução
e de espessura da parede e do septo ventricular afetam, respectivamente, 50% 10% e 20%
destes indivíduos.
36
Figura 5.3: Incidência de sintomas na classe 3 no treino e na validação
Validação da Classe 4
A Tabela 5.5. detalha as pontuações na escala PND dos seis pacientes de validação
agrupados na classe 4. Apesar da pequena amostra de pacientes de validação agrupada
neste cluster, notamos uma compatibilidade com os resultados obtidos no treinamento no
que diz respeito aos níveis de PND. Em ambos os cenários, a classe 4 foi a primeira a
registrar pacientes em nível IV, além de não conter nenhum paciente sem PND.
Tabela 5.5: Comparativo dos níveis de PND na classe 4 no treino e na validação
MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV
TREINO 0% 32% 26% 16% 5% 21%
VALIDAÇÃO 0% 33% 17% 0% 17% 33%
Ao analisar os demais sintomas, no gráfico da Figura 5.4, destacamos que mais
de 80% da classe 4 foi acometida por perda de peso não intencional, agulhadas,
dormência, insensibilidade à dor e temperatura e dor neuropática, tanto no treino quanto
na validação. Em nenhum dos casos foi relatado vômito, náusea e insuficiência renal. A
variação média da incidência dos sintomas entre os dois cenários foi de 14% neste grupo.
37
Figura 5.4: Incidência de sintomas na classe 4 no treino e na validação
Validação da Classe 5
A classe 5 reuniu cinco pacientes do grupo de validação. As incidências de cada
nível da escala PND e dos demais sintomas constam na Tabela 5.6 e no gráfico da Figura
5.5, respectivamente.
Tabela 5.6: Comparativo dos níveis de PND na classe 5 no treino e na validação
MAPA NO PND PND I PND II PND IIIa PND IIIb PND IV
TREINO 0% 30% 20% 20% 10% 20%
VALIDAÇÃO 0% 20% 40% 20% 20% 0%
É notável que, diferentemente do resultado obtido no treinamento, não foi
registrado paciente de validação com PND nível IV na classe 5. Contudo, é importante
levar em consideração o número relativamente pequeno de indivíduos mapeados neste
cluster. Afinal, no caso das classes 4 e 5, variações da ordem de um paciente para mais
ou para menos representam mudanças percentuais de aproximadamente 20%. Tendo feito
essa ressalva, apontamos que todos os demais níveis da escala PND se fazem presentes
na classe 5, seja na etapa de treinamento ou de validação.
Nos dois cenários, todos os pacientes do grupo são acometidos por agulhadas, dor
neuropática, dormência, náusea e vômito. Pelo menos 90% dos pacientes relataram perda
de peso não intencional, saciedade precoce, tontura e insensibilidade à dor e temperatura.
39
6. Conclusão
Confrontando os resultados obtidos no projeto com os registros de pontuação na
escala PND, é possível concluir que a rede neural foi bem-sucedida em diferenciar os
indivíduos sintomáticos dos considerados clinicamente assintomáticos. Tanto no
treinamento da rede quanto no processo de validação, todos os pacientes assintomáticos
foram mapeados na classe 1, ocupando toda a região superior do mapa. Por sua vez, os
sintomáticos, que constituem 10% deste grupo, apresentam sintomas de pouca severidade
para PAF. Portanto, podemos inferir que esta classe representa o estágio assintomático
ou inicial da manifestação da doença.
As outras classes foram escalonadas em ordem de severidade de acordo com a
porcentagem da presença dos sintomas em cada uma delas e sua comparação com a escala
PND. A classe 2, localizada na região centro-direita do mapa, agrupou indivíduos de
graduação leve, com presença de sintomas intermediários. Este cluster foi o único a
registrar migração de pacientes de baseline para todos os demais grupos, conforme
observado na análise das trajetórias das suas consultas posteriores. Por esses motivos, fica
evidente o caráter intermediário da classe 2.
Na classe 3, observamos um aumento na incidência de sintomas presentes no
grupo anterior, considerados moderados. Este cluster, que ocupa a área esquerda do mapa,
é majoritariamente formado por pacientes com herança paterna da mutação na TTR, em
oposição ao que ocorre na classe 2. Também é possível fazer um destaque para a presença
de indivíduos com mutação diferente de Val30Met e achados relacionados à insuficiência
cardíaca neste grupo.
Por fim, as incidências dos sintomas de PAF considerados mais severos aumentam
gradativamente nas classes 4 e 5, sendo a primeira marcada por um estágio moderado-
grave e a segunda pelo estágio mais severo. As trajetórias dos pacientes com baseline na
classe 5 mostram que nenhum deles migrou para outro grupo. Considerando a natureza
exclusivamente degenerativa da PAF, esse fato reforça a conclusão de que a classe 5
representa o maior grau de severidade da doença.
A posterior validação feita com base nos dados de 48 novos indivíduos serviu para
reforçar as conclusões elaboradas sobre cada classe. Fica evidente a consistência do mapa
produzido, uma vez que a proporção dos níveis de PND e a presença dos principais
40
sintomas de cada grupo se mantiveram estáveis, com as maiores flutuações percentuais
ocorrendo nas classes com menor quantidade de pacientes.
A análise dos resultados obtidos não ficou restrita à comparação da incidência das
30 características dos indivíduos de cada classe. Por utilizar o SOM como ferramenta de
visualização bidimensional dos dados, o projeto também se beneficia com a possibilidade
de detectar informações relevantes relacionadas ao posicionamento dos agrupamentos no
mapa e às trajetórias dos pacientes em suas consultas posteriores.
De modo geral, o incremento da severidade da doença está distribuído vertical-
mente no mapa, com a classe assintomática ocupando toda a região superior, as classes
intermediarias predominantemente na região central a as classes mais graves ocupando
praticamente toda a região inferior do mapa. Com isso, podemos inferir que
deslocamentos verticalizados pelo mapa estejam relacionados à manifestação mais
agressiva da PAF, enquanto trajetórias horizontais representariam um desenvolvimento
mais brando. Nesse sentido, as avaliações mais detalhadas da progressão de cada paciente
reforçaram as diferenças entre os clusters. Nos casos apresentados na Seção 4.2, foi
possível relacionar claramente deslocamentos nas regiões de fronteira entre classes com
mudanças significativas nos quadros clínicos relatados pelos pacientes.
Perspectivas
O trabalho desenvolvido possui perspectivas de avanço baseadas na ampliação da
base de dados e no próprio aprimoramento do modelo, com a revisão da lista de
características fornecidas como entrada à rede.
Além disso, com o acesso a dados de novos pacientes do THAOS, será possível
incorporar os 48 pacientes de validação ao treinamento da rede neural e validar os
resultados com os dados dos novos pacientes disponíveis. Inclusive, a possibilidade de
acessar informações de indivíduos de outras regiões geográficas é promissora, pois
permitirá avaliar o desempenho do modelo frente a um conjunto de dados com maior
variabilidade genética.
Paralelamente, um sistema para uso médico está em fase de desenvolvimento. O
profissional de saúde poderá registrar os dados de um paciente em consulta no sistema
para determinar de modo simples a sua posição atual no mapa, obtendo informações sobre
o cluster em que o indivíduo se localiza. Com base nessas informações e nos dados de
outros pacientes que ativaram neurônios na mesma região, o sistema auxiliaria a
41
elaboração de um prognóstico para o paciente, oferecendo suporte ao profissional médico
na tomada de decisão em relação às estratégias de tratamento.
42
Bibliografia
[1] “THAOS - Transthyretin Amyloidosis Outcomes Survey,” [Online]. Available:
https://www.thaos.net/. [Acesso em 18 agosto 2018].
[2] C. Rapezzi, “Transthyretin-Related Amiloidoses and the Heart: A Clinical
Overview,” Nature Reviews Cardiology, pp. 398-408, julho 2010.
[3] J. M. Seixas, J. Faria, J. Souza Filho, A. Vieira, A. Kritski e A. Trajman,
“Artificial neural networks models to support the diagnosis of pleural tuberculosis
in adult patients,” The International Journal of Tuberculosis and Lung Disease,
pp. 682-686, 2013.
[4] L. V. C. Cascão, “Modelos de inteligência Computacional para o apoio à triagem
de pacientes e diagnóstico clínico de tuberculose pulmonar,” em Dissertação de
M.Sc., Rio de Janeiro, 2011.
[5] The MathWorks, Inc., “k-means clustering - MATLAB kmeans,” [Online].
Available: https://www.mathworks.com/help/stats/kmeans.html#buefthh-3.
[Acesso em 5 Fevereiro 2018].
[6] S. S. C. Novis, “Aplicação das Redes Neurais Artificiais na criação de um escore
de gravidade para pacientes com Polineuropatia Amiloidótica Familiar,” em
Dissertação de M.Sc., Rio de Janeiro, 2014.
[7] S. Novis, F. Machado, V. B. Costa, D. Foguel, M. W. Cruz e J. M. d. Seixas,
“Applying an artificial neural network model for developing a severity score for
patients with hereditary amyloid polyneuropathy,” Amyloid, 18 Julho 2017.
[8] M. Nuvolone, L. Obici e G. Merlini, “Therapies, Transyhyretin-associated
Familial Amyloid Polineuropathy – Current and Emerging,” US Neurology, pp.
24-32, 2012.
[9] M. Saporta, C. Zaros, M. Cruz, C. André, M. Misrahi, C. Bonaiti-Pellié e V.
Planté-Bordeneuve, “Penetrance estimation of TTR familial amyloid
polyneuropathy (type I) in Brazilian families,” Eur J Neurol. v.13, n-3, pp. 337-
341, 2009.
[10] Centro de Estudos em Paramiloidose Antonio Rodrigues de Mello, “CEPARM,”
[Online]. Available: http://ceparm.com/. [Acesso em 08 2018].
[11] Hospital Universitário Clementino Fraga Filho, “HUCFF,” [Online]. Available:
http://www.hucff.ufrj.br/. [Acesso em 08 2018].
[12] Hospital Universitário Clementino Fraga Filho, “Introdução - CEPARM,”
[Online]. Available: http://ceparm.com/o-ceparm/introducao/. [Acesso em 6
Fevereiro 2018].
[13] Associação Brasileira de Paramiloidose, “Tipo de Amiloidoses,” 2016. [Online].
Available: http://www.paramiloidose.com.br/tipo-de-amiloidoses.html. [Acesso
em 6 Fevereiro 2018].
[14] Associação Brasileira de Paramiloidose, “Sintomas,” [Online]. Available:
http://www.paramiloidose.com.br/sintomas.html. [Acesso em 6 Fevereiro 2018].
[15] Y. Ando, T. Coelho, J. L. Berk, M. Waddington Cruz, B.-G. Ericzon, S.-i. Ikeda,
D. Lewis, L. Obici, V. Planté-Bordeneuve, C. Rapezzi, G. Said e F. Salvi,
“Guideline of transthyretin-related hereditary amyloidosis for clinicians,”
Orphanet Journal of Rare Diseases, 20 Fevereiro 2013.
43
[16] C. Andrade, “A peculiar form of peripheral neuropathy: familiar atypical
generalized amyloidosis with special involvement of the peripheral nerves,”
Brain, pp. 408-427, 1952.
[17] Associação Brasileira de Paramiloidose, “Tratamentos,” [Online]. Available:
http://www.paramiloidose.com.br/tratamentos.html. [Acesso em 6 Fevereiro
2018].
[18] DrugBank, [Online]. Available: https://www.drugbank.ca/drugs/DB11644.
[Acesso em 12 08 2018].
[19] T. Coelho, L. Maia, A. Martins da Silva, M. Waddington Cruz, V. Planté-
Bordeneuve, P. Lozeron, O. Suhr, J. Campistol, I. Conceição, H. Schimidt, P.
Trigo, J. Kelly, R. Labaudinière, J. Chan, J. Packman, A. Wilson e D. Grogan,
“Tafamidis for transthyretin familial amyloid polyneuropathy: a randomized,
controlled trial.,” Neurology, pp. 785-792, 21 Agosto 2012.
[20] P. E. Ambrósio, “Redes neurais artificiais no apoio ao diagnóstico diferencial de
lesões intersticiais pulmonares,” em Dissertação de M.Sc., Ribeirão Preto, 2002.
[21] C. G. e. Souza e L. M. T. e. Souza, “O Uso de Redes Neurais Artificiais no
Diagnóstico de Doenças Reumatológicas,” em Trabalho de Conclusão de Curso,
Florianópolis, 2004.
[22] L. W. L. K. e. a. Dyck PJ, “Variables influencing neuropathic endpoints: the
Rochester Diabetic Neuropathy Study of Healthy Subjects,” Neurology, pp. 1115-
1121, 1995.
[23] American Heart Association, Inc., “Classes of Heart Failure,” Maio 2017.
[Online]. Available:
www.heart.org/HEARTORG/Conditions/HeartFailure/AboutHeartFailure/Classes
-of-Heart-Failure_UCM_306328_Article.jsp#.WvEfU4jt42w. [Acesso em 08
Maio 2018].
[24] The MathWorks, Inc., “MATLAB - MathWorks - MATLAB & Simulink,”
[Online]. Available: https://www.mathworks.com/products/matlab.html. [Acesso
em Setembro 2018].
[25] Helsinki University of Technology, “Laboratory of Computer and Information
Science,” [Online]. Available: http://www.cis.hut.fi/. [Acesso em setembro 2018].
[26] A. Orjuela, “Apoio ao Diagnóstico de Tuberculosis Pleural e Meníngea,” em Tese
de D.Sc., Rio de Janeiro, 2105.
[27] The MathWorks, Inc., “Neural Network Training Concepts,” [Online]. Available:
https://www.mathworks.com/help/nnet/ug/neural-network-training-concepts.html.
[Acesso em 12 08 2018].
[28] T. Kohonen, Self-Organizing Maps, Springer, 2001.
[29] T. R. P. J. e. a. Aguiar FS, “Development of two artificial neural network models
to support the diagnosis of pulmonary tuberculosis in hospitalized patients in Rio
de Janeiro, Brazil,” Med Biol Eng Comput., p. 1751–1759., 2016.
[30] The MathWorks, Inc., “Silhouette plot - MATLAB silhouette,” [Online].
Available: https://www.mathworks.com/help/stats/silhouette.html. [Acesso em 08
Fevereiro 2018].
[31] B. Yegnanarayana, Artificial Neural Networks, New Delhi: Prentice Hall of India,
2006, p. 18.
[32] P. D. Wasserman, Neural computing: Theory and Practice, New York: Van
Nostrand Reinhold, 1989.
44
[33] S. Haykin, Neural Networks and Learning Methods, Upper Saddle River: Pearson
Prentice Hall, 2009.
45
Apêndice A - Redes Neurais Artificiais
Redes neurais artificiais são sistemas computacionais capazes de executar tarefas
complexas de reconhecimento de padrões, classificação e predição a partir de um con-
junto de dados de entrada. Elas recebem essa denominação por serem inspiradas nas redes
neurais biológicas, formadas por unidades fundamentais interconectadas, denominadas
neurônios.
Em sistemas nervosos biológicos, cada neurônio recebe, processa e transmite si-
nais dentro da rede. Estima-se que o cérebro humano possui aproximadamente 1011 neu-
rônios e 1015 conexões [1]. Pode-se dizer que a organização dos modelos de redes neurais
artificiais representa uma analogia ao modelo biológico. Contudo, é importante reforçar
que tais sistemas não têm a pretensão de reproduzir a complexidade da inteligência hu-
mana em sua integridade – o objetivo, na verdade, é modelar a forma como o cérebro
realiza tarefas específicas de interesse [2, pp. 1-6].
A.1 – O Neurônio Artificial
Os neurônios artificiais são modelos matemáticos projetados para processar sinais
de modo análogo a uma célula nervosa. Essencialmente, uma rede neural artificial – a
qual iremos nos referir apenas como rede neural – é formada por neurônios conectados
entre si. Cada conexão é caracterizada por um peso, também chamado de peso sináptico.
Conforme representado na Figura A.1, o neurônio recebe um conjunto de sinais
de entrada 𝓍1, 𝓍2 . . . 𝓍𝑛 para cada sinapse j. Cada entrada 𝓍𝑗 é multiplicada pelo respec-
tivo peso sináptico 𝑤𝑗. O somatório de todas as multiplicações somado a um bias (Equa-
ção 1). O resultado é processado por uma função de ativação 𝜑(∙), tipicamente não linear,
que determina o valor do sinal de saída 𝑦 (Equação 2). Portanto, o neurônio descrito pode
ser representado pelas equações [3, pp. 10-14]:
𝓊 = ∑ 𝑤𝑗𝓍𝑗
𝑛
𝑗=1
+ 𝑏
Equação 1
e
46
𝑦 = 𝜑(𝓊)
Equação 2
Figura A.1: Modelo de neurônio artificial
A.2 – Paradigmas de Aprendizado de Redes Neurais
Uma das características que diferencia redes neurais de sistemas de computação
tradicionais é sua capacidade de autoajustar seus parâmetros de acordo com o ambiente
de interesse. Esse processo é denominado aprendizado ou treinamento e demanda a apli-
cação de uma série de vetores de entrada à rede. Durante o treinamento, os pesos sinápti-
cos são ajustados de acordo com algoritmos específicos, até que venham a convergir em
um conjunto de valores que produza a saída desejada. Assim, podemos concluir que a
configuração final dos pesos sinápticos representa o conhecimento adquirido pela rede
neural [2, pp. 22-25].
Dentre os diversos algoritmos de aprendizado já desenvolvidos, é possível identi-
ficar dois importantes paradigmas. O treinamento supervisionado requer o uso de pares
de vetores de treinamento. Cada par contém dados de entrada e seus respectivos alvos,
que representam a saída desejada da rede neural. O treinamento não supervisionado, por
outro lado, emprega vetores de entrada sem fornecer alvos à rede.
Treinamento Supervisionado
Os algoritmos de treinamento supervisionado consistem na aplicação sequencial
de pares de treinamento. Os vetores de entrada são processados pela rede neural e a saída
resultante é comparada com o alvo fornecido, para que o erro possa ser determinado de
acordo com uma função performance. Para isso, frequentemente são utilizados a soma
dos erros quadráticos (Equação 3) ou o erro médio quadrático (Equação 4):
47
𝑆𝑆𝐸 = ∑(𝑡𝑖 − 𝑜𝑖)2
𝑁
𝑖 = 1
Equação 3
𝑀𝑆𝐸 =1
𝑁 ∑(𝑡𝑖 − 𝑜𝑖)
2
𝑁
𝑖 = 1
Equação 4
onde N é o número total de iterações, ti é o valor do iésimo alvo desejado e oi é o iésimo
resultado obtido pela rede.
O processo de aprendizado supervisionado é ilustrado pela Figura A.2a. O erro da
rede neural é calculado iterativamente para cada par de vetores de treinamento. Após cada
iteração, os pesos da rede são ajustados buscando minimizar o erro até que o mesmo
convirja para um valor tolerável. Quando o treinamento é concluído, é importante expor
o sistema a um conjunto de dados de teste. Nessa etapa, representada na Figura A.2b, os
pesos sinápticos não sofrem novos ajustes; o objetivo é aferir a performance da rede neu-
ral já treinada.
Figura A.2: (a) Treinamento Supervisionado; (b) Teste da Rede Neural
Treinamento Não Supervisionado
Em muitas aplicações, não temos a nossa disposição os valores de saída adequa-
dos para os dados utilizados no treinamento da rede neural. Nesses casos, são utilizados
48
algoritmos não supervisionados, que não requerem alvos para aferir o erro produzido pela
rede. Esse paradigma de treinamento apresenta um alinhamento significativo com os me-
canismos encontrados no análogo biológico das redes neurais. Afinal, as intensas ativida-
des de aprendizado realizadas nos primeiros anos de vida de uma criança, por exemplo,
ocorrem sem o fornecimento de gabaritos. O sistema nervoso se auto organiza para res-
ponder adequadamente aos estímulos do ambiente.
Figura A.3: Treinamento Não Supervisionado
Em redes neurais artificiais, o processo de treinamento não supervisionado é di-
recionado por regras de aprendizado competitivo. Durante o treinamento, os neurônios de
uma camada da rede são expostos aos dados de entrada e competem para determinar quais
deles serão ativados. A ativação dos neurônios é definida pela sua relação com as carac-
terísticas da entrada, de acordo com as regras escolhidas para o aprendizado [3, pp. 34-
37].
A.3 – Mapa Auto-Organizável
O mapa auto-organizável é um tipo de rede neural não supervisionada desenvol-
vida por Kohonen e outros em 1984. Em um SOM, os neurônios normalmente são orga-
nizados em uma estrutura com uma ou duas dimensões e a rede opera com base na mo-
dalidade de aprendizado competitivo, denominada winner takes all. Os pesos sinápticos
são ajustados na medida em que a rede recebe estímulos dos dados de entrada. Assim, o
mapa gradualmente desenvolve sua topografia de modo que determinadas regiões geo-
gráficas passam a guardar relação com características estatísticas da entrada fornecida
[4].
Para que a rede possa ser treinada adequadamente, os vetores de pesos sinápticos
são inicializados com valores aleatórios. O treinamento do SOM consiste em três etapas:
competição, determinação de vizinhança e ajuste sináptico [3, pp. 425-437].
Competição
O objetivo da etapa de competição é determinar o neurônio que será ativado para
cada vetor de entrada m-dimensional, representado por
49
𝒙 = [𝑥1, 𝑥2, … , 𝑥𝑚]𝑇
É importante destacar que os vetores dos pesos sinápticos devem ter a mesma
dimensão dos vetores de entrada. Portanto, em um mapa formado por l neurônios pode-
mos representar o vetor de pesos do neurônio j por
𝒘𝒋 = [𝑤𝑗1, 𝑤𝑗2, … , 𝑤𝑗𝑚]𝑇
O neurônio vencedor, denominado best matching unit (BMU), será aquele cujo
vetor de pesos for mais compatível com o vetor de entrada. O critério utilizado para de-
terminar essa compatibilidade é a distância euclidiana entre os vetores. Desse modo, a
BMU, denotada na Equação 5 por 𝑖(𝒙), será a unidade que tiver a menor distância eucli-
diana em direção ao vetor de entrada 𝒙.
𝑖(𝒙) = arg min‖𝒙 − 𝒘𝒋‖
Equação 5
Determinação de Vizinhança
Após a definição do neurônio vencedor, uma função de vizinhança é aplicada para
selecionar neurônios próximos à BMU, para que eles também sejam excitados e tenham
seus pesos ajustados. A função de vizinhança ℎ𝑗,𝑖 é simétrica e centrada ao redor da BMU,
representada por i. A Equação 6 corresponde à função Gaussiana, que é uma das funções
de vizinhança mais adotadas em SOM:
ℎ𝑗,𝑖 = exp (− 𝑑𝑗,𝑖
2
2𝜎2)
Equação 6
onde 𝑑𝑗,𝑖 é a distância entre um neurônio j e a BMU i.
Ao analisar a Equação 6, podemos notar que, quanto mais distante um neurônio
estiver em relação à BMU, menor é o valor da função de vizinhança. No local da BMU,
a função atinge a unidade, que é seu valor máximo.
Ajuste Sináptico
Os pesos sinápticos da BMU e de seus neurônios adjacentes são modificados em
relação ao vetor de entrada 𝒙, como indicado na Equação 7. O valor final do vetor 𝒘𝑗 no
tempo discreto n + 1 é calculado conforme a Equação 8.
50
∆𝒘𝑗 = 𝜂ℎ𝑗,𝑖(𝒙 − 𝒘𝑗)
Equação 7
onde 𝜂 é um parâmetro conhecido como taxa de aprendizado.
𝒘𝑗(𝑛 + 1) = 𝒘𝑗(𝑛) + ∆𝒘𝑗
Equação 8
A Figura A.4 ilustra uma grade bidimensional formada por 36 neurônios, onde é
possível visualizar a BMU e seus neurônios vizinhos, excitados pelo vetor de entrada e
pela função de vizinhança.
Figura A.4: SOM bidimensional, com BMU ativada e neurônios vizinhos excitados
O dégradé na coloração dos neurônios indica a intensidade do ajuste de seus pesos
sinápticos: quanto mais distante o neurônio estiver da BMU, mais suave será o ajuste.
Esse comportamento é consequência das características da função de vizinhança já dis-
cutidas, podendo ser facilmente verificado na Equação 6 e Equação 7.
A.4 – Algoritmo Kmeans
O algoritmo Kmeans tem como objetivo encontrar o particionamento ótimo para
dividir um número n de observações em k clusters, onde k é um valor inteiro previamente
definido. O procedimento ocorre da seguinte maneira [5]:
1. Inicializar os k centroides, que representam os centros de cada cluster. Eles
podem ser inicializados com valores randômicos ou com a aplicação de algo-
ritmos mais elaborados.
51
2. Para cada centroide, é calculada sua distância euclidiana em relação a todas as
observações. As observações são associadas ao cluster correspondente ao cen-
troide mais próximo.
3. Determinar as novas localizações dos centroides a partir da média das obser-
vações de cada cluster.
4. Repetir os passos 2 e 3 até que um critério de parada seja acionado, como a
convergência do algoritmo ou a execução de um número máximo de iterações.
[1] B. Yegnanarayana, Artificial Neural Networks, New Delhi: Prentice Hall of India,
2006, p. 18.
[2] P. D. Wasserman, Neural computing: Theory and Practice, New York: Van
Nostrand Reinhold, 1989.
[3] S. Haykin, Neural Networks and Learning Methods, Upper Saddle River: Pearson
Prentice Hall, 2009.
[4] T. Kohonen, Self-Organizing Maps, Springer, 2001.
[5] The MathWorks, Inc., “k-means clustering - MATLAB kmeans,” [Online].
Available: https://www.mathworks.com/help/stats/kmeans.html#buefthh-3.
[Acesso em 5 fevereiro 2018].