Uma Metodologia Nebulosa para Sistemas de Apoio Decisão ... · de conjutos "fuzzy" tipo 1 em...

10
I SBAI - UNESP - Rio Claro/SP - Uma Metodologia Nebulosa para Sistemas de Apoio à , Decisão sem oUSO de Arvores de Decisão Ronei Marcos de Moraes Depto. de Estatística [email protected] Ana Emília Machado de Arruda Depto. de Informática Centro de Ciências Exatas e da Natureza Universidade Federal da Paraíba Campus s/n - João Pessoa - PB CEP 58050 Resumo. É apresentada uma forma de se confeccionar Sistemas Especialistas sem a neces- sidade das árvores lógicas. Em seu lugar, utiliza-se uma composição de matrizes que trabalha todas as possibilidades de decisão e emite um parecer final. 1. Introdução. Os primeiros sistemas especialistas ou sistemas de apoio à decisão tiveram seu desenvolvimento baseado nos conceitos básicos da Inteligência Artificial. Tais sistemas tinham seus domínios limi tados a modelos onde os dados e informação tratados necessitavam ser exatos e precisos, pois esses podiam ser analizados utilizando-se operações básicas da álgebra e matemática convencionais. A representação da base de conhecimento em tais sistemas consistia de um conjunto de regras de inferência do tipo: Se X é AI, então BI Se X é A 2 , então 1" é B 2 Se X é A,,, então 1" é Bn onde AI/i> e BI/s (k = 1,2, ... , 17,) eram necessariamente valores numéricos precisos ou valores sirnlJólicos que poderiam ser valores lingüísticos de variáveis lingüísticas, mas satisfazendo às exigências da lógica clássica, onde cada sentença do tipo Xi é Ak ou li é Bk pode assumir um entre dois valores: O ou 1. Daí, dmante o processo de inferência, para que uma regra fosse satisfeita (valor ver- dade = 1) produzindo algum resultado, o estado do sistema, em certo momento, deveria coincidir exatamente a um dos lados esquerdos de regras antecedentes. A representação do conhecimento em sistemas reais torna-se bastante complexa, devido às exigências de que as regras sejam exatas e que, para cada estado do sistema exista uma coincidência com termos antecedentes, o que provoca a produção de um grande número de regras de inferência. Um caso desse tipo seria um sistema especialista de auxílio ao diagnóstico médico. A base do conhecimento, usando os princípios acima, seriam regras de inferência do tipo: Se X é AI , então 1" é Bl onde X é a variável lingüística sintoma, AI é um valor lingüístico de X, Y é a variável lingüística doença e BI é um valor lingüístico de Y. . Particularmente, no caso de doenças exantemáticas (sarampo, catapora, rubéola, etc.), a grande semelhança existente entre os quadros clínicos que caracterizam cada doença perten- cente ao grupo, podem tornar essa variedade de regras ainda maior. Algumas vezes, os sinais e/ou sintomas apresentados por esses pacientes chegam até mesmo a confundir o especialista - 500-

Transcript of Uma Metodologia Nebulosa para Sistemas de Apoio Decisão ... · de conjutos "fuzzy" tipo 1 em...

I SBAI - UNESP - Rio Claro/SP - Bra~il

Uma Metodologia Nebulosa para Sistemas de Apoio à ,

Decisão sem oUSO de Arvores de Decisão

Ronei Marcos de Moraes Depto. de Estatística

[email protected]

Ana Emília Machado de Arruda Depto. de Informática

Centro de Ciências Exatas e da Natureza Universidade Federal da Paraíba

Campus Univ~rsitário, s/n - João Pessoa - PB CEP 58050

Resumo. É apresentada uma forma de se confeccionar Sistemas Especialistas sem a neces­sidade das árvores lógicas. Em seu lugar, utiliza-se uma composição de matrizes que trabalha todas as possibilidades de decisão e emite um parecer final.

1. Introdução.

Os primeiros sistemas especialistas ou sistemas de apoio à decisão tiveram seu desenvolvimento baseado nos conceitos básicos da Inteligência Artificial. Tais sistemas tinham seus domínios limi tados a modelos onde os dados e informação tratados necessitavam ser exatos e precisos, pois esses podiam ser analizados utilizando-se operações básicas da álgebra e matemática convencionais.

A representação da base de conhecimento em tais sistemas consistia de um conjunto de regras de inferência do tipo:

Se X é AI, então Yé BI Se X é A2 , então 1" é B2

Se X é A,,, então 1" é Bn

onde AI/i> e BI/s (k = 1,2, ... , 17,) eram necessariamente valores numéricos precisos ou valores sirnlJólicos que poderiam ser valores lingüísticos de variáveis lingüísticas, mas satisfazendo às exigências da lógica clássica, onde cada sentença do tipo Xi é Ak ou li é Bk só pode assumir um entre dois valores: O ou 1.

Daí, dmante o processo de inferência, para que uma regra fosse satisfeita (valor ver­dade = 1) produzindo algum resultado, o estado do sistema, em certo momento, deveria coincidir exatamente a um dos lados esquerdos de regras antecedentes. A representação do conhecimento em sistemas reais torna-se bastante complexa, devido às exigências de que as regras sejam exatas e que, para cada estado do sistema exista uma coincidência com termos antecedentes, o que provoca a produção de um grande número de regras de inferência.

Um caso desse tipo seria um sistema especialista de auxílio ao diagnóstico médico. A base do conhecimento, usando os princípios acima, seriam regras de inferência do tipo:

Se X é AI , então 1" é Bl

onde X é a variável lingüística sintoma, AI é um valor lingüístico de X, Y é a variável lingüística doença e BI é um valor lingüístico de Y. .

Particularmente, no caso de doenças exantemáticas (sarampo, catapora, rubéola, etc.), a grande semelhança existente entre os quadros clínicos que caracterizam cada doença perten­cente ao grupo, podem tornar essa variedade de regras ainda maior. Algumas vezes, os sinais e/ou sintomas apresentados por esses pacientes chegam até mesmo a confundir o especialista

- 500-

I SBAI - UNESP - Rio Claro/SP - Brasil

e, por não apresentarem limites bem definidos, não permite excluir qualquer doença durante o processo de decisão. Quadros clínicos, traduzidos em linguagem natural, exigem significados precisos para que sejam utilizados nas árvores de decisão. E ainda, a grande semelhança entre os quadros clínicos dessas doenças provoca a geração de uma grande variedade de regras de inferência a fim de cobrir todas as possibilidades.

Surgiu, então, uma nova geração de sistemas especialistas a qual utiliza os conceitos da lógica "fuzzy" no desenvolvimento de sistemas de apoio à decisão. Existem duas vantagens principais adquiridas com o uso dos conjuntos nebulosos em sistemas especialistas: A primeira delas é um considerável aumento da capacidade de representação do conhecimento em lin­guagem natural, com o uso de variáveis lingüísticas, cujos valores são definidos por conjuntos "fuzzy" dependentes do contexto, ou seja, os valores associados a tais variáveis são avaliações subjetivas atribuídas por especialistas. Os significados desses valores lingüísticos são especifi­cados por funções de pertinência que, por sua vez, representam conjuntos nebulosos. Os valores dessas funções de pertinência são numéricos e, no entanto, não eliminam a subjetividade do valor lingüístico. A segunda, são os métodos de inferência baseados na lógica "fuzzy" provendo modos de raciocínio que são aproximados e inexatos como quase todos os modos de raciocínio humano. Assim, pode-se construir bases de conhecimento com regras do tipo:

Se X é AI.:, então Y é BI.: (k = 1,2, ... ,n)

sendo que A,.:'s e BI.: 's são, geralmente, valores lingüísticos de variáveis lingüísticas, os quais são representados por seus graus de pertinência em um esquema de representação de significados através de funções de pertinência.

Desse modo, as sentenças Xi é AI.: e lj é BI.: podem assumir quaisquer valores entTe ° e 1 e, se for observado que X é A', sendo que A' não coincide exatamente com nenhum A", pode-se chegar a conclusão Y é B', através de uma aproximação de racicínio. Existem ainda, as árvores de decisão e apenas permite-se fazer uma aproximação para alguma sentença conhecida se não houver um casamento exato.

A idéia básica usada para o desenvolvimento de um sistema especialista de auxílio ao diagnóstico médico consiste na representação da base de conhecimento através de conjuntos "fuzzy". E ainda, as operações para tratamento dessa base de conhecimento e das informações fornecidas ao sistema pelo especialista sobre o paciente são operações da Teoria de Conjuntos Clássica extendidas aos conjuntos nebulosos, ao contrário das árvores de decisão ou uso de regras de inferência.

A base de conhecimento para tal sistema consiste de uma matriz cujos elementos são graus de pertinência dos sintomas em conjuntos nebulosos que definem as doenças. Assim, cada coluna da matriz representa uma doença e cada linha representa os gralLs de pertinência de um determinado sintoma em cada uma das doenças definidas.

Antes de entrar nos detalhes da metodologia, torna-se necessário uma breve revisão às bases da teoria que possibilita essa abordagem.

2. Alguns. Aspectos Teóricos Úteis.

A Teoria dos Conjuntos clássica, admite que um conjunto seja uma união de vários elementos, reunidos em limites bem definidos. Desta forma, um elemento pode pertencer ou não ao conjunto em questão, assumindo dois estados booleanos: 1, se pertence, e 0, caso contrário. Um conjunto "fuzzy" é uma classe de conjuntos que admite a possibilidade de pertinência parcial neles, ou seja, são caracterizados por não possuírem limites bem definidos. A Teoria de "Fuzzy Sets" foi introduzida por Zadeh (1965). Segundo o próprio Zadeh, a justificativa pode vir de um simples exemplo do tipo: Quem pertence à classe dos números reais muito maiores que um'? Logicamente, cada qual responderá a essa questão de forma subjetiva, segundo o seu próprio entender do conceito de proximidade.

- 501-

I SBAI - UNESP - Rio Claro/SP - Brasil

Definição 1 [Kandel (1986)]. Seja U = {x} denotando um espaço de objetos. Então um conjunto "fuzzy" A em U é um conJunto de pares ordenados

A = {X,f.LA(X)},X E U

onde f.LA(X) é denominado o grau de pertinência de x em A e é um número no intervalo [O; 1] . . Os extremos do intervalo representam respectivamente o não pertencimento e o total pertcnc'Ítnento ao conjunto "fuzzy".

Exemplo 1: Vamos abordar o exemplo dado inicialmente sob uma forma um pouco mais restri­

tiva. Pensemos no caso de um subconjunto A definido da seguinte forma: A="Números inteiros próximos de cinco". O universo em discussão pode ser considerado o conjunto dos números inteiros. Um possível subconjunto contendo os elementos próximos de 5, usando a representação clássica de conjuntos, seria, por exemplo, A = {4, 5, 6}. No entanto, observa-se que o conceito de proximidade é um tanto subjetivo, e assim, a teoria clássica dos conjuntos não é conveniente para representar conjuntos onde as restrições para o mesmo não são exatas e precisas. Poderíamos considerar, por exemplo, que 5 é muito próximo de 5, enquanto que, 4 e 6 são próximos de 5, mas não tão próximos quanto o próprio 5 e assim por diante. Poderíamos definir uma possível função de pertinência da seguinte forma:

() 0.1 0.4 0.7 0.9 1.0 0.9 0.7 0.4 0.1

f.LA x = 1 + 2 + 3 + ""4 + 5 + 6 + 7 + 8 + g-ou seja, os valores de pertinência crescem à medida que se aproxima de cinco e decrescem à medida que se afasta. Desta forma, conclui-se que apenas o valor cinco pertence totalmente ao conjunto A e que os demais pertencem parcialmente a ele. Os valores não definidos estão definitivamente excluídos de pertencerem a A.

Funções características definidas como mapeamentos de elementos de um subconjunto A do universo de disclU"sO no intervalo [0;1] representam conjuntos "fuzzy" do tipo 1. De um modo geral, conjuntos "fuzzy" tipo k têm suas funções de pertinência definidas como mapeamentos de conjuntos "fuzzy" tipo (k -1) no intervalo [0;1]. Particularmente, conjuntos "fuzzy" tipo 2 são representados por funções de pertinência entendidas como mapeamentos de conjutos "fuzzy" tipo 1 em [0;1]. Os conjuntos nebulosos do tipo 2 são particularmente interessantes devido ao fato de que os graus de pertinência não podem ser obtidos facilmente nas mais variadas situações práticas [Kandel (1986)]. .

No exemplo 1, os valores assumidos pela variável x, que representa um elemento genérico do universo de discurso X, eram apenas valores numériGos. Ocorre, porém, que os conceitos humanos são um tanto subjetivos, não sendo conveniente representá-los através de valores numéricos. Existe, então, a possibilidade de x ser uma variável lingüística, e daí, assumir valores lingüísticos. Uma variável lingüística é definida como sendo uma variável cujos valores são palavras ou sentenças formuladas em uma linguagem natural ou artificial.

Um exemplo de uma variável lingüística seria a variável idade assumindo valores lingüísticos, tais como, jovem, muito jovem, velho, não muito velho, muito velho, etc. No caso da variável lingüística idade, a correspondente variável numérica pode ac;sumir valores como X = {1,2, ... ,100}, os quais constituem um conjunto chamado variável base para idade. Desse modo, valores lingüísticos de idade podem ser considerados conjuntos "fuzzy" onde o universo de discurso é a variável base de idade, e as funções de pertinência representantes desses conjuntos constituem os significados dos valores lingüísticos. Um possível conjunto de termos de idade seria:

T('idade) = m:uito J'o'uem + jovem + pouco jovem + pouco velho + velho + + nw'Íto velho

- 502-

I SBAI - UNESP - Rio Claro/SP - Brasil

Cada valor lingüístico mencionado acima pode ser representado corno sendo um subconjunto "fuzzy" de X, corno por exemplo,

() 0.0 0.4 0.8 0 ~ 9 1.0 0.9 0.8 0.0

J.Ljouem X = T + ... + 10 + ... + 16 + 17 + 18 + ... + 25 + 26 + ... + 100

sendo J.Ljovcm(x) entendida corno o significado do valor lingüístico jovem com relação à variável base x.

Por outro lado, existem certas variáveis lingüísticas, tais corno, aparência e simpatia, as quais não apresentam urna variável base bem definida, ou seja, não se sabe corno expressar valores para a variável base de aparência em termos de medidas exatas.

Um possível conjunto de valores lingüísticos para a variável aparência seria:

T(aparência) = muito bonita + bonita + atmente + pouco bonita + + feia + muito feia

sendo que não existe urna variável base numérica para a variável aparênCia. Escutamos frases do tipo "Maria é bonita", "Marta é muito bonita", "Fabiana é

feia" ou "Lívia é muito feia". Essas associações de valores lingüísticos da variável lingüística aparência a objetos de urna classe é totalmente subjetiva e ba"eada apena" em impressões humanas que variam entre pessoas diferentes.

Dessa forma, alguém poderia achar que os valores de pertinência associados à classe de mulheres bonitas seria

() 1.0 0.8 0.3 0.0

J.LA x = -- + -- + . + --Marta Maria Fabiana Lívia

sendo A um conjunto "fuzzy" de mulheres bonitas. Tal conjunto A denota o significado do valor lingüístico bonita dentro de urna classe de objetos bem definidos: mulheres. Observa-se a grande facilidade proporcionada pela Teoria dos "Fuzzy Sets" na representação de expressões lingüística", assim corno, na definição de seus significados em termos de funções de pertinência, cujos valores são exatos e precisos.

Pelo fato de que na Teoria de Conjuntos Nebulosos não há limites bem definidos, também não se pode atribuir probabilidades em seu sentido usual. Dessa forma, foi criada uma medida análoga denominada Possibilidade, cuja função distribuição de possibilidade é definida corno numericamente igual à função de pertinência, ou seja:

Cabe aqui urna observação importante acêrca do conceito de distribuição de possibi­lidades: a sua natureza é não-estatística. Corno consequência, não se pode tentar estabelecer relações entre urna distribuição de possibilidades de um conjunto e sua distribuição de proba­bilidades de forma direta.

Porém, dependendo da problemática, a interpretação através da Possibilidade pode não ser razoável. Assim, na Teoria "Fuzzy" existe também urna medida de probabilidade de urn evento neb'uloso, definida corno sendo [Moraes e Arruda (1993)]:

Definição 2. Seja (Rn, cP, P) um espaço de probabilidade onde cP é urna a-álgebra de Borel em Rll e P é a medida de probabilidade sobre Rn. Então, um evento "fuzzy" em Rn é um conjunto A em Rll, cuja função de pertinência J.LA(;i,A : Rn ~ [0,1]) é Borel mensurável. A probabilidade de um evento "fuzzy" A é dennida pela integTal de Lebesgue-Stieltjes:

P(A) = r /-LA (x )dP iRn = E(J.LA)

- 503-

( SBAI - UNESP - Rio Claro/SP - Brasil

Até aqui não foram discutidas as operações possíveis s.obre conjuntos nebulosos. Como é possível pensar nesses conjuntos como uma generalização ou extensão dos conjuntos clássicos, é de se e:;perar também que haja condições para que as operações destes últimos possam ser preservadas. Natmalmente, isso existe e é denominado Pr'incípio da Extensão [KandeI1986)]. Tal princípio permite que uma grande variedade de ferramentas aplicadas a modelos exatos e precisos possa ser adaptada à manipulação de modelos imprecisos.

Esse breve "review" serve como base para mostrar que poucos conceitos nebulosos podem ser de enorme utilidade.

3. A Metodologia.

Fechado esse breve parênteses sobre a Teoria dos "Fuzzy Sets", passa-se a analisar como isso pode ser aplicado ao caso em estudo.

Inicialmente, observa-se como seria a interpretação de cada nível lógico. Em um caso médico, considera-se que cada sintoma corresponda a uma variável lógica que pode assumir os valores O ou 1. Quando se diz que certa pessoa tem febre, significa dizer em termos lógicos, que a variável febre assume o valor lógico 1. Caso contrário, isto é, quando dizemos que tal pessoa não possui febre, atribui-se o nível O à variável febre.

No entanto, certos sintomas, ou mesmo a maioria deles, têm .variações próprias. No caso da variável febre, normalmente ouve-se as expressões: "febre alta", "febre de 38 graus", "febre baixa" ,etc. Observa-se que febre é uma variável que pode assumir naturalmente, valores numéricos (38 graus) ou lingüísticos (alta, baixa). Um sistema de auxílio ao diagnóstico médico baseado nas árvores de decisão e lógica clássica necessitaria de uma base de conhecimento contendo todas essas possíveis variações para cada um dos sintomas. Assim, febre alta, febre de 38 graus e febre baixa seriam variáveis distintas com significados exatos para o sistema. A necessidade de se considerar todas essas variações de um único sintoma reside no fato de que certas doenças caracterizam-se apenas dentro de uma faixa específica de valores do sintoma, isto é, um sub-nível do sintoma. Dessa forma, a informação de que o paciente apresenta febre pode ser incompleta para a produção de resultados razoáveis, de modo que todas as .doenças que se caracterizam por qualquer variação de febre, seriam incluídas no diagnóstico final. Na lógica clássica, se forem consideradas as variações de febre como sendo características diferentes de doenç:as diferentes, deve-se ter uma variável para cada variação do sintoma (febre alta, febre baixa) a fim de identificá-los como sintomas distintos.

N a lógica "fuzzy", as variações de determinado sintoma podem ser representadas de forma mais simples. Podemos considerar o sintoma como sendo um conjunto nebuloso, cuja função de pertinência faz o mapeamento de valores da escala do sintoma no intervalo [O; 1]. Esta função de escala pode ser interpretada como uma função de pertinência daquela determinada variação do sintoma na escala. No caso do sintoma febre, o conjunto dos números reais no intervalo [36; 43] graus Celsius seria a sua base de valores. Logo, tem-se uma função representando o mapeamento de um subconjunto dos reais no intervalo [O; 1], significando a pertinência de cada valor possível de febre na escala de valores. No entanto, febre pode assumir também, valores lingüísticos do tipo: alta, baixa ou normal (não febre). Nesse caso, cada um desses valores lingüísticos constitui-se um intervalo na variável base. Por exemplo, febre alta cOlTesponde aos valores de (38,5; 43, O] graus. Assim, tanto valores numéricos como valores lingüísticos podem ser passados como entrada no sistema. Então, a metodologia a ser empregada utiliza-se de uma função de escala para a construção do vetor de entrada, podendo esta ser composta por valores numéricos ou lingüísticos indistintamente.

Após a construção do vetor de entrada, o próximo pa'3SO é a construção da matriz de decisões que é dinâmica e refeita a cada vetor de entrada, utilizando-se o artifício do conjunto nebuloso do tipo 2. Cada doença é definida como sendo um conjunto nebuloso, cuja função

- 504-

I SBAI - UNESP - Rio Claro/SP - Brasil

de pertinência faz o mapeamento de alguns sintomas no intervalo [Oi 1], ou seja, cada um dos possíveis sintomas que possam servir de entrada para o sistema possui um certo grau de pertinência no conjunto nebuloso que constitui cada doença. Por exemplo, uma doença D pode ser caracterizada por febre alta ou dependendo da resistência da pessoa por ausência de febre, originando uma função de pertinência do tipo:

0.9 0.4 f-LD = + ----

febre alta não febre

onde 0.9 significa que é alta a pertinência da "febre alta" para a doença D e 0.4 mostra um grau de pertinência baixo para o sintoma "não febre" para a mesma doença.

Desta forma, os sintoma.s são acondicionados em uma função de pertinência para uma determinada doença e simplifica toda a abordagem.

o valor obtido no mapeamento de escala passa pela função de pertinência e adquire o valor daquele sintoma específico para cada uma das doenças em questão. A restrição à essa função-escala é que ela seja monotonamente crescente, para que um mesmo ponto no contra­domínio não seja função de mais um ponto no domínio. O valor da pertinência do sintoma é ponderado pela probabilidade clássica do sintoma dado a doença, ou seja, o total de sintomas que o paciente possui sobre o total de sintomas possíveis. O produto da possibilidade pela probabilidade clássica é a probabilidade nebulosa.

Por exemplo, um paciente registra o sintoma de febre em 38.5 graus. Mapeada por sua escala, encontra-se uma pertinência hipotética em 0.7 que, mapeado agora pela função de pertinência da doença, obtém o grau em 0.9, significando que o sintoma é altamente pertinente à doença em questão. Se, no conjunto geral de sintomas, o paciente apresentar todos os sintomas que compõem a matriz, a probabilidade clássica será a unidade. A multiplicação da pertinência (possibilidade) pela probabilidade resulta em 0.9. Quando da multiplicação do vetor pela matriz: 0.7 * 0.9 = 0.63. Pode-se notar que o valor resultante é próximo do próprio 0.7. Percebe-se agora que, no caso da doença compatível, espera-se que a soma aritmética dos valores das variáveis do vetor de entrada seja próximo do valor da resposta dada pela doença compatível. A resposta pode não ser única, visto que o critério é de proximidade, então o sistema indica todas as possíveis respostas e suas possibilidades para realmente auxiliar a decisão e não decidir . pela pessoa que o utiliza.

4. Estudo de Caso.

Será estudado de forma exaustiva um caso médico, onde as sintomáticas de várias doenças são parecida.s, alterando-se apenas as intensidades dos sintomas e, em alguns casos, havendo a possibilidade de que a doença admita que um determinado sintoma tenha mais de um nível possível. Nesse caso, a necessidade de um sistema especialista se dá principalmente quando o caso não é de natmeza simples e há vários diagnósticos possíveis. Simulando um caso deste tipo, propÇíe-se o estudo de um caso no qual a sintomática é descrita exclusivamente por variáveis lingüísticas, quanto à intensidade de cada sintoma. As variáveis são:

- 505-

I SBAI - UNESP - Rio Claro/SP - Brasil

Variáveis Febre Pressão

Dor-de-cabeça Dores nas juntas

Diarréia

Níveis Normal, Baixa, Alta Baixa, Normal, Alta

Ausente, Fraca, Moderada, Forte Ausente, Fraca, Moderada, Forte Ausente, Fraca, Moderada, Forte

Para esse conjunto de variáveis, pode-se visualizar doenças com sintomáticas seme­lhantes . Vê-se abaixo, cinco sintomáticas do tipo:

1.0 0.8 0.2 /1DI = c 1 I + - I + - 1+ le )re norma pressao a ta pressao norma

0.7 0.3 + + + Dor-de-Cabeça moderada Dor-de-Cabeça forte

1.0 0.8 0.3 + D . f, + D';' d d + D' ;. c ores nas Juntas orte larrela mo era a IarreIa lorte

0.8 0.3 0.9 /1 D, = c b b' + c b I + - I + - le re aIxa le re a ta pressao a ta

0.2 1.0 + pressão baixa + Dor-de-Cabeça forte +

0.9 . 0.3 + Dores nas juntas moderada + Dores nas juntas forte +

1.0 + D' ;. c IarreIa lorte

1.0 0.9 0.9 J.LD3 = febre baixa + pressão baixa + Dor-de-Cabeça forte +

1.0 0.9 + D ' + D' ;. c ores nas Juntas ausente Iarrela 10rte

0.8 0.7 0.9 /1D4 = c b b' + . - I + D d C b + le re alxa pressao norma 01'- e- a eça ausente

0.6 0.9 0.2 + D . c + D' ;. c + D' ' ;. d d ores nas Juntas 10rte laITeIa lorte IarreIa mo era a

0.9 0.8 0.7 J.L D. = f' b I + - I + - 1+

o e re a ta pressao a ta pressao norma 0.8 0.3

+ + + Dor-de-Cabeça moderada Dor-de-Cabeça forte 0.7 0.9

+ D . f + D';' t ores nas Junta.,> raca Iarrela ausen e

Desta forma, o vetor de dados lingüísticos de um hipotético paciente pode ser:

Febre baixa, Pressão alta, Dor-de-cabeça forte, Dores nas juntas forte e Diarréia forte.

O Diagnóstico mais provável é a doença D2' porém o sintoma "dores nas juntas forte" possui um grau de pertinência muito baixo: apenas 0.3.

Inicialmente, os dados do paciente são mapeados nas respectivas funções de escala para cada sintoma. A função de escala é uma função contínua de possibilidade do tipo "número s"

- 506-

I SBAI - UNESP - Rio Claro/SP - Brasil

[Kandel (1986)]. Essa função levará variáveis numéricas a um determinado ponto no contra­domínio [0,1] e uma variável lingüística através da sua variável-base a um intervalo no mesmo contra-domínio. Assim, cada sintoma aqui descrito, por ser em valores lingüísticos será ma­peado da seguinte fOl;ma:

Sintomas

Febre Baixa Pressão AI ta Dor de Cabeça Forte Dores nas Juntas Forte Dié.UTéia Forte

Pertinência.., nas Respectivas Escalas

[0.30,0.70] [0.70, 1.00] [0.60, 1.00] [0.65,1.00] [0.70, 1.00]

Pelo fato de se trabalhar com mapeamentos de intervalos e o vetor descritor ter de necessariamente ser formado de valores reais, o valor a ser escolhido para "representar" o intervalo será o valor médio das pertinências. Então, o vetor descritor será dado por:

E = (0.500 0.850 0.800 0.825 0.850 )

A seguir, monta-se a matriz, a partir desses mesmos dados. O que ocorre neste momento é que, como as informações são em valores lingüísticos, o mapeamento para o conjunto nebuloso do tipo 2 se dá pelos valores da vé.U'iável base, ou seja, cada sintoma possui uma vé.U'iável base, na qual cada valor lingüístico asssume um valor real. Assim, usa-se a função de escala para obter o valor real e, na sequência, analisam-se as pertinências de cada doença para a confecção da -rI/atriz de decisões. Os resultados são visualizados abaixo:

0.0 * i 0.8 * t 1.0*1 0.8 * 1 0.0 * t D=

0.8 * ~ 0.9 * g 0.0 * ~ 0.0 * ~ 0.8 * ~ 0.3 * ~ 1.0*g 0.9 * ~ 0.0 * ~ 0.3 * ~ 1.0*~ 0.3 * g 0.0 * ~ 0.6 * ~ 0.0 * ij 0.3 * 5 1.0*5 0.9 * 5 0.9 * 5 0.0 * 5

(000 0.80 0.60 0.48 0.00 0.64 0.90 0.00 0.00 0.32

= 0.24 1.00 0.54 0.00 0.12 0.80 0.30 0.00 0.36 0.00 0.24 1.00 0.54 0.54 0.00

Efetuando-se a multiplicação do vetor descritor pela nwtriz de decisões, obtém-se um novo vetor que é o veto7' de diagnóstico:

s = ( 1.6000 3.0625 1.1910 0.9960 0.3680).

O valor de cornpamção é o valor dado pela soma dos elementos do vetor descri­to'!' que resulta 3.825. A comparação se dá por uma função de p7'Oximidade, que é uma função contínua de possibilidade do tipo "número flat" [Dubois e Prade (1980)] e denota a pertinência de cada resultado com valor de comparação. Cada resultado de proximidade pode ser interpretado como a possibilidade de que o valor do vetor de diagnóstico seja compatível com a sintomática apresentada pelo paciente. Neste sentido, abaixo estão os valores das doenças e suas possibilidades:

- 507-

I SBAI - UNESP - Rio Claro/SP - Brasil

Doenças

Dl D2

D3 D4 D5

Possibilidades

0.000 1 .000 0.000 0.000 0.000

Apesar das conceituações parecidas para cada doença do sistema, a abordagem con­segue diferenciá-las de forma bastante razoável. Com esse tipo de resultado em mãos, um médico pode verificar toda'l as possibilidades de diagnóstico e não apenas um resultado "solto" dado pela máquina. Poderão ocorrer casos, nos quais dois ou mais resultados podem estar suficientemente próximos para não permitir um único parecer conclusivo. Nesses casos, a ex­periência profissional do médico deve ser decisiva para o diagnóstico final, coisa muito difícil para qualquer sistema especialista, mesmo para os de aprendizagem já citados anteriormente. Assim, pode-se dizer que essa abordagem procura ser uma "auxiliar" do médico e não emitir pareceres finais, mas orientações para um especialista em dúvida, ou ainda, na falta de uma junta médica, ser uma opinião a mais.

Pode-se pensar ainda no que aconteceria se a descrição não fosse puramente lingüística. Nesse caso, a mesma sintomática poderia ser definida como se segue:

Febre 37.8 graus, Pressão 18 x 9, Dor-de-cabeça forte, Dores nas juntas forte e Diarréia forte.

Nota-se que, ainda assim, não se pode dizer que essa descrição seja puramente numérica, visto que dor-de-cabeça e dores nas junta'l diarréia não podem ser quantificadas. Então, utilizando as mesmas funções de escala anteriores, as avaliações seriam alteradas so­mente para os dois primeiros sintomas que agora são pontuais e não intervalares. Dessa forma, as alterações podem ser vistas abaixo:

Sintomas

Febre 37.8

Pertinência'l nas Respectivas Escalas

0.325 Pressão 18 x 9. Dor-de-Cabeça Forte Dores nas Juntas Forte Diarréia Forte

0.830 [0.60, 1.00] [0.65, 1.00] [0.70, 1.00]

Assim, o mapeamento na função de pertinência da escala se altera em valores do primeiro e do segundo valores do vetor:

E = (0.325 0.830 0.800 0.825 0.850 )

Porém, corno a matriz de decisões não se altera, pois a sintomática é, em sua essência, a mesma, o vetor de diagnóstico também pouco se altera:

5' = (1.5872 2.9045 1.052 0.9120 0.3616 )

o valor de comparação agora vale 3.630 e através da sua pertinência dada pelo número "fiat", as possibilidades são as que se seguem:

Doenças Possibilidades

Dl 0.000 D'2 1.000 D3 0.000 D4 0.000 D5 0.000

- 508-

I SBAI - UNESP - Rio Claro/SP - Brasil

Nota-se que não se alteraram as respostas finais. Isso reforça a condição de que as avaliações são segmas e a boa confiabilidade da metodologia.

5. Conclusões.

Pela explanação feita até aqui, pode-se observar que a metodologia tem gTandes possibilidades de utilização, visto que simplifica enormemente a tarefa de programação, tratamento de dados e auxilia o especialista a tomar decisões, mostrando todas as possibilidades de cada decisão.

Dentro dos casos testados aqui, ficou patente a enorme importância e a sutileza das funções de pertinência na modelagem do problema. É mostrado que toda essa sistemática só é possível devido à natureza da função de pertinência. Em [Moraes e Arruda (1993)] pode ser visto ainda que há a possibilidade de aplicação desta metodologia em casos tratados tradicionalmente pela lógica booleana com bons resultados.

Urna vantagem proporcionada pelo sistema se dá devido a possibilidade de entrada dos sintomas do paciente formuladas em expressões em linguagem pseudo-natural, como por exemplo "pressão normal", da mesma forma que é possível a entrada de valores numéricos. Assim, pode-se entrar no sistema com uma sintomática do tipo:

Febre 38,5 e Pressão baixa

Isso possibilita que um paciente apresentando normalmente um estado de pressão baixa, pode ser clasificado com uma entrada "pressão normal", o que não implica em falsos diagnósticos pela má caracterização do sintoma.

Porém, a "boa nova" deste tipo de sistema é a possibilidade da incorporação de novas informações através exclusivamente do banco de dados do sistema, sem a necessidade de alterações no "software" que o implementa. As alterações se limitarão a parâmetros de otimização do sistema. Assim, para se compor uma nova doença, no ca.so médico, desde que ela não necessite de uma sintomática diferenciada, pode-se fazê-lo acrescentando a sintomática através de sua função de pertinência no arquivo que compõe o banco de dados do sistema .

. Dessa forma, após a definição de um novo conceito, o seu manuseio pelo sistema se dá de forma automática.

Um possível avanço para este tipo de sistema poderia ser a adaptação de técnicas de aprendizado automático, as quais poderiam alterar as funções de pertinência das doenças im­plementadas, à medida que fossem detectada.s possíveis imperfeições nos diagnósticos forneci­dos .

O "perigo" dessa metodologia, sem dúvida, está na definição das variáveis lingüísticas e de suas funções de pertinência, que formam o "cérebro" do sistema.

De maneira geral, pode-se concluir que há grande variedade de utilização dessa metodologia, principalmente quando se trata dados lingüísticos que é o forte da Teoria dos Conjuntos Nebulosos .

Referências.

L. A. Zadeh", "Fuzzy Sets" , Information and Control, v.8, 1965, pg 338-353. A. Kandel, Fuzzy Mathematical Techinics with Applications. Addison-Wesley Pub­

lishing Company - USA, 1986. D. Dubois and H. Prade, Fuzzy Sets and Systems - Theory and Applications. Aca­

clemic Press, USA, 1980. R. M. de IvIoraes e A. E. Iv!. de Arruda, Uma Metodologia para Sistemas Especialistas

sem a Utilização de Regras. Relatório Técnico UFPb no. DE-006j93, 1993, 21pp (no prelo).

- 509-

-- ----