Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento...

39
UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA CURSO DE BACHARELADO EM CIÊNCIA DA COMPUTAÇÃO Técnicas de Aquisição de Conhecimento para Sistemas Baseados em Conhecimento por LAURA SILVEIRA MASTELLA Trabalho Individual I TI número 1114 Profa. Dra. Mara Abel Orientadora Porto Alegre, abril de 2004

Transcript of Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento...

Page 1: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL INSTITUTO DE INFORMÁTICA

CURSO DE BACHARELADO EM CIÊNCIA DA COMPUTAÇÃO

Técnicas de Aquisição de Conhecimento para Sistemas Baseados em Conhecimento

por

LAURA SILVEIRA MASTELLA

Trabalho Individual I TI número 1114

Profa. Dra. Mara Abel Orientadora

Porto Alegre, abril de 2004

Page 2: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

2

Page 3: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

3

Sumário

SUMÁRIO............................................................................................................................................................................ 3 LISTA DE FIGURAS ....................................................................................................................................................... 4 LISTA DE TABELAS ...................................................................................................................................................... 5 RESUMO ............................................................................................................................................................................. 6 ABSTRACT......................................................................................................................................................................... 7 1. INTRODUÇÃO À AQUISIÇ ÃO DE CONHECIMENTO .......................................................................... 8

1.1. CLASSIFICAÇÃO DAS TÉCNICAS DE AQUISIÇÃO DE CONHECIMENTO.......................................................9 1.2. PROBLEMAS DA ELICIAÇÃO DE CONHECIMENTO.......................................................................................10 1.3. DIFERENÇAS ENTRE ENGENHARIA DE REQUISITOS E AQUISIÇÃO DE CONHECIMENTO.......................13

2. O QUE É CONHECIMENTO? ......................................................................................................................... 15 2.1. CLASSIFICAÇÕES DE CONHECIMENTO.........................................................................................................15

2.1.1. Níveis de Conhecimento......................................................................................................................... 15 2.1.2. Categorias de Conhecimento................................................................................................................ 16 2.1.3. Outras dimensões do conhecimento..................................................................................................... 17

3. TÉCNICAS DE AQUISIÇÃO DE CONHECIMENTO............................................................................. 21 3.1. IMERSÃO NA LITERATURA.............................................................................................................................21 3.2. ENTREVISTAS ..................................................................................................................................................22

3.2.1. Entrevistas não -estruturadas................................................................................................................. 22 3.2.2. Entrevistas estruturadas......................................................................................................................... 22 3.2.3. Questionários........................................................................................................................................... 24

3.3. CLASSIFICAÇÃO DE CONCEITOS OU DE FICHAS (CONCEPT SORTING OU CARD SORTING).....................24 3.4. ELICIAÇÃO DE CONSTRUTOS.........................................................................................................................26

3.4.1. Grades de repertório (repertory grids) ............................................................................................... 26 3.4.2. Laddering ................................................................................................................................................. 27

3.5. TÉCNICAS DE OBSERVAÇÃO .........................................................................................................................28 3.6. RASTREAMENTO DE PROCESSOS (TRACKING METHODS)..........................................................................29

3.6.1. Relatórios verbais....................................................................................................................................30 3.6.2. Relatórios não verbais............................................................................................................................ 31 3.6.3. Análise de Protocolos............................................................................................................................. 32

3.7. CONSTRUÇÃO DE GRAFOS.............................................................................................................................32 3.7.1. Grafos de Conhecimento........................................................................................................................ 33

3.8. TÉCNICAS APLICADAS EM ENGENHARIA DE SOFTWARE...........................................................................35 3.8.1. Brainstorming.......................................................................................................................................... 35 3.8.2. Prototipação............................................................................................................................................. 35 3.8.3. Cenários.................................................................................................................................................... 35 3.8.4. Etnografia................................................................................................................................................. 36

CONCLUSÃO...................................................................................................................................................................37 REFERÊNCIAS BIBLIOGR ÁFICAS....................................................................................................................... 38

Page 4: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

4

Lista de Figuras FIGURA 2.1. A ESPIRAL DO CONHECIMENTO (MODIFICADO DE [NONAKA, 1995 #15]) .............................................20 FIGURA 3.1. CONJUNTO DE OBJETOS SEPARADOS EM DOIS, SEGUNDO OS CRITÉRIOS "VEÍCULOS" E "ANIMAIS"...25 FIGURA 3.2. CONJUNTO 1 SEPARADO EM DOIS CONJUNTOS SEGUNDO OS CRITÉRIOS "VEÍCULOS TERRESTRES" E

"VEÍCULOS AQUÁTICOS"...........................................................................................................................................25 FIGURA 3.4. GRAFO DE CONHECIMENTO REPRESENTANDO COMO AS EVIDÊNCIAS SÃO COMBINADAS PARA

SUGERIR UM DIAGNÓSTICO CLÍNICO (MODIFICADO DE [LEÃO, 1988 #4]) .........................................................34

Page 5: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

5

Lista de Tabelas TABELA 7.1. MODELOS DE QUESTÕES PARA ELICIAR INFORMAÇÃO ADICIONAL EM ENTREVISTAS

ESTRUTURADAS (MODIFICADO DE [SCHREIBER, 1999 #2]) .................................................................................23 TABELA 7.2 MATRIZ RESULTANTE DO USO DA TÉCNICA DE GRADE DE REPERTÓRIO (MODIFICADO DE [TURBAN,

1992 #1]) ....................................................................................................................................................................27

Page 6: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

6

Resumo

Aquisição de conhecimento (AC) para Sistemas Baseados em Conhecimento (SBC) pode ser definida como o processo de compreender e organizar o conhecimento de várias fontes. É a atividade inicial do processo de Engenharia de Conhecimento, e ao mesmo tempo é o gargalo no desenvolvimento dos sistemas, pois ainda não existe uma metodologia confiável de aplicação que resulte em um modelo confiável do domínio e dos processos cognitivos de seus agentes. Mesmo assim, é uma tarefa indispensável para que as informações essenciais sejam coletadas e o conhecimento chave fique disponível para ser organizado, representado, implementado e validado através de um sistema.

Esse trabalho vai apresentar uma revisão dos principais assuntos relacionados à tarefa de aquisição de conhecimento de fontes humanas: o que, afinal, entendemos por conhecimento? Quais os principais problemas e limitações da tarefa de eliciação desse conhecimento? Porque existem técnicas diversas para se eliciar conhecimento para sistemas baseados em conhecimento e para sistemas de informação? Ainda é apresentado um levantamento das principais técnicas utilizadas na Engenharia de Conhecimento, suas vantagens e desvantagens de aplicação e por fim são demonstradas algumas técnicas utilizadas na engenharia de software, para demonstrar a diferença de objetivos e métodos.

Palavras-chave: Aquisição de Conhecimento, Engenharia de Conhecimento

Page 7: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

7

Abstract

Knowledge acquisition (KA) for Knowledge-based Systems (KBS) can be defined as the process of understanding and organizing the knowledge of different sources. It is the initial activity of the process of Knowledge Engineering, and it is also the bottleneck in the systems development, therefore there is still no trustful methodology that results in a trustworthy domain model and agents cognitive processes representation. Even so, it is an indispensable task so that the essential information is collected and the knowledge is available to be organized, represented, implemented and validated through an application.

This work presents a revision of the main subjects related to the task of knowledge acquisition from human sources: what is knowledge, after all? Which are the main problems and limitations of the task of knowledge elicitation? Why there are different techniques to elicit knowledge for KBS and for Information Systems? A survey of the main techniques used for Knowledge Engineering is presented, the advantages and disadvantages of using one instead of another are demonstrated, and some techniques used in the software engineering are presented to demonstrate the difference in their objectives and methods.

Keywords: Knowledge Acquisition, Knowledge Engineering

Page 8: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

8

1. Introdução à Aquisição de Conhecimento Aquisição de conhecimento (AC) para Sistemas Baseados em Conhecimento (SBC) pode ser definida como o processo de compreender e organizar o conhecimento de várias fontes, que podem ser documentadas ou não. As fontes documentadas são, em geral, mapas, livros, filmes, manuais, bases de dados, diagramas, entre outras. O conhecimento não documentado reside na mente das pessoas que atuam no domínio, e a aquisição é por meio de interação direta.

Algumas definições de Aquisição de Conhecimento na literatura:

• “…é o gargalo na construção de Sistemas Especialistas”. [1]

• “… é a elicitação e captura do conhecimento em um formato estruturado". [2]

• “Processo de modelagem em que o conhecimento elicitado será um resultado do processo, e não o conhecimento já existente”. [3]

• “Levar pessoas a descrever como elas fazem o que fazem”. [4]

• ...“é o processo de extrair, estruturar e organizar o conhecimento de uma ou mais fontes”. [5]

• “...é o processo total de apreender o conhecimento e transferi-lo para o computador, representando-o em um formato utilizável pela máquina”. [6]

A AC é uma das atividades que constituem a Engenharia de Conhecimento, que é o processo completo de desenvolvimento de um SBC. As outras atividades são [5]: i) Representação de Conhecimento: o conhecimento adquirido é estruturado em um formalismo que pode ser compreendido pelo computador e é codificado na base de conhecimento; ii) Validação de Conhecimento: a base de conhecimento é ver ificada utilizando casos de testes; iii) Inferência: é feito projeto do software que permite que o computador faça inferências sobre o conhecimento adquirido; iv) Justificativa: projetar a capacidade do sistema de responder como uma certa conclusão foi derivada pela inferência. O engenheiro de conhecimento é o agente responsável por todas as atividades de desenvolvimento do SBC. Ele exerce o duplo papel de compreender o domínio da informação, para interagir com os detentores do conhecimento, e possuir o conhecimento necessário sobre computação, linguagens e ferramentas de inteligência artificial para selecionar o melhor ambiente e forma de implementar o sistema.

O processo de AC é identificado por pesquisadores como o gargalo da engenharia de SBC. Segundo Hayes-Roth [1]:

"A aquisição de conhecimento é um gargalo na construção de sistemas especialistas. O engenheiro de conhecimento deve agir como um intermediário, ajudando um especialista a desenvolver um sistema. Entretanto, como o engenheiro de conhecimento tem muito menos conhecimento de domínio do que o especialista, os problemas de comunicação impedem o processo de transferir a perícia para ‘dentro’ de um programa. O vocabulário usado inicialmente pelo especialista para falar sobre o domínio com um novato é freqüentemente inadequado para a solução de problemas; assim o engenheiro e o especialista devem trabalhar juntos para estendê-lo e refiná-lo. Um dos aspectos mais difíceis da tarefa do

Page 9: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

9

engenheiro de conhecimento é ajudar o especialista a estruturar o conhecimento de domínio, identificar e formalizar os conceitos do domínio.". Isso se deve a obstáculos como a multiplicidade de fontes e dos diferentes tipos e níveis de conhecimento que podem ser coletados. Além disso, a tarefa de se extrair informações de fontes humanas pode tornar-se um percalço, pois os problemas interpessoais influenciam na interação necessária para se coletar conhecimento.

O início da pesquisa em AC tinha como objetivo capturar o conhecimento utilizado em áreas como a de diagnóstico médico, nas quais os sistemas convencionais e a engenharia de software haviam falhado em prover sistemas eficazes [3]. Essa visão da aquisição levou ao paradigma da transferência de conhecimento, no qual a função principal do engenheiro de conhecimento é transferir a perícia de um especialista para um sistema de computador. A metáfora foi substituída pela visão de modelagem, em que a emulação da perícia envolve a construção de um modelo, onde um “modelo” é definido como seguem pelo dicionário Webster:

"uma representação, geralmente em miniatura, para mostrar a construção ou servir como uma cópia de algo."

A partir dessa nova visão da aquisição de conhecimento, as técnicas utilizadas se especializaram para diferentes tipos e níveis de conhecimento ou de domínio, e geram como resultado estruturas organizadas das informações coletadas, de forma que elas possam formar um modelo do conhecimento que baseia a perícia.

1.1. Classificação das Técnicas de Aquisição de Conhecimento As técnicas de aquisição de conhecimento podem ser classificadas em manuais e baseadas em computador, sendo essa última categoria dividida em semi-automáticas ou interativas, em que o especialista utiliza o computador com supervisão do engenheiro de conhecimento; ou totalmente automáticas, também chamadas de aprendizado de máquina, em que a aplicação de computador detém todo o processo de compreensão do domínio.

Essas duas últimas envolvem aplicações de redes neurais, ferramentas de modelagem como o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No entanto, ferramentas de aquisição automáticas ou semi-automáticas apresentam muitas desvantagens. A maior delas é o fato de serem generalizadas para qualquer domínio. O resultado da aquisição podem ser informações muito superficiais sobre o domínio, pois a ferramenta não se adapta conforme os construtos vão sendo compreendidos. Ferramentas automáticas só podem ser aplicadas quando existe uma fonte de informação compreensível pelo computador, ou seja, é limitada a fontes documentadas. Quando a ferramenta semi-automática é projetada especificamente para um domínio particular, é necessário efetuar um processo de aquisição de conhecimento prévio, para identificar a melhor maneira de a ferramenta coletar informações dos usuários: descrição textual? Diagrama? Formulários dirigidos ou seqüência livre de descrição? Por esses motivos, este trabalho considera a etapa manual de aquisição de conhecimento a mais importante para se extrair as informações mais relevantes e significativas sobre o domínio.

Page 10: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

10

Além da classificação anterior, as técnicas de AC são também divididas conforme a fonte de onde se extrai o conhecimento. Quando são utilizadas para extrair informações de fontes humanas (em vez de fontes documentadas) elas são chamadas de técnicas de eliciação 1 de conhecimento. A maior parte das técnicas manuais de eliciação de conhecimento são originárias de estudos da psicologia e são todas caracterizadas por serem um tipo de entrevista, mas com uma estrutura bem definida e específica para o tipo de conhecimento que se deseja adquirir.

As pessoas de quem o conhecimento pode ser extraído são os agentes do domínio, e sua denominação muda conforme o ambiente de trabalho: em ambientes empresariais temos funcionários, gerentes, estagiários, usuários, trabalhadores de conhecimento [8]. Em ambientes acadêmicos temos pesquisadores, estudantes, professores, assistentes de pesquisa. Mas em quase todos domínios existe um agente que se destaca pela capacidade de desenvolver métodos particulares de lidar com os problemas: o especialista. Especialistas desenvolvem estruturas de armazenamento de informação particulares à aplicação, onde agrupam informações relacionadas com índices de acesso muito eficientes. Estas estruturas tendem a ser mais enxutas e eficazes no reconhecimento de situações do domínio do que as que os novatos utilizam [9, 10]. Por esses motivos, o especialista é considerado a melhor fonte de conhecimento para uma tarefa de AC.

1.2. Problemas da Eliciação de Conhecimento Existem muitos fatores que contribuem para os problemas na aquisição de conhecimento de fontes humanas utilizando técnicas manuais (ou seja, variações de entrevistas). Uma das principais limitações do início do processo é o fato de o engenheiro e o especialista “não falarem a mesma língua”, ou seja, o engenheiro pode começar as entrevistas sem estar ciente dos conceitos básicos do domínio. Hayes-Roth [1] em 1983 já dizia que o vocabulário inicialmente usado pelo especialista para falar sobre o domínio com um novato (nesse caso, o engenheiro) é inadequado para a solução de problemas. Isso acontece porque quando o especialista detecta que não está sendo compreendido nos termos triviais (mas específicos de sua área), ele precisa utilizar termos gerais, que podem ser compreendidos por leigos. Mas esses não são os termos que expressam sua maneira natural de pensar e resolver problemas sobre o domínio. Além disso, existem problemas inerentes do processo de interação entre pessoas e do tipo de conhecimento a ser adquirido. Boose [11] cita alguns em seu levantamento de técnicas de aquisição:

• As linhas de raciocínio plausíveis para o engenheiro são aquelas que podem ter menos relação com o método real de solução do problema do especialista.

• Em geral, se obtém conhecimento acadêmico (superficial) em lugar do conhecimento compilado do especialista.

• Especialistas podem estar inseguros com a tarefa: podem ter medo de perder seus empregos; podem não aprovar computadores em seu domínio privado; podem não

1 O termo em inglês “elicitation” é traduzido por “elicitação” em grande parte dos trabalhos que estudam técnicas de aquisição. Mas a melhor tradução seria “eliciação”, do verbo “eliciar” que significa, conforme o dicionário Aurélio [7]: fazer sair; expulsar; extrair uma resposta ou reação de; extrair enunciados ou julgamentos lingüísticos de (informante).

Page 11: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

11

querer expor seus métodos de solução de problemas para o escrutínio de colegas ou do público em geral.

• O engenheiro pode não ser treinado em técnicas de entrevista ou o especialista pode não ter capacidade de introspecção sobre sua forma de pensar.

• A análise dos resultados da aquisição (análise de protocolos) é trabalhosa, propensa a erros de interpretação, e resulta uma série de amostras de comportamento aleatórias do especialista que precisam ser sintetizadas pelo engenheiro de conhecimento.

Outras características que podem limitar o processo são expostas no estudo disponível no sítio da Epistemics [12]:

• A maior parte do conhecimento está na cabeça dos especialistas (em contrapartida às fontes documentadas);

• Especialistas armazenam grandes quantidades de conhecimento;

• Grande parte do conhecimento é tácito2;

• Eles não sabem tudo o que eles sabem e usam;

• Conhecimento tácito é difícil (quase impossível) de se descrever;

• Especialistas são pessoas muito valiosas para seu domínio, e, por isso, muito ocupadas;

• Cada especialista não sabe tudo;

• Conhecimento tem uma “shelf life”, ou seja, um período de validade antes de se tornar obsoleto.

Por esses motivos, pode -se compilar os objetivos da aplicação de técnicas de aquisição como segue. O processo de AC deve:

• ser sucinto o suficiente para tirar o especialista de seu trabalho por períodos não muito longos;

• utilizar abordagens psicológicas para melhorar a capacidade de expressão do entrevistado;

• permitir que o engenheiro de conhecimento incremente sua compreensão sobre o domínio;

• organizar as informações de maneira que não-especialistas compreendam o conhecimento coletado;

• focar no conhecimento essencial para a engenharia do SBC;

• capturar conhecimento tácito;

• Permitir que o conhecimento de diferentes especialistas ou de diferentes fontes seja integrado;

2 Conhecimento tácito será detalhado no capítulo seguinte.

Page 12: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

12

• Facilitar o processo posterior de análise de protocolos.

O trabalho de Shadbolt [13] apresenta o problema da falta de testes e avaliações dos métodos de AC. Nesse trabalho os autores não chega m a fazer testes de validação com ferramentas de AC e mostrar resultados da avaliação. Ele foca a discussão na metodologia que deve ser empregada para avaliar as técnicas de AC. Por exemplo, uma das dificuldades de avaliação apresentadas no artigo é o fato de que, na área da psicologia, um experimento típico deveria ser executado em uma amostra grande o suficiente para prover significado estatístico aos resultados. Entretanto, qualquer amostra de especialistas grande o suficiente (no mínimo 20 pessoas) seria difícil de reunir e muito caro para testar.

Uma série de experimentos realizados pela Universidade de Nottingham entre 1980 e 1990 se propunha a estudar duas questões. Primeiro, se as técnicas de AC são diferentemente eficazes, ou seja, não só a questão se uma técnica é melhor ou pior que a outra, mas até mesmo considerações sobre a complementaridade de técnicas. Em segundo lugar, a questão sobre os diferentes efeitos de se aplicar as técnicas em diferentes domínios, por exemplo, domínios comerciais e domínios acadêmicos. A intenção desse experimento não era revisar os resultados, mas sim, avaliar as avaliações feitas sobre as técnicas, tentando definir uma metodologia de validação de técnicas de AC. Os experimentos chegaram às seguintes conclusões sobre o que é necessário para se avaliar uma técnica:

• Saber separar problemas intrínsecos da técnica dos problemas da implementação/ interface/plataforma;

• Determinar em quantos/quais domínios/tarefas deve -se utilizar a técnica de AC;

• Definir quando é preciso usar mais de uma técnica de AC;

• Identificar quantas sessões de aquisição são ótimas.

Segundo o trabalho de Wagner e Chung [14] muito da pesquisa atual em AC é direcionada para o desenvolvimento de ferramentas e técnicas que podem ser usadas para automatizar o processo de aquisição. Mas quando é necessário revisar a literatura existente em KA para guiar ou escolher uma técnica apropriada de AC, torna-se claro que existe pouca pesquisa nisso. Os autores indicam uma série de perguntas a serem respondidas que contribuiriam com o amadurecimento da pesquisa em AC [15].

• Existe a melhor técnica de aquisição de conhecimento?

• Se não existe uma melhor, qual a melhor combinação de técnicas?

• Quais técnicas são mais apropriadas sob quais circunstâncias?

• Que habilidades são necessárias para utilizar essas técnicas?

• Alguns tipos de domínios são mais fáceis de se adquirir conhecimento?

• Existe relação entre técnicas de KA e alguns tipos de domínio?

• Alguns tipos de conhecimento são mais fáceis de serem adquiridos?

• Existe uma ligação entre domínios de conhecimento e técnicas utilizadas para adquirir esse conhecimento?

Page 13: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

13

O trabalho afirma, ainda, que a pesquisa em KA deveria se voltar para estudos de caso, em vez de para experimentos. Para confirmar essa hipótese, os autores definiram um estudo de aplicação das técnicas no domínio da Gestão de Produção e Operação (P/OM). Foram estudados os processos de desenvolvimento de 90 sistemas especialistas P/OM e os resultados relatam quais as técnicas mais utilizadas, quais os tipos de problemas predominantes e o impacto das técnicas e dos domínios de problemas:

• Treze dos noventa sistemas não apresentaram atividades de AC;

• Dos restantes, metade utilizou técnicas automáticas e metade, técnicas manuais;

• Técnicas mais populares eram entrevistas estruturadas e não estruturadas;

• Técnicas originárias da psicologia (p.ex., classificação de fichas) foram utilizadas em praticamente nenhum dos sistemas;

• Nenhum sistema estudado usou análise de protocolos;

• Os sistemas abrangeram quase todos os tipos de domínio;

• Problema mais popular é o de diagnóstico, seguido pelo de planejamento e projeto.

1.3. Diferenças entre Engenharia de Requisitos e Aquisição de Conhecimento Muitos trabalhos discutem se existe uma diferença essencial entre esses dois tipos de sistemas e entre os objetivos das disciplinas que estudam a coleta de requisitos para cada um deles. Shaw e Gaines [3] apresentam paralelos entre as duas áreas, como, por exemplo, a crítica aos paradigmas iniciais que definiam a aquisição:

Para SBC, a aquisição era vista como uma transferência de conhecimento, em que o engenheiro de conhecimento tinha a função de ‘transferir’ o conhecimento do especialista para o software. Similarmente, a aquisição de requisitos para SI era entendida como uma captura de requisitos , que era criticada da mesma forma: “Muito se fala de captura de requisitos, como se requisitos fossem borboletas que são apanhadas e pregadas em um gabinete de especificações” [16]. Ambas as metáforas foram substituídas pela visão de modelagem, que tem o objetivo mais realista de criar uma representação do conhecimento sobre o domínio e dos requisitos necessários. Afora essa analogia, pode-se indicar algumas diferenças no objetivo das técnicas, já que a definição dos dois tipos de sistema também é diferente.

Sistemas de informação não exigem tanto esforço na compreensão do domínio de aplicação. Em geral são sistemas desenvolvidos para solucionar problemas cujos passos já são conhecidos, na verdade seu maior objetivo é o de otimizar tarefas que podem ser facilmente automatizadas. Nesse contexto, a maior preocupação de um engenheiro de software reside em saber quais as entradas e saídas os futuros usuários esperam do sistema, e como elas devem ser coletadas e apresentadas. Por isso a tarefa é conhecida por engenharia de requisitos, pois esse é o foco da eliciação: os requisitos do sistema, ou seja, o que o usuário necessita que o sistema apresente.

Page 14: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

14

Sistemas de conhecimento, por outro lado, exigem que o engenheiro mergulhe fundo na compreensão do domínio, pois em geral a chave da boa performance de um SBC é ter implementado em suas linhas de código de maneira mais fidedigna os passos de raciocínio que o especialista segue na resolução de problemas, e apresentar em sua base de conhecimento um modelo similar à estrutura real do domínio. As entradas e saídas em geral não são um requisito de usuário, elas precisam ser identificadas pelo engenheiro de conhecimento, pois as entradas são as informações que disparam as linhas de raciocínio do especialista, e as saídas são suas interpretações e crenças sobre o domínio. Por vezes nem o próprio especialista sabe o que são suas entradas e saídas ao solucionar um problema.

O trabalho de Shaw e Gaines termina por afirmar que as técnicas de aquisição de conhecimento apresentam poucas características que são específicas para o desenvolvimento de SBC, e sugere que elas podem ser aplicadas tanto para coletar ‘conhecimento’ quanto para coletar ‘requisitos’ de SI, concluindo que deveria existir uma maior colaboração entre as duas áreas de estudo. A colaboração realmente deve ser maior, no sentido de que engenheiros de SBC por vezes não se preocupam com a maneira como as informações serão apresentadas aos usuários, o sistema é inteligente mas quase impossível de ser utilizado por sua falta de ergonomia. E SI podem tirar vantagens de técnicas que exploram o cerne do conhecimento de seus usuários.

As técnicas estudadas nesse trabalho são técnicas voltadas para aquisição de conhecimento e de requisitos do sistema. O agente responsável pela interação com o usuário ou com o especialista será chamado engenheiro (que pode ser o engenheiro de conhecimento ou de requisitos) ou de analista. Em geral, as técnicas que tem o usuário do sistema como foco de sua aplicação são aquelas originadas da ES, enquanto técnicas que se voltam para o especialista do domínio, são, em geral, aquelas utilizadas para adquirir conhecimento para SBC. Na apresentação de algumas técnicas, os participantes do processo de aquisição que são responsáveis por fornecer as informações são chamados agentes do domínio. Mas independentemente de sua origem, todas serão referenciadas, nesse trabalho, como técnicas que adquirem conhecimento, pois os requisitos de um sistema de informação não deixam de ser conhecimento dos usuários finais sobre a tarefa.

Page 15: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

15

2. O que é conhecimento? Dados, informação e conhecimento são três palavras freqüentes na literatura de engenharia de conhecimento. Elas são por vezes usadas como sinônimos, mas seus significados são levemente diferentes. Schreiber e colegas [17] descreve m as definições mais utilizadas, que criam uma demarcação na semântica dos termos:

Conhecimento: É tudo o que se usa para agir e criar novas informações. Conhecimento inclui a informação sobre o domínio e a forma como essa informação é utilizada para resolver problemas.

Exemplo: Maria tem mais de 18 anos. Maiores de 18 anos são responsáveis legais por seus atos. Maria será cobrada pelos danos.

Informação: Reconhecimento dos objetos do domínio, suas características, suas restrições e seus relacionamentos com os outros objetos, sem ater-se à utilidade dessa informação. É o dado com o seu significado associado.

Exemplo: Idade de Maria = 20 anos

Dado: Representação simbólica de um objeto ou informação do domínio sem considerações de contexto, significado ou aplicação. Sinais não interpretados, como os bits em um computador. Exemplo: 20 anos

2.1. Classificações de Conhecimento A Hipótese do Acesso Diferenciado afirma que diferentes técnicas de aquisição podem ser necessárias para eliciar diferentes tipos de conhecimento de um especialista [18]. Ainda que as evidências para essa hipótese sejam incertas, a eficácia e eficiência de diferentes técnicas, quando aplicadas experimentalmente, aparentam depender do tipo de conhecimento sendo eliciado [19]. As pessoas organizam e demonstram seus conhecimentos de diferentes maneiras. Isso favorece a teoria de que são necessárias diferentes técnicas: algumas induzem o agente a nomear os termos principais utilizados em seu domínio, outras produzem como resultado a seqüência de passos aplicados pelo agente para solucionar uma tarefa. É importante conhecer o tipo de conhecimento para o qual cada técnica se destina de maneira a criar uma metodologia de eliciação mais eficaz.

A seguir são descritos alguns dos principais "tipos" de conhecimento. Essa divisão não chega a ser taxionômica, pois os tipos não são disjuntos e ainda não há maneira de se fazer uma listagem extensiva de todas as maneiras diferentes nas quais o cérebro pode estruturar as informações. Mas é importante conhecer as formas básicas de organização de conhecimento, principalmente o conhecimento tácito, que é considerado o principal objetivo da tarefa de eliciação.

2.1.1. Níveis de Conhecimento Os níveis de profundidade em que um determinado domínio é compreendido podem ser muitos, mas podemos generalizá-los como a seguir [5, 20] :

Page 16: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

16

• Conhecimento superficial: Descrição de objetos do domínio; informações que se referem a problemas imediatos ou situações muito específicas e sua associação com a solução. Em geral representam a relação de entrada-saída de um sistema.

• Conhecimento do domínio: Apresentação da forma de resolver problemas num determinado domínio, na forma de descrições, heurísticas ou procedimentos, muitos deles sem base teórica.

• Conhecimento profundo: Estrutura interna e causal (relações de causa e efeito) dos objetos do domínio e suas interações. É baseado em um conjunto integrado e coeso de consciências que incluem emoções, senso comum, intuição, etc. É o conhecimento teórico do domínio que pode ser aplicado a diferentes tarefas e em mais de uma situação utilizando mecanismos de transferência e analogia. Este tipo de conhecimento é de difícil aquisição e trato computacional.

Para exemplificar a classificação, examinemos os níveis atingidos por um estudante tradicional de Francês (ou seja, que aprenda pelas técnicas convencionais e não as descritas no item anterior). Inicialmente, o estudante será capaz de reconhecer um conjunto de questões ou frases simples e aplicá-las no contexto adequado. O estudante sabe que ao ouvir a frase "Bonjour, comment allez vous? " ele deve responder preferencialmente com a frase "Bien, merci, et vous?". Ele possui conhecimento superficial do domínio e, se o conjunto for grande o suficiente, o estudante poderá se comunicar na maioria das situações do dia-a-dia.

Num segundo momento, o estudante domina a gramática da língua e reconhece as estruturas que devem ser respeitadas nas construções das frases. Ele não apenas utiliza as frases que aprendeu, mas é capaz de criar suas próprias frases e expressões sem ferir o idioma. Possui conhecimento do domínio.

Finalmente, o estudante decide aprofundar-se no estudo da Língua Francesa. Ele não só amplia seu vocabulário e domina as regras de gramática, mas compreende as raízes da língua, a origem de diversos termos, seu significado e aplicações precisos. Não necessariamente, esse estudante irá se comunicar melhor possuindo conhecimento profundo do Francês do que o fazia no segundo estágio, mas certamente terá um conhecimento com maior possibilidade de aplicação em outros domínios utilizando mecanismos como analogia (por exemplo, no aprendizado de algum outro idioma).

2.1.2. Categorias de Conhecimento Diferentemente da classificação e níveis, a categorização do conhecimento refere-se aos diferentes esquemas mentais que utilizamos para armazenar e associar as informações. Turban [5] define as seguintes categorias:

• Conhecimento declarativo: Basicamente, conhecimento declarativo descreve os aspectos estáticos do conhecimento, ou seja, o que são os objetos do mundo. O conhecimento factual é especificado, mas não o modo como aplicar esse conhecimento para solucionar problemas. São representados fatos, relacionamentos, objetos, atributos e outras características estáticas do domínio. É um conhecimento superficial.

Page 17: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

17

• Conhecimento procedimental: Abrange o conhecimento que está na forma de conjuntos de instruções. São os procedimentos que indicam como as informações declarativas podem ser utilizadas para realizar tarefas sobre domínio ou se fazer inferência sobre fatos gerando novas informações. Pode fornecer uma aplicação imediata para o conhecimento declarativo.

• Conhecimento semântico: Refere-se às estruturas cognitivas dos objetos e à forma como eles são armazenados em memória. Inclui informação sobre: palavras e outros símbolos; significado dos símbolos e regras associadas; relacionamentos entre símbolos como sinônimos e antônimos, e formas de manipulação dos símbolos e conceitos. É um conhecimento profundo.

• Conhecimento episódico: Descreve a ocorrência passada de problemas e suas soluções associadas, sendo armazenado de forma classificada e indexada, na memória de longa duração, que é onde são preservadas as informações depois de selecionadas e organizadas pela mente humana. É aquele conhecimento sobre situações que "fugiram à regra" e para os quais as inferências baseadas.

• Metaconhecimento: Conhecimento sobre o conhecimento, ou seja, as leis básicas que regem o mundo e a forma como os demais tipos de conhecimento podem ser aplicados. É o senso comum e as regras implícitas que adquirimos no contato com o mundo e que utilizamos indiretamente e inconscientemente para guiar todas as decisões. É um conhecimento profundo.

No exemplo do estudante de Francês, o conhecimento declarativo descreveria os vocábulos conhecidos do estudante agrupados em frases, ou mesmo as frases agrupadas através dos contextos onde se aplicam. O conhecimento procedimental descreveria as regras para selecionar as frases e aplicá-las, além de descrever os roteiros a serem seguidos em determinados contextos (ser apresentado a alguém ou ir a um restaurante, por exemplo). O conhecimento semântico guarda o dicionário dos vocábulos aprendidos, com sua etimologia e significado. O conhecimento episódico refere-se a instâncias reais de diálogos ou textos onde palavras e frases foram utilizadas com sucesso, podendo ser potencialmente reutilizadas com pequenas adaptações. O metaconhecimento define a forma geral como os vocábulos, frases e diálogos devem ser selecionados e aplicados, além de fornecer critérios para a verificação de resultado quando da aplicação dessas estruturas.

2.1.3. Outras dimensões do conhecimento

Conhecimento Tácito vs. Conhecimento Focal Um indivíduo pode possuir e utilizar conhecimento em diversos níveis de consciência. Segundo os estudos de Michael Polanyi [21], em cada atividade humana existem duas dimensões de conhecimento que são mutuamente exclusivas: o conhecimento sobre o objeto ou fenômeno que está em foco – conhecimento focal – e o conhecimento que é usado como uma ferramenta para manipular ou incrementar o que está em foco – conhecimento tácito . Essas duas dimensões são complementares para a realização de tarefas: o conhecimento tácito funciona como um suporte de fundo, ativado de maneira quase inconsciente.

Page 18: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

18

Habilidades que são difíceis de serem articuladas e transmitidas para outras pessoas devem ter uma grande proporção de conhecimento tácito, e é difícil para as pessoas tomarem consciência do conhecimento que suporta suas habilidades. Aquilo que pode ser expresso em palavras e números representa apenas a ponta do iceberg, do conjunto do conhecimento como um todo. Segundo Polanyi, “podemos saber mais do que podemos dizer”. Isso acontece porque o objetivo do conhecimento tácito é atuar como um contexto de fundo enquanto agimos, permitindo processar informações mesmo sem tê-las em foco, o que torna o processo mais eficiente. Entretanto, a maneira como esse conhecimento foi organizado e indexado no cérebro dificulta o acesso "focado", ou seja, a tomada de consciência desse conhecimento, e torna sua articulação quase impossível. Esse é o motivo pelo qual o estudo do conhecimento tácito é importante para o processo de eliciação de conhecimento. Especialistas utilizam conhecimento que foi internalizado por anos de experiência para executar as tarefas mais complexas de seus domínios de trabalho. Passos de raciocínio que outras pessoas precisariam tomar consciência para resolver o problema são analisados em background por especialistas, o que torna seu método de solução de problemas mais eficaz e eficiente. E para o desenvolvimento de sistemas baseados em conhecimento deve-se tentar capturar exatamente esse processo de solução.

No exemplo do aluno que estuda Francês: no início da aprendizagem as regras de construção de sentenças em Francês ainda não fazem parte do seu conhecimento tácito, pois ele não tem um tempo de experiência suficiente com a língua para poder interiorizá-las. Por isso, quando lê um texto em Francês, o aluno precisa tomar consciência da estrutura da frase relembrando algumas das regras de construção específicas da nova língua. Ao ler uma frase em Francês, ele precisará analisar cada palavra quase que isoladamente para lembrar sua tradução na língua materna. Só então vai começar a prestar atenção no significado geral da frase. O contrário também acontece: para falar ou escrever na nova língua é necessário tomar consciência da tradução de cada palavra da língua materna para o Francês, depois lembrar das regras de construção da língua e só então poder expressar a frase. Quando as regras gramaticais e o significado das palavras estiverem automatizados para o estudante (assim como já estão as da língua materna), ou seja, fizerem parte de seu conhecimento tácito, ele poderá ler um texto em Francês mantendo seu foco somente na compreensão geral do significado, e falar ou escrever sem precisar tomar consciência das palavras que precisará usar.

Conhecimento Implícito vs. Conhecimento Explícito O termo conhecimento tácito foi novamente citado no trabalho "The knowledge-creating company" de Nonaka e Takeushi [22]. Esse trabalho, entretanto, imprime um sentido diferente ao termo cunhado por Polanyi. Para Nonaka e Takeuchi, o conhecimento pode ser tácito ou explícito. Devido a forte influência do trabalho de Nonaka à literatura de Gestão de Conhecimento, o significado mais recente do termo tácito foi adotado. Contudo, alguns autores, como Stenmark [23] , dizem que teria havido menos confusão se Nonaka tivesse adotado o termo conhecimento implícito em vez de tácito. Este trabalho vai utilizar o termo implícito para se referir ao conhecimento como definido por Nonaka.

O pressuposto de Nonaka e Takeuchi é de que o conhecimento humano é criado e expandido através da interação social entre o conhecimento implícito e o conhecimento explícito. Chamam essa interação de “conversão do conhecimento” e observam que essa

Page 19: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

19

conversão é um processo social entre indivíduos, e não confinada dentro de um indivíduo, que era a visão de Polanyi.

Esses autores estabelecem quatro tipos de conversão do conhecimento que eles denominam de socialização, externalização, combinação e internalização (Figura 2.1).

Socialização: é um processo de compartilhamento de experiências e, a partir daí, da criação do conhecimento implícito, como modelos mentais ou habilidades técnicas compartilhadas. Sem alguma forma de experiência compartilhada é extremamente difícil para uma pessoa projetar-se no processo de raciocínio de outro indivíduo.

Externalização : é um processo de articulação de conhecimentos implícitos em conceitos explícitos e é provocado pelo diálogo ou pela reflexão coletiva. Pode utilizar-se de métodos não analíticos, tais como analogias e metáforas, quando as expressões verbais não forem suficientes para expressar os insights, vivências ou percepções dos indivíduos.

Combinação : é um processo de sistematização de conceitos em um sistema de conhecimento. Envolve a combinação de conjuntos diferentes de conhecimento explícito. Ocorre troca e combinação de conhecimentos através de meios como documentos, reuniões, ou redes de comunicação computadorizadas.

Internalização : é o processo de incorporação do conhecimento explícito no conhecimento implícito. É intimamente relacionada ao “aprender fazendo”. Quando são internalizadas nas bases do conhecimento implícito dos indivíduos sob a forma de modelos mentais ou know-how técnico compartilhado, as experiências através da socialização, externalização e combinação tornam-se ativos valiosos. Esse conhecimento implícito acumulado precisa ser compartilhado com outros membros da organização, iniciando assim uma nova espiral de criação de conhecimento.

Page 20: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

20

Figura 2.1. A espiral do conhecimento (modificado de [22])

Alguns exemplos dessa transformação de conhecimento são apresentados a seguir:

• Conhecimento compartilhado: habilidades técnicas adquiridas observando o que os outros estão fazendo. O conhecimento não foi internalizado através de uma descrição externa.

• Conhecimento conceitual: é a articulação do conhecimento implícito. Por exemplo, quando se descreve uma imagem ou fato através da linguagem escrita (fazer uso da metáfora, analogia).

• Conhecimento operacional: aprender fazendo, seguindo os passos de um manual. O manual representa informações explícitas, que serão internalizadas à medida que são operadas.

• Conhecimento sistêmico: informações integradas de várias bases de dados , todas apresentando conhecimento que já foi externalizado.

Implícito

Explícito

Implícito Explícito

De

Para

Socialização Conhecimento Compartilhado

Externalização Conhecimento

Conceitual

Conhecimento Operacional Internalização

Conhecimento Sistêmico

Combinação

Page 21: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

21

3. Técnicas de Aquisição de Conhecimento As técnicas a seguir serão analisadas para o caso de desenvolvimento de um sistema a partir do conhecimento obtido de um especialista, que possui reconhecidamente um desempenho superior na solução de problemas. Como o conhecimento desse tipo de profissional tende a ser mais tácito do que explícito, as técnicas de eliciação tendem a ser mais sofisticadas do que na coleta de requisitos para construção de sistemas de informação.

• Imersão na literatura

• Entrevistas

• Entrevistas não-estruturadas

• Entrevistas estruturadas

• Questionários

• Classificação de conceitos ou fichas (card sorting)

• Eliciação de construtos

• Grades de repertório (repertory grids)

• Laddering

• Técnicas de observação

• Observação focada

• Rastreamento de processos (tracking methods)

• Relatórios verbais

• Relatórios não-verbais

• Análise de protocolos

• Construção de grafos

• Grafos de conhecimento

• Técnicas aplicadas em Engenharia de Software

• Brainstorming

• Prototipação

• Cenários

• Etnografia

3.1. Imersão na Literatura O objetivo da imersão na literatura é compreender um mínimo do domínio de trabalho, para que as entrevistas possam começar de um ponto mais adiantado. Essa familiarização do engenheiro com o domínio permite que o especialista se sinta mais à vontade para usar os termos do seu jargão nas entrevistas subseqüentes. Se o engenheiro mostra total incompreensão do domínio, o especialista tende a usar um vocabulário para novatos nas entrevistas. A conseqüência disso é que os termos adquiridos nas entrevistas não são

Page 22: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

22

aqueles que o especialista realmente usa na solução de problemas. Entretanto, não se deve tentar compreender o domínio de forma totalmente baseada na literatura. Os livros , em geral, não passam a informação da maneira como ela realmente é usada para resolver os problemas. O conhecimento que o especialista apresenta já é um compilado das técnicas mais eficazes que podem ser estudadas, além do mais, as técnicas usadas por especialistas são em geral 'otimizadas' com estratégias pessoais, devido aos anos de prática e estudo por parte do especialista.

3.2. Entrevistas

3.2.1. Entrevistas não-estruturadas Corresponde à técnica inicial de qualquer projeto de Engenharia de Conhecimento, onde o engenheiro de conhecimento conversa diretamente com o especialista, questionando diversos aspectos envolvidos na solução de problemas naquele domínio. Entrevistas não estruturadas apresentam poucas restrições. Isso significa que não existe uma ordem ou seqüência pré-definida de perguntas ou do rumo da conversa. O objetivo não é a aquisição de conhecimento sobre um tópico específico, mas sim que o agente do domínio forneça ao engenheiro uma visão geral do domínio em questão, por isso elas geralmente iniciam com o engenheiro perguntando “Como você resolve esse problema?” [24].

Conforme Schreiber [17], esta abordagem deve ser usada quando for necessário que o agente e o engenheiro de conhecimento estabeleçam um bom relacionamento. Além disso, essa é a técnica ideal para que o especialista descreva o domínio da maneira que lhe é familiar.

Entretanto, pelo fato de o agente poder falar quase livremente sobre seu domínio de trabalho, ele pode se estender em tópicos que não serão importantes para o desenvolvimento do sistema e dar pouca atenção aqueles realmente interessantes. Por isso esse tipo de entrevista não deve ser utilizado além das fases iniciais de identificação do conhecimento e de ambientação do engenheiro com o domínio.

3.2.2. Entrevistas estruturadas Nesse tipo de entrevista, mais formal, as perguntas são preparadas para serem relevantes à tarefa sobre a qual se está adquirindo conhecimento. O engenheiro planeja e direciona a conversa utilizando as questões como um guia. Essa técnica é mais eficaz porque ela “força o especialista a ser sistemático ao pa rticipar das entrevistas” [25]. Em geral, as respostas do agente do domínio são gravadas ou anotadas para posterior análise. Esses resultados geram transcritos estruturados, mais fáceis de serem analisados do que os produzidos por uma conversa não estruturada. Dependendo do tipo de entrevista feita, os transcritos podem ser utilizados para criar um glossário de definições de termos utilizados no domínio. A entrevista estruturada é útil quando é necessário preencher as lacunas de conhecimento ainda existentes sobre o domínio para o engenheiro. Exemplos de tópicos a serem estudados nessas entrevistas são:

• Identificação dos processos principais envolvidos na aplicação;

• Definição do nível do conhecimento esperado no usuário do sistema;

Page 23: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

23

• Definição do detalhamento (granularidade) das informações a serem modeladas;

• Especificações gerais do sistema a ser proposto;

• Expectativas de interface do sistema.

Entrevistas estruturadas são preparadas para serem específicas sobre o domínio em questão, por isso é difícil encontrar guias para esse processo de entrevista, de modo que o mais importante é a capacidade de análise e comunicação do entrevistador [5]. Mesmo assim, existem instruções que são ge néricas para qualquer tipo de entrevista, tais como seguintes exemplos de perguntas e seus efeitos na resposta (TABELA 3.1).

TABELA 3.1. Modelos de questões para eliciar informação adicional em entrevistas estruturadas (modificado de [17])

Modelo de questão Efeito

Porque você faria isso? Converte uma afirmação em uma regra

Como você faria isso? Gera regras de ordem mais baixa

Quando você faria isso? Só existe esse caso? Revela a generalidade da regra e pode gerar outras regras

Que alternativas existem para <a ação / decisão>? Gera mais regras

E quando esse não for o caso? Gera regras para quando a condição atual não se aplica

Você pode me falar mais sobre <um assunto já mencionado anteriormente>

Retoma o diálogo caso o especialista não tenha mais a dizer

A desvantagem em todos os tipos de entrevistas é que o conhecimento adquirido é somente aquele que pode ser verba lizado pelo agente. O conhecimento tácito e/ou profundo sobre a tarefa, por não ser facilmente externalizado, não será eliciado nessa fase da aquisição. As perguntas mais específicas sobre como o agente soluciona determinados problemas serão respondidas com explicações no estilo caixa-preta (black box, no original [17]), tais como “Eu não sei como faço isso...” ou “É óbvio que o certo a fazer é...”. Isso acontece porque descrições verbais sempre são tendenciosas e incompletas. O especialista explica o processo de solução de problema da forma como ele acha que acontece, ou da forma que seja mais fácil para o entrevistador compreender, não da forma como efetivamente acontece. O processo de comunicação não depende apenas do emissor, no caso, do especialista, mas também da capacidade do receptor, o engenheiro de conhecimento, de decodificar a informação. Mesmo que se parta do princípio de que o engenheiro de conhecimento deve ser treinado a ser imparcial na captação do conhecimento, a completa isenção de julgamento é humanamente impossível de ser atingida.

Para grande parte dos domínios, uma parte do conhecimento simplesmente não tem tradução verbal, logo não é explicitado através de entrevistas. Essa dificuldade é tanto maior quanto mais sensório for o domínio. Nesse caso, o especialista desenvolve padrões de reconhecimento visual, táctil ou auditivo e os aplica de forma inconsciente para caracterizar o problema e identificar os caminhos de solução possíveis. Essas respostas serão obtidas mais precisamente com o uso de outras técnicas, específicas para a coleta desse tipo de conhecimento.

Page 24: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

24

As entrevistas são úteis para aumentar o conhecimento do engenheiro sobre o domínio e devem ser utilizadas nas fases iniciais da aquisição de conhecimento. Sua vantagem sobre a imersão na literatura é que o engenheiro fica ciente do conhecimento pela visão do especialista, em vez de adquirir conhecimento de manual. Não é possível, no entanto, basear todo o processo de eliciação em entrevistas, embora pareça ser possível nas etapas iniciais. Com elas é possível identificar o escopo da aplicação, o tipo de domínio do conhecimento e planejar os próximos passos no processo de aquisição, bem como apontar para as técnicas de eliciação ma is adequadas para as etapas subseqüentes.

3.2.3. Questionários São questões predefinidas, distribuídas para uma amostragem significante e representativa de usuários e especialistas do domínio. São mais inflexíveis que entrevistas, pois as questões já estão elaboradas no papel, de modo que não é possível mudar o rumo da aquisição. Por esse motivo, é eficiente na avaliação de requisitos específicos e bem definidos. Quanto à ordem em que as perguntas devem ser respondidas, existem questionários de ordem fixa, de ordem múltipla, questões sim ou não, perguntas de resposta livre, perguntas de resposta restrita, entre outros.

Segundo Johnson [26], entrevistas apresentam uma taxa maior de sucesso do que questionários. Embora mais questionários possam ser remetidos às pessoas do que entrevistas possam ser feitas, sua desvantagem é que eles podem não ter retorno, enquanto entrevistas agendadas não podem ser simplesmente ignoradas. O uso de questionários se torna bastante útil quando a quantidade de pessoas que se deve entrevistar é extremamente grande.

3.3. Classificação de conceitos ou de fichas (concept sorting ou card sorting) A técnica de classificação de fichas [27] visa a identificação e organização de termos ou conceitos e seus relacionamentos num domínio particular, tais como a classificação dos objetos, as hierarquias e outras descrições estáticas dos objetos do domínio, segundo a visão do especialista. Uma lista de termos do domínio é obtida a partir das entrevistas iniciais ou extraída da análise de protocolos. O resultado também demonstra a similaridade entre os conceitos.

O método de aplicação é como segue :

• Escrever nome dos objetos em fichas;

• Especialista separa em grupos, seguindo algum critério, repetidas vezes;

• Seleciona um dos grupos e repete o procedimento;

• Especialista pode incluir ou eliminar objetos se achar necessário.

Os conceitos são apresentados em cartões ao especialista, que é instruído a classificar os cartões que possuem alguma similaridade ou que são do mesmo tipo em pilhas, formando categorias de conceitos e nomeando-as sempre que possível. As cartas são embaralhadas novamente e o especialista deve agrupá-las novamente de forma a criar novas categorias.

Page 25: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

25

Na Figura 3.1, o especialista deveria separar os objetos carro, pardal, barco, gato, ônibus e trem. Une as fichas novamente e solicita que novamente que separe em dois grupos utilizando outro critério, até que não existam mais critérios de separação. Nesse caso, um dos grupos é selecionado, como na Figura 3.2, e reinicia o processo.

Figura 3.1. Conjunto de objetos separados em dois, segundo os critérios "veículos" e "animais".

Durante a classificação, o especialista irá retirar alguns objetos por serem sinônimos ou irrelevantes, e irá incluir outros que, segundo seu critério, estão ausentes.

Figura 3.2. Conjunto 1 separado em dois conjuntos segundo os critérios "veículos terrestres" e "veículos aquáticos".

Esse processo se repete muitas vezes, mas podem ser feitas algumas variações. O resultado da aplicação da classificação de conceitos é um grupo de componentes que compartilham atributos comuns. Além de ser fácil de ser aplicada e analisada pelo engenheiro, essa técnica pode levar o especialista a perceber certa estrutura no domínio da qual ele mesmo não estava consciente [17]. Os resultados obtidos com a técnica de classificação de termos são o reconhecimento da hierarquia do domínio, a obtenção de termos não evidenciados através de entrevistas, o reconhecimento de conceitos que são sinônimos (um objeto mencionado com dois nomes diferentes) além de uma melhor compreensão global do domínio. A técnica é particularmente útil em domínios onde os métodos de solução de problemas são especialmente de classificação. Mesmo nesses casos, a aplicação torna-se

Page 26: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

26

difícil nos domínios muito complexos onde um número excessivamente grande de termos pode inviabilizar o uso de cartões. A prática aponta que os melhores resultados são obtidos quando a técnica é aplicada sobre menos do que uma centena de conceitos. Resultados medíocres são também obtidos em domínios excessivamente procedimentais, onde a explicitação das hierarquias de termos não parece fazer senso ao especialista.

3.4. Eliciação de Construtos Métodos usados para obter informação sobre como o especialista discrimina as entidades no domínio. As técnicas anteriores foram usadas para eliciar os conceitos, mas quando o engenheiro não conhece bem o domínio, ele ainda precisa compreender os graus de diferença ou semelhança entre os termos.

3.4.1. Grades de repertório (repertory grids) Essa técnica tem sua origem em um modelo do pensamento humano chamado teoria dos construtos pessoais (personal constructs theory - PCT), desenvolvida por George Kelly [28] em 19553. De forma similar às técnicas de classificação de conceitos, as grades permitem criar um mapeamento conceitual do domínio.

Para adotar essa técnica, é necessário que o engenheiro já tenha identificado muitos dos principais componentes de conhecimento associados à tarefa. Os passos de aplicação são os seguintes:

1) Selecionar um conjunto de conceitos relacionados à tarefa;

2) Apresentá-los em grupos de três para o especialista;

3) O especialista deve escolher dois conceitos como ‘similares’ e um como o ‘diferente’do grupo;

4) Após isso, ele deve indicar a razão pela qual diferenciou os três conceitos. Essa dimensão será utilizada como um construto;

5) O especialista estabelece uma escala bipolar de valores para esse construto (em geral, uma característica e seu oposto);

6) Os conceitos restantes são cotados 4 em relação a esse construto nas características associadas a eles.

Por exemplo, no caso da seleção de uma linguagem de programação (exemplo tirado de [5]). O especialista seleciona as linguagens LISP, PROLOG, COBOL e C (1). O engenheiro pede que as três primeiras sejam analisadas (2). O especialista indica que LISP e PROLOG são similares (3) em relação à orientação (4) e indica que uma linguagem pode apresentar orientação simbólica ou numérica (5). As duas primeiras linguagens são simbólicas, enquanto COBOL é numérica. LISP e PROLOG são cotados com nota 3 e COBOL é cotado com nota 1.

3 Essa teoria vê cada pessoa como um cientista cuja percepção sobre o mundo é classificada e categorizada como um modelo perceptual pessoal. Baseado nesse modelo, cada indivíduo antecipa e age baseado em suas antecipações. E esse modelo pessoal se encaixa na visão do engenheiro sobre o especialista trabalhando. 4 Em geral é utilizada uma escala de 1 a 3 ou de 1 a 5 para cotar os conceitos em relação a um construto.

Page 27: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

27

A escala utilizada para dar notas aos conceitos é aplicada pelo especialista dependendo do objetivo da cotação. O construto Tempo de Treinamento, por exemplo, recebe nota 1 se o tempo for alto e nota 3 caso contrário. Isso quer dizer que uma linguagem que possa ser rapidamente dominada é mais importante para o objetivo final do sistema que utilizará as informações coletadas.

O processo é repetido com diferentes tríades de elementos até que o especialista não consiga pensar em outros construtos discriminantes. O resultado é uma matriz que relaciona elementos e seus construtos através de medidas de similaridade. Um exemplo de construtos, de suas características e das cotações resultantes da eliciação de conhecimento para a tarefa de seleção de uma linguagem de computador é mostrado na TABELA 3.2.

TABELA 3.2 matriz resultante do uso da técnica de grade de repertório (modificado de [5])

Atributo Orientação Facilidade de Programação

Tempo de Treinamento Disponibilidade

Característica Oposto

Simbólica (3) Numérica (1)

Alta (3) Baixa (2)

Alta (1) Baixa (3)

Alta (3) Baixa (1)

LISP

PROLOG C

COBOL

3

3 2

1

3

2 3

2

1

2 2

1

1

1 2

3

Segundo Johnson [26], o engenheiro deve ter muito cuidado na escolha dos três conceitos a serem apresentados para o especialista, pois pode haver alguma influência na comparação e no agrupamento. Comparar objetos com contrastes muito explícitos, por exemplo, pode induzir o agente à não escolher um atributo de comparação não tão óbvio, mas que, por esse mesmo motivo, poderia ser mais importante para a coleta de conhecimento. E a menos que o número de objetos no domínio do problema seja pequeno, um grande número de comparações precisa ser feito, o que torna esse processo muito demorado para algumas tarefas específicas.

Algumas ferramentas de aquisição de conhecimento (implementadas para uso em computador) foram desenvolvidas baseadas em grades de repertór ios, tais como ETS, KRITON e AQUINAS, as quais são detalhadas no trabalho de Boose [29].

3.4.2. Laddering 5 Laddering é uma técnica de senvolvida para clarificar as relações entre os construtos eliciados pela técnica de grades de repertório, e, onde possível, organizá-los em relações hierárquicas [30]. Essa representação organiza de maneira informal e sem muitas restrições semânticas a hierarquia inicial do domínio. Um conceito, por exemplo, não precisa ser estritamente diferenciado de uma instância nessa fase. A técnica é aplicada da seguinte maneira:

5 O termo em inglês “ ladder” significa “escada de mão”. Ele foi utilizado para nomear a técnica porque uma hierarquia lembra uma ‘escada’ de conceitos.

Page 28: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

28

O engenheiro pede que o especialista gere um ponto de início, um conceito inicial. Pode-se utilizar o domínio das técnicas de aquisição como um exemplo. O conceito inicial seria “técnicas de aquisição de conhecimento”. É feita uma tentativa de mover a hierarquia abaixo fazendo uma pergunta que extraia exemplos de diferentes tipos de técnicas, tais como “técnicas manuais” e “técnicas auxiliadas por computador”. A hierarquia poderia ser estendida pedindo exemplos de “técnicas manuais” e assim por diante. Para mover-se um nível abaixo na hierarquia, utiliza -se a questão “Você pode fornecer EXEMPLOS dessa CLASSE?”. Perguntas similares são usadas para o engenheiro mover-se dentro do mesmo nível hierárquico (“Quais outros exemplos dessa CLASSE existem para o ITEM 1?”) ou para cima (“O ITEM 1 e o ITEM 2 são exemplos de que CLASSE?”). Essa última questão precisa ser empregada com cuidado, para que itens de níveis muito diferentes não sejam incluídos na mesma pergunta.

Alguns tipos de ladders que podem ser coletadas empregando essa técnica são [12]:

• de Conceitos : mostra conceitos e instâncias e as classes e subclasses às quais eles pertencem. Também conhecida como taxonomia, é vital para representar conhecimento na maior parte dos domínios.

• Composicional : mostra a maneira como um objeto é composto de suas partes. Também chamada partonomia, ela é útil para entender entidades de organização complexa como máquinas, documentos e empresas.

• de Decisões: mostra os caminhos de ação alternativos para uma tomada de decisão. É útil para representar conhecimento procedimental.

• de Atributos : mostra atributos e seus valores como sub-nodos. É uma maneira de representar todas as propriedades associadas a um conceito.

• de Processos: Mostra processos no domínio (tarefas, atividades) e seus sub-processos, também representando conhecimento procedimental.

3.5. Técnicas de Observação São usadas como suporte para outras técnicas de aquisição. Esta técnica permite que o especialista trabalhe no ambiente em que está acostumado sem interrupções e proporcione ao engenheiro uma visão da complexidade do problema a ser resolvido [24]. A observação pode ser usada para identificar estratégias de solução de problemas que nã o são conscientes, ou para estudar habilidades motoras ou procedimentos automáticos , para identificar as tarefas envolvidas na solução de um problema, e as limitações e restrições dessas tarefas, para identificar as informações necessárias para uma tarefa, e para validar a descrição que o especialista deu sobre o que ele realmente faz. O método consiste em o especialista proceder com a solução de problema e o engenheiro observar.

Os tipos de tarefas que se podem observar são as seguintes:

• Tarefas familiares (para o especialista): são úteis para se adquirir os passos gerais usados para solucionar o problema.

Page 29: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

29

• Tarefas com informação ou tempo restritos : são aquelas em que o especialista é apresentado ao problema com pouca ou nenhuma das informações geralmente utilizadas no processo ou que tem o tempo de solução do problema restringido. Isso permite que o engenheiro observe estratégias incomuns, que talvez não fossem reveladas em uma situação típica.

• Tarefas ‘difíceis’: são aqueles os casos mais difíceis de todos, que é onde o especialista revela realmente sua perícia verdadeira.

O engenheiro coleta informações através de um estudo visual de como a tarefa é executada pelo especialista. Segundo Johnson [26], as técnicas de observação podem ser diretas , quando o engenheiro presencia a execução da tarefa, o que pode influenciar no comportamento do especialista, e indiretas, em que um vídeo ou fita é gravado e assistido posteriormente, o que é menos intrusivo, mas requer mais tempo para análise.

Uma desvantagem da observação é que a linha de raciocínio do especialista não é revelada pelas suas ações, e não pode ser acompanhada pelo observador. Além disso, técnicas de observação não podem ser usadas de modo isolado. Ou seja, ao contrário de outras técnicas, em que se pode focar o processo de aquisição em um aspecto específico do domínio, é impossível pedir para o especialista para que execute somente uma determinada parte da tarefa total para ser observada. Além disso, é mais difícil de se interpretar as informações de uma observação do que de um relatório verbal. Em geral uma ação depende dos passos anteriores, sendo difícil separá-la do resto. Por esse motivo, as técnicas de observação são caras e consomem muito tempo, tanto do engenheiro quanto do especialista e são usadas como uma maneira de proceder com a análise de protocolos.

3.6. Rastreamento de Processos (tracking methods) Um conjunto de técnicas aplicadas para rastrear um processo de raciocínio específico do especialista (verbalizações, movimento dos olhos, ações). É uma abordagem bastante usada na psicologia cognitiva quando se deseja acompanhar a linha de pensamento de alguém enquanto ele alcança a solução de um problema. Fornecem informações detalhadas sobre muitos aspectos do processo de solução, tais como seus objetivos, os procedimentos utilizados, as ações e os conceitos. Os protocolos em geral fazem com que o agente pense sobre como ele executa a tarefa, mas na maior parte das vezes as pessoas não estão acostumadas a fazer inferências sobre seu próprio comportamento.

As vantagens da aplicação dessas técnicas devem-se principalmente a:

• Processo real de solução é analisado, ao contrário das descrições estilizadas feitas posteriormente ao momento de solução de problema. Abel [31] demonstrou que existem grandes diferenças entre o processo descrito pelo especialista e aquele efetivamente realizado por ele;

• Registro da entrevista permite uma análise posterior mais cuidadosa, que permite reconhecer os termos mais utilizados ou com mais freqüência;

• Ausência de um intervalo entre a solução de problema e posterior descrição pelo especialista, evitando distorções;

• Análise é feita com o nível de detalhe adequado à solução;

Page 30: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

30

• Informações incompletas são facilmente identificadas;

• Utilização de informações não-verbalizáveis é evidenciada na seqüência do processo.

3.6.1. Relatórios verbais Relatórios verbais podem ser de dois tipos: aqueles em que o comentário sobre o procedimento é feito ao mesmo tempo em que o especialista executa a tarefa (online ou concorrente) e aqueles em que o especialista é gravado em ação e posteriormente a tarefa é explicada verbalmente (offline ou retrospectivo). Quando o comentário nos protocolos concorrentes é feito por quem está resolvendo o problema, ele é chamado de ‘pensar alto’ (thinking aloud , no original). O comentário do tipo ‘acompanhamento’ (shadowing, no original) é feito por outro especialista, sobre o desempenho daquele que está executando a tarefa.

Um exemplo clássico de relatório concorrente é a verbalização de tarefas que precisam ser executadas em tempo real. Um piloto de avião ou um motorista de carro apresentam seu melhor desempenho quando a tarefa é executada de maneira automática. Caso precisem tomar consciência de suas ações, a tarefa é executada da pior maneira.

A explicação retrospectiva sobre a tarefa pode ser um relatório feito pelo próprio especialista que executou a tarefa ou comentários críticos, feitos por outro especialista, ou ainda pode existir um grupo de discussão sobre a maneira que a tarefa foi solucionada. Os protocolos retrospectivos são mais adequados quando o engenheiro precisa fazer questionamentos, pois o especialista não será interrompido. Se forem feitas perguntas durante a execução, a interrupção pode alterar significativamente a seqüência de raciocínio seguida pelo agente. Johnson [26] diz que protocolos retrospectivos são apropriados quando o analista está interessado nas razões e explicações, no comportamento, nos aspectos cognitivos e nos sentimentos relacionados à execução da tarefa.

Uma caracterís tica da verbalização durante o processo de solução foi reconhecida em diversos experimentos que utilizaram relatórios verbais: o especialista interrompe a verbalização da solução quando a solução torna -se não trivial, ou quando há necessidade de buscar caminhos alternativos de solução. As heurísticas utilizadas nesses momentos são importantes e devem ser posteriormente investigadas através de entrevistas.

Relatórios verbais são criticados por suas limitações:

• O especialista não conseguirá verbalizar seu raciocínio se a própria tarefa demanda dele algum tipo de comunicação ou alto processamento cognitivo. Por exemplo, um apresentador ou palestrante que é ótimo improvisador não conseguirá, durante a palestra, verbalizar qual a linha de raciocínio seguiu para criar suas falas fora do roteiro. Se a tarefa exige um alto processamento cognitivo, ele vai ter que ficar trocando de níveis de raciocínio, saindo do mais profundo para o mais superficial, para poder verbalizar, e não vai fazer nenhuma das coisas bem;

• Em segundo lugar, a própria definição de conhecimento especializado é que é um conhecimento compilado, procedimentalizado, ou empacotado de uma maneira

Page 31: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

31

particular para o especialista, e conseqüentemente, esses pacotes ou chunks de informações agregadas não são verbalizáveis;

• Além disso, mesmo quando o especialista consegue verbalizar o processo, os especialistas falham em descrever aquelas ações óbvias ou rotineiras, pois quando uma ação é repetida muitas vezes ela se torna parte do conhecimento implícito/automático, ou seja, ele não toma mais consciência do que ele faz e se uma ação não é consciente, ela não será verbalizada ;

• Outro problema é a própria habilidade do especialista em se comunicar. Algumas pessoas conseguem pensar mais rápido do que falar, outras dão respostas totalmente diferentes dependendo do momento, e alguns ainda precisam de um aquecimento para falar bem.

Para minimizar os problemas identificados para relatórios verbais, seria interessante coletar os relatórios verbais de quando dois especialistas falam ou quando o especialista fala com alguém em treinamento. A exigência de comunicação com um novato obriga o especialista a ser mais didático em sua verbalização. É importante também treinar o especialista em se reportar, mas isso depende do grau de disponibilidade e envolvimento do especialista com o projeto de aquisição de conhecimento, e pode ser um requisito difícil de ser preenchido. Além disso, é muito importante comparar os relatórios verbais com os não-verbais, que serão vistos a seguir, para preencher as lacunas do raciocínio não verbalizável.

3.6.2. Relatórios não verbais Relatórios verbais são a forma mais comum coleta de dados com o objetivo de rastrear processos, mas alguns relatórios não-verbais podem ser coletados também. Nos casos em que o especialista não consegue verbalizar sua linha de raciocínio, será necessário confiar somente nos relatórios não-verbais como protocolos do processo cognitivo.

As técnicas são utilizadas para rastrear dados como, por exemplo, o movimento dos olhos ou das mãos. O movimento dos olhos pode fornecer dicas importantes e relacionados aos padrões de busca de informações no ambiente, ou seja, para que pontos ele dirige os olhos quando busca alguma informação que complemente seu raciocínio. Essa técnica de protocolos de movimento dos olhos foi utilizada por Carmody, Kundel e Toto [32] para investigar os padrões de procura de radiologistas ao analisar chapas de raio-X. Foi interessante verificar que eles encontraram discrepâncias entre os relatórios verbais sobre como uma chapa de raio-X era analisada e seus movimentos dos olhos.

Uma prática que objetiva incrementar o conhecimento eliciado é utilizar a seqüência de fixação dos olhos como pontos de referência para um relatório verbal retrospectivo. É comum o especialista, no meio do processo de solução de problemas, desviar seu olhar para continuar por outra linha de raciocínio. Esse processo alternativo pode ser perdido se não for anotado o preciso momento em que seu olhar desviou, para posteriormente pedir um relatório dos passos de raciocínio utilizados.

O problema de relatórios não-verbais recai sobre a dificuldade de interpretação dos dados, pois às vezes não há uma correspondência um-para-um entre o objeto do foco do olhar e os objetos no pensamento.

Page 32: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

32

3.6.3. Análise de Protocolos A análise do material coletado pelas técnicas de rastreamento de processos é, talvez, a parte mais tediosa da tarefa. Os problemas existem por causa da quantidade de dados gerados, da natureza qualitativa dos dados, da complexidade e da desordenação dos dados e da subjetividade das interpretações. Dois engenheiros de conhecimento podem dar interpretações completamente diferentes do mesmo relato verbal. Algumas técnicas são utilizadas para analisar os protocolos da maneira mais fidedigna possível ao domínio e aos processos mentais originais do especialista [33].

• Análise de conteúdo: uma maneira de organizar uma quantidade muito grande de material identificando objetiva e sistematicamente algumas características específicas. Uma prática comum é criar categorias para as frases e identificar e contar quantas são classificadas em cada uma. Ou ainda considerar grupos ou seqüências de frases, em vez de uma sentença individual. A vantagem em identificar classes de sentenças está em facilitar a identificação posterior dos tipos de conhecimentos diferentes, que serão traduzidos para diferentes estruturas de representação. A dificuldade dessa tarefa é determinar as categorias apropriadas.

• Análise de interação: uma maneira de analisar quase que gramaticalmente a interação entre o entrevistador e o especialista para identificar categorias de sentenças. Nesse caso, as categorias criadas são orientadas à conversação, por exemplo, negociação, orientação, explicação, entre outras. Permite que o engenheiro de conhecimento elimine ou evidencie categorias de respostas do especialista que ele considera mais importantes em determinados momentos da transcrição.

• Ferramentas de análise de protocolos: ferramentas que utilizam técnicas para analisar automaticamente os protocolos verbais e não-verbais. O principal foco das ferramentas de análise de protocolos é a identificação e categorização das proposições e organização semântica dos segmentos do texto. Algumas ferramentas são desenvolvidas para um contexto específico, e seu desempenho fica próximo ao da análise manual. Outras ferramentas são livres de contexto, seu uso é generalizado, mas elas exigem uma interação maior com o engenheiro de conhecimento.

3.7. Construção de Grafos Técnicas que envolvem a eliciação de uma estrutura de nodos e arcos atravéz do engajamento do especialista em uma tarefa de construção de grafos. Uma variação dessa técnica bastante utilizada como um facilitador da aprendizagem em salas de aula são os mapas conceituais, em que é construída uma representação gráfica do que é relacionado à tarefa que o especialista soluciona. Essa representação demonstra o ponto de vista do especialista, mas ela é construída através de uma interação entre especialista e entrevistador. Isso permite que o engenheiro passe a compreender a visão do especialista sobre o domínio e a tarefa, assim como sobre os principais conceitos envolvidos e suas relações.

Page 33: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

33

Em geral esses métodos de construção de grafos não são sistemáticos. A regra geral é identificar os conceitos principais em nodos, interligando-os através de arcos que representam algum tipo de relação. Algumas técnicas, entretanto, determinam a metodologia de construção, como é o caso da técnica de mapeamento cognitivo, que é baseada na Teoria dos Construtos Pessoais de Kelly [28] e que foi aplicada por [34] para ajudar times e organizações a compreender os problemas pelos quais passavam. Outra técnica que apresenta método de construção é a de grafos de conhecimento, apresentada a seguir.

A vantagem das técnicas de construção de grafos é que os protocolos gerados podem ser facilmente utilizados como representação de conhecimento. Principalmente aqueles que foram desenvolvidos sistematicamente, pois a informação representada tende a ser mais formalizada e menos ambígua.

3.7.1. Grafos de Conhecimento A técnica de grafos de conhecimento, como uma técnica de eliciação de conhecimento foi proposta por [10, 35] , para caracterização da perícia na identificação de cardiopatias congênitas.

Um grafo de conhecimento é uma árvore AND/OR com três tipos de nodos:

• nodos de hipóteses, que representam as hipóteses de interpretação consideradas no grafo;

• nodos de evidências, que representam as diferentes características que suportam a interpretação, propostas pelo engenheiro de conhecimento ou incluído pelo especialista e dispostos em ordem de importância no grafo;

• nodos intermediários que representam diferentes agrupamentos de evidências utilizados pelo especialista para resolver o problema.

A técnica de aquisição de conhecimento pode ser descritas através dos seguintes passos:

1. Coleta e definição de uma lista de evidências (sintomas, sinais, falhas, reclamações, etc.), obtidas da literatura e daqueles mencionados pelos especialistas, normalmente na ordem de uma centena de evidências.

2. Identificação do conjunto existente de soluções possíveis para o problema em estudo.

3. O especialista é solicitado a selecionar entre as evidências coletadas, aquelas associadas a cada uma das soluções. Novas evidências podem ser acrescidas à lista.

4. As evidências devem ser, por sua vez, ordenadas de acordo com sua ordem de importância decrescente para aquela solução.

5. A construção do grafo é realizada por colocar as evidências ordenadas na base do grafo e a solução no topo ou raiz do grafo.

6. O especialista deve mostrar graficamente as associações entre as evidências para suportar a solução, criando, se necessário, os nodos intermediários que representam essas associações. Se uma única evidência é capaz de suportar a solução, uma única

Page 34: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

34

linha ligará essa evidência à solução (como a evidência de peso 7 da Figura 3.3). Se esse evidência só for significativa se associada a outras evidências, essa associação será representada através de um nodo intermediário com conexões para cada uma das evidências e uma única conexão até o nodo de solução, como demonstrado pelas três primeiras evidências do grafo da Figura 3.3.

7. Após a construção do grafo, são atribuídos índices de significância , na escala de 0 a 10, para cada um dos nodos de evidência e nodos intermediários. Esses índices devem representar a confiança do especialista na solução representada, caso apenas a evidência ou as evidências representadas por aquele nodo fossem encontradas.

No exemplo da Figura 3.3, os sintomas Pele Amarelada e Febre foram combinados, para definir que eles sozinhos, com graus de 8 e 9, podem indicar que o paciente está com Hepatite. O sintoma Prostração também indica Hepatite sozinho, mas com um grau de significância menor (7) que o dos outros sintomas. Para indicar Malária , outras combinações teriam que ser criadas entre os mesmos sintomas, e provavelmente a evidência Dores Musculares seria adicionada no grafo de conhecimento, para indicar a Malária com algum grau de significância.

Os grafos de conhecimento possuem maior poder de expressão quando comparados com regras de produção, ao permitirem que sejam expressos, não apenas as evidências que levam às conclusões, mas também como essas evidências se combinam para indicar determinada conclusão e o quanto elas influenciam, individual ou coletivamente, para confirmar uma determinada hipótese.

Figura 3.3. Grafo de conhecimento representando como as evidências são combinadas para sugerir um diagnóstico clínico (modificado de [10])

Assim como regras, não está implícito nos grafos de conhecimento a forma como eles serão aplicados para atingir uma determinada conclusão, ou seja, de que forma o raciocínio deve ser desenvolvido. Grafos expressam apenas como determinadas informações disponíveis no modelo do domínio estão relacionadas a uma determinada conclusão.

(9) (8) (8) (7)

Índice

Índice da combinação

das evidências

Soluções Possíveis

Hepatite Malária

Evidências

Pele amarelada

Febre Prostração ... Dores musculares

Page 35: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

35

3.8. Técnicas aplicadas em Engenharia de Software

3.8.1. Brainstorming É um método para ser utilizado com grupos de especialistas para desenvolver idéias e explorar seus significados [36]. O brainstorming permite que cada indivíduo desenvolva sua própria linha de pensamento para basear suas idéias ou faça contribuições para as expressões de raciocínio do outros participantes. Essas contribuições são encorajadas para enriquecer a saída de informações.

Para essa técnica ser utilizada de forma adequada, é necessário introduzir um estímulo no início da sessão, como uma pergunta, uma af irmação, um cenário ou uma demonstração de sistemas já existentes [24]. Todas as idéias devem ser declaradas em voz alta, de maneira a influenciar os demais participantes e devem ser gravadas de alguma maneira. É uma técnica eficaz se cada um dos participantes possui uma parte do conhecimento sobre o problema.

3.8.2. Prototipação É uma técnica que envolve o desenvolvimento de uma versão piloto do sistema para ser executada e testada pelos futuros usuários (ou pelo especialista). Esse protótipo é apenas uma representação parcial do sistema como um todo, e só será utilizado para que o engenheiro perceba quais os requisitos realmente necessários para o uso eficiente do sistema. O teste de um protótipo pode fazer o engenheiro detectar a necessidade de uso de determinadas técnicas de aquisição para coletar os requisitos que ainda faltam.

3.8.3. Cenários A técnica de cenários permite que os agentes lidem com exemplos reais do domínio em estudo, em vez de descrições abstratas. Os agentes podem criticar um cenário que descreve sua interação com o sistema, apontando as falhas ou sugerindo novos eventos ou interações que pareçam mais adequadas. A aplicação da técnica inicia com uma descrição que fornece uma visão geral de uma interação dos agentes com o sistema para atingir um objetivo pré-determinado. Durante a eliciação, são adicionados os detalhes que completam essa descrição.

Em geral, um cenário pode incluir [37]:

• Uma descrição do estado do sistema no início do cenário;

• Uma descrição do fluxo de eventos;

• Uma descrição do que pode sair errado, e como lidar com isso;

• Informação sobre atividades que podem acontecer ao mesmo tempo;

• Uma descrição do estado do sistema no final do cenário.

Abordagens diferentes de cenários foram desenvolvidas para que se consiga coletar diferentes tipos de informação sobre o sistema em diferentes níveis de detalhe. Duas das mais conhecidas são os cenários de eventos e os casos de uso. No primeiro, os cenários representam os diferentes eventos que compõe o comportamento do sistema. Cada um

Page 36: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

36

desses eventos é documentado em um cenário separado, que ilustra o fluxo de dados e as ações do início ao fim do evento, além das possíveis exceções de comportamento.

Casos de uso já foram adotados como uma parte fundamental da notação UML para descrever modelos de sistemas orientados a objetos. Um caso de uso identifica tipicamente os atores envolvidos com o sistema e todas suas possíveis relações de interação com determinados processos desse sistema.

3.8.4. Etnografia Segundo Sommerville [37] , sistemas de software não existem isoladamente, eles são usados em contextos sociais e organizacionais, de onde são derivados os requisitos do sistema. A etnografia é uma técnica que envolve estudo em profundidade por observação dos agentes do domínio em seu ambiente natural, de modo a compreender os requisitos da organização e da sociedade. Na tentativa de adquirir uma percepção mais completa e precisa do problema, sob várias perspectivas, um analista faz uma imersão no ambiente de trabalho em que o sistema será utilizado. Dessa maneira é possível coletar a relação existente entre os trabalhos executados na organização. Essa é uma informação difícil de ser extraída diretamente dos participantes do domínio, pois em geral eles sabem descrever seu próprio trabalho, mas não sabem qual sua relação e influência no trabalho dos outros membros.

Page 37: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

37

Conclusão

A tarefa de aquisição de conhecimento é uma etapa decisiva no desenvolvimento de sistemas baseados em conhecimento. O sucesso da engenharia de conhecimento depende de se as informações essenciais foram coletadas de maneira fidedigna ao domínio de interesse, e se os métodos de solução do especialista foram identificados e modelados de maneira a sugerir soluções precisas e confiáveis para os problemas.

Esse trabalho foca nas técnicas de eliciação utilizadas para coletar conhecimento especialista, utilizado no desenvolvimento de Sistemas Baseados em Conhecimento. Existe uma variedade de técnicas que são usadas para adquirir informações para outros tipos de Sistemas de Informação, que não necessariamente se baseiam em conhecimento especialista. Mas essas técnicas têm por objetivo, em geral, a coleta de requisitos de usabilidade da aplicação, enquanto técnicas de AC focam em como os problemas são solucionados por um especialista, que possui reconhecidamente um desempenho superior na solução de problemas, como esse método de solução pode ser mapeado para uma aplicação de software.

Existem muitos fatores que contribuem para os problemas que fazem da aquisição de conhecimento o gargalo do processo de desenvolvimento de SBC. As principais limitações residem em problemas inerentes do processo de interação entre pessoas. A reciprocidade entre o engenheiro de conhecimento e o especialista ou outros agentes do domínio depende de características de personalidade de ambos, habilidades de relacionamento pessoal, conhecimento (por parte do engenheiro) de abordagens psicológicas para melhorar a capacidade de expressão do entrevistado, motivação e interesse particular em participar da tarefa (por parte do especialista), entre outros fatores subjetivos. Outro fator é a natureza tácita do conhecimento a ser eliciado. Esse tipo de conhecimento, além de não ser encontrado em manuais, mas somente nos métodos do especialista, é quase impossível de ser identificado, por ser muito difícil de ser verbalizado pelo próprio especialista. Para isso foram demonstradas as técnicas de aquisição de conhecimento, e foram identificadas as categorias de conhecimento para os quais essas técnicas são mais adequadas.

Page 38: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

38

Referências Bibliográficas

1. Hayes-Roth, F., D.A. Waterman, and D.B. Lenat, Building Expert Systems. 1983, Massachusetts: Addison-Wesley.

2. Shadbolt, N. and M. Burton, Knowledge Elicitation Techniques - some experimental results, in Readings in Knowledge Acquisition - current practices and trends. 1990.

3. Shaw, M.L.G. and B.R. Gaines, Requirements acquisition. Software Engineering Journal, 1996. 11(3May): p. 149-165.

4. Scott, A.C., J.E. Clayton, and E.L. Gibson, A practical guide to knowledge acquisition. 1991. 509.

5. Turban, E., Expert Systems and Applied Artificial Intelligence. The Macmillan Series in Information Technology, ed. E. Moura. 1992, New York: Macmillan Publishing Company. 804.

6. Regoczei, S. and G. Hirst, Knowledge and Knowledge Acquisition in the Computational Context. 1994.

7. Holanda, A.B.d., Novo Aurélio século XXI. 3a. ed. 1999: Nova Fronteira. 2128. 8. Boff, L.H., O processo cognitivo de trabalho de conhecimento: um estudo

exploratório sobre o uso da informação no ambiente de análise de investimentos, in Programa de Pós-Graduação em Administração da UFRGS. 2000, UFRGS: Porto Alegre. p. 179.

9. Abel, M., J.M.V. Castilho, and J. Campbell. Analysis of Expertise for Implementing Geological Expert Systems. in 4th World Conference in Expert Systems 98. 1998. Mexico City: Cognizant Communication Office.

10. Leão, B.d.F., Contrução de uma base de conhecimento de um sistema especialista de apoio ao diagnóstico de cardiopatias congênitas , in Pós-Graduação em Cardiologia da Escola Paulista de Medicina. 1988: São Paulo. p. 230.

11. Boose, J.H. Knowledge Acquisition Tools, Methods, and Mediating Representations. in First Japanese Knowledge Acquisition for Knowledge-Based Systems Workshop JKAW-90. 1990. Ohmsha, Japan.

12. Shadbolt, N. and S. Swallow, Epistemics. 1993. 13. Shadbolt, N., K. O'hara, and L. Crow, The experimental evaluation of knowledge

acquisition techniques and methods: history, problems and new directions. International Journal of Human-Computer Studies, 1999. 51: p. 729-755.

14. Wagner, W.P., Q.B. Chung, and M.K. Najdawi, The impact of problem domains and knowledge acquisition techniques: A content analysis of P/OM expert system case studies. Expert Systems with Applications, 2003. 24(1 January 2003): p. 79-86.

15. Fellers, J.W., Key factors in knowledge acquisition. Computer Personnel, 1987. 11(1): p. 10-24.

16. Dobson, J.E., et al. The ORDIT Approach to Requirements Identification. in Proceedings of the 16th Annual International Computer Software and Applications Conference. 1992. Chicago, Illinois.

17. Schreiber, G., et al., Knowledge engineering and management - The CommonKADS methodology. 1999, Cambridge: The MIT Press. 465.

Page 39: Técnicas de Aquisição de Conhecimento para SBC · o Protégé, editores de base de conhecimento como o CYC, ou ainda ferramentas baseadas em métodos manuais de aquisição. No

39

18. Berry, D.C. and D.E. Broadbent, On the relationship between task performance and associated verbalizable knowledge. Quarterly Journal of Experimental Psychology, 1984. 36: p. 209-231.

19. Hoffman, R., et al., Eliciting Knowledge from Experts: A Methodological Analysis. Organizational Behavior and Decision Processes, 1995. 62(2): p. 129-158.

20. Harmon, P. and B. Sawyer, Creating Expert -systems for Business and Industry. 1990, New York: John Wiley &Sons. 329.

21. Polanyi, M., Personal knowledge. 1974, Chicago: The University of Chicago Press. 22. Nonaka, I. and H. Takeuchi, The knowledge -creating company: how Japanese

companies create the dynamics of innovation. 1995, New York, NY: Oxford University Press.

23. Stenmark, D. Information vs. Knowledge: The Role of intranets in Knowledge Management. in HICSS-35 - 35th Hawaii International Conference on System Sciences. 2002. Hawaii.

24. Liou, Y.I. Knowledge acquisition: issues, techniques, and methodology. in ACM SIGBDP Conference on Trends and Directions in Expert Systems. 1990. Orlando, Florida, United States: ACM Press.

25. Hoffman, R.R., The problem of extracting the knowledge of experts from the perspective of experimental psychology, in The AI Magazine. 1987. p. 53-67.

26. Johnson, P., Human-Computer Interaction - Psychology, Task Analysis and Software Engineering, ed. M.-H. International. 1992, UK.

27. Wright, G. and P. Ayton, Eliciting and modeling expert knowledge. Decision Support Systems. Vol. 3. 1987, North Holland: Elsevier Science Publ. 26.

28. Kelly, G.A., The Psychology of Personal Constructs. 1955, Norton: New York. 29. Boose, J.H., A Survey of Knowledge Acquisition Techniques and Tools, in

Knowledge Acquisition. 1989. 30. Shadbolt, N., et al., Laddering: technique and tool use in knowledge acquisition, in

Knowledge Acquisition. 1994. p. 315-341. 31. Abel, M., Um sistema especialista para identificação e classificação de turbiditos,

in Pós-Graduação em Ciência da Computação. 1988, UFRGS: Porto Alegre. 32. Carmody, D.P., H.L. Kundel, and L.C. Toto, Comparison scans while reading chest

images: taught, but not practiced. Investigative Radiology, 1984. 19: p. 462-466. 33. Cooke, N., Varieties of knowledge elicitation techniques. International Journal on

Human-Computer Studies, 1994. 41: p. 801-849. 34. Eden, C., S. Jones, and D. Sims, Messing about in problems. 1983: Oxford:

Pergamon Press. 35. Leão, B.F. and A.F. Rocha, Proposed methodology for knowledge acquisition: a

study on congenital heart disease diagnosis. Methods of Information in Medicine, 1990(29): p. 30-40.

36. Moore, C.M., Group techniques for idea building. 1987, Sage Publications: Newbury Park, CA.

37. Sommerville, I., Software Engineering. 6th ed. 2001, Harlow - England: Addison-Wesley. 693.