Relações básicas num tesauro

20
Universidade de Coimbra Faculdade de Letras Relações básicas num Thesaurus Especialização em Ciências Documentais Indexação por Assuntos I 1

Transcript of Relações básicas num tesauro

Page 1: Relações básicas num tesauro

Universidade de CoimbraFaculdade de Letras

Relações básicas

num

Thesaurus

Especialização em Ciências Documentais

Indexação por Assuntos I

Carla Alexandra Silva Ferreira

2005 / 2006

1

Page 2: Relações básicas num tesauro

Introdução

Um thesaurus, enquanto instrumento de controlo terminológico que

visa traduzir a linguagem natural dos documentos primários para uma

linguagem documental controlada, serve de ponte entre o homem e o

sistema documental, quer na representação dos conceitos, quer na

recuperação da informação. No entanto, ele é também um guia que aponta

em vários sentidos graças às relações que se estabelecem entre os seus

descritores.

Essas relações comportam um carácter de reciprocidade e visam

controlar o vocabulário, evidenciar a estrutura do thesaurus e induzir o

utilizador a pesquisas relacionadas com aquela que pretende. Neste trabalho,

as relações básicas existentes num thesaurus serão definidas e analisadas

relativamente à sua função e aplicabilidade.

2

Page 3: Relações básicas num tesauro

1. Relações de equivalência

Sabemos que um dos propósitos de qualquer thesaurus é o controlo

vocabular. Esse controlo passa, em muito, pelo controlo da sinonímia.

Aquando da construção de um thesaurus, perante vários termos que

representam o mesmo conceito – linguisticamente designados por sinónimos

– deve-se eleger um deles como termo eleito para representar esse conceito.

Esta escolha assenta no segundo princípio do processo de indexação: o

interesse do utilizador e características do fundo bibliográfico. O termo eleito

de entre o conjunto de termos equivalentes que representam o mesmo

conceito recebe a denominação de descritor. Os restantes termos preteridos

recebem a designação de não-descritores, também designados por termos

equivalentes.

Deste modo, as relações de equivalência estabelecem-se entre

descritores e não-descritores e visam, sobretudo, controlar a sinonímia. As

relações de equivalência assentam no estabelecimento de relações de

reciprocidade entre o descritor e os não-descritores. Essa de reciprocidade

nas relações de equivalência estabelece-se através dos operadores USE e UP.

O operador USE precede o termo eleito descritor. Já o operador UP (usado

por) antecede o termo preterido, ou seja, o não-descritor.

Exemplo:

ARQUITECTURA DE CENA

UP cenários

cenários

USE ARQUITECTURA DE CENA

A razão de ser do estabelecimento de relações de equivalência entre

descritores e não-descritores está no facto de estes serem termos sinónimos

e, por essa razão, qualquer um deles pode ser usado pelo utilizador no

momento da pesquisa. Além disso, estas relações permitem reduzir

substancialmente o número de termos autorizados num thesaurus uma vez

que termos sinónimos não devem ocorrem simultaneamente como

descritores num mesmo thesaurus. Ainda assim, embora tenham adquirido o

estatuto de não-descritores, esses termos equivalentes do ponto de vista

3

Page 4: Relações básicas num tesauro

semântico, devem ser incluídos no thesaurus, de forma a evitar silêncio no

momento da pesquisa.

1.1. Estabelecimento de relações de equivalência

Uma das funções das relações de equivalência é o controlo da

sinonímia. No entanto, as relações de equivalência podem e devem ser

estabelecidas quando estamos perante outros acidentes linguísticos como a

quase-sinonímia ou variações ortográficas.

A sinonímia motiva o estabelecimento de relações de equivalência

quando:

a. um conceito é representado por dois ou mais termos;

Exemplo:

AUTOMÓVEL

UP viatura

UP carro

viatura

USE AUTOMÓVEL

carro

USE AUTOMÓVEL

b. um mesmo conceito é representado simultaneamente por um termo

popular e um termo científico;

Exemplo:

cobrão

USE HERPES ZOSTER

Zona

USE HERPES ZOSTER

HERPES ZOSTER

UP Cobrão

UP Zona

c. um mesmo conceito é representado por vários termos devido à

variação linguística existente num país;

Exemplo:

alcagoita

USE AMENDOIM

4

Page 5: Relações básicas num tesauro

AMENDOIM

UP alcagoita

d. um conceito é representado simultaneamente por um termo que caiu

em desuso e um (ou vários) que são actuais;

Exemplo:

telefonia

USE RÁDIO

RÁDIO

UP telefonia

e. um conceito é representado por termos cuja origem etimológica é

diferente;

Exemplo:

MULTICELULAR (do latim)

UP policelular (do grego)

Plicelular

USE MULTICELULAR

f. um conceito pode ser representado por um termo comum e outro que

corresponde à sua marca comercial;

Exemplo:

Gilete

USE LÂMINA DE BARBEAR

LÂMINA DE BARBEAR

UP Gilete

NOTA: Gillette é o nome do inventor desta lâmina.

g. um conceito é representado por um termo novo ou por um

neologismo;

Exemplo:

shopping

USE CENTRO COMERCIAL

CENTRO COMERCIAL

UP shopping

h. um conceito é representado por uma sigla ou acrónimo;

Exemplo:

Organização das Nações Unidas para a Educação, Ciência e

Cultura

USE UNESCO

5

Page 6: Relações básicas num tesauro

UNESCO

UP Organização das Nações Unidas para a Educação,

Ciência e Cultura

A quase-sinonímia é um acidente linguístico que, no âmbito dos

thesaurus, pode ser controlado também através do estabelecimento de

relações de equivalência. A quase-sinonímia acontece quando dois termos

podem ser sinónimos no que respeita à indexação, ainda que

semanticamente possuam um significado diferente. Segundo a NP 4036,

esses termos “representam frequentemente valores diferentes de uma

mesma variável”. Apresenta como exemplo os termos ‘secura’ e ‘humidade’

e diz que num domínio como o de ‘equipamento de lavagem’, quer um

termo, quer outro, podem ser escolhidos como descritores, porque se

entende que quem estuda uma dessas propriedades se interessará também

por documentos que digam respeito à outra propriedade. A norma salienta

que termos deste género só devem ser tratados como quase-sinónimos em

domínios muito especializados.

Exemplo:

SECURA

UP humidade

humidade

USE SECURA

As variações ortográficas prendem-se com aspectos relacionados

com a evolução da língua e, num thesaurus, podem ser controladas através

de relações de equivalência quando:

a. um conceito é representado por um termo cuja grafia foi actualizada;

Exemplo:

philologia

USE FILOLOGIA

FILOLOGIA

UP philologia

b. um conceito é representado por um termo cuja grafia pode variar;

Exemplo:

PELOURO

6

Page 7: Relações básicas num tesauro

UP peloiro

peloiro

USE PELOURO

A NP 4036 refere ainda que se devem estabelecer relações de

equivalência para se fazer remissão para um termo genérico. Sobre este

aspecto refere que se trata “de uma técnica em que o nome de uma classe,

assim como os nomes dos membros dessa classe são tratados como um

conjunto de equivalências” e em que o termo genérico funciona como

descritor. Esta técnica refere a possibilidade de estabelecer uma relação de

equivalência entre um termo genérico e um termo específico, que em certos

contextos, podem funcionar como sinónimos, ainda que mantenham entre si

uma relação hierárquica. Esses contextos dependem essencialmente do

fundo bibliográfico e do interesse do utilizador. Vejamos o exemplo:

METAIS

UP alumínio

UP cobre

UP ferro

alumínio

USE METAIS

...

O estabelecimento de relações de equivalência entre um termo

genérico (METAIS) e termos específicos (alumínio, cobre, ferro) só faz sentido

num serviço cujo fundo bibliográfico tenham um carácter geral, como, por

exemplo, uma biblioteca municipal. Este tipo de relação, embora preserve a

relação hierárquica entre os termos, estabelece entre eles uma relação de

equivalência semântica com o objectivo de não sobrecarregar o thesaurus

com termos demasiado específicos para aquele fundo.

Num serviço especializado, como uma biblioteca de um Departamento

de Química, este tipo de relação não deve ser utilizado, uma vez que cada

termo considerado equivalente a um outro mais geral numa biblioteca com

um fundo bibliográfico de carácter geral, não o pode ser num serviço

especializado. Deste modo, ALUMÍNIO, COBRE e FERRO seriam considerados

descritores e termos específicos do termo geral METAIS. No entanto, se,

7

Page 8: Relações básicas num tesauro

porventura, nesse serviço especializado aparecesse um documento cujo

assunto fosse fonética acústica, então criar-se-ia uma relação de

equivalência entre este termo específico e outro mais geral, que o

compreende (por exemplo, Linguística).

2. Relações hierárquicas

As relações hierárquicas permitem, num thesaurus, reunir os diversos

descritores num conjunto hierarquizado baseado em níveis de subordinação,

onde os descritores são colocados uns em relação aos outros de acordo com

o seu grau de generalidade ou especificidade. O estabelecimento das

relações hierárquicas define a estrutura do thesaurus, fixando a ordem

hierárquica dos descritores, evidenciando as suas macro e micro-estruturas.

Segundo Gil Urdiciain, o estabelecimento de níveis de generalidade e

especificidade facilita, no momento da indexação, a eleição de termos mais

específicos que definem um conceito, eliminando a possibilidade de ruído na

pesquisa. O estabelecimento de relações hierárquicas permite dividir de

forma lógica e hierárquica o campo terminológico em que se trabalha.

As relações hierárquicas entre os descritores de um thesaurus são

recíprocas e transcrevem-se através dos operadores TG e TE. TG designa o

termo genérico, ou seja, o descritor que representa o conceito com o

sentido mais amplo e que engloba conceitos com um sentido mais específico.

TE refere-se ao termo específico, ou seja, o descritor que representa um

conceito com um sentido mais restrito e cujo sentido pode ser incluído num

conceito mais genérico.

Exemplo:

TG ROCHAS

TE ARDÓSIA

TE BASALTO

TE GRANITO

ARDÓSIA

TG ROCHAS

...

8

Page 9: Relações básicas num tesauro

Gil Urdiciain refere que um descritor pode ter nenhum, um ou mais

descritores de inferior hierarquia ou pode ter nenhum, um ou mais

descritores superiores a ele. Se não tiver nenhum descritor superior a ele,

esse descritor encabeça a hierarquia. Quando o descritor pertence a mais do

que uma hierarquia pode dar-se o caso de poli-hierarquia1.

2.1. Tipos de relações hierárquicas

As relações hierárquicas são de três tipos:

relações genéricas;

relações todo-parte;

relações enumerativas;

Estes três tipos de relações permitem estabelecer hierarquias

susceptíveis de serem submetidas a um teste lógico porque, segundo a NP

4036, “cada termo subordinado deve referir-se ao mesmo tipo de noção que

o seu termo superior”, ou seja, “o termo genérico e o termo específico devem

representar quer um objecto, quer uma acção, quer uma propriedade, etc.”

Exemplo:

Pensemos nos descritores ‘cereais’ (objecto) e ‘plantação’ (acção). Como

representam noções de tipo diferente, não se pode estabelecer uma relação

hierárquica entre eles. Quando muito estabelecer-se-á uma relação

associativa (PLANTAÇÃO TR CEREAIS). No entanto, se em vez de ‘plantação’

tivéssemos o descritor ‘milho’, então poderíamos estabelecer uma relação

hierárquica entre eles, uma vez que ambos representam objectos.

a. Relações genéricas

Estas relações evidenciam a relação entre uma classe ou categoria e

os seus membros ou espécies

Exemplo:

ARQUITECTURA

TE ARQUITECTURA CIVIL

ARQUITECTURA CIVIL

TG ARQUTECTURA

1 Ver 2.2.

9

Page 10: Relações básicas num tesauro

ARQUITECTURA CIVIL

TE ARQUITECURA URBANA

ARQUITECTURA URBANA

TG ARQUITECTURA CIVIL

b. Relações todo-parte

Estas relações são as relações hierárquicas mais comuns e

estabelecem-se em situações em que a parte ou espécie (o termo

subordinado) está implícita no todo ou genérico (termo subordinante).

Neste caso, o todo é representado pelo termo genérico e a parte pelo

termo específico.

As relações todo-parte aplicam-se nos seguintes casos;

sistemas e órgãos do corpo :

Exemplo:

SISTEMA DIGESTIVO

TE BOCA

TE ESÓFAGO

TE ESTÔMAGO

TE GLÂNDLUAS GÁSTRICAS

BOCA

TG SISTEMA DIGESTIVO

...

GLÂNDULAS GÁSTRICAS

TG ESTÔMAGO

localização geográfica ;

Exemplo:

BRASIL

TE MARANHÃO

TE RIO DE JANEIRO

TE NITÉROI

TE NOVA IGUAÇU

MARANHÃO

TG BRASIL

...

NITÉROI

TG RIO DE JANEIRO

10

Page 11: Relações básicas num tesauro

...

disciplinas e domínios do conhecimento ;

Exemplo:

LINGUÍSTICA

TE FONÉTICA

TE FONÉTICA ACÚSTICA

FONÉTICA

TG LINGUÍSTICA

FONÉTICA ACÚSTICA

TG FONÉTICA

estruturas sociais hierarquizadas ;

Exemplo:

EXÉRCITO

TE CORPO DO EXÉRCITO

TE REGIMENTO

CORPO DO EXÉRCITO

TG EXÉRCITO

REGIMENTO

TG REGIMENTO

c. Relações enumerativas

Estas relações identificam a ligação existente entre uma categoria

geral de coisas ou acontecimentos (representada por um nome

comum) e um espécime individual dessa categoria (representada por

um nome próprio).

Exemplo:

FILÓSOFOS EXISTENCIALISTAS, séc. 20

TE JEAN-PAUL SATRE

TE GABRIEL MARCEL

JEAN-PAUL SATRE

TG FILÓSOFOS EXISTENCIALISTAS, séc. 20

...

2.2. relações poli-hierárquicas

11

Page 12: Relações básicas num tesauro

Estas relações reflectem o facto de alguns termos poderem pertencer

a várias facetas e depende de mais do que um termo genérico. Vejamos o

exemplo:

INSTRUMENTOS DE MÚSICA

TE ÓRGÃOS

ÓRGÃOS

TG INSTRUMENTOS DE MÚSICA

INSTRUMENTOS DE TECLAS

TE ÓGÃOS

ÓRGÃOS

INSTRUMENTOS DE TECLAS

3. Relações associativas

Das três relações básicas de um thesaurus, esta é mais peculiar.

Contrariamente às anteriores, as relações associativas não supõem nem

sinonímia, nem hierarquia, mas sim associações semânticas mentais. Aqui os

termos não são sinónimos, nem fazem parte da mesma hierarquia, são

termos que, por associação de ideias, reenviam para outros conceitos. Tal

como as relações anteriores, é uma relação recíproca que é representada

através do operador TR (termo relacionado), que antecede o termo ao qual

o descritor está associado.

Exemplo:

ESTILOS ARQUITECTÓNICOS

TR CORRENTES ARQUITECTÓNICAS

CORRENTES ARQUITECTÓNICAS

TR ESTILOS ARQUITECTÓNICOS

O subjectivismo do indexador é mais susceptível de se manifestar no

estabelecimento de relações deste tipo. Por essa razão, a NP 4036 adianta

que as relações associativas só se devem estabelecer se um dos termos for

fortemente implicado pelo outro, de acordo com o quadro de referências

partilhado pelos utilizadores, sempre que o outro seja utilizado como termo

de indexação. Deste modo, um dos termos deve ser um componente

necessário como explicação ou definição do outro. Isto faz com que, na

12

Page 13: Relações básicas num tesauro

pesquisa, o utilizador seja induzido a pesquisar em campos afins ao conceito

localizado.

A função das relações associativas é localizar todos os conceitos

relacionados reciprocamente num thesaurus. As ligações estabelecem-se

entre os termos que os representam e dão-se ao nível da faceta. Este tipo de

relações estabelece-se entre termos que pertencem à mesma categoria e

termos que pertencem a categorias diferentes. Quanto aos primeiros, trata-

se de termos que contêm o mesmo termo genérico, mas cujo significado se

sobrepõe. Não se trata de termos equivalentes, mas sim de termos que por

algumas afinidades que possuem são utilizados sem grande rigor aquando da

pesquisa. Por essa razão, torna-se necessário chamar a atenção do utilizador

para a existência de outro(s) termo(s) relacionado com o pretendido (ver

exemplo anterior).

Relativamente aos termos que pertencem a categorias diferentes, as

relações associativas podem ser estabelecidas:

a. entre uma disciplina ou campo do conhecimento e os objectos ou

fenómenos estudados;

Exemplo:

FILATELIA

TR SELOS

SELOS

TR FILATELIA

b. entre uma operação/um processo e o seu agente ou instrumento;

Exemplo:

PLANTAÇÃO AGRÍCOLA

TR ALFAIAS AGRÍCOLAS

ALFAIAS AGRÍCOLAS

TR PLANTAÇÃO

c. entre uma acção e o produto/efeito da acção;

Exemplo:

INDEXAÇÃO

TR CATÁLOGO DE ASSUNTOS

CATÁLOGO DE ASSUNTOS

TR INDEXAÇÃO

13

Page 14: Relações básicas num tesauro

d. entre uma acção e o seu sujeito/objecto passivo;

Exemplo:

ANÁLISE DOCUMENTAL

TR DOCUMENTO

DOCUMENTOS

TR ANÁLISE DOCUMENTAL

e. entre conceitos e as sua propriedades;

Exemplo:

FOGO

TR CALOR

CALOR

TR FOGO

f. entre conceitos relacionados e as suas origens;

Exemplo:

ÁGUA

TR NASCENTE

NASCENTE

TR ÁGUA

g. entre conceitos ligados por causa-efeito;

Exemplo:

EROSÃO

TR VENTO

VENTO

TR EROSÃO

h. entre um objecto e o seu contrário;

Exemplo:

CHUVA

TR GUARDA-CHUVA

GUARDA-CHUVA

TR CHUVA

i. entre um conceito e suas unidades de medidas;

Exemplo:

FREQUÊNCIA

TR HERTZ

HERTZ

TR FREQUÊNCIA

14

Page 15: Relações básicas num tesauro

j. entre termos sincategoremáticos e os termos dos substantivos ligados

a eles;

Exemplo:

LITERATURA CINZENTA

TR LITERATURA

LITERATURA

TR LITERATURA CINZENTA

k. entre conceitos que tenham uma sucessão no espaço e no tempo;

Exemplo:

INFÂNCIA

TR ADOLESCÊNCIA

TR ADULTEZ

TR VELHICE

ADOLESCÊNCIA

TR ADULTEZ

TR INFÂNCIA

TR VELHICE

...

l. entre termos antónimos;

Exemplo:

ESTABILIDADE

TR INSTABILIDADE

INSTABILIDADE

TR ESTABILIDADE

15

Page 16: Relações básicas num tesauro

Conclusão

As relações semânticas aqui apresentadas têm como principal

objectivo controlar o vocabulário de um thesaurus. Visam, sobretudo,

permitir uma representação precisa e unívoca do conteúdos dos documentos

sujeito ao processo de análise documental.

Vimos que as relações de equivalência se prestam de forma mais

efectiva ao controlo do vocabulário ao controlarem a sinonímia. Por outro

lado, as relações hierárquicas, ainda que se prestem igualmente ao controlo

vocabular – a combinação hierárquica de termos genéricos e específicos

permite reduzir ambiguidades motivadas sobretudo pela polissemia uma vez

que esse contexto estrutural especifica os eventuais termos polissémicos –

elas contribuem, sobretudo, para a organização estrutural do thesaurus já

que os descritores se apresentam hierarquizados de acordo com a área de

conhecimento do thesaurus. Já as relações associativas cumprem uma

função sobretudo indutiva, ou seja, a sua função num thesaurus é, em muito,

fornecer ao utilizador pistas e levá-lo a pesquisar um assunto relacionado

com aquele sobre o qual fez efectivamente a sua pesquisa, mas que, no

momento da pesquisa, não se lembrou ou tinha em mente. Estas relações

ajudam também no controlo vocabular na medida em que, associando um

termo a outro, podem especificar e fixar o seu sentido.

16

Page 17: Relações básicas num tesauro

Para terminar, verificámos ainda nesta breve reflexão sobre as

relações básicas existentes num thesaurus que as relações hierárquicas e

associativas se estabelecem entre descritores (ou rubricas uniformes) e que

as relações semânticas se estabelecem entre descritores e não-descritores,

reduzindo, deste modo, os termos entre os quais se estabelecem as relações

hierárquicas e associativas.

17