1aulaindexacao2013-130515205248-phpapp01
-
Upload
erica-pedrosa -
Category
Documents
-
view
26 -
download
8
Transcript of 1aulaindexacao2013-130515205248-phpapp01
Relembrando fundamentos da representação temática
Universidade Federal do Rio Grande (FURG) Disciplina Indexação: T & P (2013)Profa. Gisele Dziekaniak
[email protected] http://indexacaoteoriaepraticafurg.blogspot.com.br/
Classificação
Para James Duff Brown a classificação é umPara James Duff Brown a classificação é um “processo mental” constantemente executado de “processo mental” constantemente executado de forma consciente e inconsciente por qualquer ser forma consciente e inconsciente por qualquer ser humano, ainda que não reconhecido como tal.humano, ainda que não reconhecido como tal.
Para Piedade (1983, p. 16) “Classificar é dividir em grupos ou classes, segundo as semelhanças e diferenças.”
Para Ranganathan classificar era traduzir o nome dos assuntos dos documentos da linguagem natural para a linguagem artificial adotada pelos sistemas de classificação bibliográfica. (PIEDADE, 1983)
Característica, classe e categoria
Característica Qualidade ou atributo escolhido para servir de base à
classificação ou à divisão. Pode-se classificar adotando características distintas
para o mesmo objeto. Exemplos: Livros
- Tamanho- Cor- Língua- Assunto
“Há tantas possibilidades de classificar quantas forem as semelhanças e diferenças existentes entre os objetos ou ideias a classificar.” (PIEDADE, 1983, p. 17)
■ Literatura
- Lugar
- Língua
- Período
Classificação cruzada
Pode-se classificar adotando várias características, mas empregando uma de cada vez e aplicando-a a todos os membros da classe. Ex.: característica Sexo para dividir animais racionais, não poderemos empregar, ao mesmo tempo, a característica faixa etária.
O emprego simultâneo de mais de uma característica se chama Classificação cruzada, quando as classes não são mutuamente excludentes, gerando confusão.
Classificação cruzada
Exemplo correto:
Animais Racionais
_________________________
Homens Mulheres
____________ _____________
Crianças Adolescentes Adultos Crianças Adolescentes Adultos
Classificação cruzada
Exemplo incorreto: Se empregássemos, ao mesmo tempo duas características (Língua e lugar)
Literatura
____________________________________
Em língua Do Brasil De Portugal Em língua Do Chile Do Peru etc.
portuguesa espanhola
Característica, classe, categoria
ClasseÉ o conjunto de coisas ou ideias que possuem
um ou vários atributos, predicados ou qualidades em comum. Ex.: Mamíferos, Vertebrados, Canários, Animais.
Categoria São as maiores classes de fenômenos, as
classes mais gerais que podem ser formadas.São as grandes classes. Ex: na categoria Lugar,
pode-se distinguir as facetas: Lugar físico, Lugar político, Orientação (norte, sul etc.).
Aristóteles e a classificação
Aristóteles dividiu o conhecimento com base em três critérios (NUNES, 2007): Critério de ausência ou presença do homem
nos seres investigados; critério de imutabilidade e critério de modalidade prática.
Trata-se de uma hierarquização conceitual que divide um tema geral em espécies a partir de uma característica classificatória.
Aristóteles e a classificação
Aristóteles desenvolveu um sistema filosófico baseado em uma concepção rigorosa do Universo. Em seus tratados biológicos, apresentou o sistema de classificação dos animais que não se encontrava completo e que, originariamente em número de quatro, foram os seguintes:
Gênero Espécie Diferença Propriedade, e Acidente.
Aristóteles e a classificação
Metafísica
Porfírio e a classificação
A partir de Aristóteles, Porfírio descreve como as qualidades atribuídas às coisas
podem ser classificadas,
quebrando o conceito filosófico
da substância como um
genus/espécie do
relacionamento:
Bacon e a classificação
Na classificação baconiana, apesar de algumas de suas classes e divisões se tornarem imbricadas, este sistema foi considerado um dos mais influentes nas diversas tentativas feitas para classificar o conhecimento. A classificação de Bacon está baseada na figura abaixo:
Bacon e sua classificação
MIR (Memória, Imaginação e Razão)
Foi a base para a criação da CDD
Indexação - conceito
Etapas do tratamento temático
Análise de assunto Processo de ler um documento para extrair
conceitos que traduzam a essência do seu conteúdo. (DIAS, NAVES, 2007, p. 9)
Envolve cultura do indexador, experiência, conhecimento linguístico, cognitivo e lógico.
Também chamada de análise conceitual, análise documentária, análise da informação e subject analysis.
Etapas do tratamento temático
1) Fases da Análise de assunto Leitura técnica do documento (leitura
documental) Extração de conceitos que representam a obra Atinência - termos em LN (do que trata a obra?)
Sugestão de leitura: Dias e Naves (2007)
Etapas do tratamento temático
2) Tradução Passagem dos termos de linguagem natural
(LN) para linguagem artificial/documentária (LA/LD).
Eleição descritores autorizados pela LD (cabeçalhos de assunto, palavras-chave, termos de indexação).
Sugestão de leitura: Lancaster (2004)
Análise documentária
“A análise documentária é definida como um conjunto de procedimentos efetuados com o fim de expressar o conteúdo dos documentos, sob formas destinadas a facilitar a recuperação da informação.” (DIAS, NAVES, 2007, p. 11)
Metainformação (informação da informação)
Leitura do bibliotecário (LUCAS, 2000)
Questões ideológicas Equívoco da neutralidade Ilusão da completude Sujeitos leitores
Organizam arquivos Autorizados a ler, escrever e interpretar
Tipos de leitura Como apreensão do documento (literal) Como leitura interpretativa
Dica de leitura: Lucas (2000)
Subordinação, superordenação e coordenação
Meio de transporte
Aéreo AquáticoTerrestre
Carro Moto
Superordenação Subordinação
Coordenação
Recuperação da Informação - RI
Information Retrieval: Termo cunhado por Calvin Mooers (década de 1950) que engloba aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.
É a responsável pela criação e desenvolvimento da Ciência da Informação. (SARACEVIC, 1996)
O objetivo é recuperar informações através da busca por alguma entrada catalogada a priori.
Sistema de Recuperação da Informação - SRI Um sistema de informação coleta, processa,
armazena, analisa e dissemina informações e é constituído por um conjunto de componentes relacionados entre si. (GROSSI, 2008).
São sistemas de operações interligadas para identificar dentre um grande conjunto de informações, aquelas que sejam úteis, de acordo com a demanda expressa pelo usuário. (LOPES, 2002)
Objetivo de um SRI é permitir que um usuário recupere documentos através de características como: autor, título, assunto ou qualquer combinação desses elementos.
Atividades em um SRI
Representação das informações contidas nos documentos;
Armazenamento; Gestão física e/ou lógica desses documentos
e de suas representações; Recuperação da informação representada e
dos próprios documentos armazenados (links).
Disseminação da informação.
Sistema de Recuperação da Informação - SRI “Localização de documentos e itens de
informação que tenham sido objeto de armazenamento.” (ROWLEY, 2002, p. 114)
Para Cendón (2006) catálogos de bibliotecas, bases de dados bibliográficas, e motores de busca na internet são exemplos de SRI. (GROSSI, 2008)
Subsistemas dos SRIs
Subsistemas de entrada: Seleção/aquisição, descrição, representação, organização de arquivos, armazenamento.
Subsistemas de saída: Análise e negociação de questões, estratégia de busca/recuperação, disseminação/acesso ao documento.
Subsistema de avaliação:Não se refere especificamente nem à entrada, nem à saída, mas a ambos, ao sistema como um todo.
Avaliação dos SRI
Cobertura:Representa quanto o sistema contém informações
relevantes.
Exaustividade:Este conceito relaciona-se ao grau de profundidade com que os assuntos dos documentos são representados.
Precisão: Relaciona-se com a proporção de itens recuperados que são relevantes.
Avaliação dos SRI
Tempo de resposta: É o intervalo médio entre o momento da consulta e a apresentação do resultado.
Esforço do usuário:É o esforço despendido para obter resultados na busca.
Formato: como os resultados são apresentados. São várias as características e tipologias comuns aos diversos sistemas de recuperação da informação, porém um módulo que todos devem possuir, por ser fundamental, é o módulo de interface com o usuário. (ARAUJO, 1994).
Estratégias de busca em um SRI
Estratégia de busca é o conjunto de decisões tomadas e de procedimentos adotados durante uma busca.
É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados. (LOPES, 2002).
É a técnica ou conjunto de regras para tornar possível o encontro entre uma pergunta formulada e a informação armazenada em uma base de dados.
Uma boa estratégia de busca implica em conhecer a base de dados, as fórmulas de busca, o assunto que se busca e/ou a bibliografia que é objeto de busca.
Identificar a Necessidade de Informação (NI).
NI fórmula de busca = resultado SRI
Estratégia de busca
Resposta insatisfatória = RUÍDO = Usuário insatisfeito = Nova estratégia de busca Resposta satisfatória = NI satisfeita= Item recuperado = usuário satisfeito
Objetivos da estratégia de busca
Recuperar um número suficiente de registros relevantes e evitar que: Sejam recuperados itens irrelevantes; Sejam recuperados um número excessivo de
itens; Sejam recuperados um número insignificante
de registros.
Problemas em recuperação da informação Os autores nem sempre usam as mesmas
palavras que os usuários para descrever o mesmo conceito.
Má formulação da consulta.
Lógica de busca: Operadores booleanos
AND E
OR OU
NOT NÃO
Os operadores booleanos tem por objetivo definir como será a combinação feita entre os termos ou expressões de uma pesquisa.
Lógica de busca: Operadores booleanos OR/OU Amplia a pesquisa e tem a
intenção de buscar ou esse ou aquele termo. Ou seja, qualquer uma das palavras.
Exemplo:A or B
A B
Lógica de busca: Operadores booleanos AND/E Restringe a pesquisa e
significa a expressão que tenha todas as palavras. O resultado da busca deve recuperar ambos os termos.
Exemplo:A and B
Lógica de busca: Operadores booleanos NOT/NÃO Exclui um dos termos da
pesquisa. Equivale dizer: sem a seguinte palavra.
Exemplo:
A not B
Lógica de busca: Operadores booleanos Podem ser usados em expressões mais
complexas, onde se adotam os parênteses. Ex: (A or B) and CA pesquisa será feita 1º combinando a OR b e o
resultado se combina com AND
Exercícios Operadores booleanos
Crie buscas usando assuntos que representem os seguintes conjuntos:
1. 3.
2. 4.
Linguagem de indexação e de busca
Linguagem de indexação: Termos ou códigos usados como pontos de acesso em
um índice. Geralmente adota linguagem controlada (LC)
Linguagem de busca: Termos que são usados por um consulente ao
especificar uma necessidade de busca. Podem ser Linguagem natural (LN) ou LC, desde que o
usuário tenha acesso à linguagem documentária adotada pelo sistema de recuperação da informação.
Linguagem natural e linguagem artificial ou controlada (LOPES, 2002)
CONCEITUE LINGUAGEM NATURALÉ a linguagem usada habitualmente na fala e na escrita representadas na base de dados pelos termos do título e resumo.
CONCEITUE A LINGUAGEM CONTROLADA É o conjunto de termos organizados de forma
hierarquizadas e/ou alfabética, com o objetivo de possibilitar a recuperação de informação temáticas, reduzindo substancialmente a diversidade de terminologia.
Tarefa: Pesquisar conceitos de LN e LA/LC/LD em outras fontes de informação da área. Entrega: Próxima aula. (não esquecer de referenciar as fontes adotadas).
Diferenças entre Linguagem natural (LN) e linguagem controlada (LC, LC)
Linguagem natural ou livre (LN)
Linguagem controlada (LC, LA, LD)
Busca direta no texto Depende de uma LD
Usa linguagem comum do usuário
Distancia-se da linguagem do usuário
Oferece mais pontos de acesso
Os pontos de acesso são limitados pelo indexador
Oferece maior revocação Oferece menor revocação
Oferece menos precisão Oferece maior precisão
Tarefa: Ler o texto LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002 e CRIAR QUADRO COMPARATIVO ENTRE LN E LC Entrega: próxima aula.
Revocação e Relevância (Lancaster, 2004)
Revocação (recall) Capacidade de um SRI em recuperar itens
existentes na base de dados. Precisão mede quantos documentos
relevantes foram recuperados
Relevância (Precisão) Capacidade de um SRI em recuperar itens
úteis ao usuário e minimizar a recuperação de documentos inúteis.
Fórmulas para avaliar um SRI (Revocação e Relevância)
Itens não recuperados Relevantes (D)
Itens não recuperados Relevantes (D)
Itens não recuperados não Relevantes (C)
Itens recuperados Relevantes (A)
Itens recuperados não Relevantes (B)
Revocação = relevantes recuperados/ total de itens relevantes que existem no sistema
Precisão = relevantes recuperados/ total de itens recuperados
Revocação R= A / (A+D)
Relevância P = A / (A+B)
Revocação e Relevância
Esses dois parâmetros são inversamente relacionados, significando que a melhoria de um implica na piora do outro.
Tradicionalmente, existem dois fatores muito importantes que governam a eficiência da indexação de um documento e consequentemente, influenciam na revocação e na precisão: Exaustividade: Define o número de diferentes
conceitos (tópicos) que estão indexados. Especificidade: Define o grau de precisão da
linguagem de indexação em descrever um dado documento.
Referências
ARAUJO JUNIOR, R. H. Precisão no processo de busca e recuperação da informação. Brasília: Thesaurus, 2004.
DIAS, M. M. L.; DIAS, E. W. Análise de assunto: teoria e prática. Brasília: Briquet de Lemos, 2007.
GROSSI, M.G. R. Estudo das características de software e implantação de um software livre para gerenciamento de bibliotecas universitárias federais brasileiras. 2008. Tese (Doutorado em Ciência da Informação) – UFMG, Belo Horizonte, 2008.
LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004.
LOPES, I. L. Uso das linguagens controlada e natural em bases de dados: revisão de literatura. Ci. Inf., v. 31, n.1, Brasília, p.41-52, jan./abr. 2002.
Referências
NUNES, L. Da Classificação das Ciências à classificação da Informação: uma análise do acesso ao conhecimento. 2007. Dissertação (Mestrado em Ciência da Informação) - PUC de Campinas, 2007. Disponível em <http://www.bibliotecadigital.puc-campinas.edu.br/tde_busca/arquivo.php?codArquivo=340 > Acesso em 22 nov. 2009
PIEDADE, M. A. R. Introdução à teoria da classificação. Rio de Janeiro: Interciência, 1977.
ROWLEY, J. A biblioteca eletrônica. 2.ed. Brasília: Briquet de Lemos, 2002.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n.1, p.41-62, jan./jun. 1996.