Aula 4

35
Aula 4 Disciplina: Recuperação da Informação Letícia Strehl 9 abr. 2009

description

Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de buscaComponente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de buscaComponente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)

Transcript of Aula 4

Page 1: Aula 4

Aula 4Disciplina: Recuperação da Informação

Letícia Strehl9 abr. 2009

Page 2: Aula 4

Conteúdos da Aula 4

Componente do processo de RI (4/6) : a verbalização da necessidade de informação em uma seqüência de expressões de busca

Componente do processo de RI (5/6): a seqüência dos itens apresentados como um resultado da estratégia de busca

Componente do processo de RI (6/6): a medida em que os registros recuperados satisfazem a necessidade de informação do usuário (avaliação da relevância)

Page 3: Aula 4

Componente do processo de RI (4/6)

A verbalização da necessidade de informação em uma seqüência de expressões de busca

Page 4: Aula 4

Aspectos principais dos pedidos dos usuários

Aspecto semântico: é o tópico de um pedido, apresenta o assunto que é a preocupação do usuário. Exemplo: “A influência dos hábitos alimentares

nos fatores de risco cardiovasculares em idosos.”. Aspecto pragmático: diz respeito ao propósito

do pedido do usuário, a finalidade para a qual a informação recuperada será utilizada. Exemplo: imagina-se que o usuário poderá

precisar de uma busca exaustiva por todos os documentos relevantes; ou somente de uns poucos trabalhos altamente relevantes; ou ainda deseja recuperar apenas os documentos publicados recentemente.

FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link

A e

ntr

evis

ta d

e r

efe

rên

cia

pre

cisa

rá e

scla

rece

r os

dois

asp

ect

os.

Page 5: Aula 4

Quando o pedido torna-se objeto de estratégia e tática de busca: definições Estratégia de busca (como o ato da

busca): um plano para a busca como um todo

Estratégia de busca (como um área de estudo): o estudo da teoria, dos princípios e da prática de formular e usar táticas de busca

Tática da busca: o movimento feito para melhorar uma busca

Page 6: Aula 4

Tipos de busca em um SRI

Busca por um item conhecido Busca por uma informação específica Busca por uma informação geral Busca exploratória pela base de dados

MEADOW, Charles T., Boyce, Bert , Kraft, Donald . Text Information Retrieval Systems. 2nd ed. San Diego: Academic Press, 2000.

Page 7: Aula 4

Informações Essenciais para definição dos Elementos da Busca

Informações sobre: a base de dados os procedimentos de busca o conhecimento anterior do pesquisador

Page 8: Aula 4

A etapas de elaboração de expressões de busca

Análise dos conceitos Eleição dos termos de busca Seleção dos recursos de busca

Page 9: Aula 4

Análise dos conceitos

Definir os conceitos mais relevantes para o tema a ser pesquisado.

Pergunta para auxiliar o usuário: Qual seria o título do artigo perfeito?

SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).

Page 10: Aula 4

Exemplo de busca para a análise dos conceitos

Busca por informações sobre: “A influência dos hábitos alimentares nos fatores de risco cardiovasculares em idosos.”

SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).

Page 11: Aula 4

Uma solução caseira para identificar os conceitos

Física da matéria condensada experimental. Quais são: os materiais estudados? as propriedades e os fenômenos

observados? as técnicas de análise empregadas?

LANCASTER, F. W. Indexação e resumos: teoria e prática. 2.ed. Brasília: Briquet de Lemos, 2004. O Apêndice 2 apresenta algo semelhante.

Page 12: Aula 4

Exemplo de um registro do INSPEC

Materiais

Propriedades e fenômenos

Técnicas de análise

Page 13: Aula 4

Eleição dos termos de busca

Objetivo: ampliar os conceitos com um maior número de termos possíveis, visando a recuperação de tudo que há sobre o tema.

Fontes: o próprio usuário, através de seu conhecimento

ou de artigos e livros que ele tenha como referência

os tesauros e vocabulários controlados das bases de dados

os dicionários técnicos, de sinônimos, manuais, etc.

SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).

Page 14: Aula 4

Exemplo de busca para a eleição dos termos

Termos:

SALVADOR OLIVÁN, J. A.; ANGÓS ULLATE, J. M. Técnicas de recuperación de información: aplicación con Dialog. 1ª. ed. Gijón: Trea, 2000. (Biblioteconomía y administración cultural, 37).

Page 15: Aula 4

A rotina de seleção dos termos

FIDEL, R. Searchers selection of search keys. 1, The selection routine. Journal of the American Society for Information Science, v. 42, n. 7, p. 490-500, Aug. 1991. Link

Page 16: Aula 4

Seleção dos recursos de busca: Definição

Recursos desenvolvidos com a finalidade de atender a um ambiente baseado em texto, onde o usuário não sabe de antemão quais são os documentos cobertos pela base de dados ou desconhece os termos a partir dos quais os registros podem ser recuperados.

ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.

Page 17: Aula 4

Recursos de busca usuais (1)

ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.

Page 18: Aula 4

Recursos de busca usuais (2)

ROWLEY, J. A biblioteca eletrônica. Brasília: Briquet de Lemos, 2002.

Page 19: Aula 4

Componente do processo de RI (5/6)

A seqüência dos itens apresentados como um resultado da estratégia de busca

Page 20: Aula 4

A seqüência dos itens apresentados como um resultado da estratégia de busca

104 mil !

Page 21: Aula 4

Componente do processo de RI (6/6)

A medida em que os registros recuperados satisfazem a necessidade de informação do usuário

Page 22: Aula 4

Uso da informação

O indivíduo seleciona mensagens entre um grupo de mensagens que recebe ou acompanha. Ele faz a escolha quando percebe uma relação significativa entre o conteúdo da mensagem e o problema que tem em mãos.

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Determinada pelo conhecimento e rede de referências do indivíduo, assim como conteúdo e forma da mensagem

Page 23: Aula 4

Relevância da informação

A principal tentativa de medir o produto da RI é o conceito de relevância.

A relevância pode ser definida tendo como parâmetros duas perspectivas distintas: Do sistema: relacionamento entre os

registros recuperados e o pedido Do usuário: valor ou utilidade do registro

para o usuário

MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 24: Aula 4

Relacionamento X Valor

Exemplo: Como resultado de uma busca é

recuperado um documento já conhecido pelo usuário e que está altamente relacionado com o assunto que motivou a pesquisa. Em termos de relacionamento, o documento satisfaz completamente o critério de relevância. Em termos de utilidade para o usuário, o valor é nulo, considerando que o documento não é capaz de fornecer nova informação.

MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 25: Aula 4

A relevância sob duas perspectivas:o sistema (1)

A informação pode ser representada objetivamente, possibilitando a comparação entre a representação e a questão proposta

Computa-se o número de correspondências entre os termos da pesquisa do usuário e os termos do documento, de modo a medir o grau de proximidade com o tema de pesquisa.

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 26: Aula 4

A relevância sob duas perspectivas:o sistema (2)

LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.

Page 27: Aula 4

A relevância sob duas perspectivas:o usuário

A relevância é produto de uma relação construída pelo usuário entre a informação e a pesquisa. Deste modo, é:

Subjetiva, dependente do julgamento humano; Cognitiva, dependente do conhecimento e da percepção do

indivíduo; Situacional, relacionada com os problemas particulares de

informação do usuário; Multidimensional, influenciada por variados fatores; Dinâmica, sujeita a constantes mudanças ao longo do

tempo; Mensurável, pode ser observada num dado momento.

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 28: Aula 4

A medida da relevância (1)

A relevância, seja qual for sua definição, é considerada a o principal parâmetro para avaliação da RI.

Basicamente, três medidas compostas são utilizadas para analisá-la: Precisão Revocação Eficácia (menos utilizada)

MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 29: Aula 4

A medida da relevância (2)

Relevante Não relevante

Recuperado a b

Não recuperado c d

MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 30: Aula 4

Precisão

Capacidade de evitar documentos irrelevantes

Onde: P= precisão a=documentos relevante recuperados b=documentos não relevantes recuperados

LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 31: Aula 4

Revocação

Capacidade de recuperar documentos relevantes

Onde: R= revocação a=documentos relevante recuperados c=documentos relevantes não recuperados

LANCASTER, F. Wilfrid. Indexação e resumos : teoria e prática. Brasília: Briquet de Lemos, 1993.MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Page 32: Aula 4

Eficácia

Capacidade de recuperar itens relevantes e ignorar os irrelevantes

Onde: E= eficácia P=Precisão R=Revocação

MEADOW, C. T. et al. Text information retrieval systems. 2nd. ed. San Diego: Academic Press, 2000. (Library and information science).

Uma das possíveis

fórmulas para o cálculo

Page 33: Aula 4

Classes de uso da informação (Taylor)

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 34: Aula 4

O cuidado com a “supersimplificação”

Risco, ver SEMPRE o usuário como alguém que quer: extrair informações específicas num curto

espaço de tempo, OU, ao contrário investir esforço para buscar e explorar

informação

A verdade é que as pessoas oscilam continuamente entre extrair e explorar

- O uso da informação é um processo confuso, desordenado, sujeitos aos caprichos humanos, como qualquer outra atividade -

CHOO, C. W. A organização do conhecimento. 2.ed. ed. São Paulo: Senac, 2006. Cap. 2

Page 35: Aula 4

Fim