Aula 01 - Recuperação da Informação
-
Upload
nilton-heck -
Category
Technology
-
view
6.829 -
download
3
description
Transcript of Aula 01 - Recuperação da Informação
![Page 1: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/1.jpg)
DCI-UFPE 1
Recuperação da Informação
Renato Fernandes Corrêa
Recuperação da Informação -Introdução
2010.2
![Page 2: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/2.jpg)
2
Roteiro
Motivação/Introdução
Definição
Sistema de Recuperação de Informação
Exemplos de SRI
![Page 3: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/3.jpg)
3
Motivação/Introdução
O problema: "a tarefa massiva de tornar mais acessível, um acervo crescente de conhecimento“. VANNEVAR BUSH (1945)� Explosão informacional� Importância estratégica da informação
![Page 4: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/4.jpg)
4
Motivação/Introdução
A solução: Calvin MOOERS (1951) cunhou o termo recuperação de informação, destacando que ele "engloba os aspectos intelectuais da descrição de informações e suas especificidades para a busca, além de quaisquer sistemas, técnicas ou máquinas empregados para o desempenho da operação.“
“Certamente, a recuperação da informação não foi a única responsável pelo desenvolvimento da CI [Ciência daInformação], mas pode ser considerada como principal; ao longo do tempo, a CI ultrapassou a recuperação da informação, mas os problemas principais tiveram sua origem aí e ainda constituem seu núcleo.” SARACEVIC (1991)
![Page 5: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/5.jpg)
5
Recuperação de InformaçãoDefinição
Área de pesquisa e desenvolvimento que � investiga métodos e técnicas� para a representação, a organização, o armazenamento, a busca e a recuperação de itens de informação
Objetivo principal� facilitar o acesso a documentos (itens de informação) relevantes à necessidade de informação do usuário�Geralmente representada através de consultasbaseadas em palavras-chaves
![Page 6: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/6.jpg)
6Tarefa típica de Recuperação de Informação (RI)
Dados� Um corpus de documentos e� Uma consulta do usuário
Encontrar � Um conjunto (ordenados) de documentos que são relevantes para a consulta
![Page 7: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/7.jpg)
7
Elementos de um Sistemas de RI
Sistema de RIConsulta
Corpus de
documentos
Documentos
ordenados
1. Doc1
2. Doc2
3. Doc3
.
.
Usuário
![Page 8: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/8.jpg)
Indexação
8
Como funciona?
Usuário
Necessidade de
Informação
RecuperaçãoRecuperação
Documentos
Indexação
RepresentaçãoRepresentação
Consulta
Recuperação de Informação
Sistema de
Recuperação da Informação
Resultado
Armazenamento
Casamento, Ordenação
![Page 9: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/9.jpg)
Modelos de Recuperação de Informação
Existe uma distinção entre:� A tarefa do usuário
� Recuperação ou Navegação
� A visão lógica dos documentos � sua representação no sistema
� O modelo de recuperação de informação� Clássico ou estruturado ou navegação
![Page 10: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/10.jpg)
Navegação
Embrapa - Infoteca
![Page 11: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/11.jpg)
Recuperação
![Page 12: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/12.jpg)
12
Sistemas de RI
Um sistema automático para RI pode ser visto como� a parte do sistema de informação responsável pelo armazenamento ordenado dos documentos em um banco de dados,
� e sua posterior recuperação� para responder a consulta do usuário.
Etapas principais na construção:� Aquisição (seleção) dos documentos� Preparação dos documentos� Indexação dos documentos� Armazenamento� Recuperação
� Busca (casamento com a consulta do usuário)� Ordenação dos documentos recuperados
![Page 13: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/13.jpg)
13Exemplos de sistemas de recuperação de informação
Sistemas de RI em DVD e Cederrom
Catálogo em linha de acesso público
Engenhos de busca
Serviços de busca em linha
Sistemas de gerenciamento de documentos
Sistemas de Filtragem de Informação
Sistemas de Extração de Informação
![Page 14: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/14.jpg)
Catálogo em linha de acesso público(OPAC)
Sistemas que recuperam informação em bases de dados catalográficos de bibliotecas.
Exemplo:
![Page 15: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/15.jpg)
15
Engenhos de Busca
WebWeb
Consulta
Resposta
Base deÍndices
Engenho de Busca
Usuário
Spider
Indexador
Representação dos Docs
Servidor de Consultas
Aquisição
Pré-ProcessadorDocs
Recuperador
Ordenador
21
34
Motor deIndexação
Browser
![Page 16: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/16.jpg)
Serviços de busca em linha
Sistemas que recuperam informação em bases de dados bibliográficos.
Exemplos:
![Page 17: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/17.jpg)
Sistemas de gerenciamento de documentos
Sistemas que gerenciam versões e recuperam informação em um corpus de documentos digitais.
Exemplos:� Softwares Proprietários da IBM, Xerox, Oracle e Microsoft
� Softwares Livres� Alfresco� KnowledgeTree� Main//Pyrus DMS� Nuxeo� OpenKM� Archivista
![Page 18: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/18.jpg)
Sistemas de Filtragem de Informação
Sistemas que filtram a informação recuperada de acordo com o interesse do usuário
Servidor News
ArtigosIndexados
Usuário
Perfil dousuário
Engenho de Busca InternetInternet
![Page 19: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/19.jpg)
19
Sistemas de Extração de Informação
Sistemas capazes de extrair de documentos relevantes apenas a informação requerida
A informação extraída pode ser apresentada ao usuário e/ou armazenada em BDs.
Sistema de EI
BD
Nome:End.:Fone:Fax:Preços:
TemplatePágina de Hotel
![Page 20: Aula 01 - Recuperação da Informação](https://reader030.fdocumentos.tips/reader030/viewer/2022020306/5571066ed8b42a605f8b4e35/html5/thumbnails/20.jpg)
20
Referências
BAYEZA-YATES, RIBEIRO-NETO. Modern Information Retrieval. Addison Wesley: 1999.
ROWLEY, J. A Biblioteca Eletrônica. 2 ed. Brasília: Brinquet Lemos Livros, 2002.
SARACEVIC, T. Ciência da informação: origem, evolução e relações. Perspec. Ci. Inf., Belo Horizonte, v. 1, n. 1, p. 41-62, jan./jun. 1996