INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática...

30
INFORMÁTICA INFORMÁTICA INSTRUMENTAL INSTRUMENTAL Prof. Edberto Ferneda

Transcript of INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática...

Page 1: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

INFORMÁTICA INFORMÁTICA INSTRUMENTALINSTRUMENTAL

Prof. Edberto Ferneda

Page 2: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

BUSCA DE BUSCA DE INFORMAÇÃO NA INFORMAÇÃO NA WEBWEB

Informática Instrumental

Page 3: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaLivro

◦Numeração de páginas;◦Subdivisão em partes (capítulos);◦Sumários e índices;

◦Exame rápido do conteúdo;◦Acesso não linear e seletivo ao texto;◦Segmentação do saber em módulos;◦Conexões a outros livros

(bibliografia)

Page 4: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaLivro

Page 5: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaJornais

◦Adaptados a uma atitude de “atenção flutuante”;

◦No território quadriculado do livro precisamos de índices, sumários, etc. O leitor do jornal realiza diretamente uma navegação a olho nu;

◦As manchetes chamam a atenção, dando uma primeira idéia, pinçam-se aqui e ali algumas frases, uma foto e, de repente, encontramos algo que nos atrai.

Page 6: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaJornais

Page 7: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaRevistas

Page 8: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

◦ “pacote terrivelmente redobrado, com pouquíssima superfície que seja diretamente acessível em um mesmo instante. A manipulação deve então substituir o sobrevôo”.

◦ Tela gráfica de alta resolução;◦ Representação icônica (figurada) das

estruturas de informação e dos comandos;◦ Uso do mouse, permitindo agir sobre o que

ocorre na tela;◦ Menus que mostram as operações que se

pode realizar;

Page 9: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

Page 10: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

Page 11: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

Page 12: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

Page 13: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Interfaces da EscritaInterfaces da EscritaComputador

WebBrain

Page 14: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

BUSCANDO BUSCANDO INFORMAÇÕES NA INFORMAÇÕES NA WEBWEB

Page 15: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando informações na Buscando informações na WebWebSites/mecanismos de busca

◦ permitem ao usuário submeter sua expressão de busca e recuperar uma lista (geralmente ordenada) de endereços de páginas (URLs) que presumivelmente são relevantes para a sua necessidade de informação

◦ Maioria de uso geral◦ Em um acervo extremamente grande como é

a Web é essencial uma indexação antecipada de seus documentos (páginas). A maioria dos mecanismos de busca da Web gera índices. Pelo caráter dinâmico da Web esses índices devem permanecer em constante processo de atualização

Page 16: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWebSites/mecanismos de busca

◦Índexação Não Automáticos

O autor fornece dados sobre sua página e associa a ela uma ou mais categorias que descrevem o assunto tratado na página

Automáticos Spiders (robôs, crawlers ou worms)

Partindo de uma lista inicial de URLs, rastreiam a estrutura hipertextual da WEB, colhendo informações sobre as páginas que encontram;

Indexam cada página utilizando métodos de indexação automática

Page 17: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Indexação não-automática (manual)◦ Indexadores profissionais especificam uma

hierarquia de assuntos e indexam as páginas Web utilizando tais categorias.

◦ Uma URL submetida pode ser associada a uma categoria de qualquer nível. Por exemplo, ela pode ser ligada a uma categoria principal, “Ciência”, ou à subcategoria, “Ciências Humanas”, ou à sub-subcategoria, “Biblioteconomia e Ciência da Informação”.

◦ A URL cadastrada é avaliada por profissionais, que podendo alterar os dados fornecidos pelo usuário.

◦ Caso um usuário não consiga encontrar uma categoria apropriada para descrever sua página, ele pode sugerir uma nova categoria.

Page 18: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Page 19: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb Indexação automática

◦ A indexação automática é realizada através de duas etapas: Seleção de endereços (URLs) de páginas; Indexação das páginas, gerando para cada uma um

conjunto de termos de indexação.

◦ Existem programas que “viajam” através da Web a fim de selecionar URLs de páginas de potencial interesse para que sejam indexadas. Utilizando a metáfora da Web, esses programas são chamados de spiders (aranhas) ou ainda robôs, crawlers ou worms.

◦ Partindo de uma lista inicial de URLs, esses robôs rastreiam a estrutura hipertextual da Web colhendo informação sobre as páginas que encontram.

Page 20: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Banco de dados de URLs

Buscador(yahoo, google, etc)

Page 21: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Banco de dados de URLs

Buscador(yahoo, google, etc)

URLs(links)

Page 22: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Banco de dados de URLs

Buscador(yahoo, google, etc)

URLs(links)

Page 23: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb Indexação automática

◦ Duas estratégias podem ser adotadas pelos robôs para rastrear as páginas da Web breadth-first

visa maximizar a amplitude da pesquisa descendo apenas poucos níveis de cada site

deep-first visa maximizar a profundidade buscando um maior detalhamento do

assunto tratado pelo site.

◦ Quando uma nova página é recuperada, o robô extrai todas os links (URLs) dessa página e os adiciona na sua base de dados.

◦ Para aumentar a velocidade de cobertura da Web podem ser usados vários robôs trabalhando em paralelo, cada um cobrindo uma região ou um domínio diferente da Web e enviando suas URLs para a base de dados.

Page 24: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWebIndexação automática

◦Depois de formado o banco de dados de URLs o robô poderá acessar cada página e indexa-la usando métodos de indexação automática.

Page 25: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWebBuscas

◦Geralmente dois níveis de busca: básico e avançado

◦Básico: Buscas booleanas utilizando os

operadores AND, OR, NOT

◦Avançado: Buscas por proximidade: NEAR, ADJ Buscas por tipo de mídia ou tipo de

arquivo: “.JPG”, “.MPEG”, “.GIF”, etc.

Page 26: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

www.google.com.br

Page 27: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

História da Internet

Page 28: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWebMeta-buscadores

◦Realizam buscas utilizando diversos mecanismos de busca; A expressão de busca é traduzida e

enviada para cada um dos mecanismos que o meta-buscador utiliza.

Cada buscador retornará uma lista de URLs

O meta-buscador agrega as listas em uma única lista, eliminando possíveis duplicações.

Page 29: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

Page 30: INFORMÁTICA INSTRUMENTAL Prof. Edberto Ferneda. BUSCA DE INFORMAÇÃO NA WEB Informática Instrumental.

Buscando Informações na Buscando Informações na WebWeb

http:///www.metacrawler.com