Post on 07-Oct-2020
UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE TECNOLOGIA
DEPARTAMENTO DE INFORMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
THIAGO PRADO DE CAMPOS
Uma ferramenta para apoiar a pesquisa exploratória na Web
Maringá 2013
THIAGO PRADO DE CAMPOS
Uma ferramenta para apoiar a pesquisa exploratória na Web
Dissertação apresentada ao Programa de Pós-Graduação em Ciência da Computação do Departamento de Informática, Centro de Tecnologia da Universidade Estadual de Maringá, como requisito parcial para obtenção do título de Mestre em Ciência da Computação Orientador: Prof. Dr. Sérgio Roberto P. da Silva
Maringá 2013
Dados Internacionais de Catalogação-na-Publicação (CIP) (Biblioteca Central - UEM, Maringá – PR., Brasil)
Campos, Thiago Prado C198f Uma ferramenta para apoiar a pesquisa exploratória na Web
/ Thiago Prado Campos. -- Maringá: [s.n.], 2013. 130 f. : il. color., tabs. Orientador : Prof. Dr. Sérgio Roberto Pereira da Silva. Dissertação (mestrado) - Universidade Estadual de
Maringá. Programa de Pós-graduação em Ciência da Computação. Departamento de Informática, 2013.
1.Recuperação da informação - Pesquisa Exploratória. 2.
Pesquisa Exploratória - Ferramentas Web. 3. Framework - Ferramenta de apoio. 4. Interação humano - Computador. I. Universidade Estadual de Maringá. Programa de Pós-graduação em Ciência da Computação. Departamento de Informática. II. Silva, Sérgio Roberto Pereira da. III. Título.
CDD 23.ed. 006.333
DEDICATÓRIA(S)
Em memória de Sebastião Ribeiro de Campos e José Joaquim de Maria.
AGRADECIMENTO(S)
Deus é o autor da vida e agradeço a ele não só pelo dom da vida, mas pelas oportunidades que a
vida me deu para estudar, trabalhar e conhecer pessoas maravilhosas que me fizeram chegar até
aqui, são elas: meus pais, Cristina e Lourenço, que pacientemente e amorosamente me educaram e
me proporcionaram condições e incentivo para estudar; minha esposa, Cristina, que compreendeu
minha necessidade de me ausentar para participar das aulas, realizar os trabalhos e atividades do
programa de mestrado e me apoiou durante todo o percurso; aos colegas de curso que iniciaram
comigo a jornada de aulas e que alguns infelizmente não puderam concluir, mas contribuíram com
esta minha nova experiência de vida; aos colegas do Grupo de Sistemas Interativos Inteligentes
(GSII), pelas discussões, opiniões, dicas de experiência e comunhão de objetivos; e ao meu
orientador, prof. Dr. Sérgio Roberto P. da Silva, pela oportunidade de ter participado da sua
disciplina de IHC como aluno não regular e que nos proporcionou uma caminhada de mútuo
trabalho e dedicação para chegar até aqui. Agradeço também aos demais professores do programa
e funcionários do Departamento de Informática da UEM, que atuaram na condução das atividades
e faço votos de muito sucesso. Também agradeço ao meu diretor, prof. Marcos Imamura e demais
colegas da UTFPR, que me incentivaram durante todo o percurso das atividades do mestrado.
Finalmente, agradeço também às pessoas que de forma identificada, ou anônima, responderam
nossos questionários, contribuindo para a coleta de informações da pesquisa e aos testadores
voluntários da nossa ferramenta.
Uma ferramenta para apoiar a pesquisa exploratória na Web
RESUMO
Este trabalho contextualiza a Pesquisa Exploratória, um tipo de busca de informação que tem
foco em tarefas de aprendizado e investigação. Neste tipo de pesquisa, o pesquisador não
domina o espaço de informação no qual está situado o problema que, em geral, se apresenta a
ele de maneira mal estruturada. Inúmeras ferramentas de apoio vêm sendo desenvolvidas para
conduzir o pesquisador ao sucesso na realização de pesquisas exploratórias, envolvendo as
áreas de interação humano-computador e recuperação da informação. Estas ferramentas,
porém, ainda não atingiram a plenitude de cobertura das necessidades dos pesquisadores
envolvidos nas tarefas de pesquisa exploratória. Uma destas necessidades, por exemplo, é o
apoio às atividades de revisitação de longo e muito longo prazo de documentos. As pesquisas
exploratórias percorrem múltiplas sessões e podem ultrapassar meses de execução, precisando
de um apoio adequado de histórico de pesquisa para proporcionar suporte à recuperação de
documentos importantes outrora visitados. Neste trabalho identificamos as principais
dimensões que podem potencializar o sucesso de uma pesquisa exploratória e propusemos
uma ferramenta que integra o histórico de pesquisa com estas dimensões. Esta ferramenta
utiliza-se de uma abordagem visual da apresentação do histórico combinado com fatores de
personalização e organização do conteúdo que é registrado durante as atividades de busca de
informação. Os resultados obtidos em uma série de experimentos indicaram que vários dos
componentes inseridos no sistema foram úteis para os pesquisadores, sendo este um motivo
para concluirmos que este é um caminho promissor para apoiar a pesquisa exploratória.
Palavras-chave: Pesquisa Exploratória, histórico de busca, busca de informação
A tool for support the exploratory search on the Web
ABSTRACT
This work contextualizes the exploratory search; a kind of information seeking that has a
focus on learning and investigative tasks. In this type of search, the researcher does not
dominate the information space in which the problem is situated that, generally, is brought to
it poorly structured. To drive the user to the success in conducting exploratory research,
numerous specific support tools have been designed and created, with involvement of areas of
HCI and Information Retrieval. These tools, however, have not yet reached the full coverage
of the needs of the researchers involved in exploratory research tasks. One of these needs, for
example, is a better support for activities of long and very-long term revisitation. As
exploratory searches run multiple sessions and can overcome months of implementation, they
need adequate support of the search history to provide support for the recall of important
documents once visited. In this work, we identify the main dimensions that can enhance the
success of an exploratory search, and proposed a tool to integrate the search history with these
dimensions. This tool uses a visual approach to the presentation of the search history
combined with factors of customization and organization of content, which is recorded during
the research activities of the user. The results of a series of experiments indicated that most
components inserted in the system were useful to the researchers and this is a reason for us to
conclude that this is a promising way to support exploratory research.
Keywords: Exploratory search, search history, information seeking.
LISTA DE FIGURAS
Figura 1 - Um rascunho de um pesquisador engajado no modelo berry-picking. Extraído de (HEARST, 2009). ..................................................................................................................... 20
Figura 2 – Atividades de Information Seeking. Adaptado de (MARCHIONINI, 2006) ......... 22
Figura 3 - Posicionando Pesquisa Exploratória. Adaptado de (WHITE e ROTH, 2009). ....... 27
Figura 4 - Tela do VSE, extraída do documento VSE_Shots, disponível em http://sites.google.com/site/alhenshiri/Home/downloads ......................................................... 32
Figura 5 - tela do MyWish extraída de (ANGELACCIO, BUTTARAZZI e PATRIGNANELLI, 2007). ...................................................................................................... 33
Figura 6 - Clusterização de nós proposto por (SALLABERRY, et al., 2010). ........................ 34
Figura 7 - Tela do TheHotMap.com, disponível online em http://www.thehotmap.com ........ 35
Figura 8 – Tela do VisGets, obtida em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore 36
Figura 9 - Tela do WebSearchViz extraída de http://home.engineering.iastate.edu/~tien/WebSearchViz/tool.html ........................................ 37
Figura 10 - Tela de resultados do Tianamo, após pesquisa por “flamengo”. ........................... 37
Figura 11 - Tela da Search Bar (MORRIS, MORRIS e VENOLIA, 2008) ............................. 38
Figura 12 - Ferramenta Search History Tree acoplada ao Factic (ŠIMKO, TVAROZEK e BIELIKOVA, 2010) ................................................................................................................. 39
Figura 13 - Tela do YouPivot. Extraído de (HAILPERN, et al., 2011). .................................. 40
Figura 14 - Interface do sistema Querium 1.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012) ................................................................................................................. 41
Figura 15 – Interface do sistema Querium 2.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012). ................................................................................................................ 42
Figura 16 – Tela do ActionShot, extraído de (LI, et al., 2010). ............................................... 44
Figura 17 – Tela do Context Web History, extraída de (WON, JIN e HONG, 2009) ............. 45
Figura 18 - Exemplos de rich snippets. Extraído de http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=99170 .................. 49
Figura 19 – Resultado da Busca no Google por “Titãs”........................................................... 53
Figura 20 - Mapa conceitual para os elementos da solução ..................................................... 60
Figura 21 – Tela de criação de um novo projeto, com objetivos.............................................. 61
Figura 22 - Diagrama Estendido de Entidade-Relacionamento para base de dados da aplicação servidora. .................................................................................................................................. 64
Figura 23 – Exemplos de recursos de interface do navegador que pode ser utilizado por extensões. Extraído de http://www.jefvlamings.com/blog/chrome-extensions-for-dummies/ 66
Figura 24 – Recursos de Background e Content Script executam sem que o pesquisador perceba. Extraído de http://developer.chrome.com/extensions/overview.html ........................ 66
Figura 25 – Extensão indicando informações de documento já visitado pelo pesquisador ..... 68
Figura 26 – Exemplo de notificação de atividade já realizada ................................................. 69
Figura 27 - Componente popup aberto no contexto de navegação. ......................................... 70
Figura 28 – Tela de Histórico do Projeto ................................................................................. 71
Figura 29 - Tela de detalhes de uma navegação ....................................................................... 73
Figura 30 – Detalhes sobre uma atividade de pesquisa ............................................................ 74
Figura 31 – Área de opções e filtro. Acima exibido de maneira completo e embaixo, com zoom, para melhor compreensão. ............................................................................................. 74
Figura 32 - Miniatura da linha do tempo, para facilitar a navegação em estruturas mais extensas. .................................................................................................................................... 76
Figura 33 - Tela de Preferências do Usuário ............................................................................ 76
LISTA DE TABELAS
Tabela 1 – Comparação entre extensões de apoio ao histórico de pesquisa (1. Nossa solução, 2. e-history , 3. New History, 4. history 2, 5. enhanced history, 6. better history, 7. History Trends, 8. Visual History e 9. YouPivot & Timemarks (Beta). ............................................... 78
Tabela 2 – Dimensões cobertas por nossa solução. .................................................................. 79
Tabela 3 – Resultados das tarefas dos testes de usabilidade. As notas indicam o grau de satisfação sobre como a tarefa está projetada para ser realizada pelo pesquisador, em uma escala de 0 a 10. ........................................................................................................................ 84
Tabela 4 – Frequência de uso da extensão ............................................................................... 85
Tabela 5 – Frequência de uso de recursos da extensão ............................................................ 86
Tabela 6 – Utilidade dos recursos do sistema .......................................................................... 87
Tabela 7 – Opinião dos pesquisadores sobre substituir o histórico tradicional pela solução apresentada. .............................................................................................................................. 89
Tabela 8 – Objetivos escolhidos para o projeto do teste de usabilidade .................................. 91
LISTA DE ABREVIATURAS E SIGLAS
API Application Programming Interface
CSS Cascade Style Sheet
DAO Document Access Object
ESS Exploratory Search Systems
HCI Human Computer Interaction
HCIR Human Computer Interaction and Information Retrieval
HTML Hypertext Mark-up Language
IHC Interação Humano-Computador
IR Information Retrieval
ISP Information Seeking Proccess
JSON JavaScript Object Notation
SERP Search Engine Results Page
URL Uniform Resource Location
SUMÁRIO
Introdução ............................................................................................................................... 15
Information Seeking e Pesquisa Exploratória ...................................................................... 19
2.1. Definindo a Pesquisa Exploratória ........................................................................... 22
2.2. Histórico de Pesquisa e Revisitação .......................................................................... 27
2.3. O estado da arte em ferramentas de Pesquisa Exploratória .................................. 30
2.3.1. Ferramentas que fazem uso de Técnicas de Visualização da Informação ..... 31
2.3.2. Ferramentas baseadas no Histórico de Pesquisa/Navegação........................... 38
2.4. Considerações Finais .................................................................................................. 45
Um Framework para Ferramentas de Apoio ....................................................................... 47
3.1. A Qualidade dos Documentos .................................................................................... 47
3.2. A Apresentação dos Documentos .............................................................................. 49
3.3. O Tempo da Pesquisa ................................................................................................. 51
3.4. Cognição e a Aquisição de Conhecimento ................................................................ 52
3.5. A Personalização da Pesquisa e de seus Resultados ................................................ 53
3.6. A Colaboração entre Pesquisadores ......................................................................... 55
3.7. Considerações Finais .................................................................................................. 56
Uma Ferramenta de Apoio a Pesquisa Exploratória na Web ............................................. 57
4.1. Hábitos de pesquisa e decisões iniciais ...................................................................... 57
4.2. Modelo Conceitual do Sistema Proposto .................................................................. 59
4.3. Aspectos de Implementação da Aplicação Servidora .............................................. 62
4.4. A Extensão e Aspectos de Implementação ............................................................... 65
4.4.1. Analisador de Conteúdo ....................................................................................... 67
4.4.2. Controlador de Operações .................................................................................... 68
4.4.3. Interface do Usuário ............................................................................................. 69
4.5. A Interface de Histórico do Projeto .......................................................................... 71
4.5.1. Linhas do Tempo .................................................................................................. 71
4.5.2. Opções e Filtros .................................................................................................... 74
4.5.3. Miniatura .............................................................................................................. 75
4.6. Preferências do Pesquisador ...................................................................................... 75
4.7. Considerações sobre tecnologias envolvidas ............................................................ 77
4.8. Outras extensões semelhantes e comparações com a nossa solução ...................... 78
4.9. Considerações Finais .................................................................................................. 79
Experimentos e Resultados .................................................................................................... 80
5.1. Avaliação de sistemas de apoio à Pesquisa Exploratória ........................................ 80
5.2. Definição de Experimentos e Grupo de Testes ........................................................ 82
5.3. Resultados ................................................................................................................... 84
5.4. Considerações Finais .................................................................................................. 91
Conclusões e Trabalhos Futuros ........................................................................................... 92
6.1. Trabalhos Futuros ...................................................................................................... 94
Referências ........................................................................................................................... 96
Apêndice A Protocolo de Revisão Sistemática ......................................................... 100
Apêndice B Questionário sobre Hábitos de Pesquisa Exploratória .................... 103
Apêndice C Tabulação das Respostas do Questionário sobre Hábitos de
Pesquisa Exploratória ...................................................................................................... 109
Apêndice D Formulário de Identificação de Participante em Testes .................. 119
Apêndice E Checklist de Funcionalidades ................................................................. 121
Apêndice F Roteiro de Testes de Usabilidade ........................................................... 124
Apêndice G Questionário Final de Avaliação ............................................................ 128
15
Introdução
Suponha um pesquisador da área de Ciência da Computação, membro de um laboratório de
pesquisa em uma empresa privada. Esta empresa desenvolve websites para Internet e
vislumbra que em um futuro próximo parte da navegação na Web será feita por meio dos
televisores. Este pesquisador fica então encarregado de pesquisar e trazer ao gerente de
produtos da empresa oportunidades e soluções destinadas ao uso neste tipo de aparelho. Para
realizar esta tarefa, ele poderá ter de aprender um pouco sobre este ambiente como, por
exemplo, quais: os equipamentos disponíveis e em desenvolvimento, os padrões de interação,
as tecnologias para codificação e programação, as interfaces de usuário para televisores, as
interfaces de programação com sistemas dos fabricantes, os tipos de conteúdo que podem ser
oferecidos e de interesse dos usuários, as similaridades e diferenças entre computadores
desktops, móveis e televisores, dentre outros assuntos. Para entender tudo isto e trazer
algumas soluções o pesquisador, provavelmente, utilizará a própria Internet para realizar suas
pesquisas e consultas.
Todo este trabalho poderá demorar semanas, ou meses, e por diversas vezes o
pesquisador poderá modificar a ordem de pesquisa e a visitação de páginas conforme for
descobrindo, ou compreendendo, parte do contexto e do ambiente do problema. Durante a
execução da pesquisa ele, possivelmente, sentirá a necessidade de anotar pontos interessantes,
definir perguntas a serem respondidas, metas a serem atingidas, revisitar páginas, relembrar
conceitos ou rever as anotações e as descobertas que fez.
1 Capítulo
16
O cenário anterior descreve o contexto de uma pesquisa exploratória, a qual em
geral é conduzida sem que o pesquisador conheça ou tenha forte domínio sobre o que está
pesquisando (WHITE e ROTH, 2009). Existe um objetivo mais ou menos definido, mas não
se sabe exatamente a forma da resposta. A pesquisa exploratória é uma especialização da
busca de informação (information seeking), um processo que descreve a atividade de tentar
obter informações por meio de uma combinação de pesquisas e navegação (WHITE e ROTH,
2009). Ela é diferente de quando se procura pelo telefone de uma empresa, pelo valor de um
produto ou pelos nomes dos jogadores que fazem parte de um time de futebol. Nestes tipos de
pesquisas bastará passar os olhos, ou visitar os primeiros resultados retornados pelas
ferramentas de buscas mais populares, para que a resposta seja encontrada, pois já existe um
padrão de resposta esperado pelo pesquisador e, por isso, não é preciso aprender, ou
investigar, basta procurar a informação que já tem uma forma definida na sua mente.
Nos últimos anos, pesquisadores das áreas de recuperação da informação, design de
interface do usuário, visualização da informação e biblioteconomia têm trabalhado para
desenvolver ferramentas de suporte a pesquisa exploratória (WHITE, KULES e BEDERSON,
2005). Parte desse esforço foi apresentada em workshops e simpósios recentes que exploram a
intersecção das áreas de Interação Humano-Computador (Human-Computer Interaction -
HCI) e a Recuperação de Informação (Information Retrieval – IR), denominados HCIR. O
termo HCIR parece ter sido proposto por Gary Marchionini quando, em 2004, fez uma
apresentação1 ressaltando que embora HCI e IR sejam áreas bastante tradicionais elas se
relacionam e esse relacionamento tem-se potencializado quando a Web ganhou foco. Isso se
deu porque até então a recuperação de informação em documentos era tratada principalmente
pela correspondência de consultas, isto é, um documento é retornado nos resultados se ele
contém o texto digitado na consulta de pesquisa, ou uma propriedade com o valor
correspondente à consulta. Com a introdução da estrutura de hiperlinks dada pela World Wide
Web (WWW), outros pontos como a ligação entre as páginas e unidades de medida que possam
indicar similaridade, ou relevância dos links, foram introduzidos no processo de recuperação
de informação. Esta estrutura de hiperlinks é ponto importante no processo de execução da
pesquisa exploratória, pois é por meio da navegação que o pesquisador tentará adquirir
conhecimento e informação adicional para clarear seus objetivos e, portanto, resolver seu
problema, que em geral está mal estruturado ou em um espaço de informação pouco
conhecido por ele. A solução para seu problema poderá ser construída da informação
1 Apresentação disponível em PDF e vídeo, respectivamente nas URLs http://ils.unc.edu/~march/HCIR_MIT.pdf e http://www.youtube.com/watch?v=noMQjrACHxQ
17
encontrada e do conhecimento adquirido durante sessões de pesquisa, ou análise, de
documentos relevantes e irrelevantes (WHITE e ROTH, 2009), sendo que até mesmo a
navegação ao acaso pode estimular analogias de pensamentos.
A pesquisa exploratória apresenta necessidades distintas em relação às métricas de
recuperação (recall) e precisão (comumente empregadas na IR) durante sua execução. No seu
início, uma alta recuperação é mais útil, pois o objetivo é maximizar o número de documentos
relevantes que foram visitados pelo pesquisador; porém, no final, uma alta precisão é mais
interessante, pois o pesquisador já terá uma ideia clara sobre o assunto de seu interesse e irá
requerer que os documentos apresentados sejam focados neste assunto. Neste ponto os
buscadores tradicionais falham, pois eles têm o foco fixo na precisão, deixando em segundo
plano a recuperação, sendo, portanto, mais úteis somente na fase final. Além disso, devido à
sua característica exploratória, este tipo de pesquisa torna-se mais interativa, no sentido de
que o pesquisador tem de interagir em maior grau com os documentos retornados pelos
sistemas de busca para atingir seu objetivo.
Deste modo, o escopo geral deste trabalho é o estudo e compreensão do fenômeno da
pesquisa exploratória, visando propor algumas soluções para os problemas encontrados na sua
execução. Em um primeiro momento, procuramos entender o fenômeno investigando
trabalhos que propunham melhorar a experiência de execução da pesquisa exploratória por
meio do uso de técnicas de visualização da informação. Neste sentido encontram-se os
projetos MyWish de Angelaccio, Buttarazi e Patrignanelli (2007), LED (Lookup Explore
Discover) de Mirizzi e Noia (2010), TheHotMap.com (http://www.thehotmap.com) de
Hoeber, Schroeder e Brooks (2009), Visual Search Engine (VSE) de Alhenshiri et al. (2010) e
a WebSearchWiz de Nguyen e Zhang (2006) entre outros. Analisando inicialmente estes
trabalhos e posteriormente outros por eles referenciados, conseguimos extrair um conjunto de
dimensões que formam um framework útil no desenvolvimento de ferramentas para o apoio à
pesquisa exploratória. As dimensões identificadas foram: Qualidade dos Documentos,
Apresentação, Cognição e Aquisição de Conhecimento, Tempo, Personalização e
Colaboração, as quais serão discutidas em maiores detalhes no capítulo 3.
Da análise anterior observamos ainda que para algumas das dimensões, como a de
“Apresentação” e de “Qualidade dos Documentos” já existem significativas pesquisas
realizadas e boas ferramentas desenvolvidas (embora ainda seja possível explorar problemas
nestas dimensões). Entretanto, para uma dimensão em particular, a “Temporal”, poucos
trabalhos foram realizados com ênfase em pesquisa exploratória. Neste contexto, encontramos
o projeto SearchBar de Morris, Morris e Venolia (2008) que realiza um esforço para
18
identificar as tarefas do pesquisador durante as sessões de uso de um navegador na Web, mas
esta ferramenta não chegou a ser disponibilizada e não evoluiu. Também encontramos o
Semantic History Map, apresentado por Simko, Tvarozek e Bieliková (2010) presente dentro
de uma ferramenta já existente de pesquisa exploratória em repositório de imagens. Este
projeto apresenta uma forma visual de apresentar um histórico, mas, ela foca o registro de
filtros selecionados dentro de um sistema de pesquisa multifacetado. Uma das soluções mais
atraentes que encontramos foi o sistema YouPivot e TimeMarks (Hailpern, et al., 2011) que
associa pistas conceituais aos registros de atividades de navegação e algumas melhorias de
visualização do histórico. Entretanto, nenhuma delas permite ao pesquisador interagir com o
histórico para organizar suas atividades de tal forma que elas possam se encaixar dentro de
um contexto de pesquisa, com objetivos e particularidades definidas pelo próprio pesquisador.
A união das três ideias anteriores nos levou ao objetivo específico deste trabalho que
é o de prover um esquema visual para representar o histórico da pesquisa, fazendo distinção
entre atividades de navegação e de busca, procurando, assim, melhorar as ferramentas de
histórico dentro do contexto de pesquisa exploratória. Para isto procuramos criar relações
entre a dimensão temporal e as demais dimensões envolvidas na pesquisa exploratória para
apresentar uma ferramenta de histórico que pudesse ser mais útil que as tradicionais.
Preocupamo-nos em atender à necessidade de registrar e oferecer possibilidades para
recuperar o caminho percorrido durante todo o tempo de pesquisa, possibilitando ao
pesquisador relembrar o que ele já fez e quais direções ele já tomou para tentar responder suas
perguntas. Mais do que registrar o caminho percorrido, entendemos ser necessário oferecer
maneiras de filtrar e organizar os registros, procurando evitar que a sobrecarga de informação
se torne um empecilho na interpretação do histórico do projeto de pesquisa.
Esta dissertação está organizada da seguinte forma: este capítulo fez uma introdução
sobre o trabalho, apresentando seu contexto, motivações, objetivos e organização. O Capítulo
2 apresenta uma revisão bibliográfica, incluindo a definição de Pesquisa Exploratória e de
outros modelos de busca de informações defendidos por diversos autores e mostrando o
estado da arte de trabalhos que procuram investigar a pesquisa exploratória. O Capítulo 3
apresenta um framework para o desenvolvimento de ferramenta de pesquisa exploratória
empregado neste trabalho. O Capítulo 4 descreve um sistema desenvolvido para tratar a
dimensão temporal. O Capítulo 5 descreve o processo de testes e experimentos realizados sob
o sistema desenvolvido e apresenta os resultados obtidos. O Capítulo 6 discute as conclusões
obtidas ao longo do trabalho e faz sugestões de trabalhos futuros.
19
Information Seeking e Pesquisa Exploratória
Hearst (2009) reuniu diversas tentativas de descrever um modelo para o processo cognitivo de
busca de informações (Information Seeking) e as estratégias utilizadas durante as etapas desse
processo. Ela cita que o modelo padrão de information seeking foi descrito por Marchionini
(1989) como “um caso especial de resolução de problemas”, que “inclui reconhecer e
interpretar o problema de informação, estabelecer um plano de pesquisa, realizar a pesquisa,
avaliar os resultados e, se necessário, interagir com o processo de novo”. Hearst (2009)
também afirma que esta definição parece ser senso comum para outros autores e outros
modelos apresentam definição semelhante.
Baseado nesta definição podemos concluir que o processo de busca é basicamente um
ciclo de passos que procura refinar a consulta até que a informação desejada seja recuperada.
Entretanto, diversos autores, como Bates (1989), defendem que um pesquisador pode mudar
de direção após aprender sobre determinado tema com os resultados obtidos. Observando o
comportamento destes pesquisadores, ela concluiu que eles costumam formular questões
diferentes após cada iteração, as quais podem levá-los inclusive a direções diferentes da meta
original. Entretanto, ao final de várias interações, este processo faz com que o pesquisador
atinja a meta original, uma vez que as respostas vão sendo parcialmente recuperadas ao longo
das iterações. Este modelo ficou conhecido como berry-picking (colheita de frutos), sendo
ilustrado na Figura 1. Nesta mesma ótica, Hearst ainda diz que o valor principal da pesquisa
encontra-se no aprendizado acumulado e nas informações adquiridas durante o processo de
pesquisa, ao invés, simplesmente, do último conjunto de resultados do processo.
2 Capítulo
20
Uma explicação cognitiva para esse modelo padrão pode ser derivada do modelo de
golfos de execução e de avaliação, proposto por Norman (1986). Hearst (2009) compara o
processo de busca de informação com a teoria de Norman da seguinte forma: 1) a dificuldade
do pesquisador em identificar sua necessidade de informação e representá-la como palavras-
chave de uma consulta, correspondem ao golfo de execução a ser atravessado e; 2) o processo
de avaliar os resultados obtidos e analisar se eles satisfazem a sua necessidade ou se será
necessário reformular a consulta, correspondem ao golfo de avaliação.
Kuhlthau (1991) definiu seis estágios no que ela chamou de Information Seeking
Process (ISP):
1. Iniciação – reconhece-se de que existe uma informação necessária, mas
desconhecida por parte do pesquisador. Desta forma, tem-se um problema.
2. Seleção – seleciona-se o tema geral, ou abordagem, que deverá ser seguida para
tentar obter-se a informação desejada.
3. Exploração – investiga-se o tema geral, para aprofundar o entendimento a seu
respeito. Nesta etapa o pesquisador pode não conseguir formular consultas
relevantes, justamente por ainda não compreender o tema de forma satisfatória.
Por esta razão ele pode sentir a necessidade de procurar outras informações que
são pré-condições para a compreensão do tema.
Figura 1 - Um rascunho de um pesquisador engajado no modelo berry-picking. Extraído de (HEARST, 2009).
21
4. Formulação – define-se um foco de pesquisa. Depois de um tempo, o pesquisador
consegue enxergar e compreender melhor o tema, e as respostas encontradas até o
momento vão se encaixando, o que lhe possibilita uma melhor formulação de
consultas.
5. Coleção – reúnem-se as informações relacionadas ao tema focado e a pesquisa
volta-se para informações que definem, ampliam e apoiam o foco.
6. Apresentação – realiza as últimas pesquisas. O pesquisador percebe que começa a
encontrar informações já vistas antes, o que acaba levando-o a concluir que
conseguiu explorar com eficácia o tema desejado.
A teoria de Information Foraging apresentada por Peter Pirolli (2007) introduz o
conceito de “cheiro” de informação (information scent) para tentar explicar o comportamento
dos pesquisadores em busca de informação. Segundo este modelo, os pesquisadores procuram
nos websites pistas relacionadas ao seu objetivo e, quando encontram, calculam a
possibilidade de realmente encontrar o que desejam. Se previr sucesso o pesquisador continua
a navegar por aquele website, do contrário ele o abandona. O modelo é baseado na observação
de animais a procura de comida/caça. Enquanto houver traços/pistas de que é lucrativo
procurar naquela região o animal/predador continuará a procura/ perseguição. Esta teoria tem
sido aplicada em projetos de avaliação de usabilidade de websites por meio do mecanismo de
eye tracking (BUSCHER, CUTRELL e MORRIS, 2009).
E por fim, outra forma de compreender a busca de informação é por meio dos estudos
de Sense-Making, o qual é definido como o processo de buscar por uma representação e
codificar dados nesta representação, para responder a perguntas de tarefas específicas
(RUSSELL, et al., 1993). Aplicando o sense-making à interpretação do processo de busca
temos, à medida que o pesquisador vai adquirindo conhecimento a cerca de um tema ele vai
construindo um mapa mental para compreensão daquele tema. Isto lhe dará informação
suficiente para realizar tomadas de decisão, como reforçam White e Roth (2009, p. 31,
tradução nossa1): “sense-making é a criação de consciência situacional e compreensão em
situações de alta complexidade ou incerteza, a fim de tomar decisões”.
“O sense-making geralmente envolve os seguintes passos [...]: 1) reconhecer uma
lacuna de conhecimento; 2) gerar uma estrutura inicial, ou modelo de conhecimento
necessária para completar a tarefa (conceitos, relacionamentos e hipóteses); 3) buscar
informações; 4) analisar e sintetizar a informação para criar compreensão e percepção;
1 “Sense-making is the creation of situational awareness and understanding in situations of high complexity or uncertainty in order to make decisions” (WHITE e ROTH, 2009, p. 31)
22
5) criar um produto de conhecimento, ou ação direta, baseado na percepção e
concepção obtida (WHITE e ROTH, 2009, p. 31, tradução nossa2).
Estas e outras definições de information seeking são objetos de investigação da
Ciência da Informação. Nosso objetivo até aqui não foi o de exaurir estas definições, mas
apresentar algumas que se aproximam da definição de pesquisa exploratória que daremos a
seguir, iniciando com uma classificação das atividades de information seeking dada por Gary
Marchionini e da qual se origina o termo pesquisa exploratória.
2.1. Definindo a Pesquisa Exploratória
Gary Marchionini classificou três tipos de atividades de Information Seeking (Figura
2), cada uma possuindo adequadas técnicas e táticas que podem ser apoiadas por ferramentas
computacionais: a procura (lookup), o aprendizado (learn) e a investigação (investigate). Ele
destaca que uma pesquisa exploratória envolve atividades de aprendizado e investigação,
sendo que estas atividades às vezes se sobrepõem, pois os pesquisadores podem realizar
tarefas paralelas. Ele diz que os pesquisadores entendem que buscas Lookup podem ser
subtarefas de Learn ou Investigate (MARCHIONINI, 2006).
2 “Sense-making generally involves the following steps […]: (1) knowledge gap recognition; (2) generation of an initial structure or model of the knowledge needed to complete the task—concepts, relationships, and hypotheses; (3) search for information; (4) analysis and synthesis of information to create insight and understanding; and (5) creation of a knowledge product or direct action based on the insight or understanding.” (WHITE e ROTH, 2009, p. 31)
Figura 2 – Atividades de Information Seeking. Adaptado de (MARCHIONINI, 2006)
23
Procura - Dos três tipos de information seeking considerados por Marchionini, este é
o mais básico e tem sido foco das áreas de banco de dados e desenvolvimento de sistemas de
gestão já há muito tempo. Em geral, as atividades de procura (ou recuperação) retornam dados
discretos e bem estruturados como números, nomes, frases ou arquivos de texto. Elas
normalmente respondem a perguntas como quem, quando e onde, sendo adequadas para
responder a perguntas bem especificadas, cujos resultados serão precisos o suficiente ao ponto
de exigir o mínimo de análise e comparação entre cada um dos itens retornados. Esta é uma
área na qual os motores de busca da Web se mostram eficientes, fruto da herança dos
algoritmos e arquiteturas desenvolvidas nos sistemas de gestão de banco de dados da era pré-
Web.
Aprendizado - O termo aprendizado é usado no sentido de obter um novo
conhecimento e inclui auto aprendizado ao longo da vida ou experiência profissional, bem
como os conhecimentos direcionados adquiridos de maneira conduzida durante a fase escolar.
Marchionini usa terminologia da taxonomia dos objetivos educacionais (Bloom3) e diz que as
pesquisas que visam apoiar o aprendizado devem alcançar: a aquisição de conhecimentos,
compreensão de conceitos ou habilidades, a interpretação de ideias, e as comparações e
agregações de dados e conceitos, que são as habilidades definidas no nível mais superficial
para o domínio cognitivo.
Por causa da enorme quantidade de recursos (documentos) disponíveis para consulta e
sua popularidade a Web tornou-se também uma ferramenta para as pesquisas de aprendizado e
investigação. Porém, a pesquisa de aprendizagem (como defende Marchionini), envolve
várias iterações e cada iteração devolve um conjunto de objetos que exige processamento
cognitivo e interpretação. Esses objetos podem ser representados de diferentes maneiras
(mapas, gráficos, textos, vídeos, etc.) e exigem do pesquisador um esforço de tempo de leitura
ou visualização, comparação e tomada de decisões qualitativas.
Investigação – Este tipo de pesquisa pode exigir múltiplas iterações durante elevado
período de tempo. Além disso, é comum que os resultados obtidos sejam avaliados antes de
serem incorporados como um novo conhecimento (MARCHIONINI, 2006). Pesquisas de
investigação costumam atingir os níveis mais profundos da hierarquia de Bloom, conhecidos
como análise (identificação das partes e suas relações), síntese (combinação de partes para
formar um todo) e avaliação (julgamento do valor do conhecimento). A pesquisa de
3 Benjamin Bloom liderou um grupo formado pela American Psychological Association para criar uma "classificação de objetivos de processos educacionais" cujas conclusões foram publicadas em 1956 no trabalho Taxonomy of Educational Objectives: The Classification of Educational Goals.
24
investigação além de proporcionar aquisição de novo conhecimento, permite identificar
lacunas que impedem a completa compreensão de um determinado tema.
Estabelecendo a pesquisa exploratória como a combinação de tarefas de aprendizado e
investigação, estudos começaram a ser feitos para entender como as pessoas aprendem e
investigam durante o processo de busca de informação. White e Roth (2009) identificaram
uma série de atributos que caracterizam estas atividades, diferenciando-as, principalmente,
das atividades de procura:
1. A duração de uma pesquisa exploratória pode levar dias, ou meses, e por isso
estende-se por diversas sessões de pesquisa.
2. A motivação para realizar a pesquisa é algo em aberto, porque o pesquisador
revela incerteza sobre a informação disponível, ou possui informação incompleta
sobre o tema. Muitas vezes ele não sabe se existe de fato uma resposta para o
problema que tenta resolver. A curiosidade e a persistência são o combustível para
condução da pesquisa.
3. A meta da pesquisa não é simplesmente achar uma informação, mas, conduzir o
pesquisador para compreender um tópico a fim de tomar melhores decisões com as
informações encontradas e com o aprendizado acumulado durante a tarefa de
busca de informação. As pesquisas exploratórias têm ênfase em ampliar
conhecimento, ou proporcionar desenvolvimento pessoal.
4. O comportamento durante a pesquisa combina navegação e busca focada, com
maior ênfase na primeira para diminuir as dúvidas que possam surgir quando uma
nova informação é encontrada.
5. A pesquisa exploratória pode envolver colaboração de outras pessoas interessadas
no resultado do trabalho ou assistentes na realização das tarefas.
6. As ferramentas de suporte devem ser avaliadas em termos de sua capacidade em
ajudar o pesquisador a obter novos conhecimentos e oferecer subsídios para
tomada de decisão.
Kules e Capra (2009) também listaram algumas características comuns às tarefas de
pesquisas exploratórias quando criaram um procedimento de concepção de tarefas
exploratórias para utilização em avaliações de interfaces que se propõe a apoiá-las. Para eles,
uma tarefa exploratória:
Indica incerteza, necessidade de informação ou necessidade de descoberta;
Sugere aquisição de conhecimento, comparação ou tarefa de descoberta;
25
Oferece baixo nível de especificidade sobre: a informação necessária e como
encontrar esta informação;
Diriye et al. (2010) apresentam elementos que estão envolvidos nas tarefas de
pesquisa exploratória, citando:
Objetivo – “informar uma decisão ou produzir algum novo conhecimento”.
Atividades de Pesquisa – envolvem um elemento de investigação, aprendizagem
e descoberta;
Complexidade conceitual – as etapas da pesquisa e informações de destino
podem ser vagas;
Complexidade processual – a tarefa de pesquisa deve envolver uma série de
ações de pesquisa;
Segundo definição de Diriye et al (2010), se algum destes critérios não é atendido
pode ocorrer uma mudança na natureza da tarefa de pesquisa, podendo afetar a categoria de
tarefes a qual ela pertence. No entanto, eles reforçam que os critérios mais importantes são os
de “objetivo” e “atividades de pesquisa”. Se uma atividade é menos complexa em termos
conceituais ou processuais que outra, isto não quer dizer que ela não é uma tarefa de pesquisa
exploratória. Finalmente, à medida que o pesquisador possui amplo domínio de conhecimento
sobre o espaço de informação no qual está inserido o problema de pesquisa, será menor sua
necessidade de aprender e a complexidade conceitual da tarefa de pesquisa torna-se pequena.
Desta forma, a tarefa para este pesquisador, pode ser rebaixada para uma tarefa de lookup. Por
outro lado, a mesma tarefa para um pesquisador pouco familiar ao espaço de informação será
de pesquisa exploratória, pois haverá grande necessidade de aprendizado e investigação além
de aumentar a complexidade conceitual da tarefa.
Wildemuth e Freund (2012) descrevem como projetar tarefas exploratórias e
consideram que as tarefas de busca exploratória:
“[…] focam em objetivos de pesquisa sobre aprendizado e investigação, os quais são
gerais, abertos, e muitas vezes têm como alvo vários itens/documentos; envolvem
incertezas e são motivadas por problemas mal definidos ou mal estruturados; são
dinâmicas e evoluem ao longo do tempo; são multifacetadas e podem ser
processualmente complexas; são frequentemente acompanhadas de outras
informações, ou comportamentos cognitivos, tais como sense-making”
(WILDEMUTH e FREUND, 2012, p. 1, tradução nossa4)
4 “[…] focus on learning and investigative search goals; they are general (rather than specific), open-ended, and often target multiple items/documents; they involve uncertainty and are motivated by ill-defined or ill-
26
Em resumo, a pesquisa exploratória pode ser compreendida como um tipo de
information seeking com fortes características em aprendizado e investigação, no qual o
processo de execução da pesquisa pode incluir comportamentos citados nos modelos ISP, de
berry-picking, information foraging e sense-making, servindo como um guarda-chuva para
este conjunto de conceitos, conforme pode ser ilustrado pela Figura 3.
O modelo de berry-picking é importante porque explica a mudança de direção da
pesquisa, principalmente, quando o pesquisador se depara com conceitos por ele
desconhecidos, o que torna necessário um desvio do seu processo natural de busca de
informação para preencher esta lacuna de conhecimento. O modelo de information foraging
ilustra, principalmente, a atividade de exploração, a qual é realizada para aprofundar o
conhecimento básico adquirido sobre os conceitos inicialmente desconhecidos e também para
investigar situações e informações que podem estar relacionadas com o tema da pesquisa,
proporcionando descobertas. Quanto melhor o faro e instinto do pesquisador, maior serão as
chances de sucesso da sua investigação. As etapas descritas no Information Seeking Process
incorpora os modelos de berry-picking e information foraging na etapa de exploração,
considerando também a etapa de formulação. O ISP também traz a visão do comportamento
envolvendo navegação e busca focada, característica da pesquisa exploratória indicadas por
White e Roth. Esta diferenciação do comportamento entre atividade de navegação e pesquisa
será aproveitada no nosso modelo conceitual de ferramenta de apoio. Ainda das características
citadas por White e Roth, é importante também a identificação do longo tempo de execução
da pesquisa exploratória. Tempo este que será necessário e suficiente para produção de novo
conhecimento por meio da execução de tarefas complexas (característica lembrada por Kules
e Capra, Wilson et al. e Wildemund e Freund), as quais envolvem a criação de uma coleção
de documentos/informações, análise, comparação e sínteses, para que todo o conhecimento
adquirido possa fazer sentido e orientar as tomadas de decisões (sense-making). Ferramentas
de apoio com suporte a coleta, lembrança dos documentos visitados para análise e
comparação futura e, facilitadoras de descobertas e geração de sínteses, podem aprimorar a
execução de pesquisas exploratórias.
structured problems; they are dynamic and evolve over time; they are multi-faceted and may be procedurally complex; and they are often accompanied by other information or cognitive behaviors, such as sensemaking.” (WILDEMUTH e FREUND, 2012, p. 1)
27
Figura 3 - Posicionando Pesquisa Exploratória. Adaptado de (WHITE e ROTH, 2009).
2.2. Histórico de Pesquisa e Revisitação
Um estudo apresentado por Komlodi, Marchionini e Soergel (2007) afirma que a busca de
informação é uma atividade construída com processamento e armazenamento sobre a
memória humana, ressaltando o aspecto temporal deste tipo de busca. Este aspecto valoriza as
funções de atenção, aprendizado, recuperação e reconhecimento da informação que, segundo
estes autores, são cruciais para que um pesquisador se mova pelas fases da busca de
informação. Por isso, quanto melhor puderem ser apoiadas estas tarefas, melhor será o
desempenho do pesquisador no processo de busca. No contexto de busca de informação os
autores acreditam que as ferramentas de históricos são úteis e podem ser utilizadas tanto pelos
pesquisadores (para recuperar o que já fizeram) quanto pelo sistema (para prover
personalização). Prover acesso fácil à informação que foi vista anteriormente e incorporar
Sense‐making
Information foraging
Comportamento Exploratório
Recuperação de Informação
Visualização da Informação
Berry‐picking
Pesquisa Exploratória
28
dados históricos à visualização da informação são boas práticas a serem seguidas em projetos
de sistemas de pesquisa (KOMLODI, SOERGEL e MARCHIONINI, 2006).
Analisando o uso de históricos em interfaces de usuário em diferentes domínios de
problemas (edição de vídeo, sistemas colaborativos e navegação na Web), eles concluem que
os principais recursos e funcionalidades fornecidas costumam ser: a apresentação de uma
linha do tempo de ações realizadas ou eventos ocorridos; os mecanismos de desfazer e refazer
uma operação; a seleção de histórico manualmente por meio de lista de favoritos ou
oferecimento de recursos com menus contextuais e; a análise do histórico registrado para
predição de comportamento futuro.
Revisita a páginas dentro de uma mesma sessão de pesquisa na Web, ou até mesmo em
sessões paralelas, é comum, ocorrendo com maior frequência durante pesquisas exploratórias.
Os pesquisadores decidem continuar uma sessão interrompida, querem refazer uma pesquisa
ou precisam reencontrar algum conteúdo que viram há um longo período de tempo. Neste
sentido, Mayer (2009) fez um levantamento para classificar os tipos de revisitas e ferramentas
existentes para apoiar o pesquisador quando desta necessidade. Segundo ele, “boas
ferramentas de apoio podem fazer com que o pesquisador economize tempo valioso, libere
capacidades cognitivas e aumente a satisfação de uma maneira geral” (MAYER, 2009, p.
177). Ele classifica os tipos de revisitas por meio de quatro dimensões, sendo três pertinentes
de se citar:
1. Revisitas conforme a dimensão temporal – classifica as revisitas em termos do
intervalo de tempo transcorrido entre o penúltimo acesso e a atual visita a uma
determinada página:
Short-term: em menos de uma hora;
Medium-term: de uma a 24 horas;
Long-term: acima de 24 horas;
Very long-term: acima de uma semana
2. Revisitas conforme a dimensão de objetivo – classifica as revisitas conforme o
interesse do pesquisador:
Content: quando é desejado rever o mesmo conteúdo já visto antes ou verificar
modificações no conteúdo anteriormente visto;
Navigation: para proporcionar o acesso à outra página com conteúdo desejado;
Tool: reutilização de um sistema, como webmail, por exemplo.
Non-intentional: sem intenção de visitar.
29
3. Revisitas conforme a dimensão de contexto – classifica as revisitas conforme a
sessão em que ocorreu o penúltimo acesso e a última visita à página e as relaciona
com a continuidade da tarefa (objetivo).
Intra-session: visitas dentro da mesma sessão, com mesmo objetivo;
Intra-task but inter-session: visitas no contexto da tarefa, mas realizadas em
sessões diferentes;
Inter-task: visitas realizadas em contexto de tarefas diferentes.
Mayer aprofundou seu estudo comparando os tipos de revisitas com as principais
ferramentas disponíveis. Com isto e observando o comportamento dos pesquisadores, ele
concluiu:
As revisitas classificadas como short-term têm frequentemente o objetivo de
backtracking, isto é, quando o pesquisador está voltando para uma página que
contém links de outras páginas de seu interesse, sendo comum em páginas iniciais
ou de listagens. Por esta natureza, esta revisita costuma ocorrer dentro de uma
mesma sessão. Para realizar estas revisitas o pesquisador costuma recorrer ao
botão de voltar, presente nos navegadores.
As revisitas de medium e long-term costumam ter como objetivos: retomar sessões
iniciadas mais cedo, reutilizar uma ferramenta ou ainda, monitorar o conteúdo
previamente visitado. Estas revisitas costumam ser apoiadas pelo recurso de auto
completar da barra de endereços do navegador, lista de histórico de navegação e
bookmarks.
As revisitas de long-term e very long-term são classificadas como re-pesquisa, e
ocorrem quando o pesquisador deseja reencontrar, ou redescobrir, conteúdo
específico de alta importância. Os navegadores têm como apoio neste objetivo os
recursos de bookmarks e lista de histórico, mas, além destes recursos, as
ferramentas de busca na Web são muito utilizadas.
Esta tendência de ações para revisitas de long-term e very long-term foi confirmada
por nosso trabalho nos resultados do “Questionário de Hábitos de Pesquisa Exploratória”
(Apêndice C) aplicado a um conjunto de pesquisadores locais. Da amostra pesquisada, 70% e
65% dos pesquisadores respectivamente procuram em seus favoritos ou acessam o histórico,
pra relembrar um documento anteriormente visitado. Também descobrimos que 50% dos
pesquisadores tentam refazer a pesquisa que lembram ter originado aquele resultado (nesse
30
caso lembram-se das palavras-chaves) e que 42% tentam pesquisar pelo conteúdo que
lembram conter no documento.
Observamos também que o recurso de favoritos (bookmarks) pode ser inútil quando o
pesquisador se esquece de salvar o documento. Além disso, a listagem de histórico nativa do
navegador também não é apropriada para revisitas de very long-term, pois costuma excluir
registros após um período de dias ou estes se perdem em reinstalações/mudança de
navegador. Outro problema dos históricos tradicionais é que eles apresentam todo o conteúdo
de URLs (Uniform Resource Locations) requisitadas pelo navegador em servidores Web
durante o tempo, o que inclui, por exemplo, páginas de redirecionamento (encurtadores de
URL, exibição de publicidade ou de finalidade estatística) e uso do navegador em atividades
não relacionadas à pesquisa do pesquisador. Neste sentido, 42,9% dos entrevistados
afirmaram que o fato de registrar todo esse conteúdo dificulta extrair informação útil do
histórico.
Com base na consideração destes últimos autores e nas respostas que obtivemos por
meio de nossa investigação, resolvemos desenvolver uma ferramenta de apoio à pesquisa
exploratória que contivesse um recurso de histórico de pesquisa. Neste histórico, objetivamos
identificar melhor o comportamento de navegação e busca, realizada pelo pesquisador,
procurando aprimorar a apresentação visual das atividades a fim, também, de diferenciá-las
nas dimensões tempo, objetivo e contexto indicados por Mayer. Deste modo, esperamos
facilitar a lembrança e comparação entre os recursos visitados, integrando o histórico com
outros aspectos relacionados a uma pesquisa exploratória, dos quais falaremos no Capítulo 3.
2.3. O estado da arte em ferramentas de Pesquisa
Exploratória
Uma vez tendo compreendido e delimitado a definição sobre Pesquisa Exploratória, partimos
para levantar o estado da arte em trabalhos relacionados a este tema. Para isto, estabelecemos
um protocolo de revisão sistemática (Apêndice A). Nesta revisão encontramos trabalhos sobre
vários aspectos do suporte à pesquisa exploratória, dentre os quais ressaltamos: a aplicação de
técnicas de visualização da informação para apresentação dos resultados de pesquisa e as
tentativas de registrar e exibir o histórico da pesquisa para permitir ao pesquisador
compreensão dos passos realizados e continuidade em caso de necessidade de interrupções.
31
2.3.1. Ferramentas que usam técnicas de Visualização da
Informação
Existem diversas definições para Visualização da Informação. A maioria delas sugere uma
representação visual para dados abstratos que proporcionem reforço cognitivo de forma a
facilitar a aquisição de conhecimento de quem vê tal representação. Alhenshiri et al. (2010)
argumentam que técnicas de visualização da informação podem ser incorporadas no processo
de busca em dois importantes estágios: na reformulação da consulta (query) feita pelo
pesquisador e na apresentação dos resultados. Deste modo, procuramos trabalhos que
aplicassem tais técnicas nas Search Engine Results Pages (SERPs).
Uso de grafos para exibir resultados de pesquisa - Uma das grandes apostas em
técnicas de visualização da informação para exibir resultados de buscas é a utilização de
grafos. O protótipo de Alhenshiri et al (2010), Visual Search Engine (VSE) é uma interface de
pesquisa (Figura 4) no qual os resultados são obtidos da união dos itens retornados por
ferramentas populares. Termos de pesquisa alternativos são apresentados ao pesquisador
baseados em palavras extraídas da WordNet5. A visualização dos resultados da pesquisa é
proporcionada por um grafo no qual os nós exibem o título do documento e uma miniatura
com o conteúdo do recurso. Ao clique sobre um nó é possível abrir o documento no browser
ou ampliar a imagem. Arestas indicam similaridades de documentos. Um painel lateral
permite exibir algumas meta-informações, como tamanho, data da última modificação,
pagerank e descrição do documento.
5 Uma base de dados léxicais para o idioma inglês, provendo sinônimos e conjunto de palavras e relacionamentos entre eles. http://wordnet.princeton.edu/
32
Angelaccio, Buttarazi e Patrignanelli (2007) apresentam a versão 3.0 de uma
ferramenta chamada MyWish (Figura 5), que se integra com o TouchGraph6. Nela, os
resultados da pesquisa são apresentados na forma de um grafo a partir da query utilizada, que
é considerada o nó central. Os primeiros filhos são os domínios que contêm documentos
relevantes e os nós seguintes são pastas e subpastas do domínio até as folhas, que são os
documentos.
6 Projeto criado por Alexander Shapiro que a partir de um XML estruturado desenha grafos para finalidades diversas - http://www.touchgraph.com/navigator
Figura 4 - Tela do VSE, extraída do documento VSE_Shots, disponível em http://sites.google.com/site/alhenshiri/Home/downloads
33
Outro bom exemplo de aplicação de grafos é o trabalho de Sallaberry et al. (2010).
Eles realizaram um aprimoramento na geração dos grafos, por meio da remoção de nós para
encontrar pontes e clusters de informação. Esta abordagem torna o grafo menos “poluído” e
convida o pesquisador a interagir com ele (Figura 6). Um clique sobre um nó que representa
um cluster de informação expande o grafo e permite enxergar as keywords que servem de
ponte entre os clusters e recursos. O sistema utilizou a API da engine Exalead
(http://www.exalead.com/).
Apesar de bem projetadas, essas soluções possuem algumas limitações. O VSE é
limitado quanto à extração ou inferência de semântica na visualização dos resultados da
pesquisa, pois apenas apresenta o título e uma miniatura do documento no nó do grafo e
quatro campos de meta-informação quando um nó é selecionado (tamanho, data de
modificação, pagerank e resumo do documento). O MyWish 3.0, apesar de integrar-se com
uma excelente biblioteca de manipulação de grafos, apresenta uma hierarquia de nós e folhas
que acreditamos ser pouco intuitiva aos pesquisadores no processo de pesquisa exploratória.
Isto porque, nem sempre a hierarquia de pastas, subpastas e documentos reflete em uma boa
organização taxonômica que de fato traga entendimento da importância do documento no
contexto do domínio no qual ele está hospedado. A solução de Sallaberry, et. al. (2010) é a
que melhor explora o uso dos grafos, sendo que seu foco foi aprimorar a maneira de
clusterizar os nós dos grafo. Este trabalho provavelmente poderá servir como base para outras
abordagens com esta mesma estrutura de dados (grafo).
Figura 5 - tela do MyWish extraída de (ANGELACCIO, BUTTARAZZI e PATRIGNANELLI, 2007).
34
Uso de nuvens de texto, Wordbars e Mapas - O projeto LED (Lookup Explore
Discover)7 de Mirizzi e Noia (2010) utiliza nuvem de texto para sugerir o uso, ou remoção, de
palavras-chave à string de busca. Uma versão do conhecido website de busca Yahoo®
(http://www.yahoo.com/) com uma interface baseada em nuvem de texto foi proposto por
Lunardi, Monat e Castro (2008). Segundo eles “as nuvens atendem ao objetivo de aumentar a
compreensão, comunicando informações contextuais por meio de variações na forma como os
dados são visualizados e proporcionando a visualização de dimensões adicionais da
informação de forma a tornar o contexto explícito”. Já é possível ver uma aplicação prática
desta modelagem no website Quintura (http://www.quintura.com/). O uso de nuvem de texto é
uma boa maneira para auxílio na formação das querys da pesquisa, mas estes projetos não
incluem nenhuma melhoria na visualização dos resultados da pesquisa.
Hoeber, Schroeder e Brooks (2009) nos apresentam o TheHotMap.com
(http://www.thehotmap.com), um website no qual os resultados da pesquisa são exibidos com
três ferramentas visuais: um histograma com termos mais frequentes nos documentos que
sugerem filtros para os resultados da pesquisa, denominado wordbar; uma etiqueta de cor
para cada termo da pesquisa, no qual a tonalidade da cor representa a frequência do termo no
documento (quanto mais escuro, mais frequente) e; um hotmap, que apresenta em miniatura
toda a listagem de resultados e respectivas etiquetas de cores, possibilitando ao pesquisador
7 Disponível em http://sisinflab.poliba.it/led/ e também na forma de complemento para o navegador Firefox
Figura 6 - Clusterização de nós proposto por (SALLABERRY, et al., 2010).
35
avançar diretamente sobre algum ponto da listagem que tiver interesse, conforme mostra a
Figura 7. O conceito de representar a frequência de termos da pesquisa no documento com
etiqueta de cores é um ponto positivo do TheHotMap.com, incluindo sua wordbar e hotmap.
Mas sentimos falta da indicação de relações entre os documentos.
O VisGets (DÖRK, et al., 2008), Figura 8, é um projeto que reúne nuvens de tags e
mapas. Segundo os autores, a união destas duas técnicas de apresentação proporciona uma
melhor compreensão de domínio do conceito e da distribuição espacial dos recursos. A meta
principal deste grupo era expandir as possibilidades de geração de queries por meio da
interação do usuário com a visualização de algumas características dos documentos. A
interface apresenta basicamente três opções: Time VisGet, que permite visualizar e definir
uma faixa temporal referente a publicação dos recursos; Location VisGet, que exibe pontos
demonstrando a quantidade de documentos presentes em regiões geográficas e; Tag VisGet,
que é uma nuvem de tags com termos frequentes nos documentos encontrados. Os resultados
são apresentados em uma listagem de caixas com o título dos documentos. Mover o mouse
sobre um item do resultado exibe um resumo do documento (uma descrição com imagem
extraída do documento). Esta parece ser uma boa ferramenta para pesquisa que têm
significativa relação com tempo ou distribuição geográfica da informação. Fora deste
contexto os recursos Location VisGet e TimeVisGet serão pouco úteis ao pesquisador,
Figura 7 - Tela do TheHotMap.com, disponível online em http://www.thehotmap.com
36
restando apenas a exibição da nuvem de tags como forma de sugerir ao usuário continuidade
na pesquisa exploratória. Recentemente o projeto foi disponibilizado para fins de
demonstração em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore.
Outras abordagens de visualização - fugindo dos paradigmas de visualização até aqui
apresentados, encontramos o trabalho de Nguyen e Zhang (2006) que gerou o aplicativo
WebSearchViz (Figura 9) no qual os itens da página de resultado da busca são desenhados em
uma visualização que lembra o sistema solar, na qual a query inicial é o Sol, centro da
visualização e os itens são distribuídos na área circular conforme proximidade com os
assuntos determinados pelo usuário. Ainda pudemos encontrar outra abordagem como o
Tianamo (http://search.tianamo.com) referenciado por Treharne e Powers (2009), uma
ferramenta que exibe os resultados da pesquisa na forma de uma superfície, como um mapa
geográfico em relevo (Figura 10). Montanhas são como clusters de informações e indicam
informações mais relevantes. O trabalho tem méritos pela originalidade do tipo de
visualização, sendo a exibição de montanhas de informação uma boa analogia para clusters. O
problema que achamos nesta abordagem é não permitir indicar outros tipos de relacionamento
entre os documentos, ou mesmo emergir deles mais informações semânticas. Além da
superfície, a ferramenta exibe na lateral uma listagem simples de título e descrição de cada
um dos recursos retornados.
Figura 8 – Tela do VisGets, obtida em http://pages.cpsc.ucalgary.ca/~mdoerk/view/explore
37
Figura 9 - Tela do WebSearchViz extraída de http://home.engineering.iastate.edu/~tien/WebSearchViz/tool.html
Figura 10 - Tela de resultados do Tianamo, após pesquisa por “flamengo”.
38
2.3.2. Ferramentas baseadas no Histórico de Pesquisa/Navegação
No contexto de soluções que procuram dar apoio ao registro do histórico de uma
pesquisa e permitir retomada de uma busca interrompida destacamos o trabalho de Morris,
Morris e Venolia (2008). Eles desenvolveram a SearchBar, para capturar, armazenar e
apresentar anotações integrado com o sistema de pesquisa do navegador. Trata-se de um plug-
in para o navegador Microsoft Internet Explorer (Figura 11). Ele monitora toda a navegação
do pesquisador e ao identificar um padrão de URL de uma ferramenta de busca começa a
registrar as queries utilizadas pelo pesquisador. A SearchBar inclui uma lista hierárquica do
histórico de pesquisas recentes, consultas e resultados visitados pelos pesquisadores, além de
anotações sobre o tópico corrente. Não encontramos este plug-in disponível para instalação e
testes, mas um vídeo8 disponibilizado pelos autores demonstra o funcionamento do sistema.
8 http://research.microsoft.com/en-us/um/people/dan/searchbar/
Figura 11 - Tela da Search Bar (MORRIS, MORRIS e VENOLIA, 2008)
39
O Factic (Tvarozek E Bielikova, 2009), um navegador para busca exploratória de
imagens baseado em ontologias e facetas, recentemente teve acrescido uma solução
denominada History Map (ŠIMKO, TVAROZEK e BIELIKOVA, 2010). A nova ferramenta
baseia-se na análise dos logs de pesquisa identificando sessões e organizando a navegação em
um único grafo de termos e recursos, permitindo ao pesquisador apoio para revisitar as
páginas anteriormente visitadas. Visualmente a ferramenta oferece uma árvore do histórico de
navegação (Figura 12). Os autores pretendem que a ferramenta gere também um mapa de
histórico semântico, que além dos termos pesquisados deverá apresentar conceitos emergidos
da folksonomia do Delicious (http://www.delicious.com).
Uma solução inovadora para tratar o histórico de vem do sistema YouPivot e
TimeMarks (Hailpern, et al., 2011), o qual trouxe como novidade a associação de pistas
contextuais às atividades realizadas pelo pesquisador no navegador. Hailpern et al trouxeram
teorias cognitivas para explicar, por exemplo, que às vezes é mais fácil se lembrar de um
documento anteriormente visto por meio da lembrança de uma música que estava tocando no
momento da leitura. Assim, eles definiram como pista contextual um elemento, ou objeto, que
tem relação temporal a um objetivo de pesquisa. O YouPivot é uma espécie de aplicação que
registra, sem intervenção do pesquisador, pistas contextuais baseadas em elementos de
atividades que são executadas pelo pesquisador no navegador, ou em outros aplicativos do
sistema (tocadores de música, comunicadores ou editores de texto, por exemplo). O
Figura 12 - Ferramenta Search History Tree acoplada ao Factic (ŠIMKO, TVAROZEK e BIELIKOVA, 2010)
40
TimeMarks permite que o pesquisador marque um momento que ele considera importante na
pesquisa. Quando acionado, o TimeMarks cria uma “fotografia” das atividades em execução,
possibilitando ao pesquisador rotulá-la para futura consulta. O sistema é completado com uma
visualização de histórico, na qual as informações registradas pelo YouPivot são combinadas
com as do TimeMarks, permitindo buscas com filtros pelo pesquisador (Figura 13). Para usar
o recurso YouPivot é necessário instalar uma aplicação servidora no sistema, a qual, até o
momento deste trabalho, só havia disponível versão para MacOS. Sem ela é possível usar
apenas uma versão mais simples do sistema, oferecida como extensão para o navegador
Google Chrome. Nela está disponível o recurso TimeMarks limitado a ‘fotografar’ somente as
informações das abas de pesquisas abertas e a geolocalização do pesquisador. A visualização
do histórico de navegação ganha uma apresentação aprimorada em relação à oferecida
tradicionalmente pelo navegador, mostrando ícones dos websites mais visitados, filtro por
título de página e URL, e uma lista das palavras de maior frequência nestes títulos.
Figura 13 - Tela do YouPivot. Extraído de (HAILPERN, et al., 2011).
41
Golovchinsky, Diriye e Dunningan (2012) apresentam o Querium, um sistema
projetado para registrar o histórico de consultas realizadas em um sistema de repositório de
artigos científicos de modo que o pesquisador pudesse verificar a equivalência entre as
consultas feitas por ele, ou por colegas, e também informar ao sistema quais documentos
foram úteis na sua pesquisa. A interface proposta na primeira versão da ferramenta (Figura
14) possuía uma série de opções e recursos, incluindo um campo de busca, uma área de
resultados, botões de ordenação, filtros, lista de consultas recentes e a pré-visualização do
documento. Nas primeiras avaliações realizadas com testes informais os pesquisadores
notaram alguns problemas e redesenharam a interface para a versão atual, Querium 2.0
(Figura 15). Um destaque que podemos fazer deste sistema é um elemento de histograma que
aparece ao lado de cada documento apresentado como resultado da busca. Este histograma
indica ao pesquisador a frequência com que aquele documento tem aparecido nos seus
resultados de consultas com o passar do tempo. Com isto ele pode identificar documentos
consistentes, presentes em várias consultas, recentemente encontrados e documentos vistos
previamente com pouca frequência e agora com mais frequência (ou vice-versa). Um dos
problemas encontrados neste projeto (que também foi identificado e tratado pelos seus
desenvolvedores) foi o excesso de recursos oferecidos ao pesquisador. Wilson e Schraefel
Figura 14 - Interface do sistema Querium 1.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012)
42
(2008) lembraram o paradoxo da escolha, de Schwartz, o qual diz que os pesquisadores
quando apresentados com um grande número de opções podem fazer escolhas pobres, ou até
mesmo não fazê-las (SCHWARTZ, 2005). Este é um problema comum nas interfaces de
pesquisa exploratória, pois, ao mesmo tempo em que precisam ser ricas em funcionalidades,
elas devem apresentar clareza no design.
Analisando as ferramentas apresentadas acima, podemos observar que a ferramenta
SearchBar se mostra interessante ao nosso objetivo por realizar um esforço em identificar as
tarefas de pesquisa do usuário durante sessões de uso de um navegador na Web. Além disso, o
History Map mostra uma forma visual de apresentar um histórico, embora não focado em
histórico de documentos navegados, mas em filtros aplicados dentro de uma interface. Estas
duas ideias nos mostram que prover um esquema visual para representar o histórico do
pesquisador, fazendo distinção entre atividades de navegação e de pesquisa pode ser um bom
caminho para apoiar a pesquisa exploratória. Deste modo, propomos a criação de relações
entre a dimensão temporal e as demais dimensões envolvidas na pesquisa exploratória, pois
ficou claro, pelo exemplo do YouPivot e TimeMark, que quanto mais pistas cognitivas possam
ser associadas aos documentos, mais facilmente eles poderão ser recuperados depois.
O projeto Querium mostrou que algumas decisões de projeto tomadas em nossa
Figura 15 – Interface do sistema Querium 2.0. Extraído de (GOLOVCHINSKY, DIRIYE e DUNNIGAN, 2012).
43
proposta estão no caminho certo, como identificar os documentos já visitados pelo
pesquisador após realizar uma consulta e proporcionar a ele uma maneira de indicar a
relevância do documento para seu projeto de pesquisa. Nossa ferramenta se difere,
principalmente no desafio de oferecer uma solução para a pesquisa aberta na Web, sem fechar
em um domínio específico de documentos e sem a necessidade do pesquisador ter de utilizar
uma interface substituta do seu mecanismo de pesquisa preferido.
Com relação a estes projetos, além de agregar algumas das características presentes
nas ferramentas citadas, ainda provemos um mecanismo de filtragem das atividades em tempo
de execução, visando reduzir a quantidade de informações que são apresentadas ao
pesquisador na visualização do histórico. A gravação de todo o contexto de atividades, como
faz o YouPivot, e a apresentação desta informação de uma só vez pode atrapalhar os
pesquisadores na busca de informação. Além disso, incorporamos definições de “projetos” e
de “sessões de pesquisa”, que permitem ao pesquisador organizar de maneira ativa o conteúdo
registrado no histórico.
Durante a fase de desenvolvimento e testes da nossa ferramenta encontramos algumas
extensões desenvolvidas para o navegador Google Chrome, das quais teceremos comparações
e comentários também no capítulo 4. Nesse mesmo capítulo discorreremos um pouco mais
sobre as percepções e as decisões de projeto que elas nos levaram a tomar.
Finalmente, é importante ressaltar que existem outros trabalhos que se propõem a
resolver problemas de histórico de navegadores, mas nem todos dentro do contexto de atender
as características de uma pesquisa exploratória, ou com caraterísticas similares aos
apresentados acima. Contudo resolvemos citar abaixo alguns deles para que fique registrado
suas principais características e contribuições.
O Memento é um trabalho que procura identificar contextos de navegação
(KULKARNI, RAJU e UDUPA, 2010). Baseado no conteúdo da página corrente e das
páginas imediatamente antes e depois desta, ele extrai frases tópico e, baseado em algoritmos
de frequência, elege o termo que melhor representa um contexto de sessão. Enquanto estiver
gerando os mesmos termos ele considera que o pesquisador está em uma mesma sessão de
pesquisa. O trabalho não apresenta formas visuais de ilustrar estes contextos ao pesquisador e
se limitou a confirmar com os participantes se os termos gerados correspondiam ao seu
objetivo de navegação.
44
O ActionShot (LI, et al., 2010), Figura 16, é uma extensão para o navegador Firefox
que tem o propósito de registrar todas as ações realizadas pelo pesquisador em páginas Web
(como cliques em botões e entradas de formulário), permitindo-lhe executá-las novamente
depois. Ele introduziu como recurso interessante o conceito de iniciar e pausar o registro das
atividades. Pelo que compreendemos, seu objetivo principal é registrar interações em algumas
páginas que o pesquisador teria interesse em reexecutar depois. Ele também possui recurso de
apresentação de screenshots das páginas (que são essenciais para registrar as interações que
acontecem nela). Este, porém, não é um recurso novo, no Contextual Web history (Figura 17)
ele também já aparece para facilitar a recordação do conteúdo da página (WON, JIN e
HONG, 2009).
Figura 16 – Tela do ActionShot, extraído de (LI, et al., 2010).
45
2.4. Considerações Finais
Nosso estudo para compreender a Pesquisa Exploratória trata-se de um exemplo de pesquisa
exploratória. Nós conhecemos o termo inicialmente quando descobrimos alguns artigos dos
workshops e simpósios de HCIR. Nos primeiros esforços vimos que era necessário investigar
outros conceitos, como Information Seeking, Information Foraging e Sense-Making e
percebemos que há relações destes com a Pesquisa Exploratória. Encontramos algumas
dúvidas e procuramos por trabalhos realizados dentro dessa temática para tentar esclarecê-las.
Neste processo fomos identificando e amadurecendo um framework de dimensões de apoio à
pesquisa exploratória (o qual será apresentado no próximo capítulo). Olhando para este
modelo criado com o aprendizado e investigação, mudamos ligeiramente o destino da nossa
pesquisa focando em um ponto especial, considerado por nós interessante de ser pesquisado.
Voltamos a refazer o processo de aprendizado e investigação para entender os casos de
revisitas e encontrar informações a cerca da necessidade e maneiras de se apoiar a pesquisa
exploratória com o uso de uma ferramenta de histórico. Enfim, conseguimos encontrar
algumas evidências de que este era um ponto interessante de ser investigado com mais
Figura 17 – Tela do Context Web History, extraída de (WON, JIN e HONG, 2009)
46
profundidade e então decidimos projetar uma solução que pudesse ser experimentada e
testada a fim de trazer benefícios aos pesquisadores.
Portanto, como resultado de nossa pesquisa bibliográfica tivemos a definição de um
framework de dimensões de apoio à Pesquisa Exploratória (apresentado a seguir) e o projeto
de uma proposta de solução que proporciona apoio a uma destas dimensões, dando ao
pesquisador uma nova forma de interagir com seu histórico de pesquisa, a qual será
apresentada no Capítulo 4.
47
Um Framework para Ferramentas de Apoio
Uma vez compreendido o que é a Pesquisa Exploratória e analisado o estado da arte das
ferramentas desenvolvidas para este tipo de pesquisa, propomos a seguir um conjunto de
dimensões necessárias de serem consideradas quando da construção de ferramentas para
apoiar a pesquisa exploratória realizada por meio da Web.
Durante nossos estudos identificamos um framework composto de seis dimensões que
devem ser apreciadas quando se pretende desenvolver uma ferramenta de apoio à pesquisa
exploratória, são elas: a Qualidade, a Apresentação, o Tempo, a Cognição e Aquisição de
Conhecimento, a Personalização e a Colaboração. Nos tópicos a seguir explicamos como cada
um destes aspectos impacta na experiência de realização deste tipo de pesquisa e destacamos
como estas dimensões se inter-relacionam e devem ser atendidas em ferramentas de apoio.
Consideramos que quanto mais destas dimensões forem cobertas por uma ferramenta, melhor
será a eficiência da pesquisa. Estas dimensões são percepções resultantes do nosso trabalho,
mas, embora elas tenham sido bastante discutidas e delimitadas na literatura, acreditamos que
outras dimensões possam vir a ser consideradas por outros autores.
3.1. A Qualidade dos Documentos
Os resultados de uma pesquisa na Web são documentos existentes nos mais diversos domínios
físicos (servidores da Internet) e conceituais (áreas de interesse), contendo arquivos em
diversos formatos (e.g. texto, hipertexto, imagem, áudio, vídeo, dentre outros). Saber
reconhecer o formato de documento adequado à consulta de um pesquisador e escolher dentre
3 Capítulo
48
os documentos aquele que estão no domínio conceitual mais relevante ao preenchimento do
seu gap de informação é uma maneira de melhorar a qualidade dos resultados da busca.
Deste modo, a dimensão de “qualidade” é a responsável por garantir a entrega de
recursos ao pesquisador que, provavelmente, satisfarão suas necessidades de informação. Ela
coordena a seleção e a classificação dos documentos que serão apresentados como resultado
de uma consulta, sendo primordial atingir um bom equilíbrio entre a cobertura (i.e. recall) e a
precisão dos documentos recuperados. Esta dimensão é tratada nos buscadores atuais por
meio dos diversos algoritmos de ranking e relevância empregados. Porém, estes algoritmos
são otimizados para buscas do tipo lookup, não sendo bem ajustados para a pesquisa
exploratória, visto que as necessidades desta variam com a fase da pesquisa. No início de uma
pesquisa exploratória é necessário que a máquina de busca trabalhe com o foco voltado para a
cobertura (i.e. recall), pois o pesquisador não detém muito conhecimento da área sendo
pesquisada e, portanto, ainda não consegue formular queries focadas. Uma maior cobertura
fornece ao pesquisador a possibilidade de aprender mais sobre o tema da pesquisa e, assim,
melhorar a qualidade de sua query. Ao aproximar-se da fase final, a pesquisa exploratória
deve mudar seu foco para a precisão, pois o pesquisador já adquiriu o conhecimento sobre a
área e agora quer saber sobre pontos específicos do assunto.
Assim, outras abordagens têm sido exploradas para melhorar a qualidade dos
resultados apresentados ao pesquisador em relação à cobertura dos tópicos pesquisados. A
extração de semântica por meio da análise do conteúdo dos documentos indexados, por
exemplo, combinada à consulta em repositórios, ou interpretação de esquemas semânticos,
podendo proporcionar ganho significativo de entendimento acerca da área do conhecimento
que envolve a pesquisa realizada. Tvarozek e Bieliková (2010) apresentam uma ferramenta de
exploração facetada para pesquisa de imagens com apoio de ontologias, na qual foi possível
fornecer, além da oportunidade de desambiguação, informações diretas sobre um assunto
pesquisado. A extração semântica pode ser feita em estruturas complexas como ontologias, ou
em estruturas mais simples como marcações existentes em páginas de Web, esquemas de
microdados, atributos RDF, tags e metatags de documentos HTML. Algumas ferramentas de
busca já se aproveitam de linguagens da Web Semântica para aprimorar os resultados de
pesquisa. Podemos citar como exemplo as ferramentas Hakia (hakia.com), Yebol (yebol.com),
Evri (evri.com), Cognition (cognition.com), SenseBot (sensebot.net), Empora (empora.com),
PubGene (pubgene.org), DayLife (daylife.com) e DeepDyve (deepdyve.com).
Outras abordagens para prover melhor qualidade nos documentos envolvem a ideia de
busca interativa, na qual o pesquisador indica se os resultados são bons, ou não, para sua
49
consulta. É possível, também, tentar interpretar melhor as palavras-chaves fornecidas na
consulta a fim de determinar quando elas se referem a um domínio específico de informação.
A ferramenta de Busca do Google, por exemplo, detecta quando a consulta está relacionada à
conversão de moeda, cálculo aritmético, previsão do tempo, resultados de eventos esportivos,
filmes no cinema, locais, dentre outros, procurando retornar uma resposta direta ao
pesquisador. Embora isto se pareça com necessidades de pesquisa do tipo lookup, elas podem
ser consideradas subtarefas de learn e investigate, como citado na Seção 2.1.
3.2. A Apresentação dos Documentos
Os buscadores atualmente listam poucas informações sobre os documentos resultantes de uma
busca, como título, URL e snippets. Os snippets são pequenas linhas de texto que aparecem
embaixo de todo resultado de pesquisa e foram desenvolvidos para dar aos pesquisadores uma
noção sobre o conteúdo da página e porque ela é relevante para a consulta. Eles costumam
apresentar a frase na qual as palavras-chaves providas na consulta aparecem no documento. A
apresentação de mais detalhes sobre o documento entre os snnipets já garantem benefícios ao
scanning visual e a aquisição de conhecimento por parte do pesquisador. Por exemplo,
baseado em esquemas de microdados (www.schema.org) a máquina de busca do Google já
vem entregando o que chamam de rich snippets, pedaço de informações sobre o documento
com apelo visual. Atualmente é possível visualizar rich snippets sobre músicas, receitas,
pessoas, produtos, eventos e resenhas (Figura 18).
Figura 18 - Exemplos de rich snippets. Extraído de http://support.google.com/webmasters/bin/answer.py?hl=pt-BR&answer=99170
50
Entretanto, somente a exibição de títulos e snippets dos documentos não propiciam a
descoberta, ou proporcionam o aprendizado e a investigação, requeridos pela pesquisa
exploratória. Isto porque, além da maioria dos títulos e snippets serem muito parecidos, a
listagem textual não mostra para o pesquisador as diferenças e os relacionamentos entre os
recursos, ou o domínio físico e conceitual a que pertence cada recurso.
Deste modo, esta dimensão é responsável pela forma como os resultados serão
visualizados pelo pesquisador. Um ponto é permitir ao pesquisador identificar as relações
entre os documentos recuperados que possam auxiliá-lo a criar um modelo mental adequado
do espaço de informação que ele está explorando. O modelo de listagem textual das páginas
de resultados das ferramentas de buscas (SERP), comuns nos buscadores atuais, é bem
adequado para as pesquisas lookup, porque estimula o scanning visual para localizar padrões
de informações, mas não apresenta um bom mecanismo visual para que o pesquisador
identifique e compreenda a relação entre os documentos e conceitos envolvidos nos
documentos.
As técnicas de visualização da informação (WIKI, 2013) produzem uma representação
visual de dados abstratos, o que pode proporcionar reforço cognitivo, facilitando a aquisição
de conhecimento de quem vê tal representação. Por isto algumas ferramentas para pesquisas
exploratórias trocam as tradicionais listagens textuais das SERP por uma visualização
estruturada do conjunto de documentos retornados. No capítulo anterior destacamos alguns
projetos que utilizam abordagens visuais para apresentar os resultados da pesquisa por meio
de grafos (SALLABERRY, et al., 2010), superfície (TREHARNE e POWERS, 2009), nuvem
de tags associada a mapas (DÖRK, et al., 2008), hotmaps (HOEBER, SCHROEDER e
BROOKS, 2009) e gráfico de proximidade (ALHENSHIRI, et al., 2010). Não encontramos
mecanismos de busca populares utilizando alguma destas abordagens, talvez porque ainda é
necessário mais esforço de pesquisa para entender os benefícios e as melhores maneiras de
explorar a apresentação e interagir com páginas de resultados visuais. Além disso, este novo
tipo de proposta é uma grande quebra de paradigma para o pesquisador.
A dimensão de apresentação é ortogonal às demais, servindo de apoio a elas como, por
exemplo, potencializando com sinalizadores o impacto da extração semântica na dimensão da
qualidade, ressaltando recursos de colaboradores da pesquisa, apresentando de maneira visual
o histórico da pesquisa, ou representando o conhecimento conquistado pelo pesquisador
durante a execução da pesquisa.
51
3.3. O Tempo da Pesquisa
Em uma pesquisa exploratória, o pesquisador aprende ao longo do tempo, alterando seus
objetivos na pesquisa e seu foco, conforme citado no modelo de berry-picking.
Consequentemente, a pesquisa exploratória pode transcender múltiplas iterações sobre
consultas e diversas sessões, prolongando-se por dias, semanas ou meses dependendo da
natureza da pesquisa, conforme característica também citada por White e Roth (2009). Esta
característica força o pesquisador a ter que recorrer à sua memória, para identificar o que já
foi visitado e descartar documentos com informações menos relevantes, pois as ferramentas
de busca tratam cada consulta de maneira isolada, sem levar em conta o que já foi apresentado
para o pesquisador, ou o que ele já aprendeu do resultado anterior. Mostramos detalhes desta
necessidade de revisitação e importância de uma ferramenta de histórico da pesquisa por meio
dos trabalhos de Mayer (2009) e Komlodi, Marchionini e Soergel (2006) (2007), no Capítulo
2.2. Deste modo, esta dimensão deve tratar o problema de sobrecarga cognitiva causada pela
necessidade de relembrar uma grande quantidade de informação que foi acessada em
momentos diferentes e por curtos espaços de tempo.
Uma forma comum de tratar este problema é fornecendo mecanismos de descarga
cognitiva, como as anotações externas, como preconizado pela teoria da cognição distribuída,
(HUTCHINS, 1995) os quais com o auxílio de mecanismos de identificação de padrões
podem ampliar a capacidade de memória do pesquisador. Estes mecanismos também podem
auxiliar o pesquisador nos casos em que ele inicia uma sessão com um objetivo e o muda em
função de recursos descobertos ao acaso. A navegação ao acaso estimula o raciocínio
analógico, e os pesquisadores podem relacionar suas experiências a outras situações
comparáveis. Assim, a “pesquisa exploratória pode estar mais preocupada com a recordação
(i.e., maximizar o número de objetos possivelmente relevantes que são recuperados) do que
de precisão (minimizando o número de objetos possivelmente irrelevantes que são
recuperados)” (WHITE e ROTH, 2009, p. 15). Uma boa ferramenta de histórico de pesquisa e
navegação pode ajudar na recordação de documentos relevantes que foram encontrados
durante a pesquisa.
Boas ferramentas de apoio a esta dimensão devem incluir recursos de memória de
sessão que armazenem consultas recentes e navegações de longo prazo, retendo informação
sobre as preferências do pesquisador e pesquisas realizadas em muitas sessões (WHITE e
ROTH, 2009). As ferramentas devem sinalizar estas mudanças ao longo do tempo, indicando,
por exemplo: o nível de entendimento, ou aprendizado, acumulado pelo pesquisador ao longo
52
da pesquisa; o nível de qualidade de documentos procurados; os objetivos de pesquisa; os
colaboradores com a pesquisa, etc.
As ferramentas para apoio a esta dimensão deveriam capturar um momento dentro de
um projeto de pesquisa, permitindo enxergar, para cada uma das dimensões, os parâmetros de
configuração e necessidades que são variáveis. Por exemplo, no início da pesquisa, o
pesquisador pode estar satisfeito com documentos que lhe retornem definições básicas sobre
os conceitos que ele está aprendendo. À medida que o tempo avança, ele passa e exigir uma
qualidade diferente dos documentos, porque seu modelo mental acerca do espaço de
informação está mudando. O mesmo ocorre com os objetivos que, como no modelo de berry-
picking, podem estar em direções opostas em tempos diferentes da pesquisa, ou pode haver
vários objetivos, cada um em um estado diferente de evolução. Um deles, por exemplo, pode
já ter sido alcançado, enquanto outros ainda permanecem incertos, ou em plena atividade de
investigação, e alguns ainda serão definidos pelo pesquisador.
3.4. Cognição e a Aquisição de Conhecimento
Do ponto de vista da pesquisa exploratória esta dimensão é a responsável pela absorção e
operacionalização de novos conhecimentos pelo pesquisador, isto é, pelo seu ganho real de
informação como resultado da pesquisa. Este é o objetivo primordial da pesquisa exploratória.
Este componente é um dos mais difíceis de ser tratado pelas ferramentas de apoio à
pesquisa exploratória, pois não é trivial determinar quanto e quando o pesquisador aprende ao
navegar, visitar e explorar o conteúdo das páginas na Web. As ferramentas atuais não
costumam saber quando os pesquisadores estão satisfeitos, ou com conhecimento suficiente,
sobre o tema da pesquisa. Na verdade, os pesquisadores simplesmente abandonam a
ferramenta, ou a pesquisa, quando acham que já sabem o suficiente ou quando encontram
conteúdos repetidos nos resultados.
Para oferecer apoio a esta dimensão é necessário construir de um modelo conceitual
do campo semântico que está sendo pesquisado. As ferramentas atuais não apresentam um
mecanismo para o pesquisador registrar as relações entre os conceitos apreendidos de forma
explícita, sendo auxiliado, ou não, pela ferramenta. Uma forma explícita, e editável, de
registrar o modelo mental do pesquisador pode auxiliá-lo a determinar quando o modelo está
completo o suficiente, detectando, por exemplo, que o modelo não sofreu alteração nas
últimas n sessões, ou que não de identificou recursos novos nas últimas m sessões. Uma
forma mais simples de auxiliar o pesquisador é possibilitar o controle de seus objetivos e
53
metas na pesquisa. Neste caso, convém também permitir que o pesquisador indique quais
recursos e consultas o ajudaram a alcançar cada um dos objetivos, pois estas informações
podem ser úteis às ferramentas que apoiam as dimensões de personalização e colaboração.
Esta dimensão também se relaciona fortemente com as dimensões de “qualidade” e
“apresentação”. Ao realizamos uma pesquisa por “Titãs” na máquina de busca do Google, por
exemplo, como mostra a Figura 19, um “quadro de conhecimento” é apresentado ao lado dos
recursos retornados pela busca, o qual é um quadro com informações oriundas de recursos da
Web Semântica e que são exibidos para potencializar o ganho de conhecimento sobre o tema
da pesquisa. Neste exemplo, o pesquisador pode facilmente utilizar o quadro para descobrir
que a banda Titãs iniciou sua carreira na cidade de São Paulo e já passou por quatro
gravadoras diferentes. Além disso, ele pode percorrer outros caminhos por meio dos links de
informações sobre os integrantes, as gravadoras, os álbuns ou as bandas relacionadas.
3.5. A Personalização da Pesquisa e de seus Resultados
Um desafio para os projetistas de ferramentas de apoio é oferecer maneiras diferentes para
que os pesquisadores realizem as mesmas tarefas, porque cada pessoa tem suas preferências
Figura 19 – Resultado da Busca no Google por “Titãs”
54
na forma de realizar suas atividades de pesquisa e de avaliar os resultados desta pesquisa.
Tratar o pesquisador de maneira personalizada melhora sua experiência de pesquisa. Deste
modo, esta dimensão está preocupada com o ajuste dos sistemas de pesquisa às características
individuais de cada pesquisador, ou grupo de pesquisadores, procurando também usar as
informações do caminho percorrido na pesquisa e de seus resultados atuais para fornecer
pistas e indicações de melhores caminhos futuros.
Atualmente, os mecanismos de pesquisa estão preocupados em personalizar os
resultados das consultas com foco na precisão, tentando retornar resultados que já foram
visualizados em situações semelhantes pelos pesquisadores, ou que estão mais aderentes ao
seu histórico de palavras-chave fornecidas. Entretanto, este comportamento não favorece a
descoberta, ou mesmo ajuda os pesquisadores a completar lacunas em suas estruturas de
conhecimento em formação. Seria interessante que as ferramentas de busca pudessem
compreender a necessidade do pesquisador ajudando-o a mover-se adiante no processo de
pesquisa criando uma ponte com a dimensão cognitiva.
Recursos interessantes de personalização foram oferecidos nas ferramentas YouPivot
(Hailpern, et al., 2011) e Querium (Golovchinsky, Diriye e Dunnigan, 2012), apresentadas no
capítulo anterior. A primeira ferramenta modelou e criou uma forma de oferecer pistas
contextuais, isto é, dicas de como estava o ambiente do pesquisador no momento da execução
de uma tarefa, para que ele pudesse, em outra ocasião, relembrar destas atividades. A segunda
criou o conceito de histograma para indicar ao pesquisador os documentos que ele pudesse já
ter visto antes na sua lista de resultados. Em ambos os exemplos, foi criada uma ponte com a
dimensão temporal.
Outras abordagens para personalizar o processo, e os resultados, de uma pesquisa
incluem a determinação da localização geográfica do pesquisador e do tipo de dispositivo
utilizado para pesquisa. Uma ferramenta integrada de apoio poderia detectar que o
pesquisador não está na sua localidade habitual e que está realizando a pesquisa por meio de
um tablet e, desta forma, ao entregar os resultados da pesquisa, sugerir que ele marque
aqueles documentos para uma consulta, ou leitura, futura.
Fornecer recursos para anotações, ou classificações, também pode ser uma maneira
de apoiar o pesquisador que deste modo pode diferenciar pela sua ótica um documento
visitado. Além disso, configurações de uso da ferramenta como idioma, filtros e quantidade
de resultados desejados são também maneiras de se personalizar o processo de pesquisa. No
contexto de uma concorrência acirrada entre os motores de busca e tecnologias, a
55
personalização é frequentemente considerada como uma das tecnologias que podem
proporcionar também uma vantagem competitiva (AHN, et al., 2008).
3.6. A Colaboração entre Pesquisadores
Grande parte das pesquisas atuais são realizadas por grupos de pesquisadores, ou é a
continuação de pesquisas anteriores, ou mesmo baseiam-se em uma ou uma série de pesquisas
realizadas anteriormente por outras pessoas. Este fenômeno ocorre tanto no meio acadêmico
quanto fora dele. Por exemplo, um estudo citado por Hearst (2009) indica que mais de um
quarto das pessoas fazem buscas colaborativas quando a atividade envolve o planejamento de
viagens. Deste modo, esta dimensão procura explorar o aspecto social da realização de uma
pesquisa exploratória por meio do compartilhamento de sucessos e fracassos, os quais quando
analisados ajudam os pesquisadores a percorrer um caminho mais simples e seguro na
pesquisa.
Uma forma simples de colaboração aparece, por exemplo, na ferramenta Google®
quando esta faz a exibição de quantos e quais dos amigos do pesquisador marcaram um
recurso que aparece na página de resultado de sua pesquisa baseado em um perfil de uma
determinada rede social. Esta técnica também é conhecida como social ranking (HEARST,
2009). Outra abordagem colaborativa é a criação de sistemas baseados em tagging, nos quais
os pesquisadores etiquetam seus recursos com palavras-chave que julgam transmitir o
conteúdo do mesmo como, por exemplo, o website Delicious®. Quando estas tags são
disponibilizadas de maneira social, gerando uma folksonomia, os pesquisadores podem
adquirir conhecimento acerca de um documento ou domínio. Pesquisas têm argumentado que
os sistemas de marcação sociais podem melhorar efetivamente a exploração do conhecimento
e atividades de sense-making (WAI-TAT FU, 2012). Isso se dá por assimilação, ou
acomodação, isto é, quando o pesquisador busca por recursos baseados no modelo conceitual
que tem sobre um tema, ou quando ele refaz seu modelo conceitual sobre um tema baseado
nas experiências de novos recursos encontrados e vistos.
A recomendação de resultados via relacionamentos em redes sociais, ou a aquisição de
conhecimento por assimilação/acomodação em sistemas de tagging, são boas maneiras de
proporcionar descoberta de conhecimento com a colaboração de terceiros, mas de maneira
passiva. Interfaces mais ativas de colaboração em pesquisas na Web procuram promover a
cooperação direta na atividade de pesquisa como, por exemplo, os projetos SearchTogether
(MORRIS e HORVITZ, 2007) e SearchTeam (www.searchteam.com). O primeiro é um
56
plugin para o navegador Internet Explorer® no qual o pesquisador pode realizar pesquisas
junto com um grupo de outros pesquisadores, visualizar o histórico das palavras chaves
utilizadas por eles em consultas e compartilhar recursos com comentários e avaliações. O
segundo é um website no qual o pesquisador cria espaços de pesquisa sobre um tema
específico e dentro dele cria pastas com as quais organiza os recursos, os quais são itens de
resultados de consultas realizadas na ferramenta de pesquisa. Este espaço de pesquisa pode
ser compartilhado com outros pesquisadores que podem realizar suas próprias consultas e
salvar nas mesmas pastas outros recursos, os quais serão visto por todos os colaboradores,
contribuindo, assim, para a pesquisa como um todo.
3.7. Considerações Finais
As dimensões que identificamos para apoiar a pesquisa exploratória podem ser enxergadas
como uma rede na qual os pontos podem se comunicar para potencializar o suporte ao
pesquisador em determinadas tarefas.
Podemos combinar as dimensões de “Qualidade” e “Apresentação” para oferecer
páginas de resultados de pesquisa com pistas visuais sobre a informação contida nos
documentos, ou a relação que existe entre eles; combinando a “Personalização”, a
“Colaboração” e a “Apresentação”, podemos apresentar os documentos que colegas de
pesquisa consideraram relevantes ao projeto que é compartilhado, ou que já foi executado por
outra pessoa anteriormente; as dimensões de “Tempo”, “Cognição” e “Apresentação” podem
se comunicar para melhorar a recordação de documentos importantes por meio da
visualização de histórico de pesquisa, ou em apresentação de representações conceituais de
um espaço de informação. Estes são apenas alguns exemplos de como combinar estas
dimensões. Por meio destes exemplos, percebemos que a dimensão de “Apresentação” é
ortogonal às demais, por estar ligada à função de transmissão de informação.
Este framework também serviu para estruturar nossas pesquisas sobre o tema da
pesquisa exploratória e definir quais as dimensões, ou intersecções entre elas serão exploradas
por parte do grupo de pesquisa no qual está inserido este trabalho.
57
Uma Ferramenta de Apoio a Pesquisa
Exploratória na Web
Neste capítulo apresentamos o projeto e a implementação de uma ferramenta de apoio à
pesquisa exploratória na Web, incluindo as escolhas tecnológicas, ou conceituais, que
envolveram seu design. Na Seção 4.1 mostramos um levantamento realizado para investigar
os hábitos dos pesquisadores quando executam pesquisas exploratórias. Na Seção 4.2
descrevemos a arquitetura do sistema proposto e o modelo que criamos para representar uma
pesquisa exploratória e suas dimensões. Nas Seções 4.3 e 4.4 descrevemos os aspectos de
implementação da aplicação servidora e da extensão. Na Seção 4.5 fazemos algumas
considerações sobre as tecnologias envolvidas nas soluções. Na Seção 4.6 apresentamos a
interface de histórico de pesquisa e na Seção 4.7 realizamos uma comparação com algumas
extensões já existentes.
4.1. Hábitos de pesquisa e decisões iniciais
Antes de começar qualquer projeto de software é importante compreender o seu futuro
usuário, investigando seus hábitos e preferências em relação ao domínio de aplicação. Desta
forma, para compreender os hábitos dos pesquisadores em relação à pesquisa exploratória
elaboramos um questionário (apresentado no Apêndice B) que foi distribuído por meio digital
pela divulgação do link de preenchimento na rede social Facebook (www.facebook.com),
4 Capítulo
58
possibilitando, assim, o compartilhamento do link, o que proporcionou um maior alcance e
diversidade para a amostra de pesquisadores.
Foram coletadas 161 respostas, dadas por pessoas entre 16 e 63 anos de idade, com
média de 30 anos (desvio padrão: 8,5). A área de atuação profissional, ou de estudos, dos
respondentes tem a seguinte distribuição: 41,6% são da Computação/Informática, 23% da
Administração/Marketing/Comunicação, e 35,4% de outras áreas. Destes, 32,9% está
cursando, ou possuem apenas, a graduação e 61,5% já a cursou, ou está cursando, pós-
graduação. Isto mostra que quase todos já realizaram alguma pesquisa do tipo exploratória,
como é comum na maioria dos trabalhos de conclusão de curso e outras atividades
acadêmicas. Em média 80,22% dos respondentes utilizam algumas vezes, ou muito, a Web
para pesquisas de características exploratórias. Estas pessoas utilizam 63,5% das vezes o
navegador Chrome e 64% delas estão familiarizados com a instalação e o uso de extensões de
navegador. Dos recursos nativos oferecidos pelo navegador 53,4% dos respondentes disseram
utilizar a marcação de favoritos e 38,5% fazem consultas ao histórico de navegação.
Baseado nestes dados, resolvemos desenvolver uma ferramenta de registro e
apresentação do histórico de uma pesquisa exploratória na forma de uma extensão para o
navegador Chrome. Escolhemos trabalhar sobre o histórico porque é uma ferramenta
conhecida de 95% os pesquisadores e apenas 1,2% acham difícil de usar. Entretanto, 38,5%
dos respondentes sinalizaram que esta ferramenta precisa ser melhorada para apoiar a
pesquisa exploratória, ou apontaram problemas, tais como: o fato de o histórico listar todo o
conteúdo navegado dificultar a extração de informação útil (42,9%) e o fato de a forma de
apresentação não ser prática (30,4%). Em geral, 38,5% afirmam que o histórico precisa de
melhorias para apoiar melhor a pesquisa exploratória. Além destes números, nos comentários
abertos, diversas pessoas1 relataram o desejo de que o histórico de navegação fosse
aprimorado, ou que existisse uma ferramenta melhor para isto. Deste modo, os primeiros
objetivos traçados para a nova ferramenta foram: filtrar o conteúdo visitado e propor uma
melhor maneira de apresentar o histórico, visando facilitar a extração de informação útil e
tornando mais prático o uso deste recurso.
Quase a totalidade dos pesquisadores (98,7%) indicou que utiliza a ferramenta de
busca Google® para realizar suas pesquisas. Dentro do universo de pesquisadores do
navegador Chrome na amostra, este índice alcança 100%. Por isso, decidimos que a
ferramenta de histórico observaria a atividade do pesquisador ao interagir com a máquina de
1 Respostas identificadas com números 8, 14, 19, 21, 23, 28, 48, 61 e 62 do Apêndice C.
59
busca do Google e capturaria informações que pudessem ser úteis para a apresentação do
histórico destas atividades como, por exemplo, as palavras-chave utilizadas na busca, os
recursos (URLs) obtidos como resultados da consulta, quais os recursos que já foram visitados
pelo pesquisador e quais restaram para serem explorados.
Algumas outras funcionalidades foram incluídas nesta solução baseando-se nos
resultados do questionário aplicado como, por exemplo:
Anotação de texto sobre recursos ou consultas realizadas, em virtude de que
68,3% dos respondentes informaram realizar anotações em papel durante as
pesquisas.
Indicação de acesso a conteúdo já visitado ou consulta já realizada, uma vez
que 58,4% dos respondentes indicaram encerrar a pesquisa quando começam a
encontrar conteúdos repetidos, já visualizados em sessões de pesquisa anteriores.
Sinalização de aprendizado por meio de lista de objetivos, porque 72,7% dos
respondentes disseram encerrar a pesquisa quando sentem ter aprendido o
suficiente sobre o assunto de interesse e já tem confiança para realizar a tarefa
pretendida.
Destaque e organização dos recursos e consultas com grades de valores de
relevância e tags definidas pelo próprio pesquisador. Este recurso busca
atender o anseio por organização e classificação dos itens visitados que algumas
pessoas revelaram.
Algumas outras funcionalidades foram levantadas, mas devido a limitações de foco e
cronograma não foram incluídas na primeira versão desta proposta. Estas possíveis
funcionalidades serão descritas mais adiante como sugestão para trabalhos futuros.
4.2. Modelo Conceitual do Sistema Proposto
O sistema proposto é composto por uma aplicação servidora, hospedada no domínio
exploratorysearch.com, e uma ferramenta do tipo extensão de navegador, a qual registra as
atividades realizadas pelos pesquisadores e oferece uma interface para interagir com estes
registros.
Por questões de popularidade entre os pesquisadores optamos em desenvolver uma
extensão para o navegador Google Chrome e capturar os resultados de pesquisas da máquina
de busca do Google. A arquitetura do sistema não inviabiliza, e inclusive permite, o
60
desenvolvimento futuro de extensões para outros navegadores e a captura de resultados de
outras máquinas de busca online.
A aplicação servidora permite o registro de usuários, os quais terão uma conta de uso
na qual podem criar e administrar seus projetos de pesquisa e preferências de uso do sistema.
A seguir explicamos alguns dos elementos (Figura 20) e terminologias que compõem o
sistema.
Figura 20 - Mapa conceitual para os elementos da solução
61
Projetos de pesquisa - são contextos de pesquisa que podem possuir objetivos
relacionados. Por exemplo, um trabalho de conclusão de curso, ou o planejamento de uma
viagem, podem ser um projeto. As atividades realizadas durante uma sessão de pesquisa são
vinculadas a um projeto.
Objetivos - são grandes metas a serem alcançadas durante a execução de um projeto.
Eles são opcionais e podem ser criados a qualquer momento. Os objetivos servem para que o
pesquisador sinalize avanços na construção do conhecimento, ou etapas do seu projeto de
pesquisa. Também é possível que o pesquisador associe atividades relacionadas a um
objetivo. Com isto ele poderá depois visualizar no seu histórico de pesquisa quais atividades o
ajudou a alcançar determinados objetivos. A evolução dos objetivos pode ser medida, ou
sinalizada, pelo pesquisador em etapas (não iniciado, em andamento ou concluído), ou em
porcentagem (0 a 100%). Na Figura 21 exibimos um exemplo de projeto e seus objetivos.
Histórico de Pesquisa - é toda a história de atividades realizadas durante a execução
de um projeto, delimitado por um período de tempo. Neste sistema, em particular,
apresentamos um novo conceito de histórico com algumas inovações que envolvem a
Figura 21 – Tela de criação de um novo projeto, com objetivos.
62
ocultação de atividades consideradas ‘inúteis’ para o projeto de pesquisa, a visualização
diferenciada das atividades de navegação com sinalizadores das suas características e
ferramentas de filtros de atividades. Os detalhes da interface do histórico de pesquisa serão
apresentados na seção 4.5.
Sessões de Pesquisa – são períodos de tempo nos quais ocorreram atividades de
pesquisa. Quando detectado um intervalo substancial de tempo de ociosidade entre uma
atividade de pesquisa e outra classificamos que houve o encerramento de uma sessão e início
de outra. Este tempo pode ser controlado pelo próprio pesquisador.
Atividades - são as principais ações realizadas pelo pesquisador no navegador quando
executando uma busca de informação. Pode ser uma visita a um documento (i.e. uma
navegação), ou realização de uma pesquisa por palavras-chave em um mecanismo de busca.
As atividades podem possuir uma anotação que servirá para consulta futura e também podem
ser classificados em grau de importância dentro do projeto, para isto usamos uma notação
simbólica de uma a cinco estrelas.
Navegação – é uma atividade na qual o pesquisador visita um documento, seja a partir
do clique em um link da página de resultados da pesquisa, ou por digitação da URL na barra
de endereços do navegador. Quando o pesquisador visita um domínio (endereço de um
servidor físico na Internet), as visitações seguintes em documentos do mesmo domínio são
consideradas como parte da mesma atividade de navegação.
Pesquisa/Consulta – é uma atividade na qual o pesquisador vai até uma ferramenta de
busca e por meio de uma, ou várias, palavras-chave realiza uma query que deve lhe retornar
um conjunto de resultados. Estes resultados são recursos/documentos que ele pode visitar para
continuar aprendendo ou investigando. As queries podem ser classificadas pelo pesquisador,
por meio de um mecanismo de rating, quanto a sua qualidade.
Documentos – qualquer recurso disponível na Web apontado por uma URL, seja
página, ou arquivo, indicado para o pesquisador nas páginas de resultado das consultas, ou
visitado por ele durante atividades de navegação. Para facilitar a lembrança, ou destacar, um
documento sobre os demais é permitido associar tags (rótulos) que façam referência ao
conteúdo do documento.
4.3. Aspectos de Implementação da Aplicação Servidora
A maioria das ferramentas de apoio ao histórico de navegação utilizam as informações que
foram coletadas e armazenadas pelos próprios navegadores. Acontece que estas informações
63
podem ser perdidas quando o pesquisador troca de equipamento, desinstala o navegador, ou
quando são excluídas pelo pesquisador, ou pelo próprio navegador, por limitações de espaço
em disco. Em projetos de pesquisa de longa duração isto pode ser um problema. Por esta
razão decidimos elaborar uma aplicação servidora que permita persistir essas informações e
potencializar o processamento que pode ser realizado sobre elas.
O objetivo principal da aplicação servidora é servir de repositório das informações de
atividades de pesquisa coletadas pela extensão e, em um segundo momento, fornecer
interfaces para consulta a estas informações. Esta aplicação foi desenvolvida na linguagem de
programação PHP, usando o banco de dados MySQL e hospedada sob o domínio
exploratorysearch.com. A escolha da linguagem de programação e o servidor de banco de
dados levaram em conta a experiência do autor como desenvolvedor, para facilitar a execução
do projeto dentro do cronograma disponível, não sendo um limitador caso se optasse pelo uso
de outras tecnologias de implementação.
O modelo de base de dados da aplicação servidora é quase uma tradução direta do
mapa conceitual do sistema, como mostra a Figura 22. O mesmo ocorre para as classes
criadas para refletirem essa estrutura, as quais replicam seus atributos com métodos get/set.
Também foram criadas classes de regras de acesso a dados (DAO) para cada uma das classes
que representam persistência de dados e foi usado o padrão de projeto Singleton para a classe
que serve de conexão com o banco de dados.
A aplicação possui dois diretórios de acesso externo:
/extension/ - que contém os scripts de comunicação com a extensão. A
comunicação se dá por transporte de informação em formato JSON.
/app/ - que contém as páginas que servem de telas de autenticação, registro,
criação e edição de projetos, preferências do pesquisador e visualização de
histórico.
64
Nossa ferramenta foi desenvolvida com interfaces em inglês e português para facilitar
a participação dos testadores iniciais e permitir uma abrangência de uso maior ao ser liberada
para uso público. Isto foi possível com a criação arquivos de dicionário de termos e frases que
podem ser aplicados à interface conforme a preferência do pesquisador. É possível criar
quantos dicionários forem desejados, para cobrir outros idiomas.
Figura 22 - Diagrama Estendido de Entidade-Relacionamento para base de dados da aplicação servidora.
65
4.4. A Extensão e Aspectos de Implementação
Uma extensão (extension) de navegador é um recurso adicional que opcionalmente pode ser
instalado no navegador, sendo armazenada em espaço de configuração do usuário do
navegador. Elas têm arquitetura conforme esquema estabelecido pelo navegador e podem
interagir com recursos disponibilizados por eles por meio de APIs. Diferem-se dos plug-ins,
que são componentes binários localizados externamente ao espaço do navegador e não
interage com seus recursos. As extensões são chamadas também de complementos ou add-
nos dependendo do navegador. Uma extensão para o navegador Google Chrome pode
interagir de diversas maneiras com o pesquisador e utilizar diversos recursos de interface
oferecidos pelo navegador (Figura 23). Os principais recursos de interface do navegador que
podem ser utilizados por extensões são:
Browser Actions/Popups – é um botão adicionado à barra de ferramentas do
Chrome, o qual ao ser clicado carrega uma janela popup que pode conter conteúdo
HTML, CSS e Javascript. O código carregado pela janela popup tem seu próprio
contexto de execução;
Page Actions – é um ícone adicionado dentro da barra de endereços, que permite
executar scripts, ou exibir uma janela popup ao clica-lo.
Desktop Notifications – corresponde a exibição de janelas de notificação na área
de trabalho do pesquisador.
Omnibox – permite a interação com a barra de endereços do navegador,
interpretando o conteúdo digitado pelo pesquisador e modificando os resultados ali
apresentados.
Context Menus – permite a adição de itens ao menu de contexto do navegador.
Options Page e Override Pages – Options page permite a criação de uma página
com opções da extensão e Override Pages permite a substituição de algum dos
recursos padrão oferecidos pelo navegador, como “Gerenciador de Favoritos”,
“Histórico” e “Nova Aba”.
66
Figura 23 – Exemplos de recursos de interface do navegador que pode ser utilizado por extensões. Extraído de http://www.jefvlamings.com/blog/chrome-extensions-for-dummies/
Existem outros recursos que podem ser usados por extensões, mas que não aparecem
para o pesquisador (Figura 24). São eles:
Background – é uma página HTML carregada em plano de fundo que pode conter
código na linguagem Javascript que é executado durante todo o tempo em que o
navegador permanecer em execução no sistema. O código carregado pela página
em background tem seu próprio contexto de execução.
Content Scripts – permite a execução de um código na linguagem Javascript em
cada conteúdo que é carregado em qualquer aba do navegador; este código é
executado no contexto do documento carregado.
Além destes recursos de interface, o navegador oferece uma API para acesso e
controle a um conjunto de métodos e funções dos seus principais componentes: Janelas, Abas,
Histórico, Favoritos, Cookies, Eventos, Tráfego de Rede, Debug, Gerenciamento,
Armazenamento, Internacionalização, Acessibilidade, dentre outros.
Figura 24 – Recursos de Background e Content Script executam sem que o pesquisador perceba. Extraído de http://developer.chrome.com/extensions/overview.html
67
Escolhemos para nossa ferramenta utilizar inicialmente os recursos de Browser Action,
Background, Content Scripts e Desktop Notifications. Com eles vamos interagir com as APIs
de Histórico, Janelas, Abas, Armazenamento e Internacionalização. Por meio da API de
internacionalização conseguimos oferecer interfaces adaptadas a pesquisadores com
navegadores no idioma inglês ou português. Novos idiomas podem ser acrescentados criando-
se apenas novos arquivos de dicionário de termos e frases.
A extensão desenvolvida possui três componentes principais: o Analisador de
Conteúdo, o Controlador de Operações e a Interface do Usuário.
4.4.1. Analisador de Conteúdo
Este componente analisa cada página visitada podendo atuar diretamente no conteúdo da
página. Sua principal função é identificar se a página carregada é uma página da ferramenta
de busca do Google e, neste caso, capturar as consultas e os resultados que são feitos por meio
da ferramenta. A máquina de busca do Google é bastante complexa e entrega resultados ao
usuário com base em uma série de formas de interação. Uma das formas, chamada de Google
Instant, ocorre quando o pesquisador refaz a digitação dos termos de pesquisa no campo
apropriado e não envia o formulário ao servidor de forma explícita (digitando enter ou
clicando no botão de pesquisa, por exemplo). Nesta forma de interação, a ferramenta de busca
entrega os resultados para o termo reescrito sem submeter novamente a página ao servidor,
não causando uma atualização total do viewport, mas apenas da região de resultados da
consulta. Para conseguir este efeito a ferramenta utiliza-se do componente XMLHttpRequest
do navegador baseado no conceito de Ajax. Este componente da extensão tem o dever de
identificar estas entregas e analisá-las corretamente.
Para cada consulta realizada na máquina de busca do Google, tanto na maneira
“instant” quanto na convencional, o componente captura os termos pesquisados e a lista de
resultados entregues pelo buscador. Em seguida, monta um pacote com estas informações e
repassa ao Controlador de Operações.
Outra função deste componente é varrer os resultados da busca e procurar no projeto
do pesquisador se eles já foram visitados e analisados pelo pesquisador. Se o documento já foi
visitado, ele aplica uma sinalização ao ladoesquerdo para indicar ao pesquisador que este
documento já foi visitado. Se além de visitado o documento possuir anotações, classificação,
tags ou objetivos associados o componente irá embutir estas informações na página de
resultados de maneira recolhida, para ser apresentada com detalhes ao pesquisador quando
68
este passar o mouse por cima desta sinalização. Este comportamento é ilustrado na Figura 25.
O objetivo deste recurso é trazer à página de resultados mais informações históricas de
documentos importantes para o projeto de pesquisa em execução.
4.4.2. Controlador de Operações
Este componente entra em execução a partir do carregamento do navegador e permanece em
execução durante todo o tempo em que o navegador estiver aberto. Ele possui diversas
funções, como tratar o conteúdo recebido do Analisador de Conteúdo, monitorar o objeto de
histórico do navegador, enviar informação para a aplicação servidora, consultar e carregar
alterações das preferências e projetos do pesquisador na área de armazenamento do
navegador, dentre outras.
Ao receber do Analisador de Conteúdo um pacote com informações de consulta, ele
analisa o pacote e adiciona-o em uma fila para posterior envio ao servidor da aplicação, na
próxima execução do envio agendado.
O componente também monitora o objeto chrome.history do navegador. Este objeto
mantém uma coleção de URLs que são visitadas pelo pesquisador conforme ele utiliza o
navegador. A cada visita é adicionado um item à coleção. Este item é analisado pelo
Figura 25 – Extensão indicando informações de documento já visitado pelo pesquisador
69
componente que verificará se é uma URL de pesquisa (da ferramenta de busca do Google) ou
outro recurso qualquer da Web. Se for uma URL de pesquisa o componente irá ignorá-la, pois
esta será tratada pelo componente Content Script da extensão. Caso seja outro recurso da
Web, o componente tentará obter o título do documento visitado e verificar junto às
preferências do pesquisador se este documento, ou URL, deve ser filtrado, isto é, se ele deve
ser oculto das atividades de pesquisa do usuário, conforme citado na Seção 2.3.2. Em seguida,
toda informação é empacotada e enfileirada para posterior envio ao servidor da aplicação.
Existem algumas tarefas agendadas para execução contínua em intervalos de tempo
pré-determinados. Estas tarefas envolvem o envio de informações capturadas do pesquisador
para o servidor da aplicação e a contínua consulta a este servidor para obter mudanças em
preferências e configurações do pesquisador, que podem ter sido realizadas por meio de
acesso à aplicação servidora ou de outros componentes da extensão no decorrer do tempo.
A cada pesquisa realizada pelo pesquisador, ou visita feita a um documento na Web, o
background encarrega-se também de realizar consultas ao servidor de aplicação e acionar,
caso seja da preferência do pesquisador, janelas de notificações que mostram alertas ao
pesquisador de que aquela atividade é igual outra já realizada por ele naquele projeto (Figura
26). Estes alertas ocorrem por meio do componente Desktop Notifications do navegador.
Como o Controlador de Operações é inicializado junto com o navegador, ele é
responsável por carregar as informações do pesquisador e do projeto vigente, que foram
salvas no armazenamento local do navegador, e preparar a exibição do ícone da extensão na
barra de ferramentas do navegador.
4.4.3. Interface do Usuário
Diferente dos componentes anteriores, os quais não têm nenhuma interface para o
Figura 26 – Exemplo de notificação de atividade já realizada
70
pesquisador, este componente oferece a principal interface para que o pesquisador possa
interagir com a extensão. É por meio de uma janela flutuante que o usuário poderá realizar
operações sobre o documento visitado, consultar e registrar mais detalhes sobre seu projeto de
pesquisa, conforme apresentado na Figura 27. O pesquisador tem acesso à esta janela por
meio do clique no botão apropriado na barra de ferramentas do navegador.
As principais finalidades desta interface são:
Permitir a autenticação do pesquisador e seleção de projeto de pesquisa a se
trabalhar;
Pausar ou retomar o registro das atividades do pesquisador;
Consultar e registrar informações sobre o documento visível como estatísticas de
visita, grau de importância/relevância dentro do projeto, tags relacionadas,
anotações particulares e objetivos do projeto alcançados neste documento;
Remover registro da atividade corrente, ou de todas as atividades à mesma URL,
ou domínio;
Acessar páginas da aplicação como preferências do pesquisador, página de gestão
do projeto e página de histórico de pesquisa.
Figura 27 - Componente popup aberto no contexto de navegação.
71
4.5. A Interface de Histórico do Projeto
A interface desenhada para exibir o histórico do projeto consiste basicamente de três áreas de
tela: Linhas do Tempo, Opções e Filtros e Miniatura.
4.5.1. Linhas do Tempo
Na área de apresentação do histórico mostramos as atividades do pesquisador dentro de um
período delimitado de tempo, organizando-a em sessões de atividades de pesquisa e
desenhando-as como uma linha do tempo horizontal. As sessões são exibidas em ordem
cronológica decrescente, isto é, a mais recente aparece primeira, conforme pode ser visto na
Figura 28, e as atividades estão registradas em ordem cronológica da esquerda para a direita.
Um aspecto visual difere atividades de consulta em mecanismo de pesquisa das
atividades de navegação. As consultas são representadas por retângulos e a navegação por
círculos e ambos possuem um ícone que indica a natureza da atividade. Dentro das atividades
de navegação é exibido o nome do domínio e logo abaixo um ícone que identifica o website
visitado.
Para diminuir a poluição visual que poderia atrapalhar a recuperação de informação,
ou tornar as linhas do tempo demasiadamente extensas, utilizamos algumas estratégias:
Figura 28 – Tela de Histórico do Projeto
72
1. As atividades de navegação são agrupadas por domínios. Assim, visitas a vários
documentos em um mesmo domínio são representados por um único círculo
seguido de um contador indicando quantos documentos foram visitados naquele
domínio. Para oferecer diferenciação entre as atividades com quantidade diferente
de documentos visitados nós desenhamos círculos de tamanhos diferentes na linha
do tempo. Quanto maior o circulo, significa que mais documentos foram visitados
naquele domínio.
2. As pesquisas cujos resultados não geraram nenhuma navegação dentro do projeto
também não aparecem na linha do tempo. Consideramos que o pesquisador
desprezou o resultado desta pesquisa. Entretanto, se no futuro outra consulta
apresentar algum documento desta mesma coleção e este for visitado pelo
pesquisador, a primeira consulta passará a aparecer na linha do tempo,
considerando que se um dos resultados foi válido no decorrer da pesquisa, pode ser
que outros também sejam de interesse do pesquisador.
3. Também não são exibidas nas linhas do tempo as atividades ocorridas enquanto a
extensão estava pausada, ou as que foram ignoradas por configurações das
preferências do pesquisador.
As atividades de consulta acompanham também um contador que indica quantos dos
resultados retornados pela consulta foram visitados pelo pesquisador no projeto, após a
realização da consulta. A representação de uma atividade pode vir acompanhada de
sinalizadores visuais que indicam que existem anotações, classificações, ou tags, associadas a
ela ou a um dos documentos (no caso de uma atividade de navegação em domínio).
Cada sessão possui uma etiqueta no canto esquerdo que indica o número da sessão, a
data e hora de início, fim e a duração daquela sessão de atividades de pesquisa.
A representação do histórico de atividades não é estática. Existem algumas opções de
interação que podem enriquecer a experiência de uso. Passar o mouse sobre as atividades de
navegação amplia sua representação visual, permitindo ao pesquisador visualizar melhor as
informações sobre o domínio visitado. Passar o mouse sobre as atividades de pesquisa amplia
sua representação e destaca as atividades de navegação cujos documentos estão presentes no
resultado daquela consulta.
73
Um clique sobre uma atividade faz aparecer um quadro de “Detalhes da Atividade”.
Para as atividades de navegação, o quadro mostra uma tabela com todos os documentos
visitados naquele domínio, a hora em que foi feita a visita e quais possuem anotações,
classificações e tags associadas (Figura 29). O pesquisador pode então rever esta anotação, ou
reclassificar o documento, ou ainda remover ou associar novas tags para cada um deles, caso
não o tenha feito em tempo de execução. Isso lhe ajuda a manter suas atividades organizadas.
Se desejar, ele também pode: ocultar a navegação do projeto; ocultar qualquer navegação feita
no projeto para aquele domínio e adicioná-lo às suas preferências de lista de exclusão; ou
mover esta navegação para outro projeto seu. Estas opções permitem simplificar ainda mais a
visualização do histórico e corroboram com aqueles pesquisadores que trabalham em mais de
uma pesquisa em paralelo. Para atividades de consulta, são listados os resultados que foram
trazidos pela consulta e se eles já foram visitados, ou não, pelo pesquisador, além de também
trazer opções para ocultação da atividade, ou a possibilidade de movê-la para outro projeto de
pesquisa (Figura 30).
Figura 29 - Tela de detalhes de uma navegação
74
4.5.2. Opções e Filtros
O quadro de opções e filtros, que é apresentado originalmente de maneira recolhida, tem
como objetivo redesenhar as sessões e linhas do tempo conforme as preferências escolhidas
para visualização. Como opção, o pesquisador pode estabelecer um período de tempo com
data de início e fim para recuperação das atividades que serão exibidas e qual é o tempo
ocioso a ser levado em consideração para estabelecer intervalos de sessão, conforme mostrado
na Figura 31. Quanto maior a definição deste tempo, menos sessões existirão e maior será o
tamanho horizontal das linhas do tempo.
Figura 31 – Área de opções e filtro. Acima exibido de maneira completo e embaixo, com zoom, para melhor compreensão.
O pesquisador tem a seu dispor uma série de filtros que impactam sobre todas as
atividades, ou somente as de navegação ou consulta, são eles:
1. Exibir apenas atividades que possuem documentos, ou consultas, com
classificações com um valor mínimo de estrelas;
Figura 30 – Detalhes sobre uma atividade de pesquisa
75
2. Exibir apenas atividades que contêm anotações;
3. Exibir apenas atividades que foram associadas com um objetivo em específico do
projeto;
4. Exibir navegações para domínios que possuem um determinado nome, ou uma
determinada string no nome;
5. Exibir navegações cujo número de documentos visitados seja maior que um valor
desejado pelo pesquisador;
6. Exibir navegações que correspondam a uma, ou várias, tags determinadas pelo
pesquisador;
7. Ocultar todas as atividades de navegação;
8. Exibir apenas pesquisas que possuírem uma determinada string no conjunto de
palavras-chave de consulta;
9. Exibir apenas pesquisa cujos resultados tenham tido um número mínimo de
visitação posterior;
10. Ocultar todas as atividades de pesquisa;
Todos os filtros têm aplicação imediata e não realizam recarregamento da página para
redesenho das sessões e linhas do tempo.
4.5.3. Miniatura
Na lateral esquerda da tela existe uma representação parcialmente escondida em miniatura de
todas as sessões e linhas do tempo. Ao aproximar o mouse ela é exibida para o pesquisador
(Figura 32). Ela foi utilizada para facilitar a navegação pela linha do tempo, quando esta se
torna muito extensa. Um clique sobre um ponto na miniatura posiciona a visualização da
página para aquele ponto da linha do tempo em tamanho real.
4.6. Preferências do Pesquisador
O sistema possui também uma área de preferências (Figura 33), por meio da qual o
pesquisador pode: configurar opções da interface, como idioma e notificações de atividades
repetidas; definir intervalo padrão de ociosidade entre seções; indicar atividades de navegação
cujo registro não deve ser feito (por nome de domínios, protocolos ou extensão de arquivos,
por exemplo) e; associar uma conta do Delicious, para personalizar a recomendação de tags
conforme sua personomia. Estas personalizações ficam gravadas na aplicação servidora.
76
Figura 32 - Miniatura da linha do tempo, para facilitar a navegação em estruturas mais extensas.
Figura 33 - Tela de Preferências do Usuário
77
4.7. Considerações sobre tecnologias envolvidas
Grande parte das soluções apresentadas no capítulo 2.3 utilizavam tecnologias proprietárias
ou fechadas para resolução do problema. Neste trabalho tivemos a preocupação de utilizar
padrões e tecnologias abertas para compor a solução. Desta forma, é justo ressaltar alguns dos
recursos que proporcionaram a criação deste sistema.
A solução cliente (a extensão) por estar inserida dentro de um navegador específico
pôde utilizar os mais recentes recursos da linguagem HTML 5, atualmente candidata à
recomendação e já suportada pelo navegador Google Chrome. Um deles foi fundamental para
viabilização de algumas funcionalidades do sistema:
Web Storage (http://www.w3.org/TR/webstorage/) – uma tecnologia correlata à
HTML5 atualmente candidata à recomendação, trata-se de uma API para prover
armazenamento e recuperação de dados no navegador, preservando contexto de sessão e de
domínio de execução. Ela foi utilizada para armazenar configurações do pesquisador e
informações sobre a navegação e pesquisa para posterior registro na aplicação servidora.
Na interface de histórico de pesquisa as principais tecnologias aplicadas foram:
Atributos data-* (http://www.w3.org/TR/html5/dom.html) - novo atributo da
linguagem HTML o qual permite que o autor da página crie atributos para finalidades
genéricas. Neste caso foi criado, por exemplo, data-idActivities, data-domain, data-query e
outros atributos que permitiram embutir informações do banco de dados que facilitassem a
interpretação e manipulação da interface pelos scripts do navegador.
Novas propriedades da CSS 3 – utilizamos propriedades como opacidade (opacity) e
cantos arredondados (border-radius) para melhorar a apresentação dos elementos e criar
formas arredondadas para representar a navegação e propriedades de transformação
(transform) e transição (transition) para criar efeitos de animação na interação do pesquisador
com os elementos da interface.
Para controlar o comportamento da interface e fazer requisições ao servidor foi
utilizada a linguagem Ecmascript (http://www.ecmascript.org/, popularmente conhecida como
Javascript), em sua forma nativa, ou com apoio de bibliotecas tais como jQuery (jquery.com),
moment.js (momentjs.com), ambas distribuídas sobre licença MIT
(http://en.wikipedia.org/wiki/MIT_License).
78
4.8. Outras extensões semelhantes e comparações com a
nossa solução
O processo de desenvolvimento de extensões para o navegador Chrome é bastante popular e,
por esta razão, extensões são produzidas e publicadas a todo instante. Listamos algumas
extensões que no período de desenvolvimento deste trabalho pudessem suscitar discussão e
comparação com nossa ferramenta. Na sequência fazemos uma comparação entre as soluções
que tratam do histórico de pesquisa: e-history2, New History3, history 24, enhanced history5,
better history6, History Trends7, Visual History8 e YouPivot & Timemarks (Beta)9.
Como podemos observar pela Tabela 1, algumas destas extensões se propõem apenas
a exibir algumas estatísticas em relação à navegação como, por exemplo, os domínios mais
visitados, os períodos do dia e dias de maior atividade de uso do navegador. Outras trazem
uma apresentação um pouco mais trabalhada em relação à listagem do recurso nativo para o
navegador, mas sem propor uma visualização totalmente nova. A ferramenta com mais
recursos semelhantes à nossa seria a YouPivot, mas ela ainda assim não tem como foco
representar atividades de pesquisa exploratória, não fazendo, por exemplo, distinção entre as
atividades de navegação e pesquisa.
Tabela 1 – Comparação entre extensões de apoio ao histórico de pesquisa (1. Nossa solução, 2. e-history , 3. New History, 4. history 2, 5. enhanced history, 6. better history, 7. History
Trends, 8. Visual History e 9. YouPivot & Timemarks (Beta).
Extensão Recursos
1 2 3 4 5 6 7 8 9
Agrupa o relatório em sessões X - - - - - - - - Agrupa a visitação em domínios X - - X - X - - XFaz distinção entre pesquisa e navegação X - - - - - - - - Permite ao pesquisador pausar o registro de atividades X - - - - - - - - Visualização gráfica das atividades registradas X - - - - - - - XTem filtros dinâmicos na visualização do histórico X X - - - - - - XPermite pesquisar no histórico por strings X X X X X X - - XTem estatísticas de navegação X - X X - - X X - Mostra gráfico para estatísticas de navegação - - X - - - X X - Permite personalização com filtros de exclusão de atividades X - - - - - - - - Usa serviço externo para persistir informações X - - - - - - - X
2 https://chrome.google.com/webstore/detail/ehistory/hiiknjobjfknoghbeelhfilaaikffopb 3 https://chrome.google.com/webstore/detail/new-history/bnfnhbibpdljadikilnahdmgdcaldnnd 4 https://chrome.google.com/webstore/detail/history-2/cahejgbbfgmlmjgdjlibphdjeldhagkp 5 https://chrome.google.com/webstore/detail/enhanced-history/ocfblifjfffcokdoocoopcnaooljncbh 6 https://chrome.google.com/webstore/detail/better-history/obciceimmggglbmelaidpjlmodcebijb 7 https://chrome.google.com/webstore/detail/history-trends/nangghhladpnhlllolmdbdgeggionole 8 https://chrome.google.com/webstore/detail/visual-history/adnkedffgiojlohglncfnkjkkgdonhng 9 https://chrome.google.com/webstore/detail/youpivot-timemarks-beta/bhojlafenkipmbhpfhoojcflnplpohoo
79
4.9. Considerações Finais
A ferramenta proposta tem como objetivo principal atacar o problema referente ao fato de
que: “a duração de uma pesquisa exploratória pode levar dias, ou meses, e por isso estende-se
por diversas sessões de pesquisa”. Para isso, observamos o comportamento dos pesquisadores
nas tarefas de gestão do tempo de pesquisa e revisitação dos documentos e sua satisfação
sobre o uso do histórico de navegação. Para aprimorar este recurso tentamos estabelecer
relações entre ele e os demais aspectos que consideramos importantes dentro da pesquisa
exploratória. Na tabela abaixo explicitamos como as dimensões discutidas na Seção 3 são
cobertas nesta proposta.
Tabela 2 – Dimensões cobertas por nossa solução.
Dimensão Como é coberta
Qualitativa Não criamos uma nova página de resultados de busca, nem propusemos um novo algoritmo para rankeamento dos documentos. Incrementamos a informação sobre a qualidade dos documentos trazendo à página de resultados da busca as informações fornecidas pelo próprio pesquisador acerca daquele documento, indicando, por exemplo, a classificação da relevância do mesmo no projeto de pesquisa em execução.
Apresentação Acrescentamos um nova maneira de apresentar o histórico de pesquisa, diferenciando atividades de pesquisa e navegação por meio de uma representação visual em linhas do tempo e sessões.
Cognição Adicionamos a possibilidade de o pesquisador organizar suas atividades de pesquisa em projetos e determinar objetivos que se pretende atingir. Possibilitamos ainda o controle de seus avanços e a associação de documentos e consultas que foram úteis para cada objetivo. Estas são algumas das maneiras de apoiar o aprendizado durante o período da pesquisa exploratória.
Temporal Esta foi a principal dimensão tratada nesta solução, a qual é coberta por meio da nova abordagem de histórico de pesquisa apoiada na relação que ela pode ter com as outras dimensões.
Personalização A ferramenta adapta-se às preferências e necessidades de execução do pesquisador por meio de ações diretas dele como, por exemplo, anotações, classificações e tagging de recursos, gestão de objetivos, indicação de remoção de itens específicos do histórico e preferências de registro, pausa e resumo de registro das atividades.
Colaboração Esta é uma dimensão que não teve recursos aplicados nesta primeira versão da ferramenta, mas foi projetada para ser atendida em versões futuras.
No capítulo seguinte nós procuramos demonstrar como foi planejado e conduzido os
experimentos em relação à proposta apresentada e os principais resultados obtidos que podem
ser usados para avaliar a utilidade da mesma no contexto apresentado e nortear o
desenvolvimento de novas versões e trabalhos futuros.
80
Experimentos e Resultados
Neste capítulo fazemos algumas considerações acerca da avaliação de ferramentas de apoio a
pesquisa exploratória e apresentamos a estratégia dos experimentos que foram realizados para
avaliar a solução proposta, como os executamos e seus resultados.
5.1. Avaliação de sistemas de apoio à Pesquisa Exploratória
Segundo White, Marchionini e Muresan (2008, p. 434, tradução nossa1), “avaliar sistemas de
apoio à pesquisa exploratória não é substancialmente diferente da avaliação de qualquer outro
sistema altamente interativo”, embora a preocupação seja maior com medidas subjetivas,
como a satisfação do pesquisador, o engajamento, a inovação na informação e o resultado do
trabalho. Em 2006 um workshop sobre avaliação de sistemas de pesquisas exploratórias
(ESS2) levantou os seguintes fatores (WHITE, MURESAN e MARCHIONINI, 2006a) para
esta tarefa:
Envolvimento e prazer – avalia o grau de envolvimento dos pesquisadores com a
ferramenta e o grau de experimentação de emoções positivas durante as interações que o
processo de pesquisa exploratória exige, podendo ser medido por meio do número de eventos
acionáveis utilizados pelos pesquisadores no sistema.
1 “Evaluating ESS is not substantially different from evaluating any other highly interactive system.” (WHITE, MARCHIONINI e MURESAN, 2008, p. 434) 2 Exploratory Search System.
5 Capítulo
81
Novidade da informação – avalia a quantidade de informação nova encontrada pelo
pesquisador, uma vez que o significado de “explorar” está relacionado a procurar e descobrir.
Sucesso da tarefa – avalia se o pesquisador foi capaz de encontrar a quantidade de
informação com detalhe suficiente para alcançar seu objetivo de pesquisa, o que difere dos
sistemas atuais em que o pesquisador está preocupado em encontrar, ou não, um documento
de destino em particular.
Tempo da tarefa – avalia o tempo gasto para atingir a plenitude de execução da
tarefa, conforme percepção do próprio pesquisador. Esta métrica poderia ser aplicada em
diferentes aspectos como o tempo total, o tempo gasto em busca direta versus exploração e o
tempo olhando para documentos irrelevantes.
Aprendizado e cognição – avalia a obtenção de resultados de aprendizagem (tarefa
fundamental da pesquisa exploratória), a perspectiva do pesquisador após a exploração e a
integralidade do espaço de informação coberto pela sua pesquisa.
Quanto à metodologia para se avaliar os ESS, os participantes do workshop
concordaram que “uma grande variedade de métodos candidatos tem de ser empregado, com a
expectativa de que os melhores métodos e práticas acabarão por prevalecer” (WHITE,
MURESAN e MARCHIONINI, 2006b, p. 59). Mesmo assim, estes autores alertam para o
fato de que “o domínio da tarefa deve conter uma mistura de tipos de tarefas: algumas que se
relacionam intimamente com as atividades regulares dos indivíduos e; algumas
completamente novas para eles [para que possa de fato haver exploração]. Os pesquisadores
que avaliam a ferramenta não podem ser envolvidos apenas em tarefas que lhe são
familiares”. Eles seguem aconselhando que “[...] os indivíduos devem ser autorizados a
conduzir suas atividades com o mínimo de interrupção [...] e técnicas como questionários e
entrevistas podem ser ferramentas valiosas, mas é preciso ter cuidado ao incluí-los no
experimento, de tal forma a não interferir com a atividade de exploração” (WHITE,
MURESAN e MARCHIONINI, 2006a, p. 2).
Apesar das peculiaridades do sistema proposto, ele é uma interface interativa e por
esta razão também deve ser avaliada como tal, com objetivo principal de identificar
problemas de interação. Para isto aplicamos alguns testes e questionários para verificar a
qualidade de uso do sistema, baseando-se nos conceitos de usabilidade definidos em Prates e
Barbosa (2003). As autoras também afirmam que as interfaces podem ser avaliadas no sentido
de sua aplicabilidade e comunicabilidade. Com relação à aplicabilidade consideramos as
orientações específicas de avaliação das ESS, citadas acima, porém não realizamos avaliação
específica para mensurar a comunicabilidade do sistema devido a problema de tempo.
82
Escolhemos utilizar métodos de avaliação empírica, isto é, aqueles nos quais se envolve
usuários para a coleta de dados (PRATES e BARBOSA, 2003). Todos os experimentos de
avaliação foram executados no ambiente natural dos pesquisadores, no qual a aplicação é
utilizada de fato, sem a presença de observadores.
5.2. Definição de Experimentos e Grupo de Testes
Organizamos os experimentos da ferramenta com três objetivos: testar as funcionalidades
fornecidas pelo sistema; mensurar a qualidade do sistema, em termos de usabilidade e;
verificar a aplicabilidade do histórico no contexto de pesquisa exploratória;
Para o primeiro grupo de testes da ferramenta lembramos o cenário apresentado no
Capítulo 1 e convidamos alguns colaboradores de uma empresa especializada em
desenvolvimento de websites. Para completar o grupo convidamos também membros do
grupo de pesquisa em Sistemas Interativos Inteligentes (GSII) do Departamento de
Informática da UEM, totalizando 10 pessoas. Nosso objetivo, neste momento era de obter
uma avaliação qualitativa de todo o sistema. Este grupo foi cadastrado para ter exclusividade
no acesso à extensão na Chrome Web Store (website que serve de repositório de extensões
para o navegador Chrome). Após ter realizado os primeiros testes com este grupo
pretendemos tornar pública a oferta da ferramenta no repositório e comunicar os participantes
do nosso questionário sobre hábitos de pesquisa, para que mais pessoas possam testar a
ferramenta a fim de obter mais feedbacks.
Alguns testadores, com maior disponibilidade de tempo, começaram a utilizar o
sistema algumas semanas antes para realizar os testes de funcionalidades. Para este teste,
fizemos um checklist listando todas as funcionalidades e pedimos para os pesquisadores
checarem se a utilizaram, se funcionou de maneira adequada (como era esperado), ou se
houve algum erro ou falha na execução, e se tinham alguma sugestão para melhorar a tarefa
de execução daquela funcionalidade. Coletamos relatos de erros de script, de tradução e de
problemas de desempenho ao longo do uso do sistema. E, finalmente, fizemos registros de
sugestões de novas funcionalidades. Os problemas relatados tanto por e-mail quanto pelo
checklist de teste de funcionalidades foram tratados antes da execução dos testes de
usabilidade.
Para mensurar a qualidade do sistema, propusemos um projeto fictício,
determinamos algumas tarefas e repassamos aos pesquisadores a execução de alguns testes de
83
uso, conduzido com o apoio da ferramenta TestRockit (http://www.testrockit.com/). As tarefas
analisadas tinham como objetivo testar:
1. Instalação da extensão, registro e autenticação no sistema;
2. Acessar as preferências e configurar exclusão de domínios e preferências de
notificação;
3. Criação de projetos e objetivos na aplicação servidora;
4. Preparação da extensão para uso (autenticação e seleção de projeto);
5. Uso básico da extensão em atividades de navegação: iniciar, pausar, registrar
informações em documentos: rating, tags e anotações;
6. Uso da extensão na atividade de pesquisa, para identificar palavras-chave de
consulta e documentos já visitados;
7. Uso básico do histórico de pesquisa: compreender sessões de pesquisa, identificar
atividades de pesquisa e navegação, compreender navegação em domínio e
encontrar informações sobre uma navegação realizada;
8. Interação com histórico de pesquisa: compreender e aplicar filtros para selecionar
atividades, navegação e pesquisa de interesse; remover atividades da linha do
tempo.
Para uma melhor aderência do teste de usabilidade com o contexto de uso da
ferramenta as tarefas de 1 a 5 foram testadas em um dia e as tarefas 6, 7 e 8 pelo menos 24h
depois. O cenário de tarefas utilizado procurou levar em consideração os aspectos citados na
Seção 2.3.2 para que refletissem tarefas de pesquisa exploratória. Realizamos um teste piloto
com duas pessoas antes de aplicá-lo aos demais participantes do grupo de testes.
O mesmo grupo de pesquisadores ficou livre para utilizar a ferramenta para outros
projetos de interesse pessoal. Então, para verificar a aplicabilidade do histórico no contexto
de pesquisa exploratória aplicamos um questionário (Apêndice G) ao grupo. Neste, tomamos
como referência algumas das métricas citadas na seção anterior.
Além do checklist, dos testes de usabilidade e do questionário, fizemos uma análise
do registro das atividades realizadas pelos pesquisadores, para identificar principalmente o
engajamento dos mesmos com o sistema; a eficácia da filtragem de atividades insignificantes
à pesquisa e; o potencial para utilização da base de dados em tarefas comuns de algoritmos de
recomendação.
84
5.3. Resultados
O grupo de pesquisadores foi deixado bem à vontade no uso da ferramenta proposta,
utilizando-a em seu computador pessoal, sem interferência de observadores. Destes, três
foram apresentados à ferramenta em uma explanação breve de 20 minutos e os outros sete
começaram a utilizá-la sem qualquer prévia explicação, apenas por meio de convite. Estes
últimos indivíduos simulam os usuários que experimentariam a ferramenta sem conhecê-la
previamente, motivados apenas pela curiosidade da oferta de uma nova ferramenta de apoio à
pesquisa. Alguns dos pesquisadores utilizaram a ferramenta, mas enviaram feedbacks apenas
por e-mail. Nestes feedbacks foram relatados problemas e sugestões de funcionalidades.
Os testes de usabilidade foram feitos por sete pessoas do grupo, apresentando os
seguintes resultados:
Tabela 3 – Resultados das tarefas dos testes de usabilidade. As notas indicam o grau de satisfação sobre como a tarefa está projetada para ser realizada pelo pesquisador, em uma
escala de 0 a 10.
Tarefa Nota Média
Desvio Padrão
Mediana
01 – Instalação e Autenticação 7,86 2,55 9 02 – Preferências 8,14 1,57 8 03 – Criação de Projetos e Objetivos 8,71 1,25 9 04 – Preparação da Extensão 9,43 0,98 10 05 – Tarefas durante a Navegação 8,00 1,77 9 06 – Retomando a Pesquisa* 8,67 0,58 9 07 – Conhecendo o Histórico* 9,33 1,16 10 08 – Interações Avançadas com o Histórico* 9,33 1,16 10
* As tarefas 6, 7 e 8 foram executadas em uma segunda etapa de testes de usabilidade. Nesta, apenas três pesquisadores concluíram o teste.
Pelas notas atribuídas na Tabela 3, indicando a satisfação em como a tarefa está
projetada para ser realizada, julgamos que a interface está satisfatoriamente bem projetada
para esta primeira versão do sistema. Alguns comentários coletados do teste confirmam este
julgamento:
1. “A tarefa pôde ser realizada com facilidade. As Opções e Preferências estão
bem estruturadas.”
2. “Foi bem tranquilo a execução da tarefa[...]”
3. “Fica bem fácil organizar um projeto com os padrões definidos”
4. “Tranquila, funcionou sem problemas”
85
Alguns deles focaram os comentários em sugestões para aprimorar o sistema, como
por exemplo: realizar a autenticação por meio de uma conta em outro sistema popular, como
Twitter/Facebook ou uma Google Account; incluir um campo em branco para identificar um
projeto do tipo “outro” e; salvar configurações de filtro na visualização do histórico.
Tivemos outros feedbacks também com opiniões positivas e sugestões de
aprimoramento:
1. “Com as informações que a extensão mostra sobre as páginas já visitadas,
facilita bastante saber o que já foi visto, e o que ainda não.”
2. “A ferramenta permitiu compreender o histórico da pesquisa ao organizar as
buscas em fluxos e associar as páginas visitadas pelo domínio. Estes podem ser
facilmente explorados e manipulados pela ferramenta de histórico do projeto.”
3. “A ferramenta permitiu filtrar as atividades de busca e navegação pelos seus
principais atributos, fornecendo a possibilidade de ter uma visão do histórico.
Seria interessante ter uma opção para salvar (e recuperar) as configurações de
filtros.”
O questionário final de avaliação foi respondido por oito pesquisadores. Indagados
sobre seu tempo de uso da extensão (i.e. com a ferramenta ativada registrando as atividades de
pesquisa) metade dos pesquisadores afirmaram tê-la usado entre 20 minutos e uma hora
diária, 25% informaram ter usado por menos de 20 minutos e os outros 25% entre uma a
quatro horas por dia. Levando em consideração que, deste grupo de pesquisadores, 60%
afirmaram usar o computador por mais de 8 horas diárias e 30% entre 4 a 8 horas por dia, é
evidente concluir, ao cruzar com a primeira informação, que a atividade de pesquisa
exploratória não foi realizada durante toda atividade de uso da Web (Apêndice D). Em muitos
momentos os pesquisadores estavam utilizando a Web para outros fins que não era da sua
pesquisa exploratória. O que ficou evidente também ao se conferir na base de dados da
aplicação a quantidade de atividades ignoradas pelo motivo de extensão pausada, mostrado na
Tabela 4.
Tabela 4 – Frequência de uso da extensão
Extensão pausada
Extensão ativada
Total
Quantidade de atividades registradas 19.093 2.067 21.160
90,23% 9,77% 100%
86
O recurso mais utilizado no sistema, como mostra a Tabela 5, foi o de incluir tags para
representar o conteúdo de um documento. Todos os pesquisadores da amostra fizeram uso
dele. Associar um documento a um objetivo, ou ocultar uma atividade do histórico, também
foram usados por quase todos os pesquisadores. Metade dos pesquisadores sinalizou não ter
utilizado o recurso de anotações e três deles afirmaram não ter usado o recurso de classificar
por estrelas. As justificativas dadas foram: não ter achado como fazer e falta de tempo. Um
dos usuários também relatou não ter usado o recurso de associar atividade ao objetivo da
pesquisa por ter achado complicado e não ter ficado claro a ele o conceito disto no contexto
da ferramenta. Este mesmo usuário disse que não achou utilidade em classificar atividades
com estrelas.
Tabela 5 – Frequência de uso de recursos da extensão
Recurso Quantidade de
Pesquisadores
Incluir tags para representar o conteúdo de um documento/página 8
Associar atividade a um objetivo de pesquisa 7
Ocultar uma visita a uma página ou todas as visitas à determinada página ou domínio
7
Classificar atividade com estrelas 5
Fazer anotações em atividades 4
Quando solicitados a indicar um grau de 1 a 5 sobre quão agradável é a apresentação
visual do histórico do projeto, com linhas do tempo indicando sessões e elementos
diferenciando pesquisas e navegação, os resultados indicaram uma média de 3.63, com desvio
padrão de 1.88. De acordo com o Gráfico 1, isto significa que para dois pesquisadores a
apresentação não agradou, para um foi indiferente e os outros cinco consideraram agradável,
ou muito agradável, obter uma apresentação visual do histórico do projeto.
87
Gráfico 1 - Agradabilidade da apresentação visual do histórico do projeto
Perguntamos também sobre a utilidade de alguns dos recursos do sistema e
descobrimos que os recursos considerados muito úteis pelos pesquisadores foram: a
possibilidade de poder pausar e retomar a pesquisa quando desejar; poder organizar as
atividades em projetos; e ocultar atividades de pesquisa, ou navegação, não relacionadas ao
projeto, como mostra a Tabela 6. Outros recursos como, por exemplo, a apresentação visual
do histórico e os filtros para refinar a visualização, também foram considerados úteis pela
maioria.
Tabela 6 – Utilidade dos recursos do sistema Muito
Útil Inútil
Poder organizar as pesquisas exploratórias em projetos e poder alternar entre projetos;
6 1 1
Poder criar objetivos para os projetos e associar atividades a estes objetivos;
3 2 1 2
Poder pausar e continuar a pesquisa quando desejar, suprimindo informações não relacionadas da visualização do histórico;
7 1
Da apresentação visual do histórico de pesquisa, com linhas do tempo indicando sessões e elementos diferenciando pesquisas e navegação;
3 3 1 1
Visualizar no histórico, informações sobre as atividades, como classificação de relevância, tags, anotações e quantidade de páginas navegadas;
4 2 1 1
Dos filtros e opções oferecidas para refinar a visualização do histórico do projeto;
4 1 2 1
De o sistema ocultar pesquisas que não geraram visitação em documentos presentes nos resultados da pesquisa;
4 2 2
Poder ocultar na tela de histórico as atividades ou sessões que julgar necessárias ou não correspondentes ao projeto;
5 1 2
Poder ocultar domínios por meio da sua configuração de preferências;
5 2 1
0
1
2
3
4
Muito Agradável ... ... ... Nada Agradável
88
Com relação à utilidade da apresentação visual, temos um número próximo aos que a
consideraram agradável. Isto é, cinco pesquisadores consideraram a apresentação visual
agradável ou muito agradável (Gráfico 1) e seis a consideraram útil ou muito útil (Tabela 7).
Quando verificado a utilidade de se apresentar informações sobre as atividades (rating, tags,
anotações e quantidade de visitas) no histórico, notamos quase a mesma consideração de
utilidade, seis consideraram útil ou muito útil.
Quando indagados sobre se “esta apresentação pudesse ter dado melhor compreensão
das atividades realizadas e aprimoramento da pesquisa” houve uma perceptível divisão de
opiniões, como mostra o Gráfico 2. Acreditamos que os que opinaram mais próximo de ‘não
ajudou nada’ o fizeram por dois motivos: 1) pouco tempo de uso da ferramenta e; 2) por que
nesta versão ainda não implementamos recursos para recomendação de documentos e
consultas e a extração semântica de conceitos do documentos. Estas características provocam,
respectivamente, uma necessidade maior de uso do histórico para relembrar documentos mais
antigos e evidenciam o potencial de recuperação destes documentos por meio dos conceitos
identificados ao longo da pesquisa, bem como os outros elementos de diferenciação dos
documentos (rating, tags e objetivos associados).
Na avaliação geral da ferramenta, a maioria se mostrou satisfeito com o sistema, como
mostra o Gráfico 3, mas, mesmo assim, algumas insatisfações puderam ser notadas. Aqueles
que não estiveram plenamente satisfeitos relataram algumas ressalvas de modo que, se
atendidas, os fariam substituir o histórico tradicional pela solução proposta como mostra a
Tabela 7.
Gráfico 2 – Auxílio dado pela apresentação do histórico em conjunto com demais elementos do sistema.
-
1,00
2,00
3,00
4,00
Muito ... ... ... Nada
89
Gráfico 3 – Grau de satisfação com o sistema
Tabela 7 – Opinião dos pesquisadores sobre substituir o histórico tradicional pela solução apresentada.
Substituiria o histórico tradicional? Sim 50% Sim, com ressalvas 50% Não, de forma alguma 0
Os pesquisadores mais críticos com a aplicação apresentaram as seguintes
considerações:
“Não vi utilidade real no sistema [...] Creio que a ideia pode funcionar, mas o
pagamento em ligar, desligar, criar projetos acaba afastando alguns usuários. Creio
que algumas atividades deveriam ser automatizadas com base em tempo de acesso
a documentos, etc. [...]”;
“Acredito que o sistema falha com relação à facilidade de aprendizagem. [...] foi
difícil compreender a relação entre os ícones (bolinhas) que apareciam. [...] ficou
pouco convidativo o clique nas ‘bolinhas’, foram várias visitas ao histórico até que
eu, por acaso, pensei em clicar na ‘bolinha’ e verificar as possibilidades que a
ferramenta me dava. [...] Outra dificuldade no uso da ferramenta, na minha
opinião, foi a necessidade de se fornecer muitas informações para o gerenciamento
das sessões de busca, por exemplo ter que informar os objetivos, atividades,
projetos, etc. [...] Acredito que falta um pouco de gerenciamento da evolução da
minha aprendizagem sobre o tema pesquisado.”
Em defesa da ferramenta podemos destacar a opinião de um pesquisador:
-
1,00
2,00
3,00
4,00
90
“A ferramenta em si é muito boa, a interface é bem acabada e intuitiva.” “Na
minha percepção, a ferramenta cumpre seu papel muito bem. Qualquer
pesquisador gostaria de ter a visão do histórico de navegação oferecido pela
ferramenta para poder relembrar, ou repassar para outras pessoas o
conhecimento adquirido na pesquisa.”
Além das conclusões obtidas pelas respostas dadas ao questionário, analisando os
registros do sistema, é possível também tirar algumas conclusões. Durante o tempo em que a
extensão não estava pausada foram registradas 9,77% das atividades, como vimos na Tabela
4, totalizando 2.067 atividades. Entretanto, destas 2.067, apenas 850 foram de fato
consideradas válidas para apresentação do histórico de pesquisa. Isto porque, mais da metade
(58,8%) foram ocultas devido à configuração das preferências de uso escolhidas pelo usuário,
ou propostas nativamente pelo sistema. Por exemplo, foram ocultas 234 atividades de URLs
pertencentes à lista de domínios ignorados e 777 atividades com URLs cujo protocolo
pertencia à lista de protocolos ignorados. Também houve URLs ocultas por serem repetidas,
ou por atenderem a um determinado padrão identificado de redirecionamento. Os próprios
pesquisadores, por ação direta, ocultaram 186 destas atividades (8,9%), excluindo-as pela
extensão (68), ou pela visualização do histórico do projeto (117). Estes últimos números
demonstram o engajamento dos mesmos na utilização das interfaces da extensão e do
histórico do projeto.
Os projetos de pesquisa criados para atender o teste de usabilidade tiveram tags
criadas em comum entre os usuários como, por exemplo: “chile” (5 vezes), “viagem” (3
vezes), “trabalhar”/”trabalho” (3 vezes) e “estudar”/”estudos” (2 vezes). Os objetivos criados
também apresentaram estruturas parecidas, como mostra a Tabela 8. Acreditamos que com a
inclusão de um algoritmo de processamento de linguagem natural seria possível criar relações
entre projetos e objetivos por meio das tags e frases de objetivo. Deste modo, o sistema
poderia reconhecer projetos e objetivos semelhantes e recomendar diferentes documentos e
consultas que alcancem objetivos que forem parecidos aos objetivos de outros pesquisadores
que já realizaram projetos do mesmo tipo e fizeram associação de atividades aos seus
objetivos. Poderia até mesmo recomendar objetivos para o projeto, aliviando um pouco a
carga de construção de lista de objetivos.
91
Tabela 8 – Objetivos escolhidos para o projeto do teste de usabilidade
Projeto Objetivos
1 Descobrir os cursos; Descobrir as agências; Avaliar os cursos; Avaliar as agências; Encontrar lugares legais para visitar; Conhecer a cidade da agência;
2 preparação para viagem ao chile/estadia e ambientação; Escolher aulas na Universidade Católica del Chile; Escolher empresa onde trabalharei
3 Viajar para o chile; Escolher as aulas; Escolher a empresa para estágio; Aprender um pouco da língua
4 Onde trabalhar?; Onde estudar?
5 Procurar cursos no chile; Hospedagens; Lugares imperdíveis para se conhecer no chile
6 Encontrar os cursos disponíveis na Universidade; Encontrar as disciplinas ofertadas; Encontrar as ementas das disciplinas; Descobrir se é possível realizar apenas algumas disciplinas do curso.
7 Encontrar informações sobre trabalho no Chile; Encontrar informações novos negócios no Chile; Encontrar agências no Chile
5.4. Considerações Finais
Em que pese às críticas recebidas dos pesquisadores que não ficaram satisfeitos com o sistema
proposto é importante lembrar, como citamos na Seção 3.2, que propor uma nova
apresentação visual para uma estrutura já consolidada é uma quebra de paradigma e um
desafio que exige bastante esforço. Deste modo, concordamos com estes pesquisadores de que
é necessária uma melhor investigação para descobrir uma maneira adequada de se oferecer
uma apresentação diferenciada, mas ao mesmo tempo útil para esta operação.
Por outro lado, os índices de aprovação quanto à utilidade de inúmeros recursos
introduzidos neste sistema nos estimula a acreditar que há espaço para melhorar o histórico de
pesquisa e a realização de atividades de pesquisa exploratória por meio da integração das
dimensões que levantamos neste trabalho, mesmo considerando a quantidade pequena de
amostra de pesquisadores. Inclusive, por esta razão pretendemos realizar uma nova iteração
de desenvolvimento do sistema, a fim de corrigir as falhas levantadas e aprimorá-lo com
algumas das sugestões indicadas pelos pesquisadores, expandindo os testes para um grupo
maior de pessoas por meio da oferta pública do sistema.
A informação coletada dos registros de atividades também nos dá parâmetros que
podem nortear trabalhos futuros envolvendo recomendação de documentos e consultas que
potencializem a descoberta e o aprendizado dos pesquisadores.
92
Conclusões e Trabalhos Futuros
Como vimos nos capítulos anteriores, existe uma especialização da busca de informação
denominada pesquisa exploratória com foco em aprendizado e investigação que não é bem
atendida pelos buscadores atuais. Este tipo de busca mescla estratégias e comportamentos
explicados em diversos modelos como ISP, berry-picking, information foraging e sense-
making, possuindo necessidades de apoio específicas, como recursos que facilitem a
orientação no espaço de informação, a coleta e lembrança dos documentos visitados, a análise
e comparação de informações, a descoberta e produção de novo conhecimento e a geração de
sínteses e avaliação para tomada de decisão.
Identificamos, por meio de um framework, seis dimensões sob as quais é possível
desenvolver estratégias e oferecer recursos para apoiar a pesquisa exploratória na Web, são
elas: a Qualidade, a Apresentação, o Tempo, a Cognição, a Personalização e a Colaboração.
Desenvolvemos então um sistema com ênfase em uma ferramenta de histórico de pesquisa
relacionando-se com estas dimensões. Esta ferramenta tem o objetivo de oferecer uma nova
abordagem para substituir os históricos dos navegadores atuais, visando, principalmente, ser
mais condizente com as características de uma pesquisa exploratória e facilitando a
revisitação de longo e muito longo prazo. Por esta razão modelamos conceitualmente o
sistema de modo a distinguir o comportamento de busca e de navegação e aplicamos nele
mecanismos de descargas cognitivas associadas às atividades realizadas pelos pesquisadores.
6 Capítulo
93
Estudamos os pesquisadores para que o sistema desenvolvido não viesse a modificar
seus principais hábitos e comportamentos de pesquisa, mas que se adaptasse a estes. Deste
modo, empregando elementos da dimensão de personalização, oferecemos mecanismos para
configurações de preferências e todo um conjunto de artefatos de classificação e organização
das atividades e projetos. A introdução de projetos com possibilidade de controle de objetivos
ampliaram as possibilidades na dimensão cognitiva. Por meio de uma nova abordagem de
visualização das atividades de pesquisa, diferenciando as pesquisas e a navegação, ampliamos
a dimensão da apresentação. Informamos nas páginas de resultados das pesquisas os
documentos antes visitados e classificados pelo pesquisador para ampliar o suporte à
dimensão qualitativa. Com a ferramenta de visualização do histórico do projeto cobrimos a
dimensão temporal. Finalmente, embora não tenhamos implementado, criamos um ambiente
para propiciar cobertura da dimensão de colaboração, o qual poderá ser explorado por meio da
aplicação de algoritmos de recomendação e da possibilidade de compartilhamento de projetos
entre pesquisadores.
Os testes realizados por uma amostra de pesquisadores mostrou que o nosso sistema é
simples e fácil de ser utilizado. Também pudemos comprovar pelos experimentos que
minimizar a quantidade de informações exibidas no histórico trazem ganhos e satisfação aos
pesquisadores. Os recursos considerados mais úteis por eles foram o controle para pausar e
retomar o registro das atividades dos projetos, a possibilidade de organizar as atividades em
projetos e a possibilidade de controlar o que é exibido, ou não, no histórico. A introdução no
histórico de pesquisa de algumas informações sobre as atividades, como, por exemplo,
classificação e rótulo dos documentos, associação destes com objetivos e anotações
permitiram por meio de filtros modificar dinamicamente a apresentação do histórico e isto
também agradou os pesquisadores. Por outro lado, ficou claro que há um grande desafio em
quebrar o paradigma de apresentação do histórico de navegação e alguns pesquisadores não
consideraram agradável e não perceberam utilidade na abordagem adotada.
Nesta versão, nossa ferramenta considera como atividades de pesquisas apenas aquelas
realizadas por meio da máquina de busca do Google. Uma vez que muitos pesquisadores
utilizam máquinas de buscas específicas para atividades acadêmicas, como ACM Digital
Library (dl.acm.org), IEEE Explorer (ieeexplore.ieee.org/) dentre outros, é importante que
mais destes sistemas sejam cobertos para identificar mais atividades de consulta em
ferramentas de busca, diferenciando-as das atividades de navegação. O sistema
deliberadamente não introduz um novo motor de busca dando preferência a registrar as
atividades do usuário de maneira passiva, a partir do próprio motor de busca que ele utiliza.
94
Entretanto, isso é feito com técnicas de Web scraping das páginas do buscador e, por esta
razão, eventuais mudanças na página do buscador impactarão mudanças neste módulo do
sistema, sendo necessário constante monitoramento.
6.1. Trabalhos Futuros
Existem alguns campos de pesquisa bastante interessantes dentro do contexto da pesquisa
exploratória. Se tomarmos cada uma das dimensões sugeridas no Capítulo 3 já haverá bons
pontos de partida para novos trabalhos relacionados. Por exemplo, com relação à dimensão de
apresentação, a modificação da página de resultados de pesquisa aplicando técnicas de
visualização da informação pode reforçar a aquisição de conhecimento sobre os itens
retornados por meio de exibição de relações entre eles e auxiliar na definição de caminhos de
visitação a serem percorridos pelo pesquisador. Outras dimensões também podem ser
identificadas e suas contribuições com a pesquisa exploratória podem ser estudadas e testadas.
Enumeramos uma série de novos recursos que podem gerar novos trabalhos de
pesquisa para aperfeiçoar a solução desenvolvida, dando inclusive cobertura para outras
dimensões. Entre eles podemos citar:
1. Recuperar conceitos semânticos dos documentos visitados, possibilitando filtrar no
histórico os recursos relacionados a um conceito específico.
o Com os conceitos recuperados de cada documento é possível propor uma
ferramenta de modelagem de mapa conceitual, para que o pesquisador possa ir
montando seu modelo cognitivo do espaço de informação no qual está inserida
a pesquisa;
o Clusterizar as atividades de navegação, agrupando-as em semelhanças ou
cobertura de conceitos.
2. Compartilhar projetos de pesquisa para que pesquisadores com objetivos comuns
possam colaborar diretamente um com o outro, visualizando e interagindo com a
linha do tempo e sessões de pesquisa compartilhadas;
3. Recomendar documentos e consultas que possam potencializar o atingimento de
determinado objetivo pelo pesquisador com base na observação de documentos
associados a objetivos parecidos em projetos de pesquisa semelhantes executados
por outros pesquisadores do sistema.
4. Utilizar o recurso de menu de contexto do navegador para adicionar ações como
guardar trecho de texto, ou imagens, contidos no documento visitado. Estes
95
elementos poderiam ser utilizados como pistas cognitivas e exibidas na linha do
tempo do histórico de pesquisa;
5. Indicar similaridade: entre consultas com base nas palavras-chaves e nos
resultados apresentados por diferentes consultas; e entre documentos, com base na
análise do seu conteúdo; Desta forma, na visualização do histórico pode-se agrupar
estas atividades em clusters.
6. Incluir novos mecanismos de pesquisas na cobertura do sistema como, por
exemplo, os específicos para trabalhos acadêmicos.
7. Permitir observação de documentos/páginas com objetivo de avisar o pesquisador
caso estas sofram alterações de conteúdo.
8. Organizar as atividades do usuário de forma automática, trocando o projeto caso o
sistema perceba que ele está no contexto de outra pesquisa exploratória.
9. Capturar imagens de telas (screenshots) dos documentos visitados, para apresenta-
las na visualização do histórico, visando aprimorar a lembrança do conteúdo.
Tão logo os navegadores ofereçam suporte a extensões para suas versões em sistemas
móveis outro foco que achamos interessante investigar é uma maneira de replicar a extensão e
apresentação do histórico para estes dispositivos. Neste caso, não basta apenas copiar o
código da aplicação, mas sim adaptá-la e prepará-la para um contexto de execução totalmente
diferente. Isto é importante, pois muitos pesquisadores utilizam tablets ou smartphones para
leituras de artigos e realizar pesquisas quando não estão no seu escritório.
Acreditamos que nosso trabalho tenha servido para elucidar algumas questões
relacionadas ao contexto de execução da pesquisa exploratória como, por exemplo, como ela
se difere de outros tipos de busca de informação, porque o caminho a ser percorrido é
importante para o pesquisador e como apoiar com ferramentas este tipo de busca de
informação. Neste último ponto, fornecemos um ponto de partida para novos trabalhos que
poderão focar em algumas das dimensões identificadas no framework proposto.
96
Referências
AHN, J.-W. et al. Personalized web exploration with task models. In: International Conference on World Wide Web, 17, 2008, Beijing, China. Proceedings… New York: ACM. 2008. p. 1-10.
ALHENSHIRI, A. et al. Augmentating the Visual Presentation of Web Search Results. In: International Conference on Digital Information Management, 5, 2010, Thunder Bay, Canada. Proceedings... [S.l.]: IEEE Conference Publications. 2010. p. 101-107.
ANGELACCIO, M.; BUTTARAZZI, M.; PATRIGNANELLI, M. Graph Use to Visualize Web Search Results: MyWish 3.0. In: International Conference on Information Visualization, 11, 2007, Zurich, Switzerland. Proceedings... Los Alamitos, CA: IEEE Computer Society. 2007. p. 245-250.
BATES, M. J. The design of browsing and berrypicking techniques for the online search interface. Online Information Review, v. 13, n. 5, p. 407-424, 1989. ISSN ISSN: 1468-4527.
BUSCHER, G.; CUTRELL, E.; MORRIS, M. R. What Do You See When You're Surfing? Using Eye Tracking To Predict Salient Regions of Web Pages. In: SIGCHI Conference on Human Factors in Computing Systems, 27, 2009, Boston, USA. Proceedings... New York :ACM. 2009. p. 21-30.
DIRIYE, A. et al. Revisiting Exploratory Search from the HCI Perspective. In: International Workshop on Human-Computer Interaction and Information Retrieval, 4, 2010, New Brunswick, NJ. Proceedings... [S.l.]: [s.n.]. 2010. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/hcir2010/docs/HCIR2010Proceedings.pdf . Acesso em: 18 jan. 2013.
DÖRK, M. et al. VisGets: Coordinated Visualizations for Web-based Information Exploration and Discovery. IEEE Transactions on Visualization and Computer Graphics, Piscataway, NJ, v. 14, n. 6, p. 1205-1212, November 2008. ISSN 1077-2626.
GOLOVCHINSKY, G.; DIRIYE, A.; DUNNIGAN, T. The future is in the past: designing for exploratory search. In: Information Interaction in Context Symposium, 4, 2012, Nijmegen, Netherlands. Proceedings... New York:ACM. 2012. p. 52-61.
HAILPERN, J. et al. YouPivot: improving recall with contextual search. In: SIGCHI Conference on Human Factors in Computing Systems, 29, 2011, Vancouver, BC, Canada. Proceedings... New York: ACM. 2011. p. 1521-1530.
HEARST, M. A. Search User Interfaces. Berkeley, CA: Cambridge University Press, 2009.
97
HOEBER, O.; SCHROEDER, D.; BROOKS, M. Real World User Evaluations of a Visual and Interactive Web Search Interface. In: International Conference Information Visualisation, 13, 2009, Washington, DC. Proceedings... Los Alamitos, CA: IEEE Computer Society. 2009. p. 119-126.
HUTCHINS, E. Cognition in the Wild. Cambridge, MA: MIT Press, 1995.
KOMLODI, A.; MARCHIONINI, G.; SOERGEL, D. Search history support for finding and using information: User interface design recommendations from a user study. Information Processing and Management: an International Journal, Tarryton, NY, v. 43, n. 1, p. 10-29, January 2007. ISSN 0306-4573.
KOMLODI, A.; SOERGEL, D.; MARCHIONINI, G. Search Histories for User Support in User Interfaces. Journal of the American Society for Information Science and Technology, New York, NY, v. 57, n. 6, p. 803-807, April 2006. ISSN 1532-2882.
KUHLTHAU, C. C. Inside the search process: Information seeking from the user's perspective. Journal of the American Society for Information Science, v. 42, n. 5, p. 361-371, June 1991. ISSN 1532-2890.
KULES, B.; CAPRA, R. Designing Exploratory Search Tasks for Evaluation of Information Seeking Support Systems. In: Information Seeking Support Systems, 1, 2008, Chapel Hill, NC. Workshop Report... [S.l.]: [s.n.]. 2009. Disponível em: http://ils.unc.edu/ISSS/ISSS_final_report.pdf. Acesso em 18 jan. 2013.
KULKARNI, C. E.; RAJU, S.; UDUPA, R. Memento: unifying content and context to aid webpage re-visitation. In: ACM Symposium on User Interface Software and Technology, 23, 2010, New York, NY. Proceedings... New York: ACM. 2010. p. 435-436.
LI, I. et al. Here's what I did: sharing and reusing web activity with ActionShot. In: SIGCHI Conference on Human Factors in Computing Systems, 28, 2010, Atlanta, USA. Proceedings... New York: ACM. 2010. p. 723-732.
LUNARDI, M. S.; MONAT, A. S.; CASTRO, J. M. F. Visualização dos resultados do Yahoo em nuvens de texto : uma aplicação construída a partir de web services. InfoDesign - Revista Brasileira de Design da Informação, v. 5, n. 1, p. 21-35, 2008. ISSN 1808-5377.
MARCHIONINI, G. Information-seeking strategies of novices using a full-text electronic encyclopedia. Journal of the American Society for Information Science, jan., 1989, 54-66.
MARCHIONINI, G. Exploratory search: from finding to understanding. Communications of the ACM - Supporting Exploratory Search, New York, NY, USA, v. 49, n. 4, p. 41-46, April 2006. ISSN 0001-0782.
MAYER, M. Web History Tools and Revisitation Support: A Survey of Existing Approaches and Directions. Foundations and Trends in Human-Computer Interactions, v. 2, n. 3, p. 173-278, March 2009.
MIRIZZI, R.; NOIA, T. D. From exploratory search to web search and back. In: Workshop on Ph.D. Students in Information and Knowledge Management, 3, 2010, Toronto , Canada. Proceedings... New York: ACM. 2010. p. 39-46.
MORRIS, D.; MORRIS, M. R.; VENOLIA, G. SearchBar: A Search-Centric Web History for Task Resumption and Information Re-finding. In: SIGCHI Conference on Human Factors in Computing Systems, 26, 2008, Florence, Italy. Proceedings... New York: ACM. 2008. p. 1207-1216.
98
MORRIS, M. R.; HORVITZ, E. SearchTogether: An Interface for Collaborative Web Search. In: ACM Symposium on User Interface Software and Technology, 20, 2007, Newport, RI, USA. Proceedings… New York: ACM. 2007. p. 3-12.
NGUYEN, N. T.; ZHANG, J. A Novel Visualization Model for Web Search Results. IEEE Transactions on Visualization and Computer Graphics, Piscataway, NJ, USA, v. 12, n. 5, p. 981-988, September 2006. ISSN 1077-2626.
NORMAN, D. A. Cognitive Engineering. In: NORMAN, D. A.; DRAPER, S. W. User Centered System Design: New Perspective on Human-Computer Interaction. Hillsdale, NJ: Lawrence Erlbaum Associates, 1986. p. 31-61.
PIROLLI, P. L. T. Information Foraging Theory - Adaptive Interaction With Information. New York: Oxford University Press, 2007.
PRATES, R. O.; BARBOSA, S. D. J. Avaliação de Interfaces de Usuário - Conceitos e Métodos. In: COELLO, J. M. A.; FABBRI, S. C. P. F. Jornada de Atualização em Informática do Congresso da Sociedade Brasileira de Computação. Campinas: SBC, 2003. Cap. 6, p. 245-293.
RUSSELL, D. M. et al. The cost structure of sensemaking. In: INTERACT '93 and CHI '93 Conference on Human Factors in Computing Systems, 1993, Amsterdam, Netherlands. Proceedings... New York: ACM. 1993. p. 269-276.
SALLABERRY, A. et al. Interactive visualization and navigation of web search results revealing community structures and bridges. In: Graphics Interface, 2010, Ottawa, Ontario, Canada. Proceedings… Toronto: Canadian Information Processing Society. 2010. p. 105-112.
SCHWARTZ, B. The Paradox of Choice: Why More Is Less. New York, NY: Harper Perennial, 2005.
ŠIMKO, J.; TVAROZEK, M.; BIELIKOVA, M. Semantic History Map: Graphs Aiding Web Revisitation Support. In: Workshops on Database and Expert Systems Applications, 21, 2010, Bilbao, Spain. Proceedings… Los Alamitos, CA: IEEE Computer Society. 2010. p. 206-210.
TREHARNE, K.; POWERS, D. M. W. Search Engine Result Visualisation: Challenges and Opportunities. In: International Conference Information Visualisation, 13, 2009, Barcelona, Spain. Proceedings… Los Alamitos, CA: IEEE Computer Society. 2009. p. 633-638.
TVAROZEK, M.; BIELIKOVA, M. Reinventing the Web Browser for the Semantic Web. In: IEEE/WIC/ACM International Joint Conference on Web Intelligence and Intelligent Agent Technology, 16, 2009, Milano, Italy. Proceedings... [S.l.]: IEEE Computer Society. 2009. p. 113-116.
TVAROZEK, M.; BIELIKOVA, M. Factic: personalized exploratory search in the semantic web. In: International Conference on Web Engineering, 10, 2010, Vienna, Austria. Proceedings... [S.l.]: Springer-Verlag. 2010. p. 527-530.
WAI-TAT FU, W. D. Collaborative Indexing and Knowledge Exploration: A Social Learning Model. IEEE Intelligent Systems, Piscataway, NJ, USA, v. 27, n. 1, p. 39-46, January 2012. ISSN 1541-1672.
WHITE, R. W.; KULES, B.; BEDERSON, B. Exploratory search interfaces. ACM SIGIR Forum, New York, NY, v. 39, n. 2, p. 52, December 2005. ISSN 0163-5840.
99
WHITE, R. W.; MARCHIONINI, G.; MURESAN, G. Evaluating Exploratory Search Systems: Introduction to special topic issue. Information Processing and Management, New York, NY, v. 44, n. 5, p. 433-436, March 2008. ISSN 0306-4573.
WHITE, R. W.; MURESAN, G.; MARCHIONINI, G. Evaluating Exploratory Search Systems. In: ACM SIGIR 2006 Workshop on "Evaluating Exploratory Search Systems", 2006, Seattle, WA. Proceedings... [S.l.]: [s.n.]. 2006. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/eess/eess2006_proceedings.pdf. Acesso em 18 jan. 2013.
WHITE, R. W.; MURESAN, G.; MARCHIONINI, G. Report on ACM SIGIR 2006 Workshop on Evaluating Exploratory Search Systems. ACM SIGIR Forum, New York, NY, v. 40, n. 2, p. 52-60, December 2006. ISSN 0163-5840.
WHITE, R. W.; ROTH, R. A. Exploratory Search: Beyond the Query-Response Paradigm. Chapel Hill, NC, USA: Morgan & Claypool, 2009.
WIKI, I. Information Visualization. Infovis: Wiki, 2013. Disponivel em: <http://www.infovis-wiki.net/index.php/Information_Visualization>. Acesso em: 18 jan. 2013.
WILDEMUTH, B. M.; FREUND, L. Assigning search tasks designed to elicit exploratory search behaviors. In: HCIR Symposium on Human-Computer Interaction and Information Retrieval, 6, 2012, New York, NY. Proceedings... New York: ACM. 2012. p. Article No. 4.
WILSON, M. L.; SCHRAEFEL, M. C. Improving Exploratory Search Interfaces: Adding Value or Information Overload? In: Workshop on Human-Computer Interaction and Information Retrieval, 2, 2008, Redmond, WA. Proceedings... [S.l.]: [S.n.]. 2008. Disponível em: http://research.microsoft.com/en-us/um/people/ryenw/hcir2008/doc/HCIR08-Proceedings.pdf. Acesso em 18 jan. 2013.
WON, S. S.; JIN, J.; HONG, J. I. Contextual web history: using visual and contextual cues to improve web browser history. In: SIGCHI Conference on Human Factors in Computing Systems, 27, 2009, Boston, USA. Proceedings... New York: ACM. 2009. p. 1457-1466.
100
Apêndice A Protocolo de Revisão Sistemática
A.1. Motivação
Após realizar um levantamento bibliográfico para definição de uma proposta de trabalho na
área de HCI (Human Computer Interaction) e IR (Information Retrieval) definimos um
contexto de pesquisa. Trata-se de procurar descobrir e desenvolver um modelo para melhorar
a facilidade de encontrar informação em resultados de uma busca exploratória por meio de
melhorias na visualização dos dados. Neste sentido, formulamos algumas perguntas de
pesquisa e nos preparamos conforme este protocolo para realizar uma revisão sistemática.
A.2. Objetivos
Encontrar trabalhos relevantes e avaliá-los de maneira justa, rigorosa e replicável.
Descobrir conferências e eventos relacionados ao tema da nossa proposta de
trabalho a fim de poder acompanhar novas publicações e também encaminhar
propostas de publicação ao longo e/ou término da nossa pesquisa.
A.3. Perguntas de Pesquisa
1. Existem maneiras de melhorar a busca exploratória em ferramentas de pesquisa
baseadas na Web? Como isto tem sido feito nos últimos anos?
2. Informações sobre o conteúdo, relação e importância dos itens listados nas páginas
de resultados de ferramentas de pesquisa podem ser melhoradas com a aplicação
de técnicas de visualização da informação?
3. Existe uma maneira de registrar e indicar o histórico da pesquisa, permitindo ao
usuário compreender os passos dados e o aprendizado acumulado ao longo da sua
101
tarefa de pesquisa exploratória?
4. A aplicação de técnicas de visualização da informação em páginas de resultados de
pesquisa de fato contribui para um melhor desempenho em buscas exploratórias?
A.4. Idioma
Serão pesquisados artigos publicados somente no idioma inglês.
A.5. Palavras-Chave
A partir da experiência obtida no levantamento bibliográfico realizado para redigir o artigo de
Trabalho Individual sobre o tema, selecionamos para pesquisa os seguintes conjuntos de
palavras-chave:
1. “exploratory search”
2. “exploratory search” AND “information visualization”
3. “exploratory search” AND “history”
4. “exploratory search” AND “user interface”
5. “search engine results pages”
6. “Web search results visualization”
7. “user interface” AND “search engine”
8. “search engine” AND “information visualization”
9. “information seeking” AND “information visualization”
10. “user interface” AND “history”
11. “information visualization” AND “history”
12. “web browser history”
A.6. Fontes de Pesquisa
Realizaremos a pesquisa nas fontes mais populares da área de Ciência da Computação, a
saber:
ACM Digital Library - The ACM Guide to Computing Literature21
IEEE Xplore Digital Library (incluindo IBM)22
21 http://portal.acm.org 22 http://ieeexplore.ieee.org
102
ISI Web of Knowledge / Web of Science23
CiteSeer24
The DBLP Computer Science Bibliography25
A.7. Critérios de Pesquisa
Artigos publicados em Journals, Revistas ou Proceedings.
Palavras-Chaves devem estar no resumo/abstract do artigo.
As publicações devem ser do período de 2006 a 2012
o Caso, não haja artigos suficientes, ampliaremos o espectro de tempo para 2001-
2012.
Os resultados devem estar disponíveis em full text para download e leitura.
A.8. Metodologia
Será feita uma consulta para cada conjunto de palavras-chave em cada uma das fontes
escolhidas conforme os critérios definidos e registraremos os resultados obtidos.
Para cada resultado de consulta, serão guardadas informações dos artigos
encontrados - título, autores, abstract e outros dados importantes.
Para cada artigo, procede-se a leitura do título e abstract para selecionar aqueles que
parecem propor uma resposta para algumas das perguntas de pesquisa.
Para os artigos selecionados, baixa-se a versão FullText e daqueles que possuírem
mais de cinco páginas faz-se leitura. Se percebido não responder às questões levantadas o
artigo poderá ser descartado. Optamos por ler apenas os artigos com pelo menos seis páginas,
uma vez que artigos pequenos poderão não contribuir com informações relevantes sobre o
contexto de realização da pesquisa, descrição da análise de experimentos e resultados obtidos.
Finalmente será redigido um relatório com um resumo do conhecimento adquirido
após as leituras dos artigos completos no qual indicaremos quais perguntas já foram
respondidas, ou ainda precisam de respostas ou quais outras questões poderão ser levantadas a
partir do contexto pesquisado.
23 http://webofknowledge.com 24 http://citeseerx.ist.psu.edu 25 http://www.informatik.uni-trier.de/~ley/db/
103
Apêndice B Questionário sobre Hábitos de Pesquisa Exploratória
Este questionário foi publicado na URL http://bit.ly/habitos-de-pesquisa e distribuído de
forma digital. Abaixo segue uma cópia da versão publicada.
-------------------------------------------------------------------------------------------------
Questionário sobre Pesquisa Exploratória – Parte 1 de 3
Olá, obrigado por acessar esta pesquisa.
O tempo estimado para preenchimento deste questionário é de 10 a 15 minutos.
Este questionário está dividido em três etapas:
1. Na primeira pedimos algumas informações para poder entender um pouco mais sobre você. São apenas 5 questões que visam determinar um perfil.
2. Na segunda etapa apresentamos um pequeno texto para explicar o que é uma Pesquisa Exploratória e faremos perguntas sobre seus hábitos de pesquisa na Internet e suas preferências de uso de ferramentas e navegadores. Serão 15 questões de múltipla escolha.
3. Na última etapa deixamos duas perguntas com espaço aberto para que você possa livremente expressar sua experiência e anseios acerca de uma pesquisa exploratória.
Queremos descobrir como você se organiza antes e durante a realização de um determinado tipo de pesquisa (busca de informação).
Nosso objetivo é validar (ou não) algumas hipóteses levantadas por nosso trabalho de pesquisa. Para isso, contamos com sua sinceridade em responder as questões a seguir.
Antecipadamente agradecemos sua atenção e esforço em nos ajudar.
Identificação de Perfil
As questões abaixo visam identificar perfis de usuários para possível segmentação.
1. Qual sua idade? _______
104
2. Sexo? ( ) masculino ( ) feminino
3. Qual seu grau de formação acadêmica? ( ) Ensino Fundamental ou Médio ( ) Graduado ou cursando Graduação ( ) Graduado, cursando pós-graduação (especialização) ( ) Graduado, cursando pós-graduação (mestrado) ( ) Especialista (graduação + especialização concluída) ( ) Mestre ( ) Mestre, cursando doutorado ( ) Doutor ( ) Doutor, cursando pós-doutorado ( ) Pós-Doutor
4. Qual sua profissão? Se estudante, escreva “estudante” ________________________
5. Sua atuação profissional ou área de estudos está mais relacionada à: ( ) Administração, Marketing, Comunicação ( ) Artes Cênicas, Design, Música, Teatro... ( ) Computação, Informática ( ) Engenharias (civil, elétrica, materiais, produção, ...) ( ) Biologia, Medicina, Agronomia, Veterinária, ... ( ) Filosofia, Serviço Social, Ciências Sociais, ... ( ) Outro: __________________________
-------------------------------------------------------------------------------------------------
Questionário sobre Pesquisa Exploratória – Parte 2 de 3
Pesquisa Exploratória
Uma pesquisa exploratória tem como objetivo fazer com que o pesquisador familiarize-se com um determinado assunto pouco conhecido ou ainda não explorado. A duração de uma pesquisa exploratória pode levar dias ou meses e, por isso, estende-se por diversas sessões de pesquisa. Durante essas sessões, o pesquisador pode encontrar conceitos que ele ainda não entende e, por isso, precisará aprender (pesquisando) sobre este conceito antes de prosseguir. Alguns autores classificam a Pesquisa Exploratória como busca de informação visando aprendizado e investigação.
Na pesquisa exploratória a meta não é simplesmente achar uma informação, mas conduzir o pesquisador para compreender um tópico a fim de tomar melhores decisões com as informações encontradas e com o aprendizado acumulado durante a tarefa de busca de informação. As pesquisas exploratórias têm ênfase em ampliar conhecimento ou proporcionar desenvolvimento pessoal.
São exemplos de pesquisas exploratórias:
• Desenvolver um novo produto por meio da compreensão de um fenômeno ou problema;
105
• Encontrar soluções para problemas complexos, por meio de aprofundamento do conhecimento e realização de experimentos.
• Dominar uma linguagem de programação para desenvolver novos sistemas para determinado dispositivo;
Exemplos que NÃO são pesquisas exploratórias:
• Procurar pelo nome completo de um artista;
• Localizar o endereço ou telefone de contato de uma empresa;
• Encontrar o menor preço para um produto ou serviço e;
• Listar os jogadores de uma equipe de futebol.
Sobre “Hábitos de Pesquisa”
6. Com a explicação acima, você acredita que conseguiu compreender o que é uma pesquisa exploratória? ( ) Não ( ) Sim ( ) Talvez, ainda tenho dúvidas
7. Você costuma recorrer à Internet nas situações a seguir? Se alguma das tarefas a seguir você nunca realizou, deixe em branco. Nunca Pouco
Algumas Vezes Muito
Planejar uma viagem de férias para destino ainda não conhecido (inclui escolher o destino)
Realizar e escrever um Trabalho de Conclusão de Curso / Monografia
Escrever um artigo técnico para um blog ou trabalho acadêmico
Criar uma apostila e slides para uma disciplina ou curso
Aprender uma Linguagem de Programação ou uma nova técnica/metodologia para aplicação no trabalho
8. Quais recursos não informatizados você utiliza durante seu processo de pesquisa exploratória? Pode marcar mais de uma opção. [ ] Anotações em papel/caderno [ ] Consulta às pessoas especialistas no assunto [ ] Leituras de publicações impressas (livros, revistas, jornais, etc.) [ ] Visita à biblioteca [ ] Outro: ______________________
9. Como você costuma iniciar uma pesquisa na Internet? Pode marcar mais de uma opção. [ ] Acessando uma ferramenta de pesquisa (ex., digitando www.google.com) e nela digitando os termos de pesquisa (palavras-chave); [ ] Digitando termos de pesquisa (palavras-chave) na barra de endereço do navegador; [ ] Digitando termos de pesquisa (palavras-chave) no campo de pesquisa oferecido
106
pelo navegador; [ ] Acessando diretamente sites específicos que você já conhece (ex. Wikipedia)
10. Quando você resolve encerrar a pesquisa que você está fazendo? [ ] Quando termina o prazo que eu tenho para obter minhas conclusões; [ ] Quando começo a encontrar conteúdos repetidos, que já visualizei em sessões de pesquisa anteriores; [ ] Quando sinto que aprendi o suficiente sobre o assunto de interesse e já tenho confiança para realizar a tarefa pretendida;
11. Você costuma se lembrar do endereço (URL) de uma página ou documento que achou interessante há alguns dias e que precisa retornar para consultá-la(o)? Considere páginas e documentos visitados no período de um dia a seis meses. Considere conseguir se lembrar pelo menos do site (domínio) onde a página se encontra e de forma que você acessando-o conseguirá reencontrá-la. ( ) Sim, sempre. ( ) Sim, na maioria das vezes eu lembro. ( ) Não, na maioria da vezes não lembro. ( ) Não, nunca.
12. O que você costuma fazer quando precisa revisitar uma página ou documento que sabe já ter visto anteriormente? Pode marcar mais de uma opção ou descrever seu próprio método/ações. [ ] Recorro aos favoritos do navegador, pois sempre guardo lá link para páginas interessantes [ ] Utilizo um serviço como Delicious, Diigo ou similar para salvar páginas interessantes com tags apropriadas [ ] Acesso o histórico de navegação, oferecido pelo navegador [ ] Sempre anoto link interessantes em um arquivo ou papel [ ] Tento refazer a pesquisa que mostrou aquele resultado pra mim [ ] Tento pesquisar pelo texto ou palavras-chave que lembro existirem naquele documento [ ] Outro: _________________________________________
Sobre ferramentas para pesquisa Queremos entender um pouco sobre suas preferências de uso de softwares e seus recursos.
13. Qual ferramenta de busca (website de pesquisa) você utiliza com maior frequência? ( ) ASK - www.ask.com ( ) Baidu - www.baidu.com ( ) Bing - www.bing.com(.br) ( ) Google - www.google.com(.br) ( ) Yahoo - www.yahoo.com(.br) ( ) Outro: ___________________
107
14. Você conhece e utiliza alguns destes outros recursos oferecidos por estas ferramentas, para enriquecer o entendimento sobre o assunto pesquisado? Pode marcar mais de uma opção Artigos Acadêmicos (Google Scholar, Microsoft Academic Search, ...) Busca Avançada Delimitação do Tempo de Publicação do Conteúdo (Período) Imagens Mapas Vídeos Histórico de pesquisas feitas (Google Web History)
15. Qual o navegador que você mais utiliza para realizar pesquisas na internet? ( ) Apple Safari ( ) Google Chrome ( ) Microsoft Internet Explorer ( ) Mozilla Firefox ( ) Opera Browser ( ) Não sei identificar o navegador que eu utilizo
16. Quais destes recursos oferecidos pelo próprio navegador de internet você utiliza para apoiar sua pesquisa na web: Pode marcar mais de um [ ] Salvar e acessar Favoritos/Marcadores (bookmarks) no Navegador [ ] Visualizar o Histórico de Navegação
17. Sobre o recurso "Histórico de Navegação"... Pode marcar mais de um [ ] Não conheço [ ] Conheço, mas não vejo utilidade para uma pesquisa exploratória [ ] Conheço, mas acho difícil de usar [ ] Conheço, mas acho que precisa ser melhorado para servir de apoio à pesquisa exploratória [ ] Conheço, mas não acho prático a forma de apresentação da informação de páginas visitadas [ ] Conheço, mas por listar todo histórico de navegação fica difícil extrair/encontrar informação útil
18. Você está familiarizado com a instalação e uso de extensões ou complementos para o navegador que você utiliza? ( ) Não ( ) Sim
19. Você utiliza alguma extensão ou complemento de navegador que otimiza seu processo de pesquisa na web? Qual? ( ) Nenhuma ( ) Outro: ___________________________________________________
-------------------------------------------------------------------------------------------------
108
Questionário sobre Pesquisa Exploratória – Parte 3 de 3
Muito obrigado por chegar até aqui!
Pedimos mais um pouco de esforço para enriquecer ainda mais nossa pesquisa.
Tente responder as duas questões a seguir e depois clique em enviar para encerrar a pesquisa.
20. Aponte outras ferramentas (sites ou softwares) que você costuma utilizar para apoiar suas pesquisas exploratórias. Ex.: Delicious, ACM Digital Library, Mendeley, etc... _______________________________________________________________________________________________________________________________________________________________________________________________________________
21. Qual recurso ou ferramenta ainda não existente você acha que seria útil para melhorar seu processo de pesquisa exploratória? _______________________________________________________________________________________________________________________________________________________________________________________________________________
-------------------------------------------------------------------------------------------------
109
Apêndice C Tabulação das Respostas do
Questionário sobre Hábitos de Pesquisa Exploratória
C.1. Perfil dos Participantes
Total de Respostas: ........................................................................................... 161
Idade Idade mínima: ...................................................................................................... 16 Idade máxima: ..................................................................................................... 63 Média de idade: .............................................................................................. 30,09 desvio padrão: .................................................................................................... 8,5 Mediana: .............................................................................................................. 29
Faixas Etárias:
16 a 20 anos
21 a 25 anos
26 a 30 anos
31 a 35 anos
36 a 40 anos
41 a 45 anos
46 a 50 anos
51 a 55 anos
56 a 60 anos
Acima de 60
7 42 54 29 9 7 7 3 2 1
Sexo Homens 101 62,7% Mulheres 60 37,3%
Formação Ensino Fundamental ou Médio 9 5,6%Graduado(a) ou cursando Graduação 53 32,9%Graduado(a), cursando pós-graduação (especialização) 31 19,3%Graduado(a), cursando pós-graduação (mestrado) 11 6,8%Especialista (graduação + especialização concluída) 22 13,7%Mestre 17 10,6%Mestre, cursando doutorado 10 6,2%Doutor(a) 7 4,3%Doutor(a), cursando pós-doutorado 1 0,6%
Área de Atuação/Estudo Computação, Informática 67 41,6%Administração, Marketing, Comunicação 37 23,0%Outros (Educação, Ciências da Informação, Direito, Geografia, Religião, Comércio, Meio-Ambiente, ...)
19 11,8%
Biologia, Medicina, Agronomia, Veterinária, ... 13 8,1%Engenharias (civil, elétrica, materiais, produção, ...) 10 6,2%Filosofia, Serviço Social, Ciências Sociais, ... 8 5,0%Artes Cênicas, Design, Música, Teatro... 7 4,3%
110
C.2. Entendimento do conceito de Pesquisa Exploratória
“Com a explicação acima, você acredita que conseguiu compreender o que é uma pesquisa exploratória?” Não 2 1,2%Sim 140 87,0%Talvez, ainda tenho dúvidas 19 12%
C.3. Comportamento de Pesquisa
Você costuma recorrer à Internet nas situações a seguir?
Recorre a Internet para: Muito Algumas
Vezes Pouco Nunca
Planejar Férias 93 59,6% 38 24,4% 20 12,8% 5 3,2%Fazer TCC 98 63,6% 33 21,4% 17 11,0% 6 3,9%Escrever Artigos 99 64,3% 28 18,2% 22 14,3% 5 3,2%Preparar Apostila/Slides 83 54,2% 41 26,8% 24 15,7% 5 3,3%Aprender LP ou Técnica 112 73,7% 21 13,8% 13 8,6% 6 3,9%
Recorre a Internet para: Muito +
Algumas Vezes
Pouco + Nunca
Planejar Férias 131 81,3% 25 18,7%Fazer TCC 131 81,3% 23 18,7%Escrever Artigos 127 78,9% 27 21,1%Preparar Apostila/Slides 124 77,0% 29 23,0%Aprender LP ou Técnica 133 82,6% 19 17,4%
Em média, 80,22% recorrem à Internet muito ou algumas vezes para realizar
pesquisas do tipo exploratória, citadas na pesquisa.
Quais recursos não informatizados você utiliza durante seu processo de pesquisa exploratória? Anotações em papel/caderno 110 68,3%Consulta às pessoas especialistas no assunto 93 57,8%Leitura de publicações impressas 138 85,7%Visita à biblioteca 61 37,9%
Como você costuma iniciar uma pesquisa na Internet? Acessando uma ferramenta de pesquisa (ex., digitando www.google.com) e nela digitando os termos de pesquisa (palavras-chave).
113 70,2%
Digitando termos de pesquisa (palavras-chave) na barra de endereço do navegador.
82 50,9%
Digitando termos de pesquisa (palavras-chave) no campo de pesquisa oferecido.
47 29,2%
Acessando diretamente sites específicos que você já conhece (ex. Wikipedia).
53 32,9%
111
Quando você resolve encerrar a pesquisa que você está fazendo? Quando termina o prazo que eu tenho para obter minhas conclusões. 38 23,6% Quando começo a encontrar conteúdos repetidos, que já visualizei em sessões de pesquisa anteriores.
94 58,4%
Quando sinto que aprendi o suficiente sobre o assunto de interesse e já tenho confiança para realizar a tarefa pretendida.
117 72,7%
Você costuma se lembrar do endereço (URL) de uma página ou documento que achou interessante há alguns dias e que precisa retornar para consultá-la (o)?26 Sim, sempre. 4 10,0%Sim, na maioria das vezes eu lembro. 11 27,5%Não, na maioria das vezes não lembro. 24 60,0%Não, nunca. 1 2,5%
O que você costuma fazer quando precisa revisitar uma página ou documento que sabe já ter visto anteriormente? ?27 Serviços Externos 13 32,5%Refaz Pesquisa que originou resultados 20 50,0%Tenta pesquisar pelo conteúdo 17 42,5%Recorre a papel/arquivo de anotação 9 22,5%Acessa o Histórico 26 65,0%Procura nos Favoritos 28 70,0%
C.4. Ferramentas de Apoio
Qual ferramenta de busca (site de pesquisa) você utiliza com maior frequência? ASK 1 0,6% Baidu 0 0,0% Bing 0 0,0% Google 157 98,7% Yahoo 1 0,6% Outro 0 0%
Você conhece e utiliza alguns destes outros recursos oferecidos por estas ferramentas, para enriquecer o entendimento sobre o assunto pesquisado? Artigos Acadêmicos 107 66,5%Busca Avançada 94 58,4%Delimitação de Tempo 49 30,4%Imagens 131 81,4%Mapas 87 54,0%Vídeos 84 52,2%Histórico de Pesquisas 19 11,8%
26 Questão inserida na pesquisa somente a partir de uma data. Por esta razão possui menos respostas que as demais. A coluna de porcentagem considera em relação à quantidade de pessoas expostas a esta questão. 27 Questão inserida na pesquisa somente a partir de uma data. Por esta razão possui menos respostas que as demais. A coluna de porcentagem considera em relação à quantidade de pessoas expostas a esta questão.
112
Qual o navegador que você mais utiliza para realizar pesquisas na Internet? Chrome 101 63,5% Firefox 37 23,3% Internet Explorer 14 8,8% Opera 1 0,6% Safari 6 3,8%
Você está familiarizado com a instalação e uso de extensões ou complementos para o navegador que você utiliza? Sim 103 64,0% Não 58 36,0%
Quais destes recursos oferecidos pelo próprio navegador de Internet você utiliza para apoiar sua pesquisa na Web: Favoritos 86 53,4%Histórico 62 38,5%
Sobre o recurso "Histórico de Navegação"... Não conhece. 8 5,0% Conheço, mas não vejo utilidade para uma pesquisa exploratória. 24 14,9% Conheço, mas acho difícil de usar. 2 1,2% Conheço, mas acho que precisa ser melhorado para servir de apoio à pesquisa exploratória.
62 38,5%
Conheço, mas não acho prática a forma de apresentação da informação de páginas visitadas.
49 30,4%
Conheço, mas por listar todo histórico de navegação fica difícil extrair/encontrar informação útil.
69 42,9%
Você utiliza alguma extensão ou complemento de navegador que otimiza seu processo de pesquisa na web? Qual? Não 145 90,1% Sim 16 9,9%
Extensões citadas:
pesquisa em documentação de códigos, pesquisa em wiki, plugins de grupos de email para printar a pagina (esqueci o nome) AVG que verifica a confiabilidade do site Ferramenta para salvar sessões Diigo Bookmark google search by image Atalho Google Xmarks GOOGLE HACKS Better History ReadItLater (agora chama-se Pocket) Crio alguns Keymarks nos favoritos do Firefox para realizar pesquisas diretamente na barra
de endereço em sites customizados Surf canion downloader downloadhelper
113
Aponte outras ferramentas (sites ou softwares) que você costuma utilizar para apoiar suas pesquisas exploratórias. 1. Periódicos da CAPEs (http://www.periodicos.capes.gov.br/), Estante Virtual
(http://www.estantevirtual.com.br/), Wolfram Alpha (http://www.wolframalpha.com/) e similares, sites de Universidades, sites de livrarias.
2. Delicious e outros sites de gerenciamento de links. 3. Costumava utilizar o library.nu até o seu fechamento, com isso procuro ainda opcoes similares como o
ebokee. Esta foi a maior perda dos ultimos anos na comunidade academica 4. Twitter 5. Wiki próprio 6. Nunca utilizei nada além do google ou sites especializados no tema de pesquisa (como o Observatório de
Imprensa para a monografica). 7. "http://www.ibict.br/
http://www.wdl.org/pt/ http://www.scielo.org/php/index.php http://www.sib.uem.br/index.php?option=com_content&view=article&id=2&Itemid=110 http://www.periodicos.capes.gov.br.ez79.periodicos.capes.gov.br/index.php?option=com_phome"
8. Mozilla Firefox Sites da Microsoft na Web 9. Delicious e Mendeley. 10. Delicious, Digg, Bookmarks do Chrome 11. basicamente delicious e os favoritos do navegador 12. Ebsco, periódico da CAPES, working papers da ANPAD 13. "ACM DIGITAL
BIBLIOTECAS DIGITAIS DE UNIVERSIDADES" 14. Preezy, Powerpoint, Adobe Premier, Xilisoft, MovieMaker, ... 15. Bibliotecas digitais (ACM, IEEE, Springer) 16. www.scielo.org , www.cpdoc.fgv.br. 17. Delicious, Diigo 18. Twitter, 19. Delicious, ACM Digital Library 20. Periódicos Capes 21. Uso muito a pesquisa interna entre os artigos da revista Techne, dentro do próprio site da editora PINI
[http://www.revistatechne.com.br/index.asp], mas este é um recurso direto da editora volta à engenharia do Brasil. Não utilizo outros recursos além daqueles ofertados pelo Google, que atendem às minhas necessidades atuais.
22. "ACM, IEEE, CiteSeerX, Engineering Village, ScienceDirect, SpringerLink, Web of Knowledge. Ferramenta: JabRef"
23. Delicious, planilhas (microsoft excel, libre office calc), google docs "Delicious Mendeley Scielo Gigablast"
24. Acm digital library 25. Portal de periódicos da CAPES 26. Evernote 27. Uso apenas os favoritos do navegador mesmo, e sincronizo eles usando o Xmarks. 28. Delicious para salvar sites, Mendeley para gerenciar arquivos, outras bibliotecas digitais com a ACM,
IEEE, Springer 29. Wikipedia, MSDN, Slideshare, scridb 30. Aplicativos e/ou extensões para marcar algum conteúdo como lista de leitura, por ex. Readability e as
Listas de Leitura do Safari
114
31. googles 32. http://www.scielo.com.br/ para pesquisas de artigos cientificos 33. Yahoo Perguntas e Respostas 34. "Portal da Capes
Scielo Banco de teses e dissertações de universidades e da Capes" Costumo fazer fichamentos com o EndNote.
35. delicious, acm, wikipedia 36. Pocket, readability, instapaper, alfred. 37. GOOGLE HACKS, 38. Mendeley 39. Blogs, Tutoriais, Artigos e etc. 40. google books frequentemente, diigo, 41. Wolfram - http://www.wolframalpha.com/ 42. "Aonde.com
Scielo" 43. Yahoo! Geocities e Scielo. 44. Wikipedia, Mendeley 45. Wikipedia 46. Sempre que busco aprender sobre um assunto que foge do meu conhecimento, busco em bases de dados de
trabalhos cientificamente coomprovados como SciElo, ScienceDirect, Engineering Village, Emerald, SpringerLink, Periódicos Capes, etc.
47. Redes Sociais. 48. wikipedia 49. ACM, IEEE, Compendex, ScienceDirect, Scirus, Biblioteca digital de teses e dissertações da USP 50. "youtube
google plus sites de universidades domínio público shareslide"
51. delicious 52. "Em ordem de importância
IEEExplorer ACM Digital Library ScienceDirect"
53. Utilizo sites acadêmicos apenas (Scielo, PePsic, CAPES, PubMed, etc) 54. Google Reader, Python, Excel 55. ISI Web of Science 56. Wikipedia, Altdevblog, StackOverflow, MSDN. 57. ACM Digital Library, Google Scholar 58. ACM Digital Library, SciELO, Since Direct, IEEE Explorer, Scirus, Microsoft Academic Search, Biblioteca
Digital Brasileira de Teses e Dissertações, Biblioteca Digital Brasileira de Computação 59. Scopus, IEEE Xplore, ACM Digital Library, Science Direct, SciELO, Scribd, Google Books 60. Minha técnica é bastante rudimentar. Durante a pesquisa vou salvando as URLs dos sites que me
interessam em um arquivo TXT ou no Google Docs. Junto com as URLs coloco uma breve descrição, escrita por mim, para lembrar o que de importante existe naquele site.
61. Mendeley 62. medline, BVS 63. Pinterest, Hootsuite 64. ACM Digital Library, Períodico Capes, Google Scholar. 65. Scribd, www.dominiopublico.gov.br 66. Scielo, pubmed 67. blogs, redes sociais,
115
68. Delicious 69. Scielo, Portal Periódicos, Google Acadêmico, Wiley Online Library, sites de Instituições de ensino
(Universidades), Journals. 70. Library 71. Google Earth, Google Maps, Site Brasil Escola, Site do MEC, Atlas Geográfico escolar, Site NG Brasil. 72. IEEE e ACM 73. Bible Works, Banco de dados no site da universidade 74. Mendeley, delicious 75. google, code.google.com, github 76. Delicious, ACM Digital Library, SpringerLink, Mendeley. 77. PubMed, 78. aclweb.org 79. Twitter (favoritos), DropBox (para armazenar resumos) 80. "ncbi
Web of Science pubmed"
81. Bibliotecas digitais em geral, wikipedia, páginas de grupos de pesquisas com suas publicações, páginas pessoais de pesquisadores com suas publicações, páginas com conteúdo didático, slides disponibilizados por outros professores/pesquisadores
82. ACM, Springer, IEEExplore, Delicious, 83. Mendeley 84. portal periodicos capes 85. Read It Later 86. Google e Youtube 87. getpocket.com 88. endnote 89. Blogs, Planilha Excel e o Google Reader.
Além de 22 menções explícitas de não conhecer outro recurso e/ou utilizar apenas a própria ferramenta de busca do Google. Qual recurso ou ferramenta ainda não existente você acha que seria útil para melhorar seu processo de pesquisa exploratória? 1. uma app-compendio tal qual a library.nu 2. melhorar o meu aprendizado sobre a internet pois a utilizo bastante quando tenho tempo geralmente é
minha secretaria (filha)que digita os meus trabalhos ou me orienta. 3. Acredito que uma ferramenta que "compreendesse" o assunto que estou pesquisando e desse mais
relevância aos resultados seria fantástico, pois muitas vezes palavras chaves podem conflitar entre vários assuntos
4. Um indexador de objetivos, onde voce planeja a pesquisa e então ao encontrar um resultado satisfatório relaciona aquela resposta a um tópico da sua lista de objetivos, sendo assim indexados os detalhes para dúvidas.
5. Eu sempre mantinha um email dentro da minha caixa com o endereço dos sites que achava interessante. Como não sou lá muito organizada perdia muita coisa e frequentemente tinha que abrir um por um para achar o que estava procurando. Uma ferramenta que organizasse toda a pesquisa realizada, por histórico (datas da pesquisa e de acessos), endereço e fácil acesso e retorno ao tema já encontrado (o nome e o que encontrou no site de importante ao invés do endereço eletronico), uma pesquisa dentro do que já foi encontrado (pesquisar apenas dentro do que está salvo dentro dessa ferramenta), e também poder criar nela várias pastas e subpastas, porque voce pode estar procedendo mais de uma pesquisa ao mesmo tempo.
6. logica boleana
116
7. Uma ferramenta que além do links da paginas, armazenasse também os textos dentro de cada uma das paginas. Um Delicious avançado.
8. Não sei se já existe, mas acredito que seria interessante um histórico mais elaborado de navegação, com a opção de separar as buscas. Por exemplo, começo fazendo uma busca X, porém como utilizo o site de buscas pra quase tudo, então faço outra busca Y que não tem nada a ver com o conteúdo buscado em X. Logo a possibilidade de poder voltar para a busca X seria interessante.
9. acho que o delicious supre as maiores necessidades (marcação com tags e possibilidade de descrição do conteúdo) só acho que se tivesse algo que pudesse ser marcado diretamente como é feito com o favoritos no navegador (clicar na estrela, sem a necessidade de control c e v do link) ou algo que pudesse selecionar e salvar um comentário ou nota diretamente na página que estou vendo.
10. Algum recurso online que organize as informações (autor, palavras-chave, objetivos, teorias e metodologias utilizadas, etc) e mostre de forma gráfica as informações. Como se fosse uma biliometria automática.
11. Acredito que um filtro mais preciso para eliminar informações homônimas.. 12. Uma ferramenta que permitisse gerenciar o meu aprendizado/aquisição de conhecimento durante a
pesquisa exploratória 13. Um banco de dados que permita localizar todas as publicaçãos , refinadas por autor, com resumos e links
para as referências dos textos. Um editor de textos em PDF , que facilite a utilização das informações destes documentos.
14. Histórico do navegador mais amigável talvez com uma busca melhorada 15. Um resumo do que encontrou. Exemplo: foram encontrados tantos artigos do ano A, outros tanto do ano B.
Um gráfico. Atualmente só mostra a quantidade de registros encontrados. Ter uma opção para baixar todos automaticamente, ou pelo menos selecionar vários para fazer download. Existir um site que busca em todos os outros e não volta artigos repetidos seria muito bom. Exibir por conferencias/periódicos seria interessante.
16. Ferramentas que apoiam e auxiliam na revisão sistemática. 17. Um sistema que fosse eliminando do resultado de busca na Web, os assuntos ou tópicos já explorado e que
não é do meu interesse. 18. Melhor forma de apresentação da pesquisa 19. Um sistema inteligente que guardasse os assuntos/temas explorados e as páginas visitadas, semelhante ao
histórico de navegador, mas que não permitisse que qualquer pessoa apagasse. 20. Talvez uma maneira mais intuitiva e fácil de agrupar e subdividir os favoritos facilitasse bastante o
processo de pesquisa. 21. Uma ferramenta de gerenciamento/organização do conteúdo já visitado 22. Como existia uma ferramenta do Google para adicionar os favoritos na nuvem, para continuar a pesquisa
em lugares diferentes aos padrões como casa, escritório. 23. Acharia bem útil uma ferramente que organizasse o histórico de navegação 24. forma de grifar o texto na internet e ao salvar o site as partes grifadas continuarem marcadas 25. tradução automática, por exemplo pesquisar sobre um conteudo usando uma expressão de busca em
portugues e ele sugerir também artigos/resultados em outras linguas. 26. Se o próprio buscador, durante a busca, pudesse disponibilizar ferramentas de edição para fichamento de
artigos e teses e armazenasse gratuitamente essas informações para mim e para outros pesquisadores, acho que facilitaria bastante.Um dos grandes problemas que percebo durante as pesquisas exploratórias é a quantidade enorme de informações. Se isso é bom por um lado, por outro acaba nos levando a ter contato com opiniões, discussões e estudos superficiais sobre o assunto - o que pode acabar requerendo mais tempo do que o planejado para a pesquisa.
27. mais semântica 28. "A busca do histórico é ruim, se comparada às buscas de pastas e arquivos. O retorno não é imediato e a
precisão é baixa. Uma busca não existente seria como do alfred, mas mais aprimorado: hoje o alfred busca pasta, arquivos e até induz pesquisa no google/youtube/outros, mas são resultados que necessitam do browser para terminar a pesquisa. O que poderia ser feito é uma ferramenta como o alfred, mas com o retorno das buscas web no
117
próprio app, mas com possibilidade de visualização no browser. Além disso, possibilidade de integração de API`s de outros serviços de consulta offline (pocket, instapaper etc)."
29. "Um filtro nos próprios buscadores que só exiba resultados de sites confiáveis e que são especialistas no ramo do interesse. Por exemplo, o Google confere pontos ao site quando aquela determinada matéria for útil ao usuário, que vota por meio de botões de ""útil"" e ""não me ajudou"", assim atribuindo ao site que mais ajuda uma melhor apresentação no buscador."
30. "tem uma extensão do diigo que tem uma série de ferramentas interessantes, como marcar partes do texto, colocar comentários sobre o texto, marcar para ler depois, mas eles ""ficam escondidos"", de uma forma que torna a atividade pouco pratica e pouco utilizada. Outro detalhe seriam formas de achar imagens já vistas, pois parte do objeto de estudo exploratório pode vir a não ser somente texto em algumas áreas (como design e comunicação), e é bem mais difícil retornar a achar uma imagem específica, do que um texto específico."
31. Sendo sincera nunca pensei em algo como um recurso ou ferramenta para melhorar minha pesquisa, mais talvez seria interessante um recurso temático em que você poderia ver o banco de dados a ser explorado não ser se isso seria possível pela imensidão de trabalhos existentes, mais as vezes as palavras chaves não ajuda encontra aquilo que se quer.
32. Uma ferramenta recomendadora baseada no interesse do usuário. 33. Uma ferramenta que me possibilitasse procurar trabalhos pelo nível de aprofundamento no assunto em
pesquisa. Se quero entender alguma metodologia, linguagem de programação, entre outros, a partir do nada me deparo com o seguinte impasse: se recorro a bases científicas, as publicações requerem um nível mínimo de entendimento sobre o assunto; se busco os termos no Google de forma irrestrita, não é possível afirmar a qualidade das informações encontradas. Assim, uma ferramenta que me ajudasse a definir o nível de aprofundamento que os trabalhos encontrados tratam sobre determinado assunto seria muito interessante.
34. Aplicativo específico para tal objetivo. 35. "Alguma forma de selecionar uma parte de um texto encontrado na internet, clicar com o botão direito e
adicionar a um ""diretório"" de ""parágrafos"" sobre determinado assunto, sendo possível pesquisar keywords nesse diretório; Após realizar uma busca, associar as páginas encontradas as keywords pesquisadas; (um dicionário da forma [keywords1 -> link1, keywords1 -> link2, keyword2 -> link1] ) Talvez essas ferramentas já existam e eu não as conheço."
36. No caso dos navegadores, acredito que o menu "Favoritos" deveria ser melhor organizado. Ele também apresenta problema de eficiência quando tem-se muitos links salvos nele. Fica muito demorado para encontrar algo que foi salvo... muitas vezes acabo recorrendo ao Google... rsrsrs. Não sei se existe outro método para organizar os links no "favoritos", mas criando pastas, apenas, não ajuda.
37. Talvez uma biblioteca com livros digitalizados de livre e gratuito acesso a todos, como numa biblioteca pública, mesmo que fosse apenas para consulta sem a possibilidade de download de materiais.
38. Acho que o pior são os sites de tradução. Muito ruim. 39. uma ferramenta que conseguisse além de integrar todas as minhas fontes, melhorar a forma como as
consultas a essas fontes sÃo feitas. seja apra encontrar pelo link ou com uma busca orgânica, buscando o conteúdo diretamente.
40. Atualmente existem ferramentas suficientes, algumas públicas e outras não. Seria muito mais interessante se o acesso fosse público sempre.
41. Um bloco de notas que acompanhasse os sites visitados. Permitindo acesso a anotações feitas em uma primeira visita.
42. Um search de conteúdo de livros disponíveis comercialmente. Exemplo: faço uma busca de "Volumetric Rendering" e a ferramenta lista todos os livros da Amazon que tratam o assunto. O search embutido da Amazon deixa bastante a desejar nesse quesito.
43. Visualização da relação dos sites listados nos resultados. 44. "Ranking de citações (existem ferramentas para isso, mas não conheço nenhum via web). 45. Mapeamento ou mapa mental de referências e trabalhos (por meio de grafos ou links)."
118
46. Eu já trabalhei com o método de revisão sistemática da literatura e tive a oportunidade experimentar uma ferramenta para auxiliar neste processo denominada StArt (http://lapes.dc.ufscar.br/ferramentas/start-tool). Eu vejo este método como uma forma altamente eficiente para que possamos organizar nossas ideias e objetivos de pesquisa. Penso que a existência de mais ferramentas que apoiem ou se baseiem nesta técnica seria de grande valia para melhorar o processo de pesquisa, especialmente na pesquisa exploratória.
47. Não consigo imaginar algo especificamente. Todavia, acredito que qualquer ferramenta de apoio deve ser online. Ajuda muito você poder ter acesso aos dados da pesquisa em qualquer lugar, mesmo que não esteja com o seu próprio computador.
48. Gostaria que o histórico de navegação apresentasse não somente os links visitados mas também um thumbnail/printscreen dos sites visitados recentemente.
49. Uma ferramenta que permitisse classificar o artigo, armazenando o arquivo em disco, atribuindo algumas características, como prioridade, ano, síntese e possível conexão com o trabalho a ser desenvolvido.
50. um banco de dados de artigos científicos elencados por assunto, autor, qualificação da revista em que foi publicado
51. Sites acadêmicos e com mais referencias 52. Melhores filtros. 53. Não vejo como melhorar mais os programas que eu já uso. 54. que não repetisse tanto as informações já apresentadas 55. "Bibliotecas digitais, que não sejam vinvuladas á Universidades ou Escolas. Hoje as bilbiotecas digitais
estão vinculadas (as que eu conheço e utilizo) ás Universidades ou escolas, o que acaba por barrar o processo de pesquisa, já que muitas vezes o usuário necessita ser acadêmico ou aluno para utilizar. Porém, que nessas bibliotecas sejam disponibilizados livros (digitalizados na íntegra) não apenas partes, resumos, ou artigos (que qualquer um escrever e publicar)."
56. Gostaria que houvesse uma maneira mais enriquecida de visualizar tanto os resultados quanto o histórico das buscas.
57. PODERIA EXISTIR UMA FERRAMENTA QUE "ENTENDESSE" O QUE SE QUER PESQUISAR, FILTRANDO MELHOR O CONTEÚDO E DIRECIONANDO PARA PÁGINAS ESPECÍFICAS E DE CONTEÚDO, POIS SE ACHA MUITA INUTILIDADE NA REDE.
58. Talvez um software/extensão no qual pudesse centralizar tudo e organizar de maneira livre ou com sugestões/modelos de como organizar a pesquisa.
59. Base de dados com busca por metodologias experimentais específicas. 60. Melhorar mecanismos de buscas em redes sociais: e.g., o que meus contatos estão fazendo/compartilhando
sobre o assunto. Isso seria mto interessante no facebook. 61. Organização de histórico do navegador. 62. registrar as pesquisar no histórico por palavra-chave 63. Uma maneira eficiente de registrar a data de visita dos sites que utilizei como referência. 64. endnote gratuito
119
Apêndice D Formulário de Identificação de Participante em Testes
Quero ser testador beta da Exploratory Search App (pt-BR)
Olá! Obrigado pelo seu interesse em tornar-se testador do nosso sistema de apoio à Pesquisa Exploratória.
Nosso objetivo com esse questionário é colher informações sobre seu perfil para que possamos realizar avaliações adequadas sobre sua utilização do sistema.
As informações fornecidas são vitais para o aprimoramento do sistema.
Os testadores tem a missão de nos ajudar a:
Testar a coerência e eficácia da nossa hipótese de pesquisa;
Usando a ferramenta em um ou mais projetos do seu interesse e prover feedbacks sobre sua utilidade;
Respondendo alguns questionários durante o período de uso da ferramenta, para reportar sua experiência.
Mensurar a usabilidade e satisfação do uso do sistema;
Executando algumas tarefas pré-determinadas e realizar considerações sobre elas, incluindo sugestões para facilitar o uso;
Corrigir bugs e aprimorar o sistema;
Checando o funcionamento dos recursos oferecidos pela ferramenta;
Propondo novas funcionalidades;
Reportando problemas de desempenho;
Podem também, conforme seu conhecimento: reportar erros de tradução / sugerir correções e; reportar erros de codificação (javascript/html/css);
Depois de responder este questionário, seu e-mail será incluído no grupo de testadores e após, você já poderá iniciar os testes sobre o sistema.
Para iniciar o uso do sistema você deverá instalar a extensão (disponível na Chrome Web Store apenas ao grupo de testadores) e fazer um registro no website do sistema.
O link para baixar a extensão e realizar o registro, bem como demais instruções serão enviadas por e-mail na sequência.
Muito obrigado!
---------------------------------------------------------------------------------------------
Nome Completo: _____________________
E-mail: _____________________________
Data de Nascimento : __________________
120
Sexo: ( ) masculino ( ) feminino
Grau de Instrução ( ) Concluído apenas até ensino Fundamental ou Médio ( ) Graduado, não estudante no momento ( ) Graduação, pós-graduando uma especialização/MBA ( ) Graduação, pós-graduando stricto-senso (mestrado, doutorado, pós-doutorado) ( ) Especialista, não estudante no momento ( ) Mestre, não estudante no momento ( ) Doutor, não estudante no momento
Profissão: __________________
Há quanto tempo você tem essa atuação profissional? ( ) Menos de um ano ( ) Entre 1 a 2 anos ( ) Entre 3 a 5 anos ( ) Acima de 5 anos
Em média, quantas horas por semana você utiliza o computador? ( ) Até 5 horas (menos de 1h por dia, em média) ( ) Entre 5 a 10 horas (média de entre 1h e 1h30 por dia) ( ) Entre 11 e 30 horas (média de 1h30 a 4h por dia) ( ) Entre 30 a 60 horas (média de 4h a 8h por dia) ( ) Acima de 60 horas (mais que 8h por dia)
Como você se classifica em termos de experiência com a internet? ( ) Iniciante, não tenho muito conhecimento e faço poucas tarefas; ( ) Intermediário, uso habitualmente no trabalho e em casa e tenho poucas dúvidas a respeito; ( ) Avançado, possuo formação adequada ou experiência suficiente pra entender detalhes
121
Apêndice E Checklist de Funcionalidades
E.1. Checklist de Testes das Funcionalidades da Extensão
Após ter usado o sistema por pelo menos cinco dias, gostaríamos que respondesse este questionário que avalia suas funcionalidades e nos servirá de guia para correções e novas implementações.
Para cada funcionalidade listada abaixo, indique se ela funcionou adequadamente ou se contém erros. Caso não a tenha utilizado, deixe em branco. Haverá depois campo apropriado para sugestões de melhorias e de novas funcionalidades. Funcionou
corretamente Não
funcionou Ocorreu um
erro
Instalar a extensão
Autenticar-se (login/senha)
Escolher projeto
Iniciar o registro das atividades
Pausar o registro das atividades
Retomar o registro das atividades
Trocar de projeto
Adicionar rating (estrelas) a um documento ou consulta
Desfazer rating
Adicionar tags em documentos
Remover tags de documentos
Fazer anotações em atividades
Remover anotações em atividades
Associar atividades com objetivos do projeto
Ocultar visita ao documento em visualização
Ocultar todas as visitas para o documento em visualização
Ocultar todas as visitas ao domínio do documento em visualização
Acessar o histórico de pesquisa
Acessar a gestão do projeto (editar projeto)
Acessar seu perfil de usuário
Fazer logout da extensão
Mostrar informações do documento atual (título, URL, tempo de visita)
Exibir na janela popup da extensão quais os resultados de uma consulta já foram visitado
Identificar na própria página de resultados do Google, quais documentos já foram visitados no projeto.
Caso alguma funcionalidade acima tenha retornado-lhe algum erro, tente descrever o contexto em que isso aconteceu e o erro retornado.
122
Você acha que alguma das funcionalidades acima poderia ser melhorada de alguma forma? Como?
Indique se não gostou da aparência / forma de interagir / tempo de execução ou qualquer outro item que possa nos indicar um caminho para melhorar esta funcionalidade.
Existem algumas novas funcionalidades que você julga que poderiam ser úteis se incorporadas à extensão? Descreva-as!
E.2. Checklist de Testes das Funcionalidades da Aplicação
Servidora e Histórico de Pesquisa
Funcionalidades de Login e Senha Funcionou
corretamente Não
funcionou Ocorreu um
erro
Fazer login
Lembrar senha
Trocar senha
Fazer logout
Funcionalidades de Edição de Projetos Funcionou
corretamente Não
funcionou Ocorreu um
erro
Acessar lista de projetos
Criar novo projeto
Excluir projeto
Acessar Edição de Projeto
Editar informações básicas do projeto (título, descrição e tipo)
Adicionar e remover tags do projeto
Alterar nome e status de objetivos
Excluir objetivo
Adicionar novo objetivo
Ver últimas atividades registradas e quantidade de atividades ignoradas
Ver documentos mais visitados
Ver consultas (pesquisas) mais realizadas
Ver as tags mais utilizadas
Ver anotações
123
Funcionalidades do Histórico do Projeto Funcionou
corretamente Não
funcionou Ocorreu um
erro
Acessar histórico de pesquisa
Exibir e Ocultar Opções e Filtros do Histórico
Ver detalhes da navegação (clique)
Ver detalhes da pesquisa (clique)
Alterar período de datas da apresentação do histórico
Alterar o intervalo entre sessões na apresentação do histórico
Aplicar filtros para atividades:
Somente classificadas com quantidade específica de estrelas
Somente atividades com anotação
Somente atividades associadas a objetivo determinado
Aplicar filtros para navegação:
Por nome do domínio
Por navegação com número mínimo de documentos visitados
Por documentos com tag específicas
Ocultar todas as atividades de navegação
Aplicar filtros para Pesquisa:
Por texto na consulta;
Por posterior visitação mínima nos resultados
Ocultar todas as atividades de pesquisa
Navegar pela miniatura da linha do tempo
Ocultar toda uma sessão de atividades
Mover uma navegação para outro projeto
Mover uma pesquisa para outro projeto
Funcionalidades da Tela de Preferências Funcionou
corretamente Não
funcionou Ocorreu um
erro
Acessar página de preferências
Vincular conta do Delicious
Desvincular conta do Delicious
Alterar idioma da interface
Modificar preferências de notificações
Alterar intervalo de tempo de sessão
Adicionar nome de domínio para ignorar
Remover nome de domínio da lista de domínios ignorados
Adicionar protocolo para ignorar
Remover protocolo da lista de protocolos ignorados
Adicionar extensão de arquivo para ignorar
Remover extensão da lista de extensões de arquivos ignoradas
124
Apêndice F Roteiro de Testes de Usabilidade
Os testes de usabilidade foram aplicados por meio da ferramenta testrockit.com e divididos
em duas etapas.
F.1. Primeira Etapa
Esta etapa consiste de três tarefas e inicia-se a partir do link http://usabilidade-etapa-01.
Tempo estimado de 40 minutos no total de todas as tarefas desta etapa.
T01 – Instalação e autenticação
Instrução:
Consideramos que você já está familiarizado com a instalação de extensões no Google Chrome. Se você ainda não estiver com a extensão de Pesquisa Exploratória instalada no seu navegador, deve instalar antes de prosseguir com as demais tarefas. Também consideramos que você já possui um registro na aplicação servidora. Apenas para encerrar esta tarefa, acesse www.exploratorysearch.com/app e autentique-se com seu nome de usuário e senha. Relate aqui sua experiência no processo de instalação da extensão e de autenticação no sistema. ATENÇÃO: SÓ CLIQUE NO BOTÃO 'DONE' QUANDO VOCÊ REALMENTE TERMINAR TODA TAREFA. Ao final de cada tarefa lhe será dado espaço para comentar a experiência. É muito importante que você relate se teve dificuldades ou não, se tem sugestões para torná-la mais fácil ou se está satisfeito em como ela está projetada.
T02 – Suas preferências
Instrução:
Agora, você deverá acessar as preferências de uso do sistema de Pesquisa Exploratória e modificá-las conforme suas reais necessidades ou preferências de uso. Troque o idioma se preferir, ative ou desative notificações e adicione exclusões de domínios ou tipos de arquivos que você julga que não interessa mostrá-los no histórico de pesquisa. Detalhe: o idioma da interface da aplicação servidora pode ser alterado, mas o da extensão do navegador será adaptado ao idioma do seu navegador. Comente se conseguiu realizar estas tarefas sem maiores dificuldade
125
T03 – Projetos e objetivos
Instrução:
Crie um projeto de pesquisa com objetivos para a situação hipotética a seguir: Imagine-se um profissional de desenvolvimento Web em uma empresa brasileira deste
segmento de porte médio (aprox. 50 funcionários). Você foi escolhido para fazer uma imersão no mercado chileno para futura abertura de uma unidade naquele país.
Para isto, você fará uma viagem ao Chile, onde irá ficar por 30 dias frequentando aulas
de alguma disciplina de um curso de sua escolha no período da manhã na Universidad Católica del Chile e estagiando numa agência digital, também de sua escolha.
A matrícula no curso e o estágio em uma empresa chilena foram oferecidos pela
associação local de fomento a novos negócios e por isso você não precisa se preocupar em fazer contato com departamentos da universidade ou com as empresas, apenas escolher o nome do curso/disciplina e da empresa.
Seu dever será então escolher as aulas que pretende assistir, a empresa onde deseja
estagiar e levantar algumas outras informações que julgar pertinente para sua estadia e ambientação no Chile. Sua viagem inicia em 30 dias.
ESTA TAREFA TERMINA APÓS VOCÊ CRIAR OS PROJETOS E OS OBJETIVOS QUE ACHAR SEREM NECESSÁRIOS PARA SUA EXECUÇÃO.
T04 – Preparar a extensão;
Instrução:
Nesta tarefa você deverá conferir se a extensão está instalada no seu navegador e escolher para uso o projeto recém-criado (da Viagem ao Chile). Você deve deixar a extensão pronta para registrar suas atividades de pesquisa neste projeto. Tendo certeza disto, você poderá encerrar esta tarefa.
T05 – Tarefas durante a navegação;
Instrução:
Você deverá realizar algumas atividades de navegação (ou pesquisa) e durante elas utilizar a extensão para incluir informações sobre alguns dos documentos visitados. Aproveite esta tarefa para pesquisar as informações que você julgar necessário para sua viagem de 30 dias ao Chile. Lembre-se dos seus objetivos! Gostaríamos que você gastasse pelo menos 20 minutos nesta atividade. Para encerrar esta atividade você deve ter tentado: 1) classificar (estrelas) alguns documentos/páginas; 2) adicionar algumas anotações durante as atividades e;
126
3) criar ou associar tags que julgar ser útil para representar alguns documentos ou páginas visitadas dentro do seu espaço de pesquisa. 4) associar a atividade a um ou mais objetivos da sua pesquisa; Após ter feito isso, você pode encerrar esta tarefa. Após a tarefa, se desejar você pode pausar a extensão ou mudar de projeto. Estará encerrado aqui a primeira bateria de testes de usabilidade. Quando desejar você pode retomar este projeto e fazer mais classificações, anotações e associações de objetivos e de tags, mas a próxima etapa dos testes de usabilidade só deverão ser feitos pelo menos após 24h da execução desta.
F.2. Tarefas da 2ª Etapa
Esta etapa consiste de três tarefas e inicia-se a partir do link http://usabilidade-etapa-02.
Tempo estimado de 45 minutos no total de todas as tarefas desta etapa.
T06 – Retomar pesquisa e refazer buscas
Instrução:
Nesta tarefa você deverá retomar a pesquisa que estava fazendo para a viagem no Chile, lembra-se? Você deve preparar a extensão para voltar a registrar suas atividades neste projeto. Tente se lembrar de alguns documentos que você visitou antes e tente revisitá-los sem usar o histórico. Você talvez precise refazer algumas busca que fez nas sessões de pesquisas anteriores. Faça-as e tente verificar se a extensão lhe ajuda a relembrar as páginas já visitadas e aquelas que não foram visitadas ainda. Comente sua experiência neste sentido. Você pode continuar por mais alguns minutos neste projeto de pesquisa, tentando atingir seus outros objetivos. Depois de pelo menos 20 minutos de atividade, você poderá encerrar esta tarefa e partir para a próxima.
T07 – Conhecer o histórico da pesquisa
Instrução:
Nesta tarefa você deverá acessar o histórico da pesquisa, fornecido pela extensão.
127
Estando na tela de histórico, você deve tentar entender o que representa suas atividades de navegação e o que representa suas atividades de pesquisa (busca). Tente identificar navegações em vários documentos de um mesmo site. Sinta-se livre para interagir com o histórico por um tempo e identificar as páginas que você classificou, 'taggeou' ou inseriu anotações. Tente ler as anotações. Você acredita que conseguiu compreender a representação do histórico e consultar as informações do passado? Comente sua experiência neste sentido.
T08 – Interação avançada com o histórico
Instrução:
Sua tarefa permanece dentro do histórico de pesquisa. Agora você deverá utilizar o quadro de opções e filtros do histórico para tentar modificar a visualização do histórico. Queremos que você perceba as potencialidades que a ferramenta pode trazer para sua visualização. Se achar que o histórico possui atividades inúteis ou desinteressantes para o projeto, tente excluí-las e reporte se isso te ajudou a enxergar melhor os documentos e pesquisas que têm a ver com seu projeto. Ao encerrar a tarefa, faça comentários sobre sua experiência no uso dos filtros. Esta é sua última tarefa de teste de usabilidade. Agradecemos por ter contribuído conosco.
128
Apêndice G Questionário Final de Avaliação
Este questionário foi aplicado a cada participante do grupo de testes, de forma eletrônica pela
URL: http://bit.ly/questionario-avaliacao-final
Questionário Final de Avaliação
1. Quanto tempo, em média, desde que instalou a extensão, você acredita ter
realizado atividades com a extensão ativada, isto é, registrando suas atividades de
pesquisa?
Considere apenas dias de uso do navegador
( ) menos de 20 minutos por dia
( ) entre 20 minutos e uma hora por dia
( ) entre uma a duas horas por dia
( ) entre duas a quatro horas por dia
( ) quatro e oito horas por dia
( ) acima de oito horas por dia, mas não o dia todo
( ) deixei a extensão ativada o tempo inteiro
1.1 Se você utilizou a extensão ativada por menos de vinte minutos por dia,
sinalize o(s) motivo(s):
____________________________________________________________
____________________________________________________________
2. Quais dos seguintes recursos da extensão você NÃO utilizou?
Considere aqui os projetos de pesquisa realizados por seu interesse próprio, não leve
em consideração, portanto, os testes de usabilidade.
[ ] Classificar atividade com estrelas
[ ] Associar atividade a um objetivo de pesquisa
[ ] Fazer anotações em atividades
[ ] Incluir tags para representar o conteúdo de um documento/página
[ ] Ocultar uma visita a uma página ou todas as visitas à determinada página ou
129
domínio.
2.1 Se você não utilizou algum dos recursos acima, sinalize o(s) motivo(s):
__________________________________________________________________
__________________________________________________________________
3. Em um grau de 1 a 5, onde 1 equivale a nada agradável e 5 equivale a muito
agradável, indique se você achou agradável a apresentação visual do histórico de
pesquisa, com linhas do tempo indicando sessões e elementos diferenciando
pesquisas e navegação?
Grau: _____
4. Em um grau de 1 a 5, onde 1 equivale a totalmente inútil e 5 equivale a muito útil,
indique a utilidade:
4.1. de poder organizar suas pesquisas exploratórias em projetos e poder alternar
entre projetos;
4.2. de poder criar objetivos para seus projetos e associar atividades a estes
objetivos;
4.3. de poder pausar e continuar sua pesquisa quando desejar, suprimindo
informações não relacionadas da visualização do histórico;
4.4. da apresentação visual do histórico de pesquisa, com linhas do tempo
indicando sessões e elementos diferenciando pesquisas e navegação;
4.5. de você visualizar no histórico informações sobre as atividades, como
classificação de relevância, tags, anotações e quantidade de páginas
navegadas;
4.6. dos filtros e opções oferecidas para refinar a visualização do histórico do
projeto;
4.7. de o sistema ocultar pesquisas que não geraram visitação em documentos
presentes nos resultados da pesquisa;
4.8. de você poder ocultar na tela de histórico as atividades ou sessões que você
julgar necessárias ou não correspondentes ao projeto;
4.9. de você poder ocultar domínios por meio da sua configuração de preferências;
130
5. A forma da apresentação do histórico de pesquisa em conjunto com os demais
elementos do sistema, ajudou você, de alguma forma a compreender melhor as
atividades que você realizou e lhe proporcionou percepções para aprimorar suas
atividades de pesquisa? Indique entre 1 (não ajudou em nada) ou 5 (ajudou
muito).
Valor: ______
6. Dê uma nota de 0 a 10 para o sistema em geral, onde:
- Com zero, você demonstra estar muito insatisfeito com o sistema, não tendo ele
qualquer utilidade nas suas tarefas de pesquisa exploratória e
- Com dez, você demonstra estar plenamente satisfeito com o sistema, tendo ele muita
utilidade para apoiar suas tarefas de pesquisa exploratória.
Nota: __________
6.1 Se você não deu nota 10 na pergunta anterior, indique aqui o que falta
ao sistema para que você possa considerá-lo muito útil e tornar-se
plenamente satisfeito.
____________________________________________________________
____________________________________________________________
7 Você substituiria o convencional histórico de navegação do navegador pela solução
por nós apresentada?
Considere a solução devidamente integrada ao navegador (e com sua conta do Google) e
com aprimoramentos de desempenho;
( ) Sim, com certeza.
( ) Sim, mas com as ressalvas indicadas na questão 9.
( ) Não, de forma alguma.
8 Adicione outras considerações que julgar necessário sobre sua avaliação do sistema
(extensão e aplicação servidora).
________________________________________________________________________
________________________________________________________________________