XIII Encontro Nacional de Pesquisa em Ciência da Informação - XIII ENANCIB 2012
GT 8 Informação e Tecnologia
PANORAMA ATUAL DO USO DOS MECANISMOS DE BUSCA NA WEB
Comunicação Oral
Rogerio Paulo Muller Fernandes - Universidade Estadual de Londrina
Silvana Drumond Monteiro - Universidade Estadual de Londrina
Maria Júlia Carneiro Giraldes - Universidade Estadual de Londrina
Fernando Luiz Vechiato - Universidade Estadual de Londrina
PANORAMA ATUAL DO USO DOS MECANISMOS DE BUSCA NA WEB
Resumo: Apresenta um panorama atual do uso dos mecanismos de busca na Web a partir de pesquisas nacionais e internacionais. Define, categoriza e retrata os mecanismos de busca face sua importância nas atividades e mercado publicitário online. Destaca o grande domínio do Google em relação a seus principais concorrentes e aponta um futuro de inovações na área ainda a ser desenvolvido.
Palavras-chave: Mecanismos de Busca. Web. Google.
1 INTRODUÇÃO
Os impactos e as transformações resultantes dos avanços tecnológicos têm sido tão
frequentes e profundos na sociedade contemporânea que se torna até redundante explicitar
essa realidade. Um destaque talvez deva ser dado ao papel da informação, que sempre teve
uma função crucial no desenvolvimento de qualquer sociedade e que deixou de ser uma
prerrogativa de poucos para se tornar um requisito e um direito básico de todos os cidadãos.
A crescente criação e conversão de informações para o ambiente digital têm levado,
no entanto, a uma proliferação de conteúdos que ao mesmo tempo em que possibilita o seu
amplo e rápido acesso torna também cada vez mais difícil a obtenção de informações
relevantes.
Como porta de entrada para esse mundo digital os mecanismos de busca, designados
como oráculos digitais por Gabriel (2008), com seus complexos algoritmos varrem a Web em
busca de sites cujo conteúdo atenda as necessidades dos usuários. A qualidade dos resultados
é o maior desafio em um mercado econômica e socialmente importante, altamente
concentrado, dominado pelo Google, mas sujeito a inovações.
O acesso às informações e a venda de bens e serviços estão cada vez mais atrelados
ao posicionamento nas listas de resultados e mesmo a alta satisfação dos usuários com o
desempenho dos mecanismos de busca obscurece a frequência com que resultados
irrelevantes são ainda apresentados.
No intuito de estabelecer um panorama atual acerca desses mecanismos de busca,
apresenta-se a seguir, além das inerentes definições e contextualizações, categorias e dados
relacionados ao seu uso.
2 MECANISMOS DE BUSCA
Um mecanismo de busca é basicamente uma ferramenta que permite ao usuário
localizar um documento que contenha uma(s) determinada(s) palavras(s). Seu trabalho é
conectar palavras digitadas (queries) em uma base de dados criada de páginas Web (um
índice) que produz uma lista de URLs (e resumo do conteúdo) que pressupostamente são os
resultados mais relevantes para a busca realizada (BATTELLE, 2005, p. 19).
Possui três principais funções essenciais para a qualidade e a velocidade do
mecanismo:
a) crawling: um programa denominado crawler1 varre a Web coletando páginas novas e
atualizadas para serem incluídas no índice;
b) indexing: as informações recolhidas são armazenadas e indexadas na base de dados;
c) searching: uma interface de busca é exibida para o usuário realizar a pesquisa, a
interface e o software relacionado que conecta a busca do usuário com o índice executa
um algoritmo para encontrar e exibir as páginas relevantes.
Cada processo é dependente do anterior, como ilustra a Figura 1, pois a busca
somente pode ser realizada se houver um índice prévio, que por sua vez, é gerado a partir das
paginas coletadas e indexadas.
Figura 1 – Anatomia de um Mecanismo de Busca
_____________ 1 Rastreador. Também chamado de spider (aranha) e bot (abreviatura de robot), entre outros. O
Googlebot, por exemplo, é o robô de rastreamento da web do Google
A categorização dos mecanismos de busca (Figura 2) e o maior detalhamento dos
seus diferentes aspectos podem ser conferidos nos artigos de Monteiro (2009), Monteiro et al
(2011), entre outros2 que descrevem e analisam a seguinte tipologia:
anatomia;
forma geral de organização ou indexação;
ordenação dos resultados;
apresentação dos resultado;
paradigma semiótico.
As categorias dos mecanismos de busca estão em constante atualização pela própria
dinâmica da Web, sujeitas ao aparecimento e desaparecimento num curto espaço de tempo, de
novos atores, conceitos, recursos e serviços.
Battelle (2005, p. 253), há alguns atrás, já apontava que no campo dos mecanismos de
busca os estudos estavam, no melhor dos casos, solucionados em 5% de todo seu potencial e
que a busca estava se modificando em um ritmo muito rápido, com várias inovações sendo
desenvolvidas, mas que num futuro próximo certamente estariam condenadas.
3 USO DOS MECANISMOS DE BUSCA
Baeza-Yates e Rivera Loaiza (2003, p. 2) destacam que existem três principais formas
de se encontrar um site:
Direta: já se conhece o endereço do site, seja pela publicidade em meios de
comunicação tradicionais ou por meio de outra pessoa (a primeira é uma forma cara
e a segunda lenta em função da necessidade de comunicação entre as pessoas para a
obtenção do endereço eletrônico);
Navegando: para isso deve haver links ao site, seja mediante publicidade na Internet
ou por outras razões (forma natural, porém somente se chega aos sites com mais
recursos ou que são mais populares);
Usando um mecanismo de busca: para isso o mecanismo de busca deve ter
previamente encontrado o site (opção mais simples e praticamente a única para
novos ou pequenos sites).
_____________ 2 Ver página do Grupo de Pesquisa Informação e Conhecimento no Ciberespaço <http://www.uel.br/grupo-
pesquisa/ciberespaco/index_entrada. html>
No entanto, a realidade atual é que os usuários estão cada vez mais iniciando suas
buscas por informações, empresas e produtos, através de mecanismos de busca. Seja por que
eles não lembram um endereço específico, seja porque as URLs nem sempre são intuitivas ou
porque é mais fácil digitar algumas palavras-chave no campo de busca do que a URL na barra
de endereços.
Pesquisa realizada pela Pew Internet (2012, p. 5) sobre o uso dos mecanismos de
busca pelos adultos americanos aponta, conforme Figura 3, que a sua utilização para
encontrar as informações desejadas é uma das atividades online mais populares, apenas
rivalizada pelo e-mail.
Figura 3 – Atividades mais Populares na Internet
Fonte3: PEW INTERNET (2012).
Quando analisado por grupos, os dados da pesquisa demonstram que o uso dos
mecanismos de busca é mais popular entre os jovens adultos usuários da Internet de 18 a 29
anos (96%), entre aqueles com curso superior (95%) e aqueles com os mais altos
rendimentos domésticos (95%). Pelo menos uma vez ao dia são usados por 54% dos usuários
e a avaliação da performance indica um ótimo desempenho e elevada confiança na
capacidade dos mecanismos de busca, a saber:
_____________ 3 O uso de redes sociais não era controlado antes de fevereiro de 2005. “Obter notícias online” e “comprar um
produto online” não foram pesquisados em 2012.
91% dos usuários afirmam que sempre ou na maioria das vezes encontram a informação que estão procurando quando eles usam os mecanismos de busca;
73% dos usuários dizem que todas ou a maioria das informações que encontram quando utilizam os mecanismos de busca são precisas e confiáveis;
66% dos usuários afirmam que os mecanismos de busca são uma fonte justa e imparcial de informações;
55% dos usuários de mecanismos de busca dizem que, em sua experiência, a qualidade dos resultados da pesquisa está cada vez melhor ao longo do tempo, enquanto apenas 4% dizem que piorou;
52% dos usuários de mecanismos de busca dizem que os resultados de pesquisas se tornaram mais relevantes e úteis ao longo do tempo, enquanto apenas 7% relatam que os resultados se tornaram menos relevantes (PEW INTERNET (2012, p. 3).
Apesar dos altos índices de sucesso alcançados, nem sempre a experiência dos
usuários na utilização dos mecanismos de busca é positiva. Quatro em cada dez usuários na
pesquisa relatam não só resultados contraditórios que impossibilitavam descobrir qual a
informação correta, como também um excesso de informações nos resultados que os
deixavam atônitos (sobrecarregados). Além disso, um em cada três apontou ausência de
informações importantes ou essenciais nos resultados apresentados.
Os dados da StatOwl (2012) exemplificam o uso dos mecanismos em relação ao
numero de palavras-chave utilizadas e páginas pesquisadas. A Figura 4 mostra que os
usuários utilizam entre uma de dez palavras em suas consultas e que majoritariamente as
buscas são realizadas com 4 (27,48%), 3 (24,27%) ou 5 (18,06%) palavras-chave.
Figura 4 –Número de Palavras-chave Usadas nos Mecanismos de Busca – Junho 2011/Junho 2012
Fonte: STATOWL (2012).
Quanto maior o número de palavras numa frase, maior a possibilidade de ter a busca
restrita, no entanto, o percentual de 69,81% relativo às buscas feitas com 3 a 5 palavras-
chave indica a adequação ao usuário destes totais.
A Figura 5, por sua vez, demonstra que 98,97% dos usuários não vão além da
primeira página de resultados dos mecanismos de busca, acentuando o imediatismo dos
usuários e a importância fundamental de se figurar no topo dos resultados.
Com números diferentes, mas não alterando o fato, pesquisa da WBI Brasil (2012)
aponta que a maioria dos usuários brasileiros, 48,3%, avança até a terceira página de
resultados de busca, com 18% visualizando somente a primeira e 33,7 indo até a segunda.
Figura 5 – Página de Resultados dos Mecanismos de Busca – Junho 2011/Junho 2012
Fonte: STATOWL (2012).
4 LINK PATROCINADO X BUSCA ORGÂNICA
Com o objetivo de potencializar e melhorar a classificação de um site nas páginas de
resultados naturais (orgânicos) nos sites de busca, surgiu toda uma indústria de consultoria
visando a implementação de estratégias para um melhor posicionamento dos sites de seus
clientes, a área de Otimização para Mecanismos de Busca, mais conhecida pelo acrônimo
SEO do inglês Search Engine Optimization. O termo se refere tanto as técnicas utilizadas
como as pessoas que realizam este tipo de trabalho
A busca orgânica é o processo usual realizado pelos usuários ao efetuarem suas
pesquisas e consultarem os resultados listados pelos mecanismos de busca. Aparecem do
lado esquerdo da página e não são, em tese, diretamente manipuláveis.
Já o link patrocinado é um formato de anúncio publicitário pago, exibido em
determinadas buscas por palavras-chave com o intuito de gerar trafego para o site do
anunciante. Aparecem do lado direito da página ou antecedendo os resultados da busca
orgânica. A ordem em que aparecem depende do valor a ser pago por cada clique e da
qualidade do anúncio.
Mapeamento realizado pela WBI Brasil (2012) dos hábitos e preferências dos e-
consumidores brasileiros em relação ao uso dos buscadores para a pesquisa de serviços e
produtos (Figura 6) demonstra que a grande maioria dos usuários (84,45%) “clica” nos
resultados de busca orgânicos, ficando os “cliques” nos anúncios online com 14,55%.
Figura 6 – Link Patrocinado x Busca Orgânica nos Mecanismos de Busca no Brasil de 2006 a 2012
Fonte: WBI BRASIL (2012).
O termo SEM (Search Engine Marketing), Marketing para Mecanismos de Busca
engloba tanto o SEO quanto os links patrocinados, além de outras ferramentas e faz parte das
diversas estratégicas de marketing digital que visam promover produtos e serviços, que vão
do banner ao marketing em redes sociais.
A despeito das estratégias visando uma melhor visibilidade de um determinado site,
são os algoritmos como o PageRank do Google que determinam a relevância e importância
das páginas e, consequentemente, o posicionamento na página de resultados. Qualidade do
site baseado em conteúdo relevante e útil são as recomendações, inclusive dos melhores
SEO. No entanto, táticas de manipulação são comuns e levam com frequência os
mecanismos de busca a se aperfeiçoarem para evitar que sejam burlados.
4 DOMÍNIO DO GOOGLE
Em um dos mais importantes artigos até hoje publicados intitulado The Anatomy of a
Large-Scale Hypertextual Web Search Engine4, Sergey Brin e Larry Page revolucionaram as
tecnologias de recuperação da informação ao apresentarem, em 1998, o algoritmo PageRank
já destacavam: “A medida mais importante de um mecanismo de busca é a qualidade nos
resultados das buscas. Nossa experiência com Google nos demonstrou que a qualidade dos
seus resultados é melhor que a maioria dos mecanismos comerciais.”
Os anos se passaram e a constatação feita duas décadas atrás continua cada vez mais
verdadeira: “Googlar” virou verbo e o Google hoje é quase sinônimo de pesquisa na Web. A
Figura 7 apresenta uma comparação do uso dos mecanismos de busca nos Estados Unidos
nos anos de 2004 e 2012, com grande predomínio do Google.
Figura 7 – Evolução do Uso dos Mecanismos de Busca
Fonte: PEW INTERNET (2012).
O percentual de 83% de uso já é um número extremamente significativo, no entanto,
ainda não reflete a atual influência do Google. Segundo dados da StatCounter, em junho de
2012, conforme Figura 8, no mercado global de mecanismos de busca o Google alcança o
_____________ 4 Anatomia de um mecanismo de busca hipertextual de larga escala para a Web.
percentual de 91,78%. Em países como Brasil (98,05%) e Argentina (95,67%), na América
do Sul, ou Espanha (96,54%) e Portugal (97,44%), na Europa, o domínio é ainda maior.
Provavelmente, somente na China onde o Baidu (53,91%) lidera, o Google (41,44%)
não é principal mecanismo de busca, não obstante em Hong Kong o Google está a frente com
65,94% e o Yahoo em segundo com significativos 33,22%. Na Rússia, o Yadex (40,91%) é o
segundo colocado e mantém ainda uma proximidade com o Google (56,68%), enquanto na
Coreia do Sul, Naver (10,67%) e Daum (6,05%) mantém respectivamente a segunda e a
terceira colocação em relação ao Google (75,37%)
Os dados da StatConter para os Estados Unidos são Google (79,61%), Bing (9,83%),
Yahoo (8,8%), AOL (0,73%), Ask Jeeves (0,7%) e outros (0,33). Apesar de haver alguma
variação nos resultados entre diferentes sites e/ou metodologias5, os dados apresentados não
deixam dúvidas quanto ao grande domínio do Google em relação aos demais mecanismos de
busca, salvo as exceções anteriormente apresentadas.
Figura 8 – Os 5 Principais Mecanismos de Busca no Mundo em Junho de 2012
Fonte: STATCOUNTER (2012).
_____________ 5 A pesquisa da Pew Internet , por exemplo, entrevistou um total de 2.253 adultos, enquanto a StatCounter é um
serviço de web analytics (medição, coleta, análise e a produção de relatórios de navegação) cujo código de monitoramento está instalado em mais de 3 milhões de sites no mundo todo, com diferentes atividades e localizações geográficas.
5 MERCADO PUBLICITÁRIO NA INTERNET
De praticamente zero em meados da década de 1990 para um negócio multibilionário
hoje em dia, a busca continua sendo, segundo relatório da IAB (2012) das receitas de
publicidade na Internet nos Estados Unidos, a principal fonte de receita de publicidade online
com 46,5% do total em 2011, perfazendo a soma de U$ 14,80 bilhões de dólares de um total
de U$ 31,70 bilhões de dólares, um incremento de 22% em relação ao ano anterior (Figura
96).
Em cima dessa importância econômica direta, o relatório destaca que os mecanismos
de busca são crucialmente importantes tanto para os usuários da Internet à procura de
informações quanto para empresas que desejam vender bens e serviços aos usuários.
Figura 9 – Formatos de Publicidade na Internet 2010/2011
Fonte: IAB (2012).
Relacionadas à exibição a receita com publicidade inclui: exibição de banners (21,5%
da receita de 2011, ou US $6,80 bilhões), Rich Media7 (4,1%, ou US $1,30 bilhões), de vídeo
digital (5,7%, ou R$1,80 bilhões) e patrocínio (3,5%, ou US $1,10 bilhões).
Anúncios classificados responderam por 8,1% da receita de 2011 ou R$2,60 bilhões,
receitas de geração de leds 4,8% ou U$ 1,50 bilhões e receitas de e-mail representaram 0,7%
do faturamento de 2011 ou U$ 213 milhões de dólares. _____________ 6 O relatório traz textualmente os percentuais numericamente fracionados e no gráfico os mesmos são
apresentados arredondados. 7 Publicidade que contém elementos gráficos ou interativos mais elaborados do que os banners standard. Estes
anúncios permitem uma grande interação, podendo conter vários elementos multimídia (vídeo, áudio, etc.) (GLOSSARIUM, 2012).
Em relevo a publicidade móvel que cresceu 149% em relação a 2010, um total de US
$1,60 bilhões ou 5,0% da receita de 2011 e se tornou uma categoria significativa.
Os dados do primeiro trimestre de 2012 indicam que a as receitas de publicidade na
Internet tiveram um incremento de 15% ou U$ 1,1 bilhão de dólares em relação ao mesmo
período de 2011, estabelecendo um novo recorde para o período.
5 CONSIDERAÇÕES FINAIS
A Web já se tornou a principal fonte de informação e entretenimento e com seus
números superlativos relacionados a toda gama de recursos disponíveis, leva seus usuários a
dependerem fundamentalmente dos mecanismos de busca para poderem ter acesso às
informações desejadas.
A localização de conteúdos, pessoas, locais e produtos, o que acontece, o que se
aprende e apreende, em que se acredita, tudo acaba sendo informado e ao mesmo tempo
influenciado pelos mecanismos de busca e seus respectivos algoritmos nos resultados
apresentados.
Com o Google “dando as cartas”, o Bing tentando ser uma alternativa viável e o
Yahoo ainda presente, o mercado de busca na Internet apresenta-se concentrado e cada vez
mais econômica e socialmente importante.
Os mecanismos de busca são os maiores geradores de tráfego a sites de comércio
eletrônico, sendo a busca na internet responsável por quase a metade do bilionário mercado
publicitário online.
O perfil de uma busca realizada hoje na Web aponta para o uso de 3 a 5 palavras-
chave, com consulta aos resultados restrita quase exclusivamente à primeira página, e uso
expressivo e dominante do Google como mecanismo de busca utilizado.
As projeções de que apenas uma pequena parte do campo de busca foi desenvolvida,
somadas a iniciativas como a Web Semântica e as frequentes inovações que, não raro na
Web, modificam completamente o seu status quo, sugerem que o futuro dos mecanismos de
busca ainda está por ser determinado.
OVERVIEW OF THE CURRENT USE OF SEARCH ENGINES IN THE WEB
Abstracts: Presents an overview of the current use of search engines from national and international web analytics and research. Define, categorize, and portrays the search engines face their importance in online activities and advertising market. Highlights the great Google's dominance over its main competitors and suggests a future of innovation in the area still being developed. Keywords: Search Engines. Web. Google.
REFERÊNCIAS
BAEZA YATES, Ricardo; RIVERA LOAIZA, Cuauhtémoc. Ubicuidad y usabilidad en la Web. Revista de gerencia tecnológica informática, v. 1, n. 2, jul. 2003. Disponível em: <http://www.cidlisuis.org/aedo/RGTIN2V1/RGTI_04.pdf>. Acesso em: 01 jun. 2012.
BATTELLE, J. The Search: how Google its rivals rewrote the rules of business and transformed our culture. New York: Portifolio, 2005.
BRIN, Sergey; PAGE, Larry.The anatomy of a largescale hypertextual web search engine. In: PROCEEDINGS OF THE 7TH WORLD WIDE WEB CONFERENCE, 7, 1998, Brisbane. Proceedings… Brisbane: Elsevier Sciences, 1998. Disponível em: <http://infolab.stanford.edu/pub/papers/google.pdf>. Acesso em: 01 jun. 2012.
GABRIEL, Martha Carrer Cruz. Oráculos digitais. In: FILE SYMPOSIUM RIO 2006. Disponível em: < http://www.digitaloracles.com.br/digitaloracles-port.pdf>. Acesso em: 03 jun. 2012.
GLOSSARIUM. Dicionário técnico. 2012. Disponível em: <http://www.glossarium.com.br/index.php>. Acesso em: 03 jun. 2012.
INTERACTIVE ADVERTISING BUREAU. Internet Advertising Revenue Report. 2012. Disponível em: <http://www.iab.net/media/file/ IAB_Internet_Advertising_Revenue_Report_FY_2011.pdf>. Acesso em: 01 jun. 2012
MONTEIRO, Silvana Drumond. As múltiplas sintaxes dos mecanismos de busca no ciberespaço. Informação & Informação, v. 14, n. especial, p. 68-102, 2009. Disponível em: < http://www.uel.br/revistas/uel/index.php/ informacao/article/view/2027/3223>. Acesso em: 01 jun. 2011.
MONTEIRO, Silvana Drumond; GIRALDES, Maria Júlia C.; VECHIATO, Fernando Luiz; MÜLLER FERNANDES, Rogerio Paulo. Em busca da compreensão da "busca" no ciberespaço. In: ENCONTRO NACIONAL DE PESQUISA EM CIÊNCIA DA INFORMAÇÃO, 12, 23-26 out. 2011, Brasília. Anais... Brasília: UnB, 2011. 1 CD-ROM, p. 1-18.
PEW INTERNET. Search Engine Use 2012. Disponível em: <http://pewinternet.org/~/media//Files/Reports/2012/ PIP_Search_Engine_Use_2012.pdf>. Acesso em: 01 jun. 2012.
STATOWL. Search engine. Disponível em: <<http://www.statowl.com/search_engine_ keyword_count.php>. Acesso em: 03 jun. 2012.
STATCONTEUR. Global Stats: top 5 search engines from Jun 2011 to Jun 2012. Disponível em: <http://gs.statcounter.com/>. Acesso em: 05 jun. 2012
WBI BRASIL. 8ª Edição do Raio– x do E-commerce: Quem é quem na mente do consumidor. 2012. Disponível em: http://www.wbibrasil.com.br/2012/pesquisas/ WBI_BRASIL_-_Pesquisa_mecanismos_busca_2012.pdf>. Acesso em: 05 junho 2012.
WIKIPEDIA. Googlar. 2012. Disponível em: <http://pt.wikipedia.org/wiki/Googla>. Acesso em: 03 jun. 2012.
Top Related