Post on 18-Dec-2014
description
SEO - Vantagens que a Web Semântica ira trazer ao seu site
Renato Bongiorno
Bem Vindos
Perguntas, idéias, links e o que quiserem - compartilhem:
#roadSemantico
A Web hoje...
Milhões de informações encontram-se disponíveis na web
Páginas são publicadas de forma exponencial a cada dia
Alcance da publicidade na Web em larga escala
Ferramentas facilitadoras para desenvolvimento
permitiram que usuários não familiarizados com
linguagens da web também criassem suas páginas
Até Fevereiro de 2012 2.795.361 registros
cadastrados só com a categoria .BR
A Web hoje...
A Web hoje... GRÁFICO DA EVOLUÇÃO DO NÚMERO DE DOMÍNIOS .br
Qual será a melhor forma de capturarmos informações relevantes e aproveitarmos melhor esse volume
imenso de informação?
A Web hoje...
O que é SEO?
Search Engine Optimization
Técnicas que tem o objetivo de melhorar o posicionamento das páginas do seu site nos resultados orgânicos dos mecanismos de busca
SEO - Busca Orgânica
SEO - Busca Orgânica
Por que eu preciso
me preocupar com a busca orgânica?
SEO - Busca Orgânica
70% dos “internautas” acessam
somente os resultados orgânicos (MarketingSherpa)
75% dos “internautas“ pesquisam somente os resultados obtidos na primeira página
(Marketshare.hitslink.com)
Foco no Google! Porque eu preciso me preocupar tanto com o Google?
Como aparecer no Google?!
As etapas essenciais para ser indexado pelo Google!
Como aparecer no Google?!
Tenha um site bem estruturado!
Tenha um site bem estruturado
Tenha títulos (tag <title>) bem definidos e independentes por página
O conteúdo dos títulos das páginas
geralmente aparecem na primeira linha dos resultados de pesquisa
Tenha um site bem estruturado
Títulos para páginas internas de seu site devem descrever com precisão o assunto
dessa página em particular
Utilize títulos descritivos e curtos (evite keyword spamming)
Tenha um site bem estruturado
Exemplo:
Título descritivo – curto e objetivo:
Dados Semânticos – Artigos sobre Web Semântica
Título incorreto – Keyword Spamming:
Dados Semânticos – Tudo sobre Web Semântica, Linguagens da Web Semântica, Dicas de Web Semântica, Desenvolvendo em Web Semântica
Tenha um site bem estruturado
Exemplo do título da página nos resultados
de busca
Títulos nos resultados de busca:
Tenha um site bem estruturado
Utilize tags de cabeçalho (títulos - h1 - h6)
As tags de cabeçalho são utilizadas para apresentar estrutura da página para os usuários
Utilizar tags de cabeçalhos de diversos tamanhos cria uma ordem hierárquica e
ajuda a estruturar o seu conteúdo
Tenha um site bem estruturado
Evite colocar textos nas tags de cabeçalho e que não sejam úteis na definição da estrutura da página, bem como colocar headings sem
seguir uma hierarquia
Utilize tags de cabeçalho com moderação!
Tenha um site bem estruturado
Otimize o uso de imagens
Todas as imagens devem ter um nome de arquivo e atributo "alt" únicos
Armazene imagens em um diretório separado
Utilize formato de arquivos amplamente suportados e leves
Tenha um site bem estruturado
Evite:
Utilizar nomes genéricos como "imagem1.jpg", "foto.gif", "1.jpg"
Escrever nomes extremamente longos e
preencher o atributo “alt” com palavras-chave ou copiar e colar frases inteiras podem ser considerados “spams”
Descreva quem é você na web!
Meta tags de descrição são importantes porque o Google talvez as utilize como descrição de suas
páginas (conhecidos como "snippets")
Talvez...?!
Se algum conteúdo é mais relevante, é ele que vale!
Descreva quem é você na web!
Meta descrições (snippets) nos resultados de busca:
Exemplo de descrições nos resultados de
busca
Adicione descrições individuais em cada página de seu site
Tenha objetividade nas descrições, evite:
› Descrições que não tenham relação com o conteúdo do site
› Descrições indicando palavras chave
› Descrições genéricas
› Copiar e colar todo o conteúdo do documento na descrição
Descreva quem é você na web!
Seja organizado!
Tenha uma estrutura organizada e URL amigáveis
Seja organizado!
Exemplos de URL:
URL amigável:
http://www.w3.org/standards/semanticweb/
URL não amigável:
http://www.ccae.ufpb.br/sbie2010/index.php?option=com_content&view=article&id=78&Itemid=67&lang=en
Seja organizado!
As URLs também fazem parte dos resultados de busca:
Exemplo de URL amigável nos
resultados de busca
Seja organizado!
Tenha um site fácil de navegar
Utilize sempre um mapa do site como link adicional de navegação em sua
estrutura HTML e no formato XML para ajudar o Google no
reconhecimendo de suas páginas
Seja organizado!
Evite:
Criar links de navegação complexos
Exagerar na segmentação do conteúdo (fazendo com que o usuário de muitos cliques para chegar a informação)
Imagens para menu de navegação
Utilize breadcrumbs
Avise possíveis problemas no site!
Tenha uma página de erro 404 util!
Evite que páginas de erro 404 sejam indexadas – utilize nofollow!
Utilize o design das páginas 404 de acordo com o design da página!
Avise possíveis problemas no site!
Exemplos de páginas 404!
Avise possíveis problemas no site!
Exemplos de páginas 404!
Conteúdo – A chave do Sucesso!
Ofereça conteúdo e serviços de qualidade!
Criar conteúdo útil e atraente irá exercer maior influencia no ranking
no seu site do que qualquer um dos outros fatores discutidos aqui.
Conteúdo – A chave do Sucesso!
Escreva textos de fácil leitura e coesos
Mantenha-se centrado no tema
Evite grandes quantidades de texto sobre temas variados em uma única página
Formate corretamente seu texto (títulos, parágrafos, subtítulos)
Evite erros ortográficos e gramaticais
Não incorpore textos em imagens
Utilize uma linguagem adequada
Conteúdo – A Chave do Sucesso!
Crie conteúdo e serviços exclusivos e atualizados!
Conteúdo original fará com que seus
usuários atuais voltem e trará novos visitantes
Conteúdo – A Chave do Sucesso!
Crie conteúdo essencialmente para os seus usuários e não para os
mecanismos de pesquisa!
Conteúdo – A Chave do Sucesso!
Evite:
Plágio e versões duplicadas do seu conteúdo
Palavras-chave repetidas no decorrer do texto
Erros ortográficos premeditados para palavras “possivelmente” pesquisadas erradas (ex.: dedetizadora, detetizadora)
Inserir texto escondido para os usuários, mas aparente aos mecanismos de pesquisa
Conteúdo – A Chave do Sucesso! Estruture textos âncoras no conteúdo do seu site
Este texto diz aos usuários e ao
Google algo sobre a página que
você está apontando
(seja interno ou externo).
Quanto melhor o texto âncora,
mais fácil será para os usuários
navegar e para o Google
entender do que se trata a
página direcionada.
Conteúdo – A Chave do Sucesso!
Escolha um texto descritivo, ao invés de "clique aqui”
Utilize textos se relacionam com o conteúdo da página apontada
Escreva textos concisos – curtos e descritivos
Torne fácil a distinção entre links e textos
Estruture textos âncoras no conteúdo do seu site
Não quer aparecer, avise!
Faça uma utilização eficaz do robots.txt
Um arquivo "robots.txt" informa aos mecanismos de pesquisa se podem ou não acessar parte de seu site.
Se você tem pastas pessoais que não deseja ser localizada pelos mecanismos de busca, informe!
Sigam-me os bons!
Nofollow – utilize de forma correta!
Indica um conteúdo do seu site que não
deve ser referenciado pelo Google
Sigam-me os bons!
Quando utilizar:
Conteúdo não confiável
Links pagos
Priorização de rastreamento
PageRank
Métrica utilizada pelo Google para representar a importância e a reputação do seu site na Web.
Um bom PageRank depende de diversos fatores como:
• A qualidade do conteúdo e a quantidade de links referenciados
• A posição do link na página, bem como sua visibilidade
• A semântica do conteúdo
PageRank
Mudanças do Google com PageRank:
• Não indexa links pagos
• PageRank depende da qualidade do conteúdo, confiabilidade da fonte de dados e credibilidade do link
• Remoção das ferramentas de PageRank da central do webmaster
• Google PageRank toolbar com poucas atualizações anuais
PageRank
O PageRank ainda é importante para SEO?
Conforme Matt Cutts, engenheiro de software do Google:
“O PageRank continua importante, é uma das métricas mais importantes dentro das 200 que
temos, mas é uma entre as 200 métricas que utilizamos no para rankear páginas...”
Redes Sociais - Entre ou saia do mercado!
Links âncora são essenciais para o bom ranking do seu
site nos mecanismos de busca, mas criar uma conta
nas redes sociais visando somente SEO não é seu
foco principal.
Redes Sociais - Entre ou saia do mercado!
Confiança é o que sua empresa deverá transmitir através de conteúdos
EXCLUSIVOS (nada de Ctrl+C e Ctrl+V )
Sendo os fatores de maior impacto nos resultados de SEO.
Redes Sociais - Entre ou saia do mercado!
Links adicionados em portais como Facebook e Twitter atribuem rel=“nofolow” nos seus links...
Porém, existe uma tendência que essas redes a trabalhem como o Google Profile e Youtube quando o conteúdo
transmitir confiança ao consumidor o mecanismo remove o atributo nofollow e passa a “rankear” seu site nos resultados
de pesquisa....
Redes Sociais - Entre ou saia do mercado!
Linkedin não utiliza “nofollow”, isto significa que se a página informada em seu perfil é totalmente relevante
para mecanismos de busca!
Redes Sociais - Entre ou saia do mercado!
Recentemente Danny Sullivan (editor chefe da Search Engine Land) realizou uma entrevista com o Google e o Bing, e ambos informaram que os links publicados nas redes sociais tem
impacto sobre o ranking nos resultados de busca, utilizando a autoridade do autor (quem é você nas redes sociais), a qualidade do post e quantas
pessoas confiam neste post...
Redes Sociais - Entre ou saia do mercado!
“SocialRank”
“HumanRank”
“AuthorRank”
Novas métricas:
Redes Sociais - Entre ou saia do mercado!
1. Número de seguidores no Twitter
2. Número de Fans em sua Fan Page
3. Número de Tweets e RTs no Twitter
4. Número de Shares e Likes no Facebook
5. A relação entre seguidores de amigos
6. A autoridade das pessoas que seguem você
7. A autoridade das pessoas que compartilham o seu conteúdo
8. A qualidade média das suas mensagens previamente compartilhadas
9. O número de menções e compartilhamentos únicos
10. A fonte e o rank dos links que você compartilha
Os 10 fatores que ajudam nessas novas métricas:
E o Google +?
Em pesquisas fora da rede Google+, segundo Vasilis Vryniotis (Engenheiro de Software e co-fundador do Web
SEO Analytics), o Google utilizará os dados da mesma forma que utiliza das demais redes
E o Google +?
Porém, se você utiliza a rede, os resultados mudam...
Redes Sociais - Entre ou saia do mercado!
E o principal...
Quanto mais visitas pelo conteúdo do seu site , mais credibilidade, e para obter
confiança dos internautas, as redes sociais são o melhor caminho....
Redes Sociais - Entre ou saia do mercado!
Estatísticas das redes – Twitter (twitter.com/blog):
3 anos, 2 meses e 1 dia: › Tempo que levou desde o primeiro tweet ao tweet bilionésimo
1 semana: › Tempo que leva agora para os usuários enviarem um bilhão de Tweets
50 milhões: › Número médio de tweets enviados por dia em março de 2010
140 milhões: › Número médio tweets enviados por dia em fevereiro de 2011
177 milhões: › Total de tweets enviado em 11 de março de 2011
Redes Sociais - Entre ou saia do mercado!
Estatísticas das redes – Twitter (twitter.com/blog): 460.000:
› Número médio de novas contas por dia até fevereiro de 2011
182%: › Aumento do número de usuários móveis em relação a fevereiro de 2010
Estatísticas das redes - Facebook (http://newsroom.fb.com/):
845 milhões: › Usuários mensais ativos no final de Dezembro de 2011
425 milhões: › Usuários mensais ativos que usaram Facebook em mobile em dezembro de 2011
PageRank Sculpting
Abandone técnicas do passado...
Técnica utilizada para “filtrar” os links com “nofollow” visando somente os links mais interessantes
Cadastro do site em vários diretórios
Abandone técnicas do passado...
Cadastrar seu site em muitos diretórios e receber aprovação para aparecer na listagem de sites nestes
diretórios não garantem mais um bom ranking
Cadastro do site em vários diretórios
Abandone técnicas do passado...
Cadastrar seu site em diretórios com qualidade de conteúdo - quality Directories (DMOZ and Yahoo Directory) – pode ajudar no ranking, mas para isso, seu site precisa ter bom
conteúdo para ser aceito nestes diretórios
Palavras chaves (Meta keywords) Não servem mais para nada!
Abandone técnicas do passado...
Em função da quantidade de spam e a declarações de palavras chave sem relação ao conteúdo do site, o Google não utiliza
mais a meta tag keyword em seus resultados.
Palavras chaves (Meta keywords)
Não servem mais para nada!
Abandone técnicas do passado...
Homem e máquina pensando juntos!
Torne seu site compreensível para humanos e máquinas…
Homem e máquina pensando juntos!
Como assim?!
Legível para máquinas e humanos?!
Homem e máquina pensando juntos!
Pesquisas como...
“A melhor padaria de Santo André”
Ainda não resultam em resultados precisos...porque?!
Homem e máquina pensando juntos!
Máquinas são utilizadas somente para
exibir a informação na tela
Para realizarmos buscas de informações precisas na Web, é imprescindível a
intervenção humana
A Web de hoje...
Dificuldades de captura de dados precisos na web atual:
Resultados sensíveis à forma de pesquisa - a ordem das palavras nos mecanismos de busca, impactam no resultado, mesmo referenciando o mesmo assunto
Resultados isolados - informações espalhadas em várias páginas necessitam de várias buscas para a obtenção do resultado desejado
Processamento da Web Atual
Dificuldades de captura de dados precisos na web atual:
Resultados com grande número de páginas - muitas vezes, poucas páginas com a informação que solicitamos
Resultados individuais - resultados referenciando a mesma página
Processamento da Web Atual
Como fazer com que os mecanismos de busca localizem os conceitos dos
itens buscados e não somente as palavras chaves?
A Web mudou e o Google também!
Web 3.0 – Web Semântica
Web Semântica é a forma de funcionamento da web
que visa facilitar a obtenção, classificação e
organização das informações na web, estruturando os
documentos para torná-los legíveis tanto para
humanos quanto para máquinas.
Google anuncia - Novo algoritmo! Matéria Olhar Digital – Março de 2012
Essa mudança não é de hoje...
Em Maio de 2009 o Google anunciou a utilização de Microformatos e RDFa para enriquecer os resultados
de busca
Em Maio de 2010 anunciou a utilização de Microformatos e RDFa no “Google Squared” provendo buscas semânticas
para imagens
Essa mudança não é de hoje...
Linguagens da Web Semântica:
XML
RDF
RDFa
Microformats
GRDDL
OWL
SPARQL
HTML5
Metadados! A chave para o sucesso da
Web Semântica! E o que são metadados?
Segundo a International Federation of Library Associations (IFLA):
"Metadados são dados sobre dados. O termo se refere a qualquer informação utilizada para a
identificação, descrição e localização de recursos"
Para o W3C, metadados são definidos como:
"Informações para Web que podem ser compreendidas por máquinas"
Segundo o filósofo e consultor David Weinberger:
"Os dados são o que você procura e os metadados aquilo que você sabe..."
Como os dados podem se conectar via web através das linguagens da
Web Semântica?
Língua franca da web permitindo que máquinas possam interagir de
modo significativo.
Representação formal de um grupo de conceitos
dentro de um domínio e as relações
entre estes conceitos. (Pollock , Jeffrey t.)
Especificações formais e explícitas de
conceitualizações compartilhadas. (Britman, Karin)
Uma base de conhecimento comum sobre um determinado domínio (assunto) que
permite ligar informações na web de forma categorizada e disponibilizá-la
universalmente. (Renato Bongiorno)
EDUCAÇÃO
› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB
Unidades
Docentes
Cursos Imagine que a minha página pessoal contendo metadados, se conecte com o vocabulário
educacional e que neste vocabulário tenha disponível as vinculação de: Unidades,
Docentes e Cursos
EDUCAÇÃO
› DOCENTE DO SENAC SP › MINISTRA CURSOS WEB
Unidades Docentes Cursos
Docente SENAC Web SP
Veja como a informação
acrescida de semântica
será compreendida na web.
Como o Google indexa as linguagens da Web Semântica?
Pequenas linhas de texto que aparecem embaixo de todo resultado de pesquisa, desenvolvidos para dar aos
usuários uma noção sobre o conteúdo da página e por que ela é relevante para a consulta.
Como adicionar Rich Snippets?!
Adicionando metadados ao seu HTML!
Escolha um formato de marcação:
Microdados Microformatos RDFa
Microdados / Microformats / RDFa: Forma de marcar um conteúdo em HTML
com sua ontologia específica afim de descrever um tipo específico de informação
Pessoas Eventos Resenhas Notícias
Rich Snippets - Microdados
<div> Meu nome é Bob Smith, mas todos me chamam de Smithy. Esta é a minha página inicial: <a href="http://www.example.com">www.example.com</a> Moro em Albuquerque, Novo México, e trabalho como engenheiro na ACME Corp. </div>
<div itemscope itemtype="http://data-vocabulary.org/Person"> Meu nome é <span itemprop="name">Bob Smith</span> mas todos me chamam de <span itemprop="nickname">Smithy</span>. Esta é a minha página inicial: <a href="http://www.example.com" itemprop="url">www.example.com</a> Moro em Albuquerque, Novo México, e trabalho como <span itemprop="title">engenheiro</span> na <span itemprop="affiliation">ACME Corp</span>. </div>
Com microdados:
Sem microdados:
Rich Snippets - Microformats
<div> <img src="www.example.com/bobsmith.jpg" /> <strong>Bob Smith</strong> Editor sênior da ACME Reviews 200 Main St Desertville, Arizona 12345 </div>
<div class="vcard"> <img class="photo" src="www.example.com/bobsmith.jpg" /> <strong class="fn">Bob Smith</strong> <span class="title">Editor sênior</span> na <span class="org">ACME Reviews</span> <span class="adr"> <span class="street-address">200 Main St</span> <span class="locality">Desertville</span>, <span class="region">Arizona</span> <span class="postal-code">12345</span> </span> </div>
Com microformats:
Sem microfortmats:
Rich Snippets - RDFa
<div> Meu nome é Bob Smith, mas todos me chamam de Smithy. Esta é minha página inicial: <a href="http://www.example.com">www.example.com</a>. Moro em Albuquerque, Novo México, e trabalho como engenheiro na ACME Corp. </div>
<div xmlns:v="http://rdf.data-vocabulary.org/#" typeof="v:Person"> Meu nome é <span property="v:name">Bob Smith</span>, mas todos me chamam de <span property="v:nickname">Smithy</span>. Esta é a minha página inicial: <a href="http://www.example.com" rel="v:url">www.example.com</a>. Moro em Albuquerque, Novo México, e trabalho como <span property="v:title">engenheiro</span> na <span property="v:affiliation">ACME Corp</span>. </div>
Com RDFa:
Sem RDFa:
As possíveis ontologias que você poderá relacionar seu conteúdo...e isso varia de negócio para negócio!
O que difere as tecnologias?
Rich Snippets - Ontologias
Ontologia recomendada pelo Google: Creative works Event
Organization
Person Place, LocalBusiness, Restaurant ...
Product, Offer, AggregateOffer
Review, AggregateRating
Linking Open Data - visa tornar os dados livremente disponível
para todos!
As figuras a seguir mostram a evolução dos conjuntos de dados que foram publicados e
interligados pelo projeto até agora:
Com essa informação fica fácil identificar os vocabulários conforme sua necessidade!
2007
2008
2009
2010
2011
Até Setembro de 2011 95 conjuntos de dados composto
por mais de 31 bilhões triplos RDF, que são interligadas por cerca de
504 milhões ligações RDF.
2011
2011
Busca Semântica
Baseia – se em consultas relacionadas ao conceito das palavras chave retornando as informações
necessárias em documentos, permitindo relações entre os documentos que tenham
conteúdo semântico.
Busca semântica x Buscador Semântico
Buscador Semântico
Sistema que coleta, indexa e analisa os documentos semânticos da web, baseia-se nos dados publicados como dados abertos
(RDF, RDFs, OWL), permitindo que se realize as buscas semânticas.
Busca semântica x Buscador Semântico
Buscador Semântico – Visão Geral
Crawling:
• Sistema de “rastreamento”, permite que o sistemas de busca acessem todo conteúdo semântico disponível na web.
• O que diferencia dos “crawlers” nos sistemas de busca convencionais é a possibilidade de rastrear diferentes fontes de informação
Buscador Semântico - Crawling
Crawling:
• PingTheSemanticWeb.com
• Sistema que alerta os crawlers sobre novas fontes de dados
Buscador Semântico - Crawling
• Crawling:
Buscador Semântico - Crawling
Olha meu site aqui bongiornoweb.com.br
Indexing:
• Processo “core” dos mecanismos de busca, indexa as informações relacionadas para serem exibidas nos retornos das pesquisas
• Relacionam metadados, elementos relacionados, permitindo uma consulta eficiente
Buscador Semântico - Indexing
Indexing & Crawling em sistemas semânticos, permitem diferentes níveis no acesso a informação:
Buscador Semântico – Indexing & Crawling
Inference:
Nos sistemas de busca semântica, as inferências são as influências que os sistemas atribuem as consultas para aumentar a coleta de dados
Buscador Semântico – Inference
Ranking:
O objetivo principal para “rankear” as informações em sistemas de busca semânticos
está em retornar nas primeiras posições a informação mais relevante.
Buscador Semântico – Ranking
Retrieval:
Diferentes retornos de dados podem ser obtidos em sistemas de busca semânticos, desde simples URIs direcionando aos documentos semânticos
ou objetos (ex.:triplas RDF) ou apresentar dados e metadados associados ao retorno da
pesquisa
Buscador Semântico – Retrieval
Queryring:
Diferentes sistemas de pesquisa são disponibilizados nos sistemas de busca
semânticos, desde os campos de formulários convencionais até sistemas de busca mais assertivos na busca de URIs e ontologias.
Buscador Semântico – Querying
SPARQL endpoint
Buscador Semântico – Querying
Navegação:
O sistema de navegação proporcionado pelos sistemas de busca semânticos são obtidos como em sistemas de busca comuns, via browser, porém permitem que outras
aplicações utilizam de seus resultados para localizar mais informações no resultado
obtido.
Buscador Semântico – Navegação
Navegação:
Um exemplo de pesquisa por aplicação – um resultado pode conter dados de uma pessoa em formato aberto (FOAF) e localizar todas as informações publicadas por essa pessoa.
Buscador Semântico – Navegação
Interface de busca:
As interfaces com os resultados de busca podem variar conforma a necessidade de acesso, se por agentes de software – permitindo acesso direto aos metadados – ou por usuários finais – permitindo uma “user interface” amigável.
Buscador Semântico – Interface
Tratamento de variações morfológicas:
Um motor de busca semântico lida com as variações morfológicas os resultados não devem mudar se você digitar "melhorar, melhora, melhoraria, melhorarado”
Tratamento de sinônimos com os sentidos corretos:
Um motor de busca semântico lida com sinônimos (cura, curar, tratar, etc ..) no contexto certo e com os sentidos de palavras corretas.
Motores de busca semântico devem reconhecer conceitos e trazer
resultados relevantes
Motores de busca semântico devem responder de forma sensata
quando a consulta é em uma forma de perguntas (o quê, onde,
como, porquê, etc)
Uma consulta deve apontar não só aos documentos, mas também
as seções relevantes dos mesmos
Estes são apenas alguns exemplos do poder da união
dos dados...querem mais?
Tim Berners-Lee e o poder dos dados abertos!
O Google já está preparado, agora só falta você!
Abram seus dados! “Open your data”
Lembra da busca inicial...da melhor padaria de Santo André...
twitter.com/bongiornoweb
facebook.com/bongiornoweb
renatobonfanti@yahoo.com.br
Renato Bongiorno