A relação entre SEO e o grande Vazamento do Google

Uma verdadeira bomba dominou as notícias sobre SEO e o Google, na última semana do mês de Maio de 2024. Tudo por conta de um grande e importante suposto vazamento de uma documentação usada pelo líder das buscas.

Se você é um profissional de SEO, já deve ter ouvido falar a respeito e se quer mais detalhes sobre o que se sabe até o momento, não pode perder o que preparamos e destacamos a seguir…

Breve histórico sobre o vazamento

Em 27 de Maio de 2024, Rand Fishkin, cofundador e CEO da SparkToro, publicou um post no blog da empresa, que está causando alvoroço nos profissionais de SEO.

O motivo do interesse no conteúdo publicado, deve-se ao fato de Fishkin ter divulgado detalhes importantes do vazamento de dados de uma suposta documentação da API usada pelo Google na sua ferramenta de busca e como isso interfere nos resultados exibidos em cada busca feita.

Segundo o autor da matéria, ele foi contatado por e-mail em 5 de maio e a pessoa – até então pedindo anonimato – alegava que os documentos vazados foram confirmados como autênticos por ex-funcionários do Google e que esses mesmos compartilharam informações adicionais e privadas sobre as operações de busca do Google.

Inicialmente as informações fornecidas por Erfan Azimi – o divulgador do vazamento, que posteriormente revelou sua identidade – contradizem as declarações públicas e “oficiais” do Google ao longo dos últimos anos, sobre alguns fatores de ranqueamento usados nas buscas, como:

  • Que sinais de cliques dados pelos usuários sejam considerados;

  • Subdomínios sejam considerados a parte do domínio;

  • Existência de uma espécie de caixa de areia (sandbox) para sites novos;

  • O tempo de existência de um domínio.

O detentor do vazamento também alegava que:

  • Era preciso dados mais completos sobre os cliques dos usuários como indicador para melhorar os resultados da busca;

  • Um recurso chamado internamento de “NavBoost” usava dados do PageRank, presente na antiga barra de ferramentas do Google, bem como a necessidade anterior por dados dos cliques, foi o que impulsionou a criação do navegador Chrome;

  • O “NavBoost” usa o número de buscas feitas para cada palavra-chave para determinar as tendências, a incidência dos cliques nos resultados, bem como o que eles chamam de cliques-longos versus cliques-curtos, sendo que o último é quando após o clique em um link, o usuário rapidamente clica para retornar à página de resultado, indicando que ele não se satisfez com o resultado apresentado;

  • O histórico dos cookies, os dados de login no Chrome e detecção de padrões de cliques, são usados para identificar e combater as ferramentas de cliques manuais e automatizados, com intuito de favorecer artificialmente um link;

  • O NavBoost também usa mecanismos para identificar a intenção do usuário e que por sua vez interfere favorecendo conteúdos afins à intenção do usuário que foi identificada;

  • São avaliadas a intenção e o engajamento no ato e após a consulta principal, para determinar a relevância nas variações da pesquisa, que é quando o usuário refina a pesquisa por não ter encontrado o que buscava com a primeira;

  • A determinação da qualidade geral de um site, influenciando uma elevação ou rebaixamento, é considerada no nível de hospedagem usando os dados obtidos no “NavBoost”;

  • Penalidades para nomes de domínios que correspondem exatamente a termos exatos de busca (ex: roupa feminina), são aplicáveis no processo de ranqueamento;

  • As buscas locais – em escalas diferentes (cidade, estado, país) – também são afetadas pelo “NavBoost”;

  • Em períodos específicos, como eleições ou na pandemia, o Google usou listas de permissão (whitelists) para determinar sites com conteúdo que não promova polêmicas com o respectivo assunto central.

A documentação da API do Google é autêntica?

A pergunta que muitos fizeram assim que o vazamento se tornou público, é se a documentação a qual Erfan Azimi teve acesso e divulgou, é autêntica?

Diante da pertinência da questão, Rand Fishkin tomou alguns cuidados antes de tornar público o conteúdo e elaborar seu post:

  • Pôde confirmar que Azimi dizia quem ele alegava ser;

  • Contatou ex-funcionários do Google que ele conhece e que tem amizade, compartilhando os arquivos vazados com eles;

  • Também contatou e expôs os documentos a um dos mais importantes nomes do SEO atualmente, Mike King.

O que as pessoas consultadas afirmaram, é que várias características da documentação sugeriam que ela seja legítima, já que foi elaborada seguindo padrões internos da empresa para documentação, bem como das nomenclaturas utilizadas. Embora os ex-funcionários não tivessem tido acesso a essa documentação em específico, ela é similar a outras com as quais eles estavam familiarizados.

De acordo com os ex-colaboradores que trabalharam na empresa, existe documentação como a que foi vazada em todas as demais equipes do Google e que tem por propósito, explicar os vários atributos e módulos de uma API, a fim de tornar os envolvidos nos projetos, familiarizados com os dados disponíveis.

Em um dos trechos da documentação, há informação que sugere que ela era no mínimo atualizada até agosto de 2023, pois consta um recurso cuja depreciação ocorreu naquele mês. Em outras palavras, há indício de que se refere a algo atualmente em uso.

Como ocorreu o vazamento?

Aparentemente o vazamento ocorreu por um descuido de um funcionário responsável pelo acesso.

O conteúdo estava hospedado no GitHub.

Esses documentos foram tornados públicos inadvertidamente e brevemente, havendo muitos links na documentação que apontam para repositórios privados do GitHub e páginas internas no site corporativo do Google, as quais exigem login específico concedido aos funcionários do Google com privilégio de acesso.

Durante esse período no qual o acesso foi público (entre março e maio de 2024) por descuido de quem deveria restringir as permissões de acesso, a documentação da API foi revelado pelo Hexdocs – queindexa repositórios públicos do GitHub – e acessada e divulgada por outras fontes e não apenas por quem a compartilhou com Fishkin.

O que é possível concluir da documentação vazada?

Fishkin é bastante claro ao mencionar que o tempo disponível para análise detalhada da extensa e complexa documentação, não foi suficiente para conclusões profundas ou mesmo razoáveis sobre como realmente funciona o algoritmo e como o trabalho de SEO atualmente feito, está sendo eficaz.

No entanto, ele destacou cinco pontos que considerou mais interessantes do que conseguiu avaliar, sendo que alguns confirmam ideias que até então o pessoal da área apenas podia supor que fosse assim e outras que contrariam o que o Google vêm divulgando ao longo dos anos.

1. NavBoost e cliques

Há vários módulos da documentação com referências a diversas nomenclaturas de cliques, os quais têm por objetivo identificar comportamentos dos internautas diante dos links e da navegação. Isso está intimamente relacionado com o chamado “NavBoost” e outro termo frequente que é “Glue” (cola em inglês).

Em outras palavras, a natureza e o “tipo” de clique, tanto importa para que ele seja ou não considerado no sistema de ranqueamento, como o peso que cada tipo tem nessa classificação.

2. Navegador Chrome

O lançamento do Google Chrome não foi apenas para oferecer uma alternativa a mais de navegador web, mas está servindo de instrumento para a empresa coletar o maior número possível de dados, como os cliques dos usuários e uma enorme quantidade de métricas relativas a páginas em especial, mas também de domínios como um todo.

Entre as possibilidades, o algoritmo calcula com maior precisão, quais links de um domínio são mais importantes / populares.

3. Whitelists

As listas brancas ou de permissão (whitelists) foram encontradas associadas a um módulo nomeado como “Good Quality Travel Sites” (sites de viagem de boa qualidade), mas também há marcadores nomeados como “isCovidLocalAuthority” (é autoridade local sobre Covid) e “isElectionAuthority” (é autoridade eleitoral), o que sugere que a ferramenta inclua na lista domínios que são mais adequados a exibir nos resultados, para assuntos que podem ser polêmicos ou que têm potencial elevado de controvérsia.

4. Feedback dos “avaliadores de qualidade”

Os “avaliadores de qualidade”, são pessoas (cerca de 12 mil espalhadas pelo mundo) que o Google paga e que avaliam os resultados da pesquisa e fornecem feedback ao Google sobre como melhorá-los, com base em diretrizes estipuladas no Quality Rater do Google, um manual de 170 páginas e que periodicamente é atualizado.

Essa plataforma é chamada de EWOC e de acordo com a documentação, o feedback dado também é usado nas buscas.

5. Cliques e avaliações de links

Os números de cliques que um link recebe, são decisivos na determinação da qualidade do link (baixa, média, alta qualidade).

Se um link é classificado como “confiável” ou de alta qualidade, ele pode subir no PageRank e nas âncoras ou ser filtrado / rebaixado por sistemas de spam de link.

Links do índice de links de baixa qualidade não prejudicarão a classificação de um site, sendo que apenas são ignorados.

Considerações e conclusões adicionais sobre a documentação

Fishkin conclui seu post fazendo considerações sobre a abordagem técnica do trabalho de SEO e que a documentação permitiu embasar.

1. Marcas são mais importantes que tudo

O Google tem meios para identificar e relacionar marcas importantes com seus correspondentes na Web, como seus sites, suas redes sociais e tudo o mais que houver.

E aparentemente o algoritmo a partir dessa identificação, prioriza o direcionamento do tráfego para elas, em detrimento de outros fatores, independente do quão bom é um conteúdo, mas que não está relacionado com uma marca tão destacada.

Ou seja, investir na marca é mais relevante para posicionar bem no Google.

2. “E-E-A-T” pode não ser tão importante como dizem

Embora nos últimos anos o Google venha frequentemente defendendo que a sigla “E-E-A-T” (Experience, Expertise, Authoritativeness e Trust, que em português significa respectivamente, Experiência, Perícia, Autoridade e Confiança) deve nortear a produção de conteúdo e que explicamos no post sobre o Core Update de Março/2024, esse conceito pode estar longe de ser tão importante como o Google quer que acreditemos.

Fishkin considera que o conceito é muito mais “propaganda”, do que prática, na determinação do quão bom é um conteúdo. Ele justifica essa consideração, ao observar que há inúmeras marcas que posicionam bem, sem no entanto, cumprirem bem os quatro requisitos.

3. A intenção do usuário é mais importante

As intenções dos usuários por determinados resultados na busca, contam mais do que a relevância do conteúdo e seus respectivos links.

Sendo assim, se um resultado que reflete uma intenção e um desejo por parte do internauta por aquele assunto, está na terceira ou quarta página das SERPs, esse resultado pode tomar o lugar de outro que está na primeira página, mesmo que o antigo primeiro lugar faça muito bem o trabalho de SEO.

Em outras palavras, a intenção do usuário para um determinado público, somado ao NavBoost, podem importar mais do que todo o trabalho de SEO on Page e SEO off Page.

4. Títulos das páginas ganham mais importância

Em direção inversa ao PageRank, aos textos âncoras, que cada vez importam menos na classificação, os títulos das páginas ganham mais e mais relevância.

Essa é uma conclusão obtida pela avaliação feita por Mike King.

5. SEO produz resultados insatisfatórios para pequenas e médias empresas

Por mais duro que seja ler isso, Fishkin conclui que o trabalho de SEO produz os resultados esperados apenas para as grandes empresas / marcas e que os resultados dos pequenos e médios, serão sempre pobres ou insuficientes comparativamente aos primeiros.

Ele ressalta que ele próprio e sua empresa, enquanto não atingirem um patamar muito maior do que ocupam hoje, serão subavaliadas pelo ranqueamento. Ele não quer dizer com isso, que ignora ou não faça o trabalho de SEO.

Fishkin termina dizendo: “É improvável que o conteúdo que você cria tenha um bom desempenho no Google se existir concorrência de sites grandes e populares de marcas conhecidas. O Google não recompensa mais operadores inteligentes e experientes em SEO, que conhecem todos os truques certos. Eles recompensam marcas estabelecidas”.

Conclusão

O vazamento de uma suposta documentação de API do Google do seu sistema de ranqueamento para resultados das buscas, traz impactos ao trabalho de SEO.

Comentários ({{totalComentarios}})