BacklinksGoogle AnalyticsOrgânico

O texto fala sobre o Google identificar e penalizar sites de spam que utilizam técnicas de manipulação de links.

Durante uma longa reunião no escritório do Google SEO, Duy Nguyen da equipe de qualidade de pesquisa abordou a questão dos links em sites de spam e sua relação com a confiança.

O Googler mencionou que estavam garantindo a segurança do texto âncora, um assunto pouco abordado anteriormente.

É crucial para muitos editores e especialistas em SEO estabelecer confiança com o Google.

Existe a crença de que a “confiança” pode contribuir para a indexação e classificação adequada de um site.

Também se sabe que não existe uma métrica de “confiança”, o que pode gerar confusão em alguns pesquisadores.

Como é possível que o algoritmo confie se não está avaliando nada?

Funcionários do Google não costumam responder a essa pergunta diretamente, mas existem patentes e estudos acadêmicos que oferecem insights a respeito.

O Google não considera confiáveis os links provenientes de sites de spam.

A pessoa que fez uma pergunta ao departamento de SEO há algumas horas.

“Se um site é penalizado, isso impacta nos links que estão direcionados para ele?”

O membro da equipe do Google, Duy Nguyen, deu uma resposta.

Eu entendo que quando você menciona “penalizar”, está se referindo ao fato de que o site foi removido devido às ações dos nossos algoritmos de spam ou intervenções manuais.

Normalmente, não confiamos em links de sites que sabemos que são spam.

Isso contribui para preservar a excelência dos nossos sinais de referência.

Confiança e Hiperlinks

Os funcionários do Google discutem a importância da confiança, que se refere à capacidade dos algoritmos confiarem ou desconfiarem de determinadas informações.

Neste exemplo, a questão não envolve a exclusão de links encontrados em sites de spam, mas sim a importância de não considerar a referência de texto âncora.

A comunidade de SEO menciona a importância de “construir confiança”, porém, neste contexto, o foco é evitar a prática de spam.

Como o Google identifica se um site é considerado spam?

Não são todos os sites que sofrem penalizações ou são alvo de ações manuais. Alguns sites não são sequer incluídos nos resultados de busca, e isso é feito pelo Spam Brain do Google, uma plataforma de inteligência artificial que avalia páginas da web em vários aspectos, desde o momento do rastreamento.

A plataforma do cérebro de spam opera de forma semelhante a:

  • Índice de Gatekeeper: O Spam Brain impede a indexação de sites durante a fase de rastreamento, o que inclui o bloqueio de conteúdo identificado por meio do console de pesquisa e sitemaps.
  • O Spam Brain também detecta o spam que foi indexado a um ponto em que os sites são levados em consideração para a classificação.

A maneira como o Spam Brain opera é treinando uma inteligência artificial com base no conhecimento do Google sobre spam.

Google abordou o funcionamento do cérebro de spam.

No ano passado, conseguimos criar uma inteligência artificial própria para combater o spam, a qual se mostrou altamente eficaz em identificar tanto padrões de spam conhecidos quanto novos, graças à nossa expertise nesse campo e ao uso da inteligência artificial.

Desconhecemos a especificidade do “conhecimento de spam” mencionado pelo Google, no entanto, existem diversas patentes e artigos de pesquisa a respeito desse tema.

Pessoas interessadas em explorar mais a fundo esse assunto podem optar por ler um artigo que elaborei sobre o tema dos algoritmos de classificação de distância de link, um método utilizado para classificar os links.

Eu também escrevi um extenso artigo que aborda diversos estudos de pesquisa que explicam os algoritmos ligados ao link, os quais podem elucidar o funcionamento do algoritmo do Penguin.

Apesar de muitas das patentes e artigos de pesquisa serem recentes, não houve mais publicações por parte de motores de busca e acadêmicos nos últimos dez anos.

A relevância dessas patentes e pesquisas reside na possibilidade de serem integradas de forma distinta ao algoritmo do Google, contribuindo para o aprimoramento da inteligência artificial, como no caso do Spam Brain.

O artigo sobre a patente de classificação de distância de links explica como um método atribui uma pontuação de classificação às páginas, considerando a distância entre os sites de referência confiáveis e as páginas que eles conectam. Os sites de referência funcionam como pontos iniciais para determinar a legitimidade dos sites e identificar possíveis práticas de spam.

A ideia é que, quanto mais um site de sementes se assemelha a um site considerado spam, maior a probabilidade de ser classificado como spam. Esse conceito de avaliar a probabilidade de spam com base na proximidade do link é explorado em estudos acadêmicos referenciados no artigo do Penguin ao qual mencionei anteriormente.

A patente descreve a criação de uma classificação para páginas com base em distâncias em um gráfico de links da web.

O sistema determina os comprimentos dos links com base em características tanto dos próprios links quanto das páginas vinculadas a eles.

O sistema calcula as distâncias mais curtas entre as páginas de sementes e as demais páginas com base nos comprimentos dos links entre elas.

Logo após, o sistema atribui uma pontuação de classificação para cada página no grupo de páginas com base nos cálculos das distâncias mais breves.

Redução do gráfico de link

A patente também faz referência a um gráfico de links simplificado.

No entanto, não se trata apenas de uma patente que aborda gráficos de links encurtados. Além do Google, também houve pesquisas sobre gráficos de links encurtados.

Um gráfico de links é semelhante a um mapa online da rede mundial de computadores, formado através do mapeamento de conexões por meio de links.

Em um gráfico de links simplificado, são excluídos os links de baixa qualidade e os sites relacionados a eles.

O que sobra é o que é conhecido como um gráfico de links simplificado.

Aqui está uma passagem retirada da patente mencionada pelo Google:

Um gráfico de ligação simplificado

Observe que os links que fazem parte dos k caminhos mais curtos das sementes para as páginas formam um subconjunto que engloba todos os links classificados como “fluxo” das sementes.

Apesar de conter menos links do que o gráfico de links original, os caminhos mais curtos das sementes para cada página neste sub-grafo têm os mesmos comprimentos que os caminhos no gráfico original.

Além disso, é possível rastrear o fluxo de classificação para cada página até as sementes k mais próximas por meio dos caminhos neste sub-grafo.

Google desconfia da credibilidade de links provenientes de sites que foram penalizados.

É evidente que o Google não considera confiáveis os links provenientes de sites que foram penalizados.

Por vezes, é difícil determinar se um site foi penalizado ou identificado como spam pelo Spam Brain.

É recomendável realizar uma pesquisa para verificar a confiabilidade de um site antes de se dedicar a tentar obter um link dele.

Na minha visão, eu acredito que não se deve basear decisões de negócios como essa em métricas de terceiros, já que os métodos de cálculo usados para gerar uma pontuação não são transparentes.

Se um site já está referenciando possivelmente sites de baixa qualidade para os quais eles próprios têm links de entrada de possíveis links pagos, como redes de blog privadas (PBNs), então é provável que seja um site de baixa qualidade.

Ilustração principal fornecida por Shutterstock/Krakenimages.com

Assista ao horário de trabalho do SEO.

Artigos relacionados

Back to top button