Blog

Google On Fixing Discovered Atualmente Não indexado

Redator Luccas19 de January de 2024

0 20 6 minutos lidos

John Mueller do Google respondeu se remover páginas de um grande site ajuda a resolver o problema das páginas que são descobertas pelo Google, mas não rastreadas. John ofereceu informações gerais sobre como resolver este problema.

Descobrido – Atualmente não indexado

Search Console um serviço fornecido pelo Google que comunica problemas relacionados à pesquisa e feedback.

O status de indexação é uma parte importante do console de busca porque diz a um editor quanto de um site é indexado e elegível para o ranking.

O status de indexação de páginas web são encontrados no relatório de indexação de página do console de pesquisa.

Um relatório de que uma página foi descoberta pelo Google, mas não indexada é frequentemente um sinal de que um problema precisa ser abordado.

Existem várias razões pelas quais o Google pode descobrir uma página, mas recusar indexá-la, embora a documentação oficial do Google apenas lista uma razão.

Nova descoberta da página, que ainda não foi incluída nos resultados de pesquisa do Google, apesar de ter sido encontrada.

Tipicamente, o Google queria rastejar a URL, mas isso era esperado para sobrecarregar o site; portanto, o Google remarcava o rastreamento.

Por esse motivo, a informação mais recente de rastreamento não foi registrada no relatório.

John Mueller, do Google, apresenta mais explicações sobre por que uma página pode ser encontrada, mas não indexada.

Páginas não indexadas para melhorar a indexação em todo o site?

Existe a crença de que ao excluir páginas específicas, isso poderá facilitar a indexação do restante do site pelo Google, reduzindo a quantidade de páginas a serem rastreadas.

Existe a ideia de que o Google possui uma quantidade limitada de rastreamento disponível (orçamento de cascata) designada para cada site.

O Googler tem repetidamente dito que não há nenhuma coisa como um orçamento de rastreamento da maneira que os SEOs percebem isso.

O Google tem uma série de considerações sobre quantas páginas rastreiam, incluindo a capacidade do servidor do site para lidar com extenso rastreamento.

Uma razão fundamental pela qual o Google é seletivo em relação à quantidade que ele indexa é a limitação de capacidade de armazenamento para guardar todas as páginas da internet.

Por essa razão, o Google costuma incluir nas suas listagens páginas que oferecem valor (desde que o servidor consiga lidar com elas) e não incluir outras páginas.

Para mais informações sobre Crawl Budget leia: Google compartilha insights em orçamento Crawl

Esta é a pergunta que foi feita:

“Definir e agregar produtos 8M usados em 2M únicas páginas de produtos indexáveis ajudam a melhorar a rastreabilidade e indexabilidade (Discovered – atualmente não indexado problema)? ”

John Mueller do Google reconheceu pela primeira vez que não era possível abordar a questão específica da pessoa, em seguida, ofereceu recomendações gerais.

Ele respondeu:

“É impossível dizer.

Eu sugiro que você dê uma nova olhada no manual abrangente do site para obter orientações sobre como gerenciar seu orçamento em nossos documentos.

Para grandes sites, às vezes rastejando mais é limitado por como seu site pode lidar com mais rastreamento.

Na maioria dos casos, porém, é mais sobre a qualidade geral do site.

Você está melhorando significativamente a qualidade geral do seu site, indo de 8 milhões de páginas para 2 milhões de páginas?

A menos que você se dedique a aprimorar a qualidade genuína, é comum simplesmente passar muito tempo diminuindo a quantidade de páginas indexáveis, sem de fato melhorar o site, o que não traria benefícios para a pesquisa.

Mueller oferece duas razões para descoberto não indexado problema

John Mueller, do Google, apresentou duas explicações sobre por que o Google pode encontrar uma página, mas não incluí-la em seu índice.

Habilidade do servidor.
Qualidade geral do site

1. Capacidade de servidor

Mueller mencionou que a capacidade do Google de explorar e catalogar páginas da web pode ser restrita pela forma como o seu site consegue lidar com um maior volume de rastreamento.

Quanto maior um site recebe mais bots que leva para rastejar um site. Compor o problema é que o Google não é o único bot rastejando um site grande.

Existem outros bots legítimos, por exemplo, da Microsoft e da Apple, que também estão tentando rastrear o site. Além disso, existem muitos outros bots, alguns legítimos e outros relacionados com hacking e raspagem de dados.

Isso significa que para um grande site, especialmente nas horas da noite, pode haver milhares de bots usando recursos do servidor do site para rastrear um grande site.

É por isso que uma das primeiras perguntas que faço a um editor com problema de indexação é o estado de seu servidor.

Em geral, um site com milhões de páginas, ou mesmo centenas de milhares de páginas, precisará de um servidor dedicado ou um host em nuvem (porque os servidores em nuvem oferecem recursos escaláveis como largura de banda, GPU e RAM).

Às vezes, um ambiente de hospedagem pode precisar de mais memória atribuída a um processo, como o limite de memória PHP, a fim de ajudar o servidor a lidar com alto tráfego e evitar 500 mensagens de resposta de erro.

Os servidores de resolução de problemas envolvem a análise de um log de erro do servidor.

2. Nível de excelência do site.

Uma justificativa interessante para não indexar um número adequado de páginas é a seguinte: A qualidade geral de um site é avaliada como uma pontuação ou determinação que o Google atribui a ele.

Partes de um site podem afetar a qualidade geral do site

John Mueller afirmou que uma parte específica de um site pode influenciar a avaliação geral da qualidade do site.

Mueller afirmou:

“…em relação a certos aspectos, consideramos a qualidade geral do site.”

E quando olhamos para a qualidade do site em geral, se você tem porções significativas que são de menor qualidade não importa para nós como por que eles seriam de menor qualidade.

… se vermos que existem peças significativas que são de menor qualidade, então podemos pensar em geral este site não é tão fantástico como pensávamos. ”

Explicação sobre a Excelência do Site

John Mueller do Google ofereceu uma definição de qualidade do site em outro vídeo do Office Hours:

“Quando se trata da qualidade do conteúdo, não queremos dizer apenas o texto de seus artigos.

É realmente a qualidade do seu site geral.

E isso inclui tudo, desde o layout até o projeto.

Como você organiza o conteúdo em suas páginas, como incorpora imagens e como lida com a velocidade são aspectos importantes que precisam ser considerados.

Qual é o tempo necessário para avaliar a qualidade geral de um site?

Outro fato sobre como o Google determina a qualidade do site é quanto tempo leva o Google para determinar a qualidade do site, ele pode levar meses.

Mueller disse:

É necessário um longo período para compreendermos a forma como um site se relaciona com o restante da Internet.

… E isso é algo que pode facilmente levar, Eu não sei, alguns meses, meio ano, às vezes até mais de meio ano… ”

Melhorando um site para ser rastreado e indexado.

Otimizar um site inteiro ou uma seção de um site é uma maneira geral de alto nível para olhar para o problema. Muitas vezes se resume a otimizar páginas individuais em uma base dimensionada.

Particularmente para sites de ecommerce com milhares de milhões de produtos, a otimização pode tomar várias formas.

Coisas para cuidar:

Menu principal
Certifique-se de que o menu principal é otimizado para levar os usuários para as seções importantes do site na maioria dos usuários estão interessados. O menu principal também pode ligar para as páginas mais populares.

Link para Seções e Páginas Populares
As páginas e seções mais populares também podem ser ligadas a partir de uma seção proeminente da página inicial.

Isso ajuda os usuários a chegar às páginas e seções que mais importam para eles, mas também sinaliza para o Google que estas são páginas importantes que devem ser indexadas.

Melhorar Páginas de Conteúdo Fino
Conteúdo fino é basicamente páginas com pouco conteúdo útil ou páginas que são principalmente duplicatas de outras páginas (conteúdo temperado).

Não basta preencher as páginas com palavras. As palavras e frases devem ter significado e relevância para os visitantes do site.

Para produtos pode ser medidas, peso, cores disponíveis, sugestões de outros produtos para emparelhar com ele, marcas que os produtos funcionam melhor com, links para manuais, FAQs, classificações e outras informações que os usuários vão encontrar valioso.

Solving Crawled Não indexado para mais vendas on-line

Em uma loja física parece que é suficiente apenas colocar os produtos nas prateleiras.

Entretanto, na prática, são necessários vendedores experientes para impulsionar a venda desses produtos rapidamente.

Uma página web pode desempenhar o papel de um vendedor experiente que pode se comunicar ao Google por que a página deve ser indexada e ajuda os clientes a escolher esses produtos.

Assista às horas do escritório do Google SEO na marca de 13:41 minutos:

Ilustração principal fornecida por Shutterstock/Rembolle.

Google On Fixing Discovered Atualmente Não indexado

Descobrido – Atualmente não indexado

Páginas não indexadas para melhorar a indexação em todo o site?