Problème récent de Crawl Google

Nouveau WRInaute
Globalement, le référencement de mon site www.chroniquedisney.fr est plutôt bon. Mais je remarque que depuis le changement du mode de crawl de Google fin 2020, j'ai un effet de bord sur les nouvelles pages.

Pour quelques films d'actualité, j'ouvre souvent une page avec quelques informations plus une affiche. Un exemple ici :
https://www.chroniquedisney.fr/fil-04-MAR/2021-black-widow.htm
Souvent, la page sera actualisée avec une critique digne de ce nom plus tard (de quelques jours à quelques mois).

Afin de lutter sur les pages zombies, j'avais mis en place pour ces pages un peu vides la balise meta suivante :
<meta name="robots" content="noindex,nofollow"><meta name="revisit-after" content="10 days" /><meta name="expires" content="never" />

Quand elle était complétée et enrichie alors la balise devenait :
<meta name="robots" content="all" /><meta name="revisit-after" content="10 days" /><meta name="expires" content="never" />

Google repassait régulièrement et référencé la page mise à jour. Et s'il ne le faisait pas, j'allais dans la page d'indexation de Google Search Console et au bout de 48H max, il crawlait la page.

Maintenant, il me donne des erreurs du genre 'URL envoyée désignée comme "noindex" ' et j'ai beau lui demandé des indexations cela prend de plus en plus de temps, même quelques mois pour certaines fiches.

J'hésite à virer le <meta name="robots" content="noindex,nofollow"> pour certaines grosses pages dont je sais que le contenu sera enrichi dans les prochains mois mais j'ai peur de créer des pages zombies qui pénalisera au final tout le référencement du site...

Bref c'est le serpent qui se mort la queue surtout que ce sont des pages de grosses actualités.
Si vous des conseils pour accélérer le crawl de ces pages, je suis preneur.
 
Olivier Duffez (admin)
Membre du personnel
meta name="revisit-after" n'a jamais existé (!!!)
meta name="expires" content="never" non plus à ma connaissance

tu devrais sans doute éviter de créer des pages vides (ou avec un titre et une image). Même pour les internautes ce n'est pas très intéressant. Ou alors débrouilles-toi pour que Google ne les crawle jamais (et ne connaisse pas leur URL).

les pb d'indexation que tu décris correspondent effectivement bien aux changements sur l'indexation Google fin 2020, sur lesquels j'ai fait des recherches comme tu le sais sans doute.

au-delà de ça, je pense que tu devrais refaire un audit avec l'indice zombie, ton dernier est vraiment très vieux, tu ne peux plus l'exploiter
 
Nouveau WRInaute
meta name="revisit-after" n'a jamais existé (!!!)
meta name="expires" content="never" non plus à ma connaissance
J'avais trouvé ça il y a un certain temps. Je l'enlèverais.
tu devrais sans doute éviter de créer des pages vides (ou avec un titre et une image). Même pour les internautes ce n'est pas très intéressant. Ou alors débrouilles-toi pour que Google ne les crawle jamais (et ne connaisse pas leur URL).
C'est ce qui me chagrine. Même si l'information est minime, surtout pour une page d'actualité comme ici, il y a des pages où l'information est plus patrimoniale. (Un exemple parmi d'autres) Comme on est un site encyclopédique, le fait d'avoir certaines informations comme des vieilles affiches, le nom des artistes ou la des dates de sortie peut-être intéressant pour le visiteur sans qu'on est fatalement le temps (ou la possibilité d'ailleurs) de voir ces dits films. Faire disparaître ce genre de pages serait dommage. Mais bon, j'ai bien peur qu'avec Google on n'ait pas fatalement le choix. Car même si on rajoute fortement du contenu, il ne veut plus repasser et donner une chance à la page...
 
Discussions similaires
Haut