Search Console Comment faire partir les erreurs Couverture => Introuvable (404)

WRInaute passionné
Salut à tous,

J'ai supprimé depuis des mois/années des pages sur mon site mais je continue de les voir dans la GSC dans Couverture => Introuvable (404), faut-il faire quelque chose de plus pour que GG ne les crawls plus pour rien ?

Lorsque j'analyse le code de l'entête HTTP de ces pages, elles renvoient bien un code 404.

Je trouve aussi dans Couverture => Introuvable (404) des anciennes url qui commencent par http:// alors que mon site est en https://

Merci pour vos réponses.
 
WRInaute impliqué
Le premier point n'est pas réellement problématique. Google teste ces vieilles adresses, mais en principe à un rythme lent. Il n'y a rien à faire, et à y réfléchir, ce n'est pas vraiment un problème.

Le second, point, c'est à dire renvoi d'un code 404 sur une requête HTTP est plus gênant. Met en place une redirection 301 plutôt.
 
WRInaute passionné
Le second, point, c'est à dire renvoi d'un code 404 sur une requête HTTP est plus gênant. Met en place une redirection 301 plutôt.
La redirection 301 est déjà en place depuis des mois mais GG continue de crawler ces très anciennes url en http://, faut-il ignorer cela dans GSC ? Ca fait quand même plus de 6000 urls qu'il crawl pour rien depuis des mois/années ? Il est quand même un peu long à comprendre que ces urls n'existent plus et qu'il faut les supprimer définitivement, non !

Idem dans Couverture => Page avec redirection, je trouve des milliers d'urls très anciennent qu'il crawl, crawl.... depuis des mois... et qu'il ne supprime pas malgré des redirections 301, que faire ?
 
Dernière édition:
Olivier Duffez (admin)
Membre du personnel
il faut vérifier qu'il n'existe plus aucun lien interne vers ces URL en 404 ou en redirection
 
WRInaute passionné
J'ai fait un audit RM Tech via votre outil, dans quel fichier excel dois-je regarder pour voir si des liens internes pointent vers ces anciennes urls qui sont en 404 ou en redirection ?
 
Olivier Duffez (admin)
Membre du personnel
Les annexes dans la partie "État des URL crawlées" :
  • Afin de vous permettre de localiser les erreurs 4xx et 5xx sur votre site, les fichiers annexes suivants contiennent les URL des pages contenant les liens en erreur
  • Afin de vous permettre de localiser les erreurs 3xx sur votre site, les fichiers annexes suivants contiennent les URL des pages contenant les liens en erreur
 
WRInaute passionné
J'ai regardé dans les annexes (fichier excel) dans la partie "État des URL crawlées" et je n'ai pas trouvé de lien vers mon site en http://.... il n'y a que des liens en https://.... dois-je en conclure que c'est Google qui débloque dans la GSC ?
 
Olivier Duffez (admin)
Membre du personnel
ça veut dire qu'il continue de crawler des URL qu'il a connues pendant longtemps à cette adresse
c'est pénible en effet, mais si la redirection est bien faite (une seule redirection 301), c'est bon

tu as donc 100% des URL crawlées par RM Tech qui sont en code 200 ?
 
WRInaute passionné
Le rapport RM Tech indique que j'ai 99,22% d'urls crawlées en code 200 et 16 urls en code 301.

Il n'y a aucune url en http elles sont toutes en https.

On ne peut plus poster d'images sur ce forum ?
 
WRInaute passionné
Quand je regarde dans la GSC => Couverture => Page avec redirection, il y a des centaines de vieilles urls du type http://mon-site.com (en http et sans www) alors que j'ai une redirection permanente (301) depuis des années qui redirige ce type de pages vers le https://www.mon-site.com mais Google continue de me les indiquer dans la GSC (leur crawler a crawlé ces pages le 4 mai 2021) : ça fait flipper leur système !!! Si c'est aussi fiable sur le reste des données de la GSC et ben ça laisse songeur...
 
Olivier Duffez (admin)
Membre du personnel
c'est pénible en effet
as-tu un exemple d'URL comme ça à nous indiquer ici ?
 
WRInaute passionné
J'ai testé avec ton outil d'analyse d'entêtes ces urls (en http et sans www) que je trouve dans Couverture => Page avec redirection et elles renvoient bien un code 301.

J'ai un site ou je trouve dans Couverture => Page avec redirection plus de 1000 urls alors que toutes ces urls renvoient bien un code 301. Avec des dates d'exploration du crawler Google du mois de mars, d'avril ou de mai 2021, donc très récentes.

La question que je me posais c'est : suis-je le seul dans ce cas là ?

Puis-je t'envoyer par email un fichier excel de ces urls afin que tu jettes un oeil sur quelqu'unes de ces urls ?
 
Discussions similaires
Haut