Nombreuses 404 dans la Search Console

ValCTZ

Nouveau WRInaute
Bonjour à tous,

Quelqu'un pourra peut-être m'éclairer...

La Search Console de notre site nous indique 11 367 URLs introuvables, en 404. Cela est dû à Magento qui a créé de nombreuses URLs un jour, sans que l'on sache pourquoi.
Lorsque je crawl le site avec Screaming Frog, celui-ci n'en trouve que 27.

J'ai également extrait les 1000 premières URls qui sont indiquées dans la Search Console, et je les ai analysées avec Screaming Frog. Il se trouve que dans l'onglet Inlinks, aucun lien n'est créé sur des pages internes, pointant vers ces 404.
Cela contredit la Search Console car quand je clique sur une 404 et "Référencée sur", de nombreuses pages internes sont indiquées.

Est-ce que quelqu'un a déjà eu affaire à ce problème ? Et surtout comment le résoudre ?

Merci d'avance !
 

ValCTZ

Nouveau WRInaute
Merci pour votre réponse. En effet l'article est bien tombé, néanmoins je n'ai pas encore solutionné mon problème...

Je ne comprends pas comment Google peut trouver ces pages puisque aucunes pages internes ne fait de liens vers ces pages 404. Lorsque je regarde "Référencée sur", je n'y trouve que d'autres 404.

Comment je peux donc faire pour que ces milliers de 404 disparaissent de la Search Console ?

Merci
 

longo600

WRInaute passionné
Bonjour @ValCTZ.

Je suis passé par là, et deux raisons sont possibles;
1) Des erreurs internes, chez moi, par ma faute, ca m'est arrivé plus d'une fois. Le malheur, c'est que Google ne te les affichera que 6 mois plus tard, et parfois, tu as corrigé ton erreur dans l'heure, mais trop tard, Google a crawlé les dites pages erronées .
Donc, il y a environ 6 mois, tu as peut-être fait des erreurs?

2) Les bugs de Google. C'est assez fréquent, Google pond des algorithmes en permanence, et souvent de manière automatique (65% du code de Google est écrit par des robots). Lorsque Google décide de déceler des liens dans des textes sans même qu'il n'y ait de balises de lien et d'ancre, c'est souvent la cata et la grande pagaille, tout se mélange.

SOLUTION :
Pour corriger les liens dans la consolle et les effacer, il n'y a malheureusement aucune autre possibilité que de le faire manuellement, par paquet de 1000, chaque jour.

Pour ma part, j'ai du en effacer plus de 500 000, sur quelques millions de liens que j'ai au total. Il y a deux ans, j'ai du restructurer complètement mon site, par les erreurs de Google. Les erreurs 404 peuvent générer une forte baisse de trafic, il faut donc les effacer dans la console dès que possible. Tu peux aussi faire ré-indexer les répertoires essentiels dans la console.
 

ValCTZ

Nouveau WRInaute
Merci pour ta réponse longo600 !

Je n'étais pas dans l'entreprise il y a 6 mois, je ne peux donc pas te dire si des erreurs ont été faites mais a priori ces milliers d'URLs ont été créées il y a quelques semaines. Sans que personne ne sache pourquoi, c'est la gestion des filtres qui a merdé et une URL était créée pour chaque combinaison possible.
Le problème a rapidement été résolu mais comme tu l'as si bien dit, Google avait déjà crawlé les pages et il était trop tard.

J'ai déjà marqué ces urls comme corrigées mais Google les détecte à nouveau et elles réapparaissent dans la Search Console.

Lorsque je crawl mon site avec Screaming Frog, il ne détecte que quelques 404 que je vais pouvoir corriger. Cela me rassure, je me dis que le problème n'est peut être pas si grave...
 

longo600

WRInaute passionné
ValCTZ a dit:
Cela me rassure, je me dis que le problème n'est peut être pas si grave...
Grave non, cela mettra du temps, les mêmes urls réapparaîtrons probablement dans les erreurs de la console, mais avec le temps, elles finiront par disparaitre (6 mois ou plus).

Parfois, Google repasse de nouveaux algorithmes en masse, et pour cela, apparement, il reprend plutot des archives plutôt que de re-crawler la totalité du web, et ca se comprends, je fais la même chose avec mon moteur Premsgo (70% des sites web ne changent pas ou peu).

Dans ce cas, de vieilles erreurs 404 peuvent ressurgir et il faut à nouveau les effacer dans la console. C'est pour cela qu'il faut toujours jeter un oeil dans la console pour les gros sites qui font beaucoup de changement, au minimum tous les 3 mois, ou au moindre signe de baisse de trafic subit.
 

Discussions similaires

Haut