Annonces Google

Vous êtes ici : Dossiers référencement > Conseils en référencement naturel

Comment supprimer les erreurs 404 listées dans Google Search Console

Par , le 07 mars 2016

Si vous n'arrivez pas à faire disparaitre les erreurs 404 indiquée dans Google Search Console (ex- Webmaster Tools), ce tuto est pour vous ! Suivez les étapes pour améliorer votre référencement naturel.

Supprimer erreurs 404

Tuto : supprimer les erreurs 404 listées dans Google Search Console

Le scénario est le suivant : malgré vos efforts, Google liste des erreurs 404 (ou autres types d'erreur) dans le rapport "Erreurs d'exploration" de la Search Console. Est-ce grave ? Comment les corriger et les faire disparaître de GSC ?

Les erreurs 404 pénalisent-elles le référencement ?

Voici les explications fournies par Google :

En général, les erreurs 404 n'ont aucune incidence négative sur les performances de votre site dans les résultats de recherche, mais elles peuvent vous aider à en améliorer l'expérience utilisateur.

Dans l'aide, on trouve des conseils supplémentaires :

Elles se produisent souvent à la suite de fautes de frappe ou d'erreurs de configuration, par exemple dans le cas de liens générés automatiquement par un système de gestion de contenu. Elles peuvent aussi être le résultat du développement croissant mené par nos services pour détecter et explorer les liens présents dans des contenus intégrés tels que JavaScript.

Cette dernière phrase n'est pas très claire, mais en gros on peut comprendre que Google cherche parfois à accéder à des URL qui n'existent tout simplement pas, mais son interprétation des codes Javascript fait que Google estime que ces URL peuvent exister...

Je termine par les derniers conseils de Google sur les 404 :

Il est tout à fait normal, voire souhaitable dans certains cas, de rencontrer des codes d'erreur 404 sur le Web. Vous ne pourrez probablement jamais contrôler tous les liens qui redirigent vers votre site ni résoudre toutes les erreurs 404 qui s'affichent dans la Search  Console. Concentrez-vous plutôt sur les problèmes les plus importants, résolvez ceux que vous pouvez, puis passez à une autre étape.

Alors ? L'objectif de mon article est justement de vous aider à comprendre quelles sont les erreurs les plus importantes, qu'il faudrait corriger.

Mon point de vue :

  • si une page générait du trafic (SEO) et se retrouve en erreur (404 ou autre), c'est un réel problème de référencement, qu'il faut absolument corriger.
  • si une page est en erreur 404 à cause d'un lien venant de l'extérieur, vous n'y pouvez rien et cela ne dégrade pas vos performances SEO. Mais si ce lien est de qualité, tant qu'il génère une erreur 404 vous n'en profitez pas, donc vous devriez corriger le problème.
  • si vous avez trop d'erreurs 404 dans vos liens internes, cela dégrade l'expérience utilisateur si bien que vous devriez les corriger

Les étapes pour corriger les erreurs 404

A votre place, je suivrais les étapes suivantes...

1- Corriger les erreurs 404 générées par les liens internes

Si jamais des erreurs 404 sont causées par des liens internes, il faut absolument les corriger car :

  • ces erreurs dégradent l'expérience utilisateur
  • ces erreurs nuisent à votre référencement puisqu'une page ne reçoit pas le lien que vous aviez prévu de lui faire
  • c'est facile à détecter et à corriger :-)
  • ça fera un premier nettoyage de la liste des erreurs 404 indiquées dans Search Console

C'est un excellent cas de figure où mon outil RM Tech va énormément vous aider et vous faire gagner du temps. Il s'agit d'un outil d'audit SEO en ligne : vous indiquez l'URL du site à étudier et vous n'avez rien d'autre à faire qu'attendre qu'il ait fini. Dès que votre rapport d'audit est prêt, regardez dans la rubrique "Analyse du crawl et de l'indexabilité" le rapport "État des URL crawlées" qui dresse le bilan des codes HTTP rencontrés sur votre site, uniquement en suivant vos liens internes.

Lancez dès maintenant votre analyse : audit sur My Ranking Metrics

Voici un exemple avec un site qui avait besoin d'un gros nettoyage (plein d'erreurs dans les liens internes) :

RM Tech tableau codes HTTP

RM Tech dresse dans un tableau le bilan des codes HTTP rencontrés

Sous forme graphique, on se rend compte de la gravité des problèmes :

RM Tech graphique codes HTTP

La même info sous forme graphique

Pourquoi utiliser RM Tech et pas simplement Search Console ? Je détaille ci-dessous comment utiliser les rapports de la Search Console, mais vous verrez que cela ne suffit pas d'avoir la liste des URL en erreur : il vous faut aussi la liste des URL qui font ce lien erroné. Search Console en donne une partie (pas tout) mais c'est manuel, URL par URL, ce qui en pratique se révèle très peu efficace.

Avec RM Tech, non seulement vous avez la liste des pages en erreur, mais pour chacune des erreurs vous avez la liste des pages de votre site qui font un lien vers cette page en erreur. Un lien qu'il faudra bien entendu modifier ou supprimer (selon les cas).

RM Tech liens vers erreurs de crawl

Une annexe très précieuse liste TOUTES les pages faisant un lien interne cassé

Je vous incite à découvrir les autres fonctionnalités : Tuto vidéo de RM Tech

2- Corriger les erreurs 404 générées par les sitemaps

Utilisez un outil d'analyse de l'entête HTTP pour vérifier que chaque URL indiquée dans votre sitemap renvoie bien un code 200 (ce qui signifie que tout est OK). Il ne doit pas y avoir de redirection et encore moins d'erreur 404 (ou 403, 410, 500, etc.).

Si vous êtes perdu dans tous ces codes : consultez la liste des codes HTTP.

3- Corriger les erreurs 404 générées par les backlinks

Il est possible que certaines erreurs 404 soient liées à des backlinks, c'est-à-dire des liens issus d'autres sites, pointant vers une mauvaise URL de votre site. Pour les identifier, utilisez votre outil préféré d'analyse de backlinks (Majestic, Ahrefs ou Moz) et récupérez la liste des backlinks pointant vers une erreur 404. Majestic a publié un article sur ce sujet, à vous de l'exploiter pour votre propre site au lieu de celui d'un concurrent. Si vous n'y arrivez pas du tout, et que vous me le demandez gentiment, il est possible que je vous le fasse gratuitement ;-)

Si celui qui a fait le lien s'est trompé légèrement dans l'URL, c'est dommage et il faut le corriger :

  • contactez le webmaster du site qui vous fait le lien en erreur pour lui demander de le corriger. Présentez-lui ça de façon positive en lui expliquant qu'il a un lien cassé sur son site...
  • s'il ne répond pas, mettez en place une redirection 301 de la mauvaise URL vers la bonne

Pour les détails, lisez mon dossier "Comment transformer des erreurs 404 en backlinks" (OK, ce titre est un peu exagéré...).

Evidemment, si le lien est de mauvaise qualité en raison du site émetteur, mieux vaut ne pas le corriger, car c'est ce qu'on appelle un lien nocif pour le SEO...

4- Corriger les autres erreurs 404

Une fois que vous aurez validé les étapes précédentes, attendez 1 ou 2 semaines que Google mette à jour votre compte Search Console. Ensuite, consultez le rapport Erreurs d'exploration, cliquez sur l'onglet "Introuvables" situé dans la sous-partie "Erreurs au niveau des URL".

Google liste les erreurs par ordre de priorité, autant en profiter.

Erreurs 404 dans Search Console

Explications sur l'interface de Search Console listant les pages en erreur (introuvables)

Si c'est plus simple pour vous de gérer la liste dans Excel, il vous suffit de télécharger le tableau au format CSV (ou Google Docs). Dans le cas du CSV, voici les colonnes que vous allez récupérer :

  • URL
  • Code de réponse : 404 pour le cas des pages introuvables
  • Erreur Google Actualités : concerne uniquement les sites présents dans Google Actualités
  • Détectée : date de 1ère détection par Googlebot (le robot de Google)
  • Catégorie : type d'erreur (ici "introuvable")
  • Plate-forme : version de Googlebot ayant rencontré l'erreur (ordinateur, smartphone ou téléphone multimédia)
  • Dernière exploration : date du dernier crawl par Googlebot

En fonction des différents cas qui restent listés, vous aurez peut-être besoin de répéter une des étapes précédentes. Pour y voir plus clair, vous pouvez cocher la case devant l'URL traitée puis cliquer sur le bouton "Marquer comme corriger". Mais comme je l'explique dans mon article "A quoi sert le bouton Marquer comme corrigées ?", cela ne sert qu'à nettoyer l'interface de la Search Console, pas à corriger les erreurs à proprement parler.

Astuce : si vous avez beaucoup d'erreurs, vous arriverez peut-être à la limite fixée par Google, à savoir 1000 URL. Pour la contourner, il suffit de déclarer une sous-partie de votre site en tant que nouvelle propriété dans Search Console. Cette technique ne marche que si vous avez des répertoires à la racine, par exemple /blog/. Dans ce cas, vous pouvez déclarer http://www.example.com/blog/ comme nouvelle propriété ; elle sera validée immédiatement et vous pourrez consulter la liste des erreurs 404 concernant uniquement ce répertoire. Pratique !

Rediriger vers l'accueil : mauvaise solution !

Je rencontre encore régulièrement des sites mal configurés, sur lesquels en cas de page introuvable on est redirigé vers la page d'accueil. Ne faites surtout pas ça !

  • vous pourrez beaucoup plus difficilement vous rendre compte des pages introuvables (elles seront absentes des rapports Search Console par exemple)
  • je déconseille de rediriger plein de pages différentes vers la page d'accueil

D'ailleurs l'aide en ligne de Google confirme qu'il faut qu'un serveur web renvoie un code 404 quand une ressource est introuvable :

Il est tout à fait normal, voire souhaitable dans certains cas, de rencontrer des codes d'erreur 404 sur le Web.

Vous avez peut-être configuré une page d'erreur 404 personnalisée (c'est très bien). Vérifiez malgré tout que le code HTTP renvoyé est bien un code 404, et pas 302 (redirection temporaire). Utilisez un outil de test de code HTTP sur une URL inexistante de votre site. Si vous avez une redirection 302, c'est sans doute que vous avez indiqué une URL entière dans votre fichier .htaccess pour la page d'erreur personnalisée.

La mauvaise façon de la définir :

ErrorDocument  404  http://www.example.com/page-introuvable.php

Voici la bonne façon (notez que l'adresse de la page personnalisée commence par / et non pas par http) :

ErrorDocument  404  /page-introuvable.php

Besoin d'aide ?

Si vous n'y arrivez pas ou que quelque chose n'est pas assez clair pour vous, n'hésitez pas à poser la question dans les commentaires ou dans le forum WebRankInfo !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC,...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le SEO (+300.000 membres, 1,5 million de posts). Il est aussi cofondateur de Ranking Metrics, leader des formations webmarketing en France (SEO, AdWords, Analytics, réseaux sociaux) et éditrice de la plateforme MyRankingMetrics (crawler et audit SEO en ligne).

Article (Supprimer les erreurs 404 listées dans Search Console) publié par WebRankInfo dans la rubrique Conseils en référencement naturel. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

6 commentaires

  • x5francois a dit le

    Bonjour Olivier,

    dans mon cas, j'ai racheté il y a 3 ans, sans vérifier un domaine qui était autrefois, il y a plusieurs années, sur une thématique adulte. Il a été abandonné pendant au moins 2 ans, avec aucune page. La nouvelle thématique est une banque d'images gratuites, pour tout public. Depuis des mois, j'ai contacté les webmasters des sites qui me faisaient des liens pour qu'ils les retirent, j'ai mis les pages linkées en 410, mais elles ressortent toujours et encore dans la search console. Je ne sais pas quoi faire, d'autant plus que je pense être pénalisé pour cette histoire de thématique adulte mémorisée par Google...

  • Olivier Duffez a dit le

    Je n'ai jamais travaillé dans ce cas de figure (il faut toujours regarder attentivement le passé d'un domaine avant de l'acheter !)... Demande sur le forum d'autres avis ?
    Tous les liens de thématique adulte pointent donc vers des pages en erreur, et ce n'est pas gênant dans ton cas. Sauf pour les liens vers la page d'accueil !

  • Hanane Taki a dit le

    Merci beaucoup pour vos explications qui me seront sûrement très utiles. Cet article est tip top et je le partage via Linkedin !

  • Olivier Duffez a dit le

    Merci Hanane !

  • Johann a dit le

    Pour PrestaShop, je suis en train de finaliser un module qui concerne ce problème (et que j'évoque en formation !) lorsqu'on désactive un produit ou une catégorie.
    Ce module redirige automatiquement un produit désactivé (et non pas supprimé) vers sa catégorie parente.
    Et il redirige une catégorie désactivée vers sa catégorie parente aussi (et ainsi de suite si la parente est aussi désactivée, jusqu'à la page d'accueil si nécessaire).

  • Olivier Perbet a dit le

    Tiens, la ville de Paris a envoyé tous ses 404 vers la Home à la refonte du site ;)

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Annonces Google

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.