Annonces Google

Vous êtes ici : Dossiers référencement > Techniques de référencement

Référencement : comment repérer et corriger les erreurs Soft 404

Par , le 14 mai 2016

Si vous avez sur votre site des erreurs de type "Soft 404", les moteurs de recherche peuvent perdre du temps à crawler et indexer des pages sans intérêt, au détriment de vos pages de contenu. Google vous aide à les détecter en les listant dans l'interface de Google Search Console. Explications...

Article mis à jour le 14/05/2016, publié initialement le 08/06/2010

Erreurs soft 404 et SEO

Rapport listant les erreurs soft 404 dans Google Search Console

Différence avec une page en erreur 404 ou 410

Quand un internaute (ou un robot) cherche à accéder à une page qui n'existe pas, le serveur web doit renvoyer un code HTTP qui précise le statut de la page :

  • si la page est introuvable car elle n'existe pas, il faut renvoyer un code 404
  • si la page n'existe plus car elle a été définitivement supprimée, il faut renvoyer un code 410

Vous trouverez dans la FAQ plus d'informations sur les codes HTTP.

Erreur Soft 404

Définition

Quand une page est introuvable, certains serveurs mal configurés affichent bel et bien un message d'erreur mais renvoient un code 200 signifiant que la page a été trouvée. C'est ce cas de figure que Google appelle "Soft 404" (ce terme n'est pas nouveau).

Voici la définition d'une erreur soft 404 :

L'URL cible n'existe pas, mais votre serveur ne renvoie pas d'erreur 404 (Fichier introuvable)

Dans ce cas, les robots risquent fort de penser qu'il s'agit d'une page de vrai contenu et vont donc l'indexer alors qu'elle ne présente aucun intérêt. C'était par exemple le cas de la page du site du gouvernement français qui était positionnée en 1er dans Google pour la requête [iznogood] suite à un Google Bombing. Après avoir été supprimée, elle affichait un message d'erreur mais renvoyait un code 200, si bien qu'elle est restée dans Google plusieurs années...

Voici les autres explications de Google (source) :

Une erreur de type "soft 404" survient lorsque le serveur affiche une vraie page pour une URL qui en réalité n'existe pas sur votre site. Cela se produit en général lorsque votre serveur traite des URL incorrectes ou inexistantes comme des URL correctes, et redirige l'internaute vers une page valide telle que la page d'accueil ou une page 404 "personnalisée".

Cela pose problème, car les moteurs de recherche risquent de passer beaucoup de temps à explorer et indexer sur votre site des URL inexistantes et souvent dupliquées. Ceci peut avoir un effet négatif sur la couverture de l'exploration de votre site, car vos véritables URL uniques sont susceptibles de ne pas être découvertes aussi vite ou de ne pas être visitées aussi fréquemment en raison du temps que Googlebot passe sur les pages non existantes.

Erreur Soft 404 à cause d'une page trop vide

Un cas de figure assez courant d'erreur Soft 404 est de laisser se faire indexer une page avec très peu de contenu. Par exemple, ça peut être une page de catégorie (listing) dans un site ecommerce, de contenu ou de petites annonces, qui n'a aucun élément à lister ! Avec uniquement une phrase du type "Aucun produit n'a été trouvé".

Dans ce cas, c'est pratique d'avoir une erreur dans Search Console pour être prévenu. Mais je vous propose bien mieux : un outil qui parcourt tout votre site et vous alerte des pages ayant a priori un contenu de trop faible qualité. Pour en savoir plus, lisez mon dossier sur la détection des pages de mauvaise qualité.

Envie de tester cet outil ? Lancez un audit gratuit ici

Erreur Soft 404 à cause d'une redirection 302

Une erreur classique est de vouloir configurer une page d'erreur 404 personnalisée, mais de se tromper dans le code du fichier .htaccess. Admettons que votre page personnalisée se nomme 404.php (vous pouvez choisir le nom que vous voulez).

Voici ce qu'il ne faut pas faire :

ErrorDocument 404 http://example.com/404.php

L'URL de la page 404 personnalisée ne doit pas commencer par http. Voici le bon code :

ErrorDocument 404 /404.php

De toutes façons, je vous conseille de toujours vérifier que pour une URL qui n'existe pas, votre serveur renvoie effectivement un code 404 et rien d'autre.

Erreur Soft 404 à cause de nombreuses redirections

Un autre cas de figure est lié aux redirections : si vous redirigez un nombre important de pages vers une autre dont le contenu diffère trop, Google peut considérer que ce n'est pas approprié et signaler ces cas de figure comme des erreurs Soft 404, même si vous faites des bonnes redirections permanentes (code 301). Essayez de rediriger vers une page plus en adéquation avec la page d'origine (supprimée). Par exemple, évitez de faire plein de redirections vers votre page d'accueil.

Google considère une Soft 404 les redirections massives vers une page au contenu trop différentClick to Tweet

Détecter les erreurs Soft 404 et les corriger

Pour savoir si votre serveur est configuré correctement, il vous suffit d'utiliser un outil qui fournit le code HTTP d'une URL et de l'utiliser en fournissant une URL inexistante de votre site. Si vous obtenez un code 404 tout va bien, sinon si vous avez un code 200 alors vous avez un problème à corriger.

La meilleur solution est d'aller dans Google Search Console, rubrique Exploration > Erreurs d'exploration. Si dans le tableau à côté de "Erreurs au niveau des URL" vous voyez "Soft 404" c'est que Google croit avoir détecté des 404-like, c'est-à-dire des pages que Google pense être des 404 mais qui renvoient un code 200.

Détection des erreurs soft 404 dans search console

Les erreurs Soft 404 peuvent être listées dans Google Search Console

Sachez que si Google a détecté des Soft 404 sur votre site, c'est qu'il a trouvé quelque part des liens vers ces pages (soit sur votre site, soit ailleurs). A vous d'agir en conséquence ! Je vous conseille de profiter de ces Soft 404 pour obtenir des backlinks.

Si vous êtes un peu perdu au niveau des tous ces codes HTTP et de leur impact sur le référencement, lisez mon tutoriel codes HTTP et référencement naturel.

On discute des soft 404 dans le forum WebRankInfo.

Cet article vous a-t-il plu ?
Note : 5.0 (1 vote)
Cliquez pour voter !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC,...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le SEO (+300.000 membres, 1,5 million de posts). Il est aussi cofondateur de Ranking Metrics, leader des formations webmarketing en France (SEO, AdWords, Analytics, réseaux sociaux) et éditrice de la plateforme MyRankingMetrics (crawler et audit SEO en ligne).

Article (Soft 404 : les pages d'erreurs avec un code HTTP 200) publié par WebRankInfo dans la rubrique Techniques de référencement. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

5 commentaires

  • Auto Dispo a dit le

    Une fonctionnalité intéressante qui m'a permis de me rendre compte qu'un module appelé depuis un site extérieur ne fonctionnait plus. De vrais pages de contenu renvoyait un code 200, mais une erreur 404 pour le module. Google les a classées dans en "Soft 404", j'ai pu corriger le tir.
    Merci qui ? :)

  • johann NGUELET a dit le

    Bonjour,

    J'ai une question, j'avais un service de personnalisation au sein du e-commerce pour lequel je travail ( environ 60% de mes pages) de faible qualité mise à part 5 landing pages qui me rapportaient énormément de traffic, les 59,80% autres étaient faible en qualité. Lorsque mon patron a voulu supprimer toutes ces pages j'ai redirigé toute ces pages vers 2 pages seulement depuis mon traffic seo a été divisé par 2 et j'ai un nombre incalculable de soft 404. Par contre sur les pays ou les pages n'ont pas été supprimé aucun souci le traffic augmente et à presque doublé.

    Pensez vous que mon traffic a été divisé par 2 à cause d'un nombre important de redirection 301 de pages de faible qualité vers seulement 2 pages ? Pensez vous que google pense que c'est une technique de black hat? j'ai lu cette article" https://www.hallaminternet.com/what-are-soft-404-errors-will-they-affect-rankings/" qui avait un peu le même souci et qui une fois qu'il a enlevé les redirections 301 et a laissé des 404 le traffic à doublé.

    Je compte laisser les redirections des 5 landing pages qui elles ne sont pas en soft 404 et passer en 410 les autres urls de faible qualité quand pensez-vous?

    Merci par avance :)

  • Olivier Duffez a dit le

    Si ces pages supprimées généraient du trafic, c'est logique qu'il ait chuté.
    Si ce n'est pas le cas, de toutes façons il ne faut pas rediriger plein de pages vers une même URL (ou 2) : Google les considère comme des soft 404

  • johann NGUELET a dit le

    Oui elles généraient du trafic plus de la moitié du trafic organic concentrés sur les 5 pages dont je parle plus haut qui elles redirigent vers 5 pages similaires. Du coup vous pensez que si je passe le reste des pages en 410, le trafic va remonter ? car la c'est lal chute libre et elle c'est amorcé le lendemain de la suppression des pages. Vaut mieux indiquer à google des pages 410 pour lui dire que les pages ont été supprimés pour qu'il les désindexe plutôt que de tout rediriger vers 2 pages car c'est considéré comme du spam non?

  • Olivier Duffez a dit le

    désolé, c'est très compliqué sans savoir de quel site on parle (il faudrait poser cette question dans le forum, merci d'avance)
    je ne comprends pas ce qu'il y a d'étonnant à voir le trafic chuter quand on supprime les pages qui le généraient ?

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.

Annonces Google


220 Partages