Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Profitez des erreurs 404 pour obtenir des backlinks !

Ne ratez surtout pas cette technique très simple qui permet gratuitement de rendre actifs des backlinks qui pour l'instant n'aident pas votre référencement. Explications...

Article mis à jour le 04/10/2016 (ajout partie liens internes), publié initialement le 08/12/2008

Identifiez les pages qui vous génèrent des erreurs 404

Backlinks et erreurs 404

Sans que vous le sachiez, il y a régulièrement des gens qui font des liens spontanés vers votre site, mais qui malheureusement font une erreur dans l'URL.

  • Quand les internautes cliquent sur ce lien, ils arrivent bien entendu sur votre page d'erreur 404 (que vous avez j'espère personnalisée).
  • Quand les robots des moteurs de recherches tombent sur ce lien, ils arrivent eux aussi sur cette erreur 404, si bien que le lien n'aidera pas la page prévue à être mieux positionnée. Si ce lien provient d'un site prestigieux, c'est encore plus dommage car il aurait pu contribuer à améliorer la notoriété de votre site.

A moins d'éplucher consciencieusement et régulièrement vos logs ou vos rapports d'erreurs, vous n'êtes sans doute jamais au courant. Mais n'oubliez pas que Google est votre ami :-) Allez dans votre compte Google Search Console, rubrique "Exploration > Erreurs d'exploration" et consultez la liste des erreurs 404 (Introuvable).

Liste des erreurs 404
Liste des erreurs 404 dans Google Search Console

Pour chaque URL ayant provoqué une erreur 404, Google vous propose une liste de pages web qui font (ou ont fait un jour) un lien vers cette fameuse URL. Il peut s'agir de pages de votre propre site (dans ce cas ce sera simple à corriger) ou bien de pages d'autres sites (dans ce cas vous devriez contacter le site en question afin qu'il corrige son lien).

Vous pouvez consulter ces informations directement dans l'interface de Google Search Console (ça ouvre pas mal de fenêtres...) ou télécharger toutes les données dans un fichier CSV pour une analyse plus intensive et sans doute plus efficace. Le problème est que ce fichier ne liste pas les URL (internes ou externes) qui vous ont fait les liens.

Backlinks internes ou externes

Si le lien est interne

Si c'est sur votre propre site qu'un lien pointe vers une page en 404, ça dégrade l'expérience utilisateur et réduit légèrement l'efficacité de votre référencement. Vous avez donc tout intérêt à :

  • vérifier régulièrement que vous n'avez aucun lien cassé
  • savoir quelles URL sont en erreur 404
  • mais surtout sur quelles pages se trouvent ces liens cassés

Comprenez bien qu'à chaque fois que vous corrigez ces liens cassés en interne, vous améliorez doublement votre site (pour l'internaute et pour le SEO) !

Pour savoir si votre site est concerné : lancez un audit gratuit RM Tech !

RM Tech est l'outil d'audit SEO que j'ai développé chez My Ranking Metrics (dont je suis cofondateur). Il s'agit d'un outil complet comprenant un crawler (qui fonctionne presque comme Googlebot) et un analyseur (qui repère les problèmes et vous priorise les choses à faire).

La version gratuite vous dira si vous avez des problèmes, avec des explications ultra détaillées. La version payante vous dira quelles pages ont ces problèmes.

Voici un exemple pour un site qui a beaucoup d'erreurs dans ses liens internes :

Erreurs 404 dans RM Tech
Le rapport d'audit RM Tech indique les erreurs 404 avec la liste des pages faisant ces liens cassés

Si le lien vient d'un autre site

Si jamais vous trouvez un lien erroné sur un site prestigieux, pour lequel vous pensez qu'il devrait largement contribuer à améliorer votre référencement, et que malheureusement vous n'arrivez pas à faire modifier le lien, alors je vous conseille de mettre en place une règle de réécriture spécifique qui va rediriger (en 301) vers la bonne URL.

Le cas classique est un lien issu d'un forum ou d'un blog, qui a transformé automatiquement un texte en lien mais qui a inclus une virgule ou une parenthèse fermante dans l'URL. Voici un exemple de règle d'URL Rewriting à appliquer dans ce cas :

RewriteRule ^exemple.html)$     /exemple.html [R=301,L]

Cet exemple redirige la mauvaise URL (contenant une parenthèse fermante) vers la bonne, transformant ainsi le lien cassé en bon backlink.

Besoin d'aide pour faire de l'URL Rewriting ? Réussir ses règles de réécriture d'URL

L'erreur à ne pas faire : rediriger toutes les 404

En lisant cet article, vous vous demandez sans doute s'il ne serait pas plus simple de rediriger 100% des URL qui renvoient un code 404, par exemple vers la page d'accueil.

C'est une erreur classique que je vous déconseille ! C'est normal pour un serveur de renvoyer un code 404 pour une URL qui n'existe pas. Il ne doit pas y avoir dans ce cas de redirection, qu'elle soit 301 ou 302.

Partagez l'info sur Twitter :

Il ne faut surtout pas rediriger (code 301 ou autre) les erreurs 404, même vers la page d'accueil !Click to Tweet

Selon les cas, vous utiliserez une règle de réécriture pour faire la redirection, ou bien une redirection dans un script côté serveur (par exemple en PHP).

Si le lien pointe vers une page n'ayant jamais existé

En creusant avec cet outil, j'ai rencontré des pages (externes) qui font des liens vers des pages de WebRankInfo qui n'ont pourtant jamais existé. Vous imaginez bien que je me suis gardé de prévenir les sites qui m'offraient ces liens ! Pour chacun de ces cas, j'ai déterminé la page de mon site la plus pertinente, et j'ai défini une règle de réécriture qui redirige en 301 la page qui n'a jamais existé mais qui reçoit un backlink vers la page la plus pertinente de mon site. Ce n'est pas grand chose, mais qui refuserait un backlink gratuit dans un monde concurrentiel ?

Que faire des erreurs 404 pour des très vieilles pages ?

Vous remarquez peut-être en utilisant cet outil qu'il indique des URL de pages censées provoquer une 404 mais qui n'existent plus depuis longtemps (et qui faisaient des liens vers des pages qui ont elles aussi peut-être aussi disparu).

S'il s'agit de pages internes, posez-vous la question de votre gestion actuelle des pages qui sont supprimées. Par exemple si vous avez un site de petites annonces, que faites-vous des pages d'annonces une fois qu'elles ont expiré ? Même chose avec un site de vente en ligne pour la gestion des produits retirés de la vente.

Nous avons aussi une très bonne discussion à ce sujet dans le forum : Pages supprimées : faut-il un 404, un 410 ou un 301 ?.

Et si on allait plus loin ?

La méthode décrite ici repose sur l'utilisation de Google Search Console. En gros, vous ne trouverez ici que les URL 404 que Google vous indique, mais rien ne dit que la liste est exhaustive. Vous devriez donc repérer 100% des cas, par exemple en analysant vos logs ou vos rapports Google Analytics (analyse croisée des pages d'erreur et des sites référents).

N'oubliez pas non plus de prendre en compte les pages de votre site assimilées à des erreurs soft 404 par Google.

Si vous ne savez pas faire tout ça, je peux m'en occuper pour vous : contactez-moi pour obtenir un devis

Et vous ?

Je ne vous cache pas que ça fait des années que j'utilise cette technique de netlinking sur WebRankInfo. Mais avec cette nouvelle fonctionnalité dans GSC, c'est encore plus simple. Et vous, comment utilisez-vous cette fonctionnalité ? Avez-vous des astuces que vous accepteriez de partager avec la communauté WebRankInfo ? On en discute dans le forum : obtenir des backlinks par l'analyse des erreurs 404.

NB : si 404, 410 ou 301 ne signifie pas grand chose pour vous, je vous conseille de lire mon tutoriel sur les redirections et de consulter la liste des codes HTTP.

Crédit image : © kotoyamagami - Fotolia.com

Cet article vous a-t-il plu ?

Note : 3.4 (8 votes)
Cliquez pour voter !

37 commentaires

folamour

Excellente astuce, merci à vous tous pour vos inputs, et a olivier d'avoir partagé le tips.

Nicolas

@Olivier : Comme je n'ai que des 404 je n'étais pas certain que les 410 apparaissaient aussi. Merci pour cette précision.

Dans "Liens vers votre site" il y a uniquement les liens vers les pages qui répondent favorablement (codes 304 et 200) ?

Olivier Duffez

@Nicolas : oui, j'ai l'impression qu'il s'agit de pages qui répondent OK, mais je n'en ai pas la certitude

Olivier Duffez

Oui Nicolas, il me semble que Google ne liste que les pages qui répondent correctement

Nicolas

@Olivier : merci pour cette précision.

J'utilise Myrankingmetrics pour vérifier les liens internes ;-)

Concernant les liens externes est-ce que tu penses que Google Search Console affiche aussi les liens externes vers des pages qui sont de types 4xx (410 par exemple) ?

Olivier Duffez

@Nicolas : dans le rapport des erreurs 404 ou 410, Google liste aussi bien des URL internes que externes comme source de liens. Cela répond-il à la question ?

Supermaury

@Olivier Duffez : merci pour cette précision. Etrangement, j'ai toujours eu cet onglet (sauf depuis le 4 octobre dernier, date à laquelle il a disparu) avec 0 erreur serveur / 0 introuvable / 0 bloqué. Bonne fin de journée.

Nicolas

@Olivier

Effectivement j'ai oublié de préciser "une fois désindexée".

Ce que je veux dire c'est que Google peut tenter de crawler régulièrement une page qui n'existe plus depuis plusieurs années. Il peut dans certains cas être intéressant de la supprimer définitivement avec une erreur 410.

D'après toi au pire combien il faut de temps pour désindexer une page avec une erreur 410 ?

Olivier Duffez

@Nicolas : ça semble dépendre de la durée pendant laquelle cette page a existé et a été indexé, et de la masse des liens qui restent pointés vers elle (évidemment, il faut s'assurer à l'aide d'un crawler qu'aucun lien interne ne pointe vers elle, et qu'elle n'est plus listée dans des sitemaps)

Nicolas

Bonjour,

Lorsqu'une page n'existe plus il m'arrive de la mettre en erreur 410 (page supprimée qui n'a pas de redirection) dans la configuration Nginx du domaine concerné.

Pour cela il faut que la page (ancienne page on va dire) :
- soit très spécifique et elle n'a pas de pages "similaires".
- n'ait pas de BL externes.

Dans ce cas elle n'a pu lieu d'exister, j'économise ainsi un crawl ^^

Olivier Duffez

@Nicolas : en effet dans ce cas la 410 peut fonctionner (c'est encore mieux de l'accompagner d'un message personnalisé adapté à la page, à destination de l'internaute). Mais tant que Google ne la désindexe pas (ça peut prendre un peu de temps), il va continuer de la crawler, donc je ne suis pas 100% d'accord avec ta dernière remarque.

Supermaury

Bonjour Olivier. Pour information, l'onglet "Téléphone multimédia" a disparu depuis ce matin de la rubrique "Erreur d'exploration". Je n'avais d'ailleurs jamais bien saisi la différence avec l'onglet "Smartphone". Bonne fin de journée.

Olivier Duffez

@Supermaury : un onglet n'est présent pour une propriété Search Console que si en ce moment il y a des erreurs à lister pour l'onglet concerné. donc ça peut disparaitre puis revenir. A moins que j'aie raté un épisode précis sur l'onglet "Téléphone multimédia" mais je n'ai rien vu passer à ce niveau.

Steph

Il n'y a pas de rubrique "diagnostic" dans Google Webmaster Tools ou bien l'article n'est plus à jour.

Olivier Duffez

En effet Steph, j'ai mis à jour l'article, l'emplacement est désormais Etat de santé > Erreurs d'exploration

blog-fender

D'ailleurs, concernant les backlinks on se demande d'ailleurs comment faire sur ce blog pour pouvoir laisser un commentaire intéressant mais qui, comme beaucoup d'autres déposé sur ce site, dispose d'un lien vers le site web du redacteur? je ne vois que le champs de saisie nom pseudo et adresse email mais pas de champs pour laisser l'adresse de son site. Comment ont bien pu faire ceux qui comme Axxion ont laissé un lien au dessus de leur commentaire avec un "rel="external" ? Est-ce une prestation de webrankinfo?

Olivier Duffez

pendant longtemps j'ai laissé des liens dans les commentaires, mais j'ai capitulé tellement les spammeurs me faisaient perdre du temps
je considère qu'on n'a pas besoin de mettre un lien vers son site pour discuter d'un sujet...

Guopei

C'est vrai qu'on ne pense pas toujours à modifier les pages 404 !! Et moi le premier, il va falloir que je mette en pratique ces bons conseils, je suis sur que c'est bénéfique aussi! Vous avez des chiffres là dessus ou c'est juste du vécu ?

mxh

C'est intéressant

Pensez aussi à faire un tour sur l'outil Bing Webmaster Tool, je le trouve bien mieux outillé que GWT (pour une fois)

+

Tutela

Ok pour la technique, mais sur mon htaccess, je suis vite arrivé à 600 lignes, après ça fait long

Olivier Duffez

C'est pas normal d'avoir besoin de 600 lignes...

axxion

Bonjour à tous,

J'ai lu ce post avec attention. J'ai un souci que je n'arrive ou je ne comprends pas la source du problème.

Webmaster tools de Google m'annonce un rapport ou toutes mes pages (sous-catégories de site sont passées en 404).

Je n'en connais pas la raison, voici l'exemple d'une de ces pages http://www.e-devis.ch/vie-pratique-demenagement.html

Pourriez-vous m'orienter sur la cause de ces pages non indexées et affichées en 404.

Merci pour vos retours
David

patarsort

Bonjour à tous,

je suis un peu largué !

Patrick

Visiter Rome

Le titre de cet article n'est pas si trompeur que ça: il s'agit en effet de reconstruction d'un backlink depuis un lien brisé (intentionnellement ou non) donc il s'agit bien d'obtention, et encore plus avec la règle de réécriture on va vraiment se le reprendre de droit, il sera bien mérité :-)

Lionel

Bonsoir

Effectivement le titre est légèrement érroné. Je m'attendais à un autre article du type "comment obtenir des backlinks ?". Ceci étant, l'article reste productif.

amicalement

Percu

Bien intéressant effectivement, merci!

alfio51

C’est vrai que cet article est interessant, mais le titre est un peu trompeur: il ne s’agit pas vraiment d’obtenir des backlinks, mais plutot de les optimiser

Pierre

Très intéressant à savoir. merci.

Olivier Duffez

@farang: pas tout à fait ! Un lien qui mène à une 404 n'est pas un lien, en tout cas pas exploitable du tout. Une fois corrigé, cela devient un lien.

farang

C'est vrai que cet article est interessant, mais le titre est un peu trompeur: il ne s'agit pas vraiment d'obtenir des backlinks, mais plutot de les optimiser....

Sooweb

C'est vrai que la fonctionnalité des liens erronés dans GWT est excellente ! D'ailleurs, j'ai vu aussi dernierement que Google avait ajouté une modif pour augmenter et ou baisser le taux du passage du bot !

ELYOTHERM

Très intéressant cet article, je viens encore d'apprendre des choses :)
Merci

Franck

Le mieux est encore (en php) de personnaliser sa page 404 de sorte qu'à chaque fois qu'elle s'affiche elle envoie également un mail avec l'URL de la page demandée, le referrer (on peut rajouter l'IP, le navigateur etc...). Cela permet de traiter en temps réel les 404

Seb

Google est sensible à ce genre de choses c'est clair. Comme par exemple il n'apprécie pas les sites conçus de manière à ne pas retourner d'erreurs 404, surement parce que çà ressemble aux générateurs automatique de pages...

TOMHTML

Je vois qu'on utilise les mêmes techniques Olivier ;) Pour l'un des sites pour lequel j'ai bossé, en optimisant à fond les ressources de cet outil j'ai vu "étrangement" mon nombre de visiteurs en provenance de Google multiplié par 3, et mon nombre de visiteurs en provenance de sites tiers multiplié par 2 ;)

Olivier Duffez

Oui j'ai vu cette liste (en anglais, merci pour ta traduc) et j'ai un petit article là-dessus à terminer...

Stratégies de Liens

Hello, comme c'est un des 69 points de la liste que j'ai publié, je mets le lien au cas où çà intéresserait (voir lien sur mon pseudo).

Les commentaires sont fermés