Annonces Google

Vous êtes ici : Dossiers référencement > Indexation Google

SEO : 27 erreurs qui peuvent désindexer vos pages sans que vous vous en rendiez compte

Par , le 09 mai 2016

Il existe pas mal de cas où vous pouvez faire une erreur avec des instructions noindex ou des URL canoniques. Consultez cet article pour vérifier que ce n'est pas votre cas...

Erreurs SEO indexation

Cet article liste de nombreuses erreurs à éviter pour ne pas faire désindexer des pages sans le vouloir

J'organise ce dossier en 2 parties qui correspondent aux 2 types d'erreur qui peuvent mener à la désindexation d'une page :

Vous allez voir qu'il y a bien plus de possibilités de se tromper que vous l'imaginez... Mais rassurez-vous, j'ai 3 propositions pour vous aider.

Mes 3 propositions pour vous aider

L'audit RM Tech (gratuit et payant)

Si votre site est important pour vos activités en ligne (et votre chiffre d'affaires), les fondamentaux du référencement doivent être en place. A moins d'avoir un temps fou devant vous et un tout petit site, il vous faut un outil pour surveiller tout ça. Et ça tombe bien car celui que j'ai développé chez Ranking Metrics (dont je suis co-fondateur) sait tout repérer !

Vérifiez qu'aucune erreur (noindex, canonique) n'est présente sur votre site : lancez un audit RM Tech

Le webinar (gratuit)

Si vous souhaitez des explications (slides, exemples) et participer à un webinar avec des questions/réponses, sachez que j'en anime un sur les questions de crawl et d'indexation. Concrètement, je présente 3 webinars (conférence vidéo en ligne) dont un sur le thème "Repérez et corrigez vos erreurs d'indexation avec RM Tech".

Participez au webinar ou accédez à son replay : inscrivez-vous (c'est gratuit)

La formation SEO (payante)

Pour aller bien au-delà, apprendre une méthodologie bien rodée, obtenir des réponses à vos questions spécifiques et encore plus, participez à ma formation au référencement naturel !

Envie d'apprendre une bonne méthode SEO ? participez à ma formation

7 erreurs à éviter sur l'instruction robots noindex

L'instruction robots noindex indique aux robots que vous ne souhaitez pas qu'ils indexent la page qui la contient. Elle peut être indiquée par une balise meta robots ou par l'entête HTTP (on parle du code X-Robots-Tag).

Voici les erreurs à éviter avec la meta robots ou X-Robots-Tag (A, B, C sont des URL) :

  1. Vous avez une meta robots noindex ailleurs que dans <head>, par exemple ajoutée par un plugin (défectueux) ou insérée de façon malintentionnée dans les commentaires. Même si Google recommande de mettre la balise meta dans l'entête HTML, en pratique si vous l'avez dans <body> il est probable que Google désindexera votre page.
  2. Vous avez préparé une nouvelle rubrique du site et mis "par sécurité" une robots noindex. A la mise en ligne (en production), vous avez oublié d'enlever ce noindex, si bien que les nouvelles pages ne s'indexent jamais...
  3. Vous traduisez petit à petit votre site, et tant qu'une page n'est pas entièrement traduite, vous mettez du noindex. Si vous ne l'enlevez pas une fois que la page est totalement traduite, elle ne pourra pas s'indexer !
  4. Vous avez un site avec beaucoup de pages de listings (par exemple des annonces immobilières) et concrètement tous ces listings utilisent le script search.php, que ce soit pour lister des annonces correspondant à un critère ou pour les résultats de recherche via un formulaire. Vous savez qu'il ne faut pas faire indexer des pages de résultats de recherche interne (via des champs libres), donc vous avez mis une balise meta robots noindex dans search.php. En faisant comme ça, vos listings classiques ne pourront plus être indexés...
  5. Vous avez lu des conseils pour vaincre l'algo Panda de Google, notamment l'astuce consistant à interdire l'indexation d'une discussion de forum tant qu'il n'y a pas de réponse. Si votre script est mal codé, vous risquez de ne plus avoir aucune page indexée dans votre forum...
  6. A l'inverse, vous souhaitez faire désindexer une page et "pour être sûr que ça marche", vous bloquez à la fois l'indexation (avec une meta robots noindex) mais aussi le crawl (directive Disallow dans le fichier robots.txt). Dans ce cas, Google n'ira pas crawler votre page, si bien qu'il ne pourra pas constater la meta robots noindex et au final, la page restera indexée...
  7. Vous souhaitez désindexer une page et vous ajoutez une balise <meta name="robots" content="no index">. En écrivant "no index" en 2 mots, les moteurs ne considèreront pas que vous souhaitez désindexer la page.

Si vous connaissez d'autres situations, merci de les indiquer dans les commentaires.

Dans le même genre, lisez les horreurs du référencement, un best of de ce qu'il ne faut pas faire en SEO...

Remarque : il existe plusieurs situations où il est justifié de désindexer des pages, par exemple pour nettoyer votre site des contenus de trop faible qualité. Si vous ne savez plus très bien comment désindexer proprement et rapidement des contenus, lisez mon dossier.

20 erreurs à éviter avec l'URL canonique

Il est possible d'indiquer aux moteurs de recherche quelle est l'URL officielle d'une page, celle sous laquelle il faut indexer la page. Dans le jargon du référencement, on appelle ça l'URL canonique.

Comment définir une URL canonique ? Si besoin : lisez mon tuto sur sa syntaxe.

Officiellement pour Google, l'URL canonique définie par le webmaster n'est qu'une indication et pas une obligation. L'aide en ligne parle de "préférence". Mais en pratique, une erreur sur l'URL canonique peut avoir des conséquences désastreuses.

Voici les erreurs à éviter avec l'URL canonique (A, B, C sont des URL) :

  1. une même URL est indiquée comme canonique pour un très grand nombre de pages sur le site (pourtant ayant des contenus différents)
  2. toutes les pages du site indiquent l'URL de la page d'accueil comme URL canonique (c'est l'une des pires erreurs, lisez cet article en anglais à ce sujet)
  3. plusieurs URL canoniques sont indiquées en chaine (A indique B, qui indique C, etc.)
  4. A indique B comme canonique, mais B redirige vers A
  5. A indique B comme canonique, et B indique A comme canonique
  6. aucune URL canonique n'est indiquée pour une page qui est appelée avec différents paramètres d'URL (par exemple utm_source et utm_medium, ou "tri", "orderby", etc.)
  7. aucune URL canonique n'est indiquée sur un site mobile non responsive design (par exemple avec m.example.com)
  8. A indique B comme URL canonique, mais B est interdite au crawl (blocage dans le fichier robots.txt)
  9. A indique B comme URL canonique, mais B est inaccessible (en erreur 404, 410, 403, etc.)
  10. A indique B comme URL canonique, mais B est interdite d'indexation (par exemple avec une meta robots noindex)
  11. Une page définit 2 URL canoniques différentes : une via l'entête HTTP et l'autre via la balis <link rel=canonical>
  12. Sur une série de pages liées à de la pagination, les pages 2 et suivantes indiquent celle de la page 1 comme URL canonique (il faut utiliser rel=next et rel=prev ou envisager de ne pas faire indexer les pages 2 et suivantes)
  13. L'URL réelle et l'URL canonique indiquée diffèrent par un slash à la fin (présent ou absent). Le célèbre plugin WordPress "Yoast SEO" fait cette erreur sur la page d'accueil.
  14. l'URL canonique indique http://www.example.com/index.html pour la page d'accueil alors que celle-ci s'affiche sous la forme http://www.example.com/ (ou l'inverse)
  15. L'URL canonique est indiquée en relatif et non pas en absolu (commence par http), ce qui n'est pas un problème en soi, mais parfois l'URL reconstituée se révèle différente ou erronée
  16. L'URL canonique spécifie "http" alors que l'URL réelle est en "https" (ou l'inverse)
  17. L'URL réelle utilise une ou des majuscules mais pas l'URL canonique (ou l'inverse)
  18. L'URL réelle utilise la réécriture d'URL mais pas l'URL canonique (ou l'inverse)
  19. L'URL canonique correspond systématiquement à l'URL consultée, sans vérification, quel que soit ce qu'on ajoute dans l'URL
  20. L'URL canonique fait référence à la préprod ou tout environnement de test ou de recette, alors que la page est désormais en prod

Si vous connaissez d'autres situations, merci de les indiquer dans les commentaires.

Si vous ne l'avez pas déjà lu, lisez mon autre article Les pires erreurs d'URL canonique.

Webinar SEO : crawl et indexation

Inscrivez-vous aux webinaires gratuits pour repérer et corriger vos problèmes SEO de crawl et d'indexation !

N'oubliez pas mon webinar sur les problèmes de crawl et d'indexation : inscrivez-vous (c'est gratuit)

Des questions ou commentaires ?

J'espère que ce dossier est aussi complet que vous le souhaitiez, en tout cas n'hésitez pas à laisser un message dans les commentaires.

Image d'illustration : Shutterstock, sous licence

Cet article vous a-t-il plu ?
Note : 5.0 (1 vote)
Cliquez pour voter !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC,...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le SEO (+300.000 membres, 1,5 million de posts). Il est aussi cofondateur de Ranking Metrics, leader des formations webmarketing en France (SEO, AdWords, Analytics, réseaux sociaux) et éditrice de la plateforme MyRankingMetrics (crawler et audit SEO en ligne).

Article (27 erreurs à éviter sur les meta noindex et URL canoniques (SEO)) publié par WebRankInfo dans la rubrique Indexation Google. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

11 commentaires

  • Awily a dit le

    Merci pour ce récap,

    "Sur une série de pages liées à de la pagination, les pages 2 et suivantes indiquent celle de la page 1 comme URL canonique (il faut utiliser rel=next et rel=prev ou envisager de ne pas faire indexer les pages 2 et suivantes)"

    Pourquoi est-il préférable d'interdire l'indexation des pages suivantes Vs "canoniser" la première page de la liste ? De mon côté, j'ai fait différents tests sur la pagination (rel next prev / désindexation, canonisation...), mais je n'ai jamais vu apparaître de changements notables sur le trafic organique

  • Olivier Duffez a dit le

    Google a expliqué que l'erreur n°1 avec l'URL canonique consiste à mettre en canonique l'URL de la page 1 pour une série de pages
    "Jamais vu de changements" : logique, ces pages n'ont aucun intérêt pour le SEO, elles génèrent très peu de visites

  • Awily a dit le

    OK, merci pour le lien

  • Malvina85 a dit le

    Bonjour,
    Concernant les Urls canonique pour les pages de listes avec pagination, j'ai chaque page avec sa propre Url canonique, et personnellement elles ont un certain impact au niveau du référencement puisqu'elles génèrent 20% du trafic d'entrée sur le site

  • Olivier Duffez a dit le

    @Malvina85 : je suis curieux de savoir de quel site il s'agit, et quelle méthode a été utilisée pour calculer ce 20%. Je ne l'ai jamais vu dépasser 1%...

  • thil a dit le

    Bonjour Olivier

    Je rajouterai un point auquel je viens d'être confronté et qui m'a coûté de nombreuses heures de prise de tête : vérifier que votre CDN ne bloque pas les IPs étrangères, notamment celles des USA !!! GSC me signalait qu'il obtenait une erreur à la lecture de mon robots.txt alors qu'il était bien présent. J'ai découvert au bout de pas mal de recherches (euphémisme !) un problème de CDN sur les mutualisés OVH (qui concerne pas mal de monde donc !). En fait mon site n'était tout simplement pas accessible aux USA, précisément d'où vient googlebot !
    J'ai fait une requête auprès d'OVH et le problème sera (je l'espère) bientôt réglé.

    Merci pour le blog et les conseils.

  • Olivier Duffez a dit le

    merci thil pour ce retour d'expérience. Ce CDN est-il une option de l'hébergement choisi, ou bien imposé à tous ceux sur mutualisés ?

  • Flipou a dit le

    Bonjour,

    En 2012 une Agence nous a en partie, mal implanter la balise canonique :

    erreur 12 : "Sur une série de pages liées à de la pagination, les pages 2 et suivantes indiquent celle de la page 1 comme URL canonique (il faut utiliser rel=next et rel=prev ou envisager de ne pas faire indexer les pages 2 et suivantes).

    En page 2 et suivantes en nous avons l'URL canonique vers la page 1 en plus des balises Next et Prev, "ce que Google déconseil aujourd'hui". Mais notre référencement est assez correct et craignons de corriger cela.

    Qu'en pensez-vous ?

    Merci à vous !

    Cdt,

    Franck

  • Olivier Duffez a dit le

    @Flipou : je n'ai pas tout compris, notamment la phrase "une Agence nous a en partie, mal implanter la balise canonique". Je remarque au passage que l'info date de 2012 ?
    Comment vérifiez-vous que "le référencement est assez correct" ? Avez-vous mesuré le trafic généré par ces pages 2 et suivantes ?

  • Flipou a dit le

    #Olivier, merci de votre retour, les pages paginées génèrent bien du trafic, cependant en plus de contenir les Balises "Next" et "prev" elles ont une URL canonique vers la page 1. et nous nous demandions du faite que l'URL Canonique n'est pas nécessaire dans ce cas de figure, si cela n'était pas préjudiciable ?

  • Olivier Duffez a dit le

    @Flipou : si ces pages sont indexées, c'est que Google ne suit pas les recommandations de vos balises d'URL canonique.
    Google recommande de ne pas en mettre vers la page 1, je ne peux pas le dire autrement ;-)

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.

Annonces Google


412 Partages