bazar suivi liens internes nofollow
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Quel impact si Google suit les liens nofollow internes ?

Depuis le 1er mars 2020, Google peut décider de suivre des liens nofollow. En interne, ça peut mettre le bazar (masse noire) si vous ne faites pas attention. Découvrez comment vérifier si cela impacte le SEO de votre site et les solutions à adopter.

Depuis ce 1er mars 2020, Google a changé sa façon de tenir compte du nofollow en ce qui concerne le crawl et l'indexation. Détrompez-vous : ça ne concerne pas que les backlinks !

Même si ça ne devrait rien changer pour certains sites, ça pourrait avoir des conséquences importantes pour d'autres. En résumé :

Google pourrait se mettre à crawler et même indexer des pages que vous ne souhaitez pas qu'il crawle ou indexe. Risque de masse noire...

On parle de #NofollowHintUpdate ou de #Nofollow ou plus précisément #CrawlIndexingUpdate...

Après des explications sur ce problème, j'explique comment savoir si vous êtes concerné (et à quel point) en quelques clics, sans analyse de logs ou autre technique "avancée". J'indique des exemples de sites concernés, fournis des solutions et termine par des questions-réponses.

En quoi est-ce un problème ?

Ce qui a changé avec le nofollow

Pendant de nombreuses années, un lien nofollow n'était pas suivi et ne comptait pas comme apport de popularité (PageRank). En gros, c'était comme s'il n'y avait pas de lien dans la page.

Si une page A fait un lien nofollow vers une page B, alors Google n'utilisait pas ce lien dans son processus de crawl. Certains pensaient que la page B ne serait donc jamais crawlée (et indexée). Mais il suffit d'un autre lien (follow) vers B, ou une présence dans un sitemap, etc. pour que B soit crawlée (et peut-être indexée).

Remarque : je ne recommande pas le nofollow pour les liens internes.

Le nofollow n'est plus qu'un "hint"

Voici ce que Danny Sullivan et Gary Illyes ont annoncé :

Pour les besoins du crawl et de l'indexation, le nofollow deviendra un indice à partir du 1er mars 2020. Ceux qui dépendent du nofollow uniquement pour bloquer l'indexation d'une page (ce qui n'a jamais été recommandé) devraient utiliser l'un des mécanismes beaucoup plus robustes répertoriés sur notre page d'aide Apprendre à bloquer les URL.

Danny Sullivan et Gary Illyes, blog officiel de Google

Avec ce changement de Google concernant le nofollow, beaucoup de SEO ont pensé aux backlinks, mais il y a désormais aussi un impact sur le crawl et l'indexation de nos propres pages.

En gros, l'algo de Google va décider pour chaque lien s'il respecte ou pas le nofollow. C'est pratique n'est-ce pas ? De notre côté, nous ne pouvons plus savoir. 🥺

Qu'est-ce qui change avec le suivi du nofollow en interne ?

En résumé :

En voyant un lien nofollow de A vers B, Google peut décider de crawler B alors qu'il ne le faisait pas avant. Et si la page B n'est pas interdite d'indexation, il peut aussi décider de l'indexer.

Je vois donc 2 problèmes potentiels :

1 des URL sont crawlées alors qu'elles ne l'étaient pas avant.

  • S'il y en a très peu ça va, mais sinon ça peut créer des problèmes avec votre budget de crawl.
  • Si ces URL (non prévues au crawl) ne sont pas en cache, votre serveur pourrait être plus sollicité que prévu... et donc votre site moins rapide.

2 des URL sont indexées (ou indexables) alors qu'elles ne l'étaient pas avant.

  • Si les pages concernées sont de très bonne qualité ça va, sinon ça dégrade la qualité globale de votre site, telle que les algos de Google cherchent à l'évaluer depuis Panda (2011).
  • Si justement ces pages n'étaient pas prévues pour être indexées, c'est sans doute qu'elles ne sont pas utiles au SEO, donc de faible qualité. Bref, des candidates à devenir zombies... 🧟‍♀️🧟‍♂️
  • Ces URL indexables pourraient créer ou amplifier vos problèmes de contenus dupliqués, ou générer de la cannibalisation entre vos pages.
  • Vous devrez désindexer toutes ces URL : c'est un travail ingrat qui peut se révéler être difficile et coûteux en temps, surtout si les mauvaises URL sont mélangées avec les bonnes...

Google ne peut-il pas faire son job correctement ?

Evidemment, on peut supposer qu'il s'agit de cas "extrêmes", que "ça n'arrivera pas pour mon site", que "Google fera bien son job", qu'il n'ira pas crawler n'importe quoi dans les liens nofollow.

Sans doute dans la majorité des cas, mais comment savoir ? Google décide de parfois d'en tenir compte, parfois pas, sans prévenir ni en amont ni en aval (rien dans la search console).

Comme vous je suppose, j'ai souvent rencontré des problèmes pénibles et parfois des incohérences chez Google, notamment dans les rapports de la Search Console :

  • Page en double : Google n'a pas choisi la même URL canonique que l'utilisateur
  • Page en double : l'URL envoyée n'a pas été sélectionnée comme URL canonique
  • Page en double sans URL canonique sélectionnée par l'utilisateur
  • Autre page avec balise canonique correcte
  • Indexée malgré le blocage par le fichier robots.txt

Je cherche ici juste à vous prévenir : si vous ne maîtrisez pas votre utilisation du nofollow dans les liens internes, les problèmes de ce type pourraient augmenter.

💡 J'ai donc décidé d'adapter mon outil RM Tech d'audit SEO, afin que chacun puisse savoir très rapidement et simplement s'il est impacté (avec les infos pour corriger le problème si besoin).

Comment savoir si je suis concerné ?

Combien d'URL à crawler en + et combien indexables ?

Si vous êtes concerné, vous avez 2 métriques à connaître, pour 2 aspects :

  • Crawl : combien ai-je d'URL supplémentaires sur mon site, pouvant être crawlées ?
  • Indexation : combien ai-je d'URL supplémentaires sur mon site, pouvant être indexées ?

1 case à cocher suffit dans RM Tech

Dans RM Tech, il suffit d'activer l'analyse avec une case à cocher (option dans les paramètres avancés) :

Suivre les liens internes nofollow dans RM Tech
Option de suivi des liens internes nofollow dans RM Tech

Ensuite, le rapport vous indique les résultats. Evidemment, les captures ci-dessous ne sont qu'une toute petite partie du rapport d'audit fourni, voyez ici un exemple anonymisé.

Cas n°1 : vous n'êtes pas concerné

Aucune URL trouvée par liens nofollow
Pour cet audit, RM Tech n'a identifié aucune URL trouvable (uniquement) par liens nofollow

Cas n°2 : vous êtes concerné mais sans risque d'indexation de nouvelles URL

Aucune URL indexable trouvée par liens nofollow
Pour cet audit, RM Tech n'a identifié aucune URL indexable parmi celles qui sont trouvables (uniquement) par liens nofollow

Cas n°3 : vous êtes concerné aussi bien pour le crawl que pour l'indexation

URL indexables trouvées par liens nofollow
Pour cet audit, RM Tech a identifié des URL indexables parmi celles qui sont trouvables (uniquement) par liens nofollow

Si vous êtes concerné, l'annexe vous fournit tous les détails des URL concernées :

  • URL
  • Indexable ? (oui/non)
  • QualityRisk (indice de manque de qualité, de 0 à 100)
  • Type MIME
  • Title
  • Meta description
  • Balise d'URL canonique
  • URL canonique via en-tête HTTP
  • Meta robots
  • En-tête HTTP X-Robots-Tag
  • Temps de téléchargement (ms)
  • Poids du code HTML brut (Ko)
  • Code HTML analysé en entier
  • Profondeur
  • Nb de liens entrants internes nofollow

Bien entendu, pour vous aider à comprendre la cause, une autre annexe liste toutes les pages faisant ces liens nofollow.

Cette option est disponible dans la version complète de RM Tech (payante).

Envie de tester pour un site ? Lancez votre audit RM Tech

N'oubliez pas de cocher la case dans les paramètres avancés, car par défaut l'option n'est pas activée. Pensez aussi à prévoir un nombre suffisant pour le "nombre maximal d'URL à explorer", car il pourrait y en avoir plus que d'habitude.

Quels sites sont concernés ?

Tous les types de sites sont concernés : ecommerce, blogs, actualités, petites annonces, forum, etc. Bien entendu, les sites tout petits ne devraient pas avoir de soucis.

Idem, tous les CMS sont concernés, ainsi que les sites sans CMS.

Pour vous montrer que ça concerne beaucoup de monde, voici quelques exemples variés trouvés avec mon outil RM Tech :

  • doctissimo.fr
  • manomano.fr
  • commentcamarche.net
  • jeumeconstruis.fr
  • mielbio.fr
Sur ce post LinkedIn, je donne en bonus les principaux cas de figure qui génèrent des problèmes. Il suffit de me le demander !

Comment régler le problème (ou l'empêcher) ?

Généralement, on conseille de ne pas utiliser de nofollow dans les liens internes. Je suis d'accord ! Sauf éventuellement dans le cas précis où on fait un lien vers une URL qui ne doit pas être crawlée, ou bien pas indexée. Mais uniquement à condition d'utiliser également les bons mécanismes, que je rappelle ci-dessous.

Comment empêcher le crawl ?

Si vous ne souhaitez pas que Google crawle une URL B alors qu'une URL A lui fait un lien, ajoutez une instruction Disallow pour bloquer B dans le fichier robots.txt concerné. Le blocage du crawl se fait avec le fichier robots.txt qui est prévu pour ça.

👉 A savoir : les outils de ma plateforme My Ranking Metrics respectent tous à la lettre les directives de vos fichiers robots.txt.

Besoin d'un dossier complet ? Guide du fichier robots.txt

Une autre solution est l'obfuscation de lien. Attention, ce n'est pas une méthode "officielle", disons qu'elle peut être considérée comme à la limite des consignes de Google. Le principe est de faire en sorte que techniquement, Googlebot ne voie pas de balise <a href>, ou bien que l'attribut href soit vide ou avec une valeur encodée (par exemple en base64). Pour éviter que ce soit considéré comme du cloaking (interdit par les moteurs), l'obfuscation doit être en place quel que soit le user-agent.

Comment empêcher l'indexation ?

Il faut utiliser une balise meta robots (avec la valeur noindex ou éventuellement none), ou bien l'entête HTTP X-Robots-Tag (ce qui peut servir pour des documents non HTML, par exemple des PDF).

Besoin d'un dossier complet ? Comment empêcher l'indexation ou désindexer

Vous pouvez éventuellement utiliser l'URL canonique, mais c'est uniquement dans des cas précis (le contenu des différentes pages doit être quasi identique) et Google ne les respecte pas dans 100% des cas (ce n'est qu'un indice).

Questions / réponses "Nofollow as a hint"

Voici quelques points supplémentaires à savoir...

🔗 Quel est l'impact du Nofollow Update sur mon positionnement Google ?

Difficile à dire... A priori ça devrait être très faible, à en croire les déclarations de Google. Par contre, il y a un réel risque de "bazar" dans les URL internes que Google pourrait se mettre à crawler et indexer (masse noire). D'où l'idée de le vérifier avec un outil spécialisé.

🔁 Si Google suit le nofollow, impact sur liens internes ou externes ?

Il est possible que Google tienne compte d'un lien externe sortant (backlink) pourtant en nofollow mais c'est difficile de l'anticiper et de le vérifier.
Par contre, pour les liens internes, c'est possible d'anticiper (très facilement avec RM Tech). Mieux vaut tester en amont et corriger si besoin qu'avoir à corriger après coup...

🤪 Que se passe-t-il avec un lien nofollow vers une URL non canonique ?

L'URL canonique est déjà un indice (hint), alors si ça se cumule avec le nofollow en tant qu'indice, ça peut compliquer les choses. En gros, ça peut augmenter le nombre de cas où Google doit décider sous quelle URL il doit indexer l'URL qu'il a crawlée, et ce n'est pas toujours celle qu'on souhaite. RM Tech liste ces cas de figure.

📅 Est-ce vraiment en place chez Google ? Faut-il s'en soucier ?

Google a prévenu longtemps avant que ce serait en place au 1er mars 2020. Leur communication n'est pas claire à ce sujet, mais ça ne change pas grand chose : vous devriez vérifier vos liens internes nofollow. Le nofollow n'a jamais été un bon moyen d'empêcher le crawl (et l'indexation), et ça le sera encore moins. C'est plus efficace pour vous de vérifier en amont, et de corriger si besoin. Votre site, votre patron ou votre client vous remerciera !

🤔 Suite à ce changement du #nofollow, que faut-il vérifier sur son site ?

Il vaut mieux faire un repérage de vos liens internes nofollow. Si vous n'en avez aucun, tant mieux ! Sinon, il vaut mieux vous assurer que non seulement l'URL de destination est bloquée au crawl (Disallow dans le fichier robots.txt) mais aussi qu'elle est interdite d'indexation (balise meta robots noindex).

Cet article vous a-t-il plu ?

Note : 4.7 (10 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

11 commentaires

Kevin de www.smartweb-group.com

A ce jour, c'est l'article le mieux renseigné que j'ai pu lire sur le sujet. Vous répondez bien aux questions que je me posais suite au changement de l'attribut nofollow. Merci pour les exemples et les solutions apportées.

Répondre
Olivier Duffez

Merci Kevin ! J'ai effectivement fait des efforts pour pousser aussi loin que possible la réflexion à ce sujet.

Répondre
vulman

Bonjour
Est-ce que le jus SEO sera transmis même si le lien est nofollow ? Ou cela ne change pas avec cette mise à jour ?
Pour le reste ça fait bien longtemps que google suit ces liens s’il le juge nécessaire... c’est juste peut-être officiel maintenant.
Merci

Répondre
Olivier Duffez

Que ce soit pour la transmission du jus ou pour le crawl (et l'indexation), nofollow est un indice désormais : parfois Google peut décider de faire comme s'il n'y avait pas de nofollow.

Répondre
visaboy

Pardon, mais je ne vois pas le soucis ??? Depuis toujours le nofollow n'a jamais été question de suivre ou pas une page, mais de transmission de jus, donc, je ne comprend pas ? Faut arrêtez de croire ce que certaines personnes disent chez google, surtout ceux qui sont payés pour passer des messages à la con… faut bosser en externe avec des professionnels, il faut arrêter de toujours les écouter, car eux-mêmes ne jouent pas à leurs propres règles, un exemple tout bête pour bien comprendre : lors du passage au responsive il y a qq années, l'algo n'était même pas encore en place alors qu'ils l'ont officiellement expliqué sur leurs chaines + guidelines, c'est juste que le temps de tout mettre en place était tellement long que si il nous l'avait dis maintenant, on s'y serait tous mis que maintenant et non le jour où ils l'ont publiquement mentionné. C'est comme la tv, faut vraiment arrêtez croire tout ce qu'on vous dit bêtement. faut pas suivre ce qu'on nous dit, faut comprendre ce qui se passe et les enjeux, c'est ça qui est important.

Répondre
Olivier Duffez

"Depuis toujours le nofollow n’a jamais été question de suivre ou pas une page, mais de transmission de jus"
Certes, mais justement les choses changent et le SEO doit s'adapter !

Répondre
visaboy

ca change pour ceux qui le savaient pas Oliv alors ;-)… car ceux qui connaissaient déjà, ça ne change rien du tout… oh yeah oh yeah :-) passez à tous une belle journée..

Répondre
Olivier de reussir-mon-ecommerce.fr

Hello Olivier,
Je n'utilise plus le nofollow depuis longtemps, ma réflexion a l'époque a été : "si je ne veux pas que Google suive ce lien c'est surement qu'il ne sert a rien donc autant ne pas le mettre."

Avec cette mise a jour je continu a penser que le nofollow n'a pas grand intérêt et qu'il ne faut mettre que les liens réelement utiles.

Répondre
Olivier Duffez

Tu as bien raison, c'est la bonne façon de voir les choses. Parfois on met du nofollow sur des liens internes qui pointent vers des pages bloquées au référencement (crawl, indexation), une sorte de sécurité, mais ça n'est pas utile tant qu'on a pris les bonnes précautions avec le robots.txt et les meta robots noindex.

Répondre
mimidu91

Bonjour,
Je suis distributeur indépendant Forever et sur la page d'accueil de mon site ils m'oblige de mettre un lien vers leur site et celui de la FVD
Pour remédier a ce problème j'ai mis un lien en nofollow pour indiquer a Google de ne pas référencer ce lien.
Est ce adapté maintenant?
Merci d'avance
Mimi

Répondre
Olivier Duffez

Si c'est un lien imposé, le nofollow me semble légitime. Par contre, ça ne dit pas que Google ne doit pas "référencer ce lien", mais qu'il doit faire comme s'il n'y était pas.

Répondre