Article mis à jour le 31/05/2017 (erreur n°13), publié initialement le 09/12/2014
Pourquoi il faut surveiller l'URL canonique...
Depuis le temps que je fais des audits (2003 !), j'ai rencontré plein de sortes d'erreurs avec l'URL canonique. Je vais vous les résumer ici, ce qui vous évitera de les faire vous aussi...
Peut-être que vous ne vous rendez pas compte du nombre important de cas où un site contient des erreurs au niveau de l'URL canonique (qui n'est pas forcément indiquée via une URL, soit dit en passant).
Rappelez-vous qu'avec RM Tech (produit de la plateforme SEO de Ranking Metrics dont je suis le cofondateur), vous pouvez vérifier si tout est OK à ce niveau sur votre site.
Un rapport d'audit gratuit en ligne vous indiquera si vous avez ou pas des problèmes de pages non indexables (ce qui peut venir de l'URL canonique mais pas seulement). Le rapport payant vous donnera tous les détails pour résoudre tous ces problèmes SEO.
Envie de voir le format d'un rapport payant ? Consultez notre exemple de rapport SEO.
Les erreurs à éviter avec l'URL canonique
Les 6 erreurs les plus fréquentes sur l'URL canonique selon Glenn Gabe :
- une même URL est indiquée comme canonique pour un très grand nombre de pages sur le site (pourtant ayant des contenus différents)
- plusieurs URL canoniques sont indiquées en chaine (A indique B, qui indique C, etc.)
- A indique B comme canonique, mais B redirige vers A
- aucune URL canonique n'est indiquée pour une page qui est appelée avec différents paramètres d'URL (par exemple utm_source et utm_medium, ou "tri", "orderby", etc.)
- aucune URL canonique n'est indiquée sur un site mobile non responsive design (par exemple avec m.example.com)
- A indique B comme URL canonique, mais B est en erreur 404 ou interdit le crawl (disallow dans le robots.txt) ou l'indexation (meta robots noindex)
Pour ma part, j'ajoute les 7 erreurs suivantes :
- L'URL réelle et l'URL canonique indiquée diffèrent par un slash à la fin (présent ou absent)
- L'URL canonique est indiquée en relatif et non pas en absolu (commence par http), ce qui n'est pas un problème en soi, mais parfois l'URL reconstituée se révèle différente ou erronée
- L'URL réelle utilise une ou des majuscules mais pas l'URL canonique (ou l'inverse)
- L'URL réelle utilise la réécriture d'URL mais pas l'URL canonique (ou l'inverse)
- L'URL canonique correspond systématiquement à l'URL consultée, sans vérification, quel que soit ce qu'on ajoute dans l'URL
- A indique B comme canonique, et B indique A comme canonique
- En cas de pagination, sur chaque URL (page 2, page 3, page 4...) on trouve comme URL canonique celle de la page 1. Voyez les autres erreurs courantes avec la pagination en SEO.
Ca n'a l'air de rien, mais à force ça peut vraiment nuire à votre référencement naturel, pas seulement sur Google d'ailleurs.
Autant le vérifier et le corriger si besoin !
Et vous, connaissez-vous d'autres erreurs avec l'URL canonique ?
Bonjour Olivier,
J'ai bien saisi l'ensemble des points énumérés et j'essaie d'en déduire des recos. J'ai quelques doutes concernant :
1) aucune URL canonique n’est indiquée pour une page qui est appelée avec différents paramètres d’URL (par exemple utm_source et utm_medium, ou « tri », « orderby », etc.) : on indique alors simplement comme URL canonique la page principale ?
2) L’URL canonique correspond systématiquement à l’URL consultée, sans vérification, quel que soit ce qu’on ajoute dans l’URL : la cause ? "ce que l'on ajoute dans l'URL" : c.a.d que malgré la modification de l'URL canonique, la page principale reste la même ? Je dois certainement mal interpréter ce point-ci... Merci d'avance !
1) oui, on indique l'URL officielle, donc sans ces paramètres
2) l'URL qui est indiquée comme étant canonique doit être "contrôlée". Il ne faut pas simplement indiquer l'URL qui a été appelée
Bonjour Olivier,
Un prestataire avec qui nous travaillons a créé un site qui existe sous 2 domaines différents (A et B).
Nous lui avons demandé de faire des redirections de type 301 pour éviter d'avoir du duplicate content entre A et B.
Il n'a pas voulu le faire sous prétexte qu'il avait mis sur le 1er site (A) partout des url canoniques qui pointent sur le second site (B)...
Pour moi cela n'est pas terrible non ? Car cela utilise indirectement du budget de crawl non ?
A partir du moment ou c'est tout le site il faut rediriger au niveau du domaine ?
Autre point toutes les pages du site (B) on la balise d'url canonique vers elle-même... ce n'est pas terrible ça non plus ?
Je ne vois pas dans ta liste le : "A" qui pointe vers "B" et "B" qui pointe sur lui-même.
Cordialement
Bonjour
En effet, c'est contre-productif de gérer 1 même site sous 2 noms de domaine, je le déconseille vraiment.
L'URL canonique qui indique elle-même : c'est une bonne pratique (à condition de le faire intelligemment, uniquement si l'URL demandée est bien l'URL canonique). C'est une sorte de prévention des problèmes.
Bonjour,
Ok merci pour ce retour.
Le domaine qui positionne l'url canonique partout est celui de la société prestataire qui à la plateforme (c'est un sous-domaine de leur domaine principal).
Nous allons donc leur demander de créer une redirection de domaine directe.
Merci Olivier
BOnjour,
Dans votre article vous dites "L’URL réelle et l’URL canonique indiquée diffèrent par un slash à la fin (présent ou absent)"
Alors qu'en est-il de la page d'accueil à ce sujet ?
En effet sur WRI la page d'accueil est sans le slash de fin alors qu'elle y est dans la balise "Meta Canonical"
L'URL de ma page d'accueil, à la racine du domaine (ou sous-domaine) inclut bien le slash final. C'est juste à l'affichage que certains navigateurs préfèrent ne pas l'afficher.
Bonjour Olivier,
Je recherche des informations sur l'url canonique et tombe sur votre article particulièrement riche en infos.
J'ai un site sous Joomla et deux composants différents (boutique en ligne et sitemap) font que mes pages produits (boutique) ont maintenant deux fois l'url canonique (la même). Par contre, les articles de joomla ont logiquement une seule url canonique (puisqu'ils ne sont pas des pages produits de la boutique).
Pensez-vous que le fait d'avoir deux fois l'url canonique (identique) est nuisible pour le référencement ?
D'avance merci pour votre feedback et belle journée à vous ! :-)
je ne pense pas que ce soit un pb
Bonjour En cas de pagination, sur chaque URL (page 2, page 3, page 4…) on trouve comme URL canonique celle de la page 1..... normalement on doit faire quoi ? Merci
Pour la pagination, il ne faut pas indiquer l'URL de la page 1 comme URL canonique ! Il faut indiquer l'URL de la pagination (elle-même) et compléter par des déclarations link rel=next et rel=prev comme indiqué dans les spécs de Google.
Bonjour Olivier, pouvez vous m'expliquer s'il vous plait pourquoi on trouve sur les pages de site wordpress , par exomple A indique A comme url canonique ? Merci
ça sert en prévention de problèmes (de contenus dupliqués par exemple).
Le webmaster pense que sa page sera toujours consultée à l'URL A, mais en fait il peut y avoir des cas où c'est autre chose. La cause peut être interne ou externe. Par exemple, des paramètres sont rajoutés à la fin de l'URL mais ils n'étaient pas prévus par le webmaster, ou pas dans cet ordre : ça modifie l'URL. Mais si elle contient la bonne URL canonique, alors elle est "protégée".
Bonjour Olivier,
Je suis l'auteur de Specialthailande.com. Le site d'un consulat me propose d'utiliser mes articles en utilisant une url canonique WordPress.
Cela nuirait-il à mon propre référencement ?
Kind regard,
Si j'ai bien compris, le site du consulat publierait une copie à 100% d'un article, tout en indiquant comme URL canonique celle de l'article sur votre site.
Dans ce cas, ça devrait être OK, même si ça peut arriver que ce soit cette URL qui sorte malgré tout dans les résultats Google.
Il faudrait "par sécurité" ajouter un lien (au début de l'article) vers celui sur votre site.
Une autre proposition serait qu'il publie seulement des extraits, suivis d'un lien "La suite : TITRE" avec le TITRE de l'article, pointant vers votre site.
Ahhh voici une bonne idée que ce rappel indispensable. Allez, j'avoue une autre chose a faire si vous avec un gros site : VERIFIEZ quelques url canoniques. J'ai passé en partie mon site en HTTPS, et provisoirement, j'ai laissé Google choisir entre les deux protocoles en changeant les urls http:// par le //.
Et puis, j'ai pensé que pour une url CANONIQUE, il ne fallait qu'une seule version de protocole, sur coup, j'ai rajouté le https devant l'url ... mais j'ai oublié les deux points ... et là, 11 millions de pages en erreurs sont remontés dans la search console ... et cela réparti sur 1000 sous-domaine ...
Voilà pourquoi on ne touche pas une page sans verifier, même si l'on est sur a 100%.
Et pour les erreurs, Google ne les remontent qu'au compte goute, ci et la par dizaine, centaine, et donc depuis plus d'un mois, c'est 2h de travail quotidien pour les supprimer dans la console...
En fait pour la pagination, il vaut mieux ne pas mettre de canonical sur les page 2, 3, n ...
Que met t-on alors ? "Noindex, Follow" ?
Soit on ne met rien, soit on met effectivement noindex (inutile de préciser follow). Le mieux étant dé réussir à se passer de pagination !
Il y a aussi basiquement l'erreur du www
Lorsqu'un site est accessible à la fois avec et sans www pour le même contenu, il est préférable de définir une url canonique correspondant à l'un d'eux uniquement. Sans cette url canonique, on duplique le contenu et on réduit/diffuse le poids du rank
Bonjour, il y a aussi la pagination. Toutes les pages indiquent en canonique la première page malgré un listing différent.
En effet Mitsu, c'est une erreur répandue
Merci de votre retour, en fait c est un cas particulier où il est très compliqué d indiquer directement "C" et où il faut forcément ces mêmes contenus sur ces 2 sites.
Merci pour cet article très intéressant,
Sinon si l'on a 2 sites et que la page "A" (sur le site "1") indique comme URL canonique la page "B" (sur le site "2") et que cette page "B" fait elle-même une redirection 301 vers la page "C" (toujours sur le site "2"), les moteurs vont-ils bien comprendre que la page "C" est l'URL canonique de la page "A" ?
Merci.
@nono : oui c'est possible, mais ça serait tout de même bien mieux d'indiquer la bonne URL canonique (C) directement dans la page A. Et encore mieux : de ne pas publier le même contenu sur 2 sites différents...
Au temps pour moi, je me suis mal exprimée.
Si je possède 2 URLs au contenu similaire :
- http://www.example.com/toto/
- http://www.example.com/toto
Vaut-il mieux mettre en place une canonique ou un redirection ?
Merci !
ça me parait étrange d'avoir 2 contenus différents pour des URL qui ne diffèrent que par un slash...
la redirection est mieux mais est impossible si l'internaute doit pouvoir consulter les 2 versions
Bonjour,
Merci pour cet article fort interessant.
Vous dites : "si l'URL réelle est http://www.example.com/toto/ il ne faut pas indiquer http://www.example.com/toto comme URL canonique"
Que faut-il faire ? car sauf erreur de ma part, il risque d'y avoir du contenu dupliqué. Faut il prévoir une redirection 301 ?
Merci !
Nanette
@Nanette : si l'URL réelle est http://www.example.com/toto/ alors l'URL canonique doit être la même, donc avec un / à la fin
Toutes les pages produit d'un site pointent vers la même url, laquelle correspond au squelette sans contenu de la page...
@Olivier : Merci.
Est-ce une erreur d'avoir une balise canonical égale à l'adresse consultée ?
Exemple : sur la page
https://www.webrankinfo.com/dossiers/
, la balise canonical indiquera aussihttps://www.webrankinfo.com/dossiers/
@Xavier : cela ne pose aucun pb. C'est ce que j'appelle de la prévention : on évite tout pb si le contenu est consulté via une URL qu'on n'avait pas imaginée
Bonjour,
Merci pour cet article.
J'ai du mal à saisir ce que vous entendez par " L'URL réelle et l'URL canonique indiquée diffèrent par un slash à la fin (présent ou absent)"
En quoi cela est une erreur? Serait-il possible donner un exemple?
Merci
Mimi
@ mimititimi : si l'URL réelle est
http://www.example.com/toto/
il ne faut pas indiquerhttp://www.example.com/toto
comme URL canoniqueQuestion : est-ce que l'âge des pages importent ?
Ex : la page la plus ancienne renvoit un canonical vers la page la plus récente ? (contenu identique, mais présentation et interaction différente, les 2 étant utile et ayant un objectif bien distinct).
@maloc : tu dois mettre en canonique l'URL la plus naturelle, la plus standard. Essaie de voir si actuellement Google a indexé les 2 ou seulement une des 2
Un bon résumé de toutes les erreurs d'utilisation de la balise rel canonical.
Je rajouterai 2 variantes déjà rencontrées :
- la boucle A canonical vers B, B canonical vers A
- plusieurs URL canonique indiquées en chaine (création d'urls à la volée couplée généralement à un système d'url permissif)
- la variante "tricky" où tout se cumule
merci alekushy, je rajoute à la liste !