Sur les sites dynamiques, on trouve parfois/souvent des paramètres passés dans les URL (derrière le signe ?). Ils peuvent servir à configurer le contenu à afficher ou à gérer des options pour liées à l'internaute. Mais ils peuvent générer des contenus dupliqués (en donnant accès au même contenu via des URL différentes). Lisez ce tutoriel pour apprendre comment paramétrer ce nouvel outil complet intégré dans Google Webmaster Tools.
Remarque : la 1ère version de ce tutoriel date de septembre 2009, quand Google a sorti cet outil pour la première fois. A l'époque, il ne permettait que d'indiquer pour chaque paramètre si Google devait en tenir compte ou l'ignorer. Désormais les options de configuration sont bien plus nombreuses, ce qui explique que j'ai réécrit entièrement ce dossier.
Avant de commencer, si vous n'êtes pas à l'aise avec la notion de duplicate content (DC), lisez mon tutoriel sur les contenus dupliqués (incluant les solutions pour améliorer votre référencement naturel).
Quels sites sont concernés ?
Certains sites dynamiques
Si vous avez un site dynamique, il est fort probable que cela vous concerne, sauf si vous avez déjà pris les mesures nécessaires. Si dans les URL de vos pages il y a parfois des variables (= paramètres) d'un des types suivants, alors vous êtes concerné :
paramètres de pagination
paramètres de gestion du tri (nom du critère de tri et valeur, par exemple ascendant ou descendant)
paramètres de filtrage (pour restreindre un listing en fonction de certaines valeurs)
paramètres de traduction
Si les paramètres ne modifient pas le contenu de la page (par exemple des identifiants de session ou des paramètres optionnels), vous devez malgré tout les gérer, comme je l'explique un peu plus bas.
Si vous utilisez du tracking
Imaginons que vous ayez configuré votre flux RSS pour que les URL qui y figurent ne pointent pas directement vers vos articles mais incluent un paramètre de tracking, vous permettant de mesurer l'impact de votre flux RSS sur votre site web. AT Internet (XiTi) est par exemple connu pour son paramètre xtor. et Google Analytics pour ses paramètres commençant par utm_ (par exemple utm_source, utm_medium, utm_campaign).
Ce type de paramètre crée du contenu dupliqué puisque votre contenu est accessible à plusieurs URL (avec ou sans ce paramètre, ou selon ses valeurs).
Google vous permet de lister ces variables dans votre compte Google Webmaster Tools. L'idée est que Google pourra fusionner les URL concernées et réduire les problèmes de contenus dupliqués pour votre site.
Remarque : la notion de tracking est essentielle pour le webmarketing ; si vous ne savez pas bien ce que cela signifie, je vous conseille de lire mon tutoriel sur le tracking des URL.
Si vous utilisez la réécriture d'URL
Si vous avez mis en place l'URL rewriting, vous ne pourrez pas configurer les paramètres dans GWT comme décrit ci-après. Mais cela ne veut pas dire que vous n'avez pas potentiellement des problèmes de contenus dupliqués ! Si ce n'est pas clair pour vous, voyez ici comment obtenir de l'aide.
Mise en place pas à pas...
Allez dans GWT (lisez comment créer un compte Google Webmaster Tools si besoin) dans la rubrique Configuration du site > Paramètres d'URL. Jusqu'à présent, ceci était dans un onglet de Configuration du site > Gestion des paramètres.
Tableau récapitulatif des paramètres d'URL
Google affiche un tableau listant tous les paramètres déjà détectés automatiquement ou configurés manuellement par une des personnes ayant accès à votre compte GWT. Voici à quoi il peut ressembler :
Exemple de tableau des paramètres d'URL dans Google Webmaster Tools, quand aucune configuration manuelle n'a encore été effectuée
Pour chaque paramètre, Google indique :
paramètre : nom de la variable présente dans l'URL
URL surveillées : nombre d'URL trouvées par Google incluant ce paramètre
Dernière configuration : date de la dernière modification de la configuration
Effet sur le contenu : indique si ce paramètre a un effet sur le contenu de la page ou pas
Ce que Googlebot doit explorer : indique ce que Google va faire et quel genre d'URL son robot va crawler ("explorer")
Pour chaque paramètre, vous pouvez modifier sa configuration ou la réinitialiser (Google déterminera à nouveau de façon automatique quelle configuration appliquer au paramètre concerné).
Vous remarquez que vous pouvez télécharger la configuration de tous les paramètres (format CSV) ce qui peut être pratique pour la traiter autrement ou la transmettre à votre référenceur / prestataire / collègue.
Configurer un paramètre sans effet sur le contenu
Si vous trouvez dans ce tableau des paramètres qui n'ont aucun effet sur le contenu (ils peuvent avoir n'importe quelle valeur, le contenu de la page restera inchangé), alors configurez-les comme tel :
Exemple de paramètre d'URL sans impact sur le contenu de la page
En indiquant à Google que ce paramètre n'affecte pas le contenu de la page, Google se débrouillera pour ne crawler qu'une seule URL (je suppose l'URL sans ce paramètre, à vérifier).
En théorie ceci permet de résoudre le problème des sites avec des identifiants de session dans les URL qui freinent considérablement le crawl (et donc l'indexation).
Configurer un paramètre avec effet sur le contenu
Si au contraire vous trouvez dans ce tableau des paramètres qui ont un effet sur le contenu (le contenu de la page diffère selon les valeurs du paramètres), alors il faut les configurer au cas par cas. Une fois que vous avez indiqué que le contenu change en fonction du paramètre, vous devez indiquer comment ce paramètre affecte le contenu :
Tri : Cette option permet de trier le contenu comme indiqué dans le paramètre. Par exemple, vous pouvez afficher des fiches de produits triées par nom, marque ou prix.
Restriction : Affiche un sous-ensemble de contenu spécifié par le paramètre (par exemple, des filtres pour afficher seulement les robes en taille M).
Spécification : Spécifie de quoi traite la page (par exemple, le sujet, l'audience, le numéro de l'article, etc.).
Traduction : Affiche le contenu dans la langue (par exemple, anglais ou klingon) spécifiée par le paramètre.
Pagination : Affiche le contenu d'une page de type listing, pour un numéro de page donné.
Autre : pour les autres cas.
Pour ma part j'ai du mal à voir la différence entre "Restriction" et "Spécification", si vous la voyez n'hésitez pas à l'indiquer dans les commentaires.
Une fois que vous avez indiqué l'impact du paramètre sur le contenu, vous devez dire à Google ce qu'il doit faire :
Par exemple, www.example.com/robes/real.htm?productid=1202938 et www.example.com/robes/real.htm?productid=5853729 sont considérées comme deux URL totalement distinctes. Avant de sélectionner cette option, assurez-vous que le paramètre modifie vraiment le contenu de la page. Dans le cas contraire, il peut amener Googlebot à explorer inutilement des contenus en double sur votre site.
Uniquement les URL dont la valeur est : (à sélectionner dans une liste). Googlebot explore uniquement les URL dont le paramètre est défini sur la valeur indiquée. Lorsque la valeur est différente, l'URL n'est pas explorée. Vous pouvez sélectionner cette option si le contenu de vos pages reste le même, mais s'affiche dans un ordre différent en fonction de la valeur définie pour le paramètre. Par exemple, www.example.com/robes/real.htm?sort=price_high présente le même contenu que www.example.com/robes/real.htm?sort=price_low. Utilisez cette option pour indiquer à Googlebot d'explorer uniquement les URL incluant le paramètre sort=price_low (et ainsi éviter d'explorer des contenus en double).
Aucune URL : Googlebot n'explore pas les URL contenant ce paramètre. Cette option est utile si votre site utilise de nombreux paramètres pour filtrer le contenu. Par exemple, vous pouvez demander à Googlebot de ne pas explorer les URL incluant des paramètres moins importants, comme pricefrom et priceto (http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38&pricefrom=10&priceto=1000). Ainsi, le contenu déjà présent sur la page http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38, qui ne contient pas ces paramètres, ne sera pas exploré une seconde fois.
Gérer les langues
Si vous utilisez un paramètre qui code la langue, choisissez l'option traduction. A priori vous demandez à Google de crawler toutes les URL (quel que soit le code de langue) mais c'est à vous de voir en fonction de votre site. Voici un exemple :
Gestion des sites multilingues avec paramètre de langue dans l'URL
Interdire le crawl
Si vous repérez des URL que Google n'aurait pas dû crawler du tout (a priori c'est rare), vous pouvez configurer le paramètre pour interdire Googlebot de venir explorer les pages concernées :
Interdire à Googlebot de crawler certaines URL
Attention, avec cette configuration, Google ne viendra plus du tout crawler ce genre de pages. Faites bien attention !
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Sympas cet article mais il me fait me poser une question. si les paramètre dans les URL peuvent générer du duplicate content. Est ce que les url shortnener aussi?
s'ils passent pas une redirection 301 en théorie ça ne pose pas de pb (sauf s'ils redirigent vers une URL qui contient encore des paramètres de tracking)
Je voudrais savoir si mon blog wordpress est concerné par ce que vous expliqué, je voudrais savoir pour ne pas perdre mon temps de tout lire et que je puisse pas le faire.
Si tu ne prends même pas la peine de lire mes explications (fournies gratuitement), ça ne me donne pas envie d'aller plus loin... Il faut faire un minimum d'effort ! Demande dans le forum sinon.
@Ciboli Le SEO ca prend du temps. Ne fais pas de SEO si tu as peur de perdre du temps.
@Olivier Duffez Merci de partager tous ces points. J'en ai justement besoin. Est ce que tu sais si GG est efficace/exhaustif pour trouver lui-même les paramètres des urls ?
@David : jusqu'à présent la gestion des paramètres d'URL n'était pas très efficace mais là ça n'a plus rien à voir, l'outil s'est vraiment amélioré. On verra d'ici quelques semaines quand on aura du recul.
Effectivement il y a eu du changement de ce coté là. Très interressant cet article, j'avais paramétré les paramètres d'url il y a longtemps mais cet outil ne semblait pas marcher. Je vais m'y pencher plus précisément.
Un question, j'ai pas fini mes traduction de produits par exemple, avec cet outil je peux éviter le crawl (et le duplicate des non-traduits) de la partie anglaise (id_lang = 2 uniquement) pour l'instant puis permettre l'accès à l'avenir sans sanctions de DC c'est bien ça ?
"Pour ma part j'ai du mal à voir la différence entre "Restriction" et "Spécification", si vous la voyez n'hésitez pas à l'indiquer dans les commentaires".
@Olivier Duffrez. Merci pour ces précieuses informations.
Après avoir configuré mes paramètres d'URL, il me semble que "Restriction" concernerait un filtre pour réduire le nombre de résultats (exemple : voitures.php?motorisation=diesel) alors que "Spécification" concernerait un identifiant unique (ex: test-auto.php?modele=Toyota-Yaris-1.2), mais c'est effectivement assez ambigu.
J'ai paramétré tout ça comme il se doit, l'outil à l'air plutôt efficace en revanche existe-t-il un outil chez GG qui permette de voir les résultats d'indexation sur les pages du site (Diminution du nombre de pages avec contenu dupliqués)?
Les outils externes à GG n'étant pas très efficace dans ce cas puisqu'ils n'incluent pas ces paramètres liées aux variables.
J'ai modifié les paramètres mais j'ai l'impression que rien n'est pris en compte. Il en va pour toute la configuration dans google webmaster tools. Y a t'il un temps d'attente pour que soit inventorié les modifications car là depuis la nouvelle mise ne ligne de mon site plus rien ne va .
Bonsoir, merci pour votre article très complet et enrichissant !
Vous y parlez de configurer les paramètres d'URL "problématiques" car comportant des variables. Si je comprends bien, ce qui les rend problématiques, c'est le fait qu'elles soient indexées et visibles par les crawlers...
Ma question est la suivante : Comment est-il possible de savoir si les urls contenant des variables sont déjà indexées dans les moteurs de recherche ? (en essayant mon url exotique avec la fonction "site:" celle ci apparait dans Google, cela veut-il dire que la page est indéxée et visible par les crawlers ?)
Merci
PS : J'ai essayé d'être le plus clair possible, j'espère que ma question n'est pas trop ridicule au point de figurer dans votre bêtisier 2012 :-)
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
19 septembre 2009 à 12:15
Sympas cet article mais il me fait me poser une question. si les paramètre dans les URL peuvent générer du duplicate content. Est ce que les url shortnener aussi?
20 septembre 2009 à 10:13
s'ils passent pas une redirection 301 en théorie ça ne pose pas de pb (sauf s'ils redirigent vers une URL qui contient encore des paramètres de tracking)
20 septembre 2009 à 17:03
Pour éviter le duplicat content du paramètre de tracking, on peut toujours inclure la balise link rel canonical dans la page concernée !
23 novembre 2009 à 9:08
Article très instructif méritant une réflexion.
22 juillet 2011 à 12:21
Je voudrais savoir si mon blog wordpress est concerné par ce que vous expliqué, je voudrais savoir pour ne pas perdre mon temps de tout lire et que je puisse pas le faire.
22 juillet 2011 à 12:24
Si tu ne prends même pas la peine de lire mes explications (fournies gratuitement), ça ne me donne pas envie d'aller plus loin... Il faut faire un minimum d'effort ! Demande dans le forum sinon.
22 juillet 2011 à 12:29
@Ciboli Le SEO ca prend du temps. Ne fais pas de SEO si tu as peur de perdre du temps.
@Olivier Duffez Merci de partager tous ces points. J'en ai justement besoin. Est ce que tu sais si GG est efficace/exhaustif pour trouver lui-même les paramètres des urls ?
22 juillet 2011 à 12:37
@David : jusqu'à présent la gestion des paramètres d'URL n'était pas très efficace mais là ça n'a plus rien à voir, l'outil s'est vraiment amélioré. On verra d'ici quelques semaines quand on aura du recul.
22 juillet 2011 à 13:01
Effectivement il y a eu du changement de ce coté là. Très interressant cet article, j'avais paramétré les paramètres d'url il y a longtemps mais cet outil ne semblait pas marcher. Je vais m'y pencher plus précisément.
Un question, j'ai pas fini mes traduction de produits par exemple, avec cet outil je peux éviter le crawl (et le duplicate des non-traduits) de la partie anglaise (id_lang = 2 uniquement) pour l'instant puis permettre l'accès à l'avenir sans sanctions de DC c'est bien ça ?
28 juillet 2011 à 11:19
"Pour ma part j'ai du mal à voir la différence entre "Restriction" et "Spécification", si vous la voyez n'hésitez pas à l'indiquer dans les commentaires".
@Olivier Duffrez. Merci pour ces précieuses informations.
Après avoir configuré mes paramètres d'URL, il me semble que "Restriction" concernerait un filtre pour réduire le nombre de résultats (exemple : voitures.php?motorisation=diesel) alors que "Spécification" concernerait un identifiant unique (ex: test-auto.php?modele=Toyota-Yaris-1.2), mais c'est effectivement assez ambigu.
4 août 2011 à 10:13
J'ai paramétré tout ça comme il se doit, l'outil à l'air plutôt efficace en revanche existe-t-il un outil chez GG qui permette de voir les résultats d'indexation sur les pages du site (Diminution du nombre de pages avec contenu dupliqués)?
Les outils externes à GG n'étant pas très efficace dans ce cas puisqu'ils n'incluent pas ces paramètres liées aux variables.
4 août 2011 à 20:19
Merci pour ce retour d'expérience et ces explications...
16 août 2011 à 1:40
@Oivier Super article ! Grand merci :o)
22 août 2011 à 11:34
bon très bon tuto mais une question primordiale subsiste quel différences entre spécification et restriction.
Je filtre un catalogue par marque il s'agit bien d'une restriction mais il s'agit bien d'une page spécifique à la marque avez vous des infos depuis ?
30 octobre 2011 à 18:41
Bonjour,
J'ai modifié les paramètres mais j'ai l'impression que rien n'est pris en compte. Il en va pour toute la configuration dans google webmaster tools. Y a t'il un temps d'attente pour que soit inventorié les modifications car là depuis la nouvelle mise ne ligne de mon site plus rien ne va .
Merci
Bien à vous
1 janvier 2012 à 19:35
Bonsoir, merci pour votre article très complet et enrichissant !
Vous y parlez de configurer les paramètres d'URL "problématiques" car comportant des variables. Si je comprends bien, ce qui les rend problématiques, c'est le fait qu'elles soient indexées et visibles par les crawlers...
Ma question est la suivante : Comment est-il possible de savoir si les urls contenant des variables sont déjà indexées dans les moteurs de recherche ? (en essayant mon url exotique avec la fonction "site:" celle ci apparait dans Google, cela veut-il dire que la page est indéxée et visible par les crawlers ?)
Merci
PS : J'ai essayé d'être le plus clair possible, j'espère que ma question n'est pas trop ridicule au point de figurer dans votre bêtisier 2012 :-)
2 janvier 2012 à 11:34
Le meilleur moyen pour savoir si une URL précise est indexée, c'est d'utiliser la commande info:
2 janvier 2012 à 12:46
Merci Olivier, c'est exactement ce dont j'avais besoin !