Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Gestion des paramètres d’URL dans Google Search Console

Sur les sites dynamiques, on trouve parfois/souvent des paramètres passés dans les URL (derrière le signe ?). Ils peuvent servir à configurer le contenu à afficher ou à gérer des options pour liées à l’internaute. Mais ils peuvent générer des contenus dupliqués (en donnant accès au même contenu via des URL différentes). Lisez ce tutoriel pour apprendre comment paramétrer cet outil complet intégré dans Google Search Console.

Article mis à jour le 06/08/2015, publié initialement le 16/09/2009

Paramètres d'URL dans GSC

Tuto : paramètres d’URL dans Google Search Console (GSC, ex- webmaster tools)

Remarque : la 1ère version de ce tutoriel date de septembre 2009, quand Google a sorti cet outil pour la première fois. A l’époque, il ne permettait que d’indiquer pour chaque paramètre si Google devait en tenir compte ou l’ignorer. Désormais les options de configuration sont bien plus nombreuses, ce qui explique que j’ai réécrit entièrement ce dossier.

Avant de commencer, si vous n’êtes pas à l’aise avec la notion de duplicate content (DC), lisez mon tutoriel sur les contenus dupliqués (incluant les solutions pour améliorer votre référencement naturel).

Egalement, sachez que Google Search Console (GSC) est le nouveau nom de Google Webmaster Tools (GWT) depuis 2015.

Enfin, même si vous devriez trouver la plupart des réponses à vos questions, je propose en fin d’article des solutions pour vous aider, notamment un audit de votre compte GSC.

Quels sites sont concernés ?

Certains sites dynamiques

Si vous avez un site dynamique, il est fort probable que cela vous concerne, sauf si vous avez déjà pris les mesures nécessaires. Si dans les URL de vos pages il y a parfois des variables (= paramètres) d’un des types suivants, alors vous êtes concerné :

  • paramètres de pagination
  • paramètres de gestion du tri (nom du critère de tri et valeur, par exemple ascendant ou descendant)
  • paramètres de filtrage (pour restreindre un listing en fonction de certaines valeurs)
  • paramètres de traduction

Si les paramètres ne modifient pas le contenu de la page (par exemple des identifiants de session ou des paramètres optionnels), vous devez malgré tout les gérer, comme je l’explique un peu plus bas.

Si vous utilisez du tracking

Imaginons que vous ayez configuré votre flux RSS pour que les URL qui y figurent ne pointent pas directement vers vos articles mais incluent un paramètre de tracking, vous permettant de mesurer l’impact de votre flux RSS sur votre site web. AT Internet (XiTi) est par exemple connu pour son paramètre xtor. et Google Analytics pour ses paramètres commençant par utm_ (par exemple utm_source, utm_medium, utm_campaign).

Ce type de paramètre crée du contenu dupliqué puisque votre contenu est accessible à plusieurs URL (avec ou sans ce paramètre, ou selon ses valeurs).

Google vous permet de lister ces variables dans votre compte Google Search Console. L’idée est que Google pourra fusionner les URL concernées et réduire les problèmes de contenus dupliqués pour votre site.

Remarque : la notion de tracking est essentielle pour le webmarketing ; si vous ne savez pas bien ce que cela signifie, je vous conseille de lire mon tutoriel sur le tracking des URL.

Si vous utilisez la réécriture d’URL

Si vous avez mis en place l’URL rewriting, vous ne pourrez pas configurer les paramètres dans GSC comme décrit ci-après. Mais cela ne veut pas dire que vous n’avez pas potentiellement des problèmes de contenus dupliqués ! Si ce n’est pas clair pour vous, voyez ici comment obtenir de l’aide.

Mise en place pas à pas…

Allez dans GSC (lisez comment créer un compte Google  Search Console si besoin) dans la rubrique Exploration > Paramètres d’URL.

Tableau récapitulatif des paramètres d’URL

Google affiche un tableau listant tous les paramètres déjà détectés automatiquement ou configurés manuellement par une des personnes ayant accès à votre compte GSC. Voici à quoi il peut ressembler :

Tableau parametres URL Google Search Console

Exemple de tableau des paramètres d’URL dans Google Search Console

Pour chaque paramètre, Google indique :

  • paramètre : nom de la variable présente dans l’URL
  • URL surveillées : nombre d’URL incluant ce paramètre dont Google connait l’existence
  • Dernière configuration : date de la dernière modification de la configuration
  • Effet : indique si ce paramètre a un effet sur le contenu de la page ou pas
  • Exploration : indique ce que Google va faire et quel genre d’URL son robot va crawler (« explorer »)

Pour chaque paramètre, vous pouvez modifier sa configuration ou la réinitialiser (Google déterminera à nouveau de façon automatique quelle configuration appliquer au paramètre concerné).

Vous remarquez que vous pouvez télécharger la configuration de tous les paramètres (format CSV) ce qui peut être pratique pour la traiter autrement ou la transmettre à votre référenceur / prestataire / collègue.

Configurer un paramètre sans effet sur le contenu

Si vous trouvez dans ce tableau des paramètres qui n’ont aucun effet sur le contenu (ils peuvent avoir n’importe quelle valeur, le contenu de la page restera inchangé), alors configurez-les comme tel :

Tableau parametres URL Google Webmasters Tool

Exemple de paramètre d’URL sans impact sur le contenu de la page

En indiquant à Google que ce paramètre n’affecte pas le contenu de la page, Google se débrouillera pour ne crawler qu’une seule URL (je suppose l’URL sans ce paramètre, à vérifier).

En théorie ceci permet de résoudre le problème des sites avec des identifiants de session dans les URL qui freinent considérablement le crawl (et donc l’indexation).

Configurer un paramètre avec effet sur le contenu

Si au contraire vous trouvez dans ce tableau des paramètres qui ont un effet sur le contenu (le contenu de la page diffère selon les valeurs du paramètres), alors il faut les configurer au cas par cas. Une fois que vous avez indiqué que le contenu change en fonction du paramètre, vous devez indiquer comment ce paramètre affecte le contenu :

  • Tri : Cette option permet de trier le contenu comme indiqué dans le paramètre. Par exemple, vous pouvez afficher des fiches de produits triées par nom, marque ou prix.
  • Restriction : Affiche un sous-ensemble de contenu spécifié par le paramètre (par exemple, des filtres pour afficher seulement les robes en taille M).
  • Spécification : Spécifie de quoi traite la page (par exemple, le sujet, l’audience, le numéro de l’article, etc.).
  • Traduction : Affiche le contenu dans la langue (par exemple, anglais ou klingon) spécifiée par le paramètre.
  • Pagination : Affiche le contenu d’une page de type listing, pour un numéro de page donné.
  • Autre : pour les autres cas.

Pour ma part j’ai du mal à voir la différence entre « Restriction » et « Spécification », si vous la voyez n’hésitez pas à l’indiquer dans les commentaires.

Une fois que vous avez indiqué l’impact du paramètre sur le contenu, vous devez dire à Google ce qu’il doit faire :

  • Laisser Googlebot décider : sélectionnez cette option si vous n’êtes pas sûr du comportement du paramètre ou si celui-ci diffère selon les parties du site. Googlebot analysera votre site pour déterminer comment gérer au mieux ce paramètre.
  • Toutes les URL : Googlebot se base sur la valeur du paramètre pour déterminer si une URL est unique. Par exemple, www.example.com/robes/real.htm?productid=1202938 et www.example.com/robes/real.htm?productid=5853729 sont considérées comme deux URL totalement distinctes. Avant de sélectionner cette option, assurez-vous que le paramètre modifie vraiment le contenu de la page. Dans le cas contraire, il peut amener Googlebot à explorer inutilement des contenus en double sur votre site.
  • Uniquement les URL dont la valeur est : (à sélectionner dans une liste). Googlebot explore uniquement les URL dont le paramètre est défini sur la valeur indiquée. Lorsque la valeur est différente, l’URL n’est pas explorée. Vous pouvez sélectionner cette option si le contenu de vos pages reste le même, mais s’affiche dans un ordre différent en fonction de la valeur définie pour le paramètre. Par exemple, www.example.com/robes/real.htm?sort=price_high présente le même contenu que www.example.com/robes/real.htm?sort=price_low. Utilisez cette option pour indiquer à Googlebot d’explorer uniquement les URL incluant le paramètre sort=price_low (et ainsi éviter d’explorer des contenus en double).
  • Aucune URL : Googlebot n’explore pas les URL contenant ce paramètre. Cette option est utile si votre site utilise de nombreux paramètres pour filtrer le contenu. Par exemple, vous pouvez demander à Googlebot de ne pas explorer les URL incluant des paramètres moins importants, comme pricefrom et priceto (http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38&pricefrom=10&priceto=1000). Ainsi, le contenu déjà présent sur la page http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38, qui ne contient pas ces paramètres, ne sera pas exploré une seconde fois.

Gérer les langues

Si vous utilisez un paramètre qui code la langue, choisissez l’option traduction. A priori vous demandez à Google de crawler toutes les URL (quel que soit le code de langue) mais c’est à vous de voir en fonction de votre site. Voici un exemple :

Configurer le crawl sur un site multilingue

Gestion des sites multilingues avec paramètre de langue dans l’URL

Interdire le crawl

Si vous repérez des URL que Google n’aurait pas dû crawler du tout (a priori c’est rare), vous pouvez configurer le paramètre pour interdire Googlebot de venir explorer les pages concernées :

Bloquer le crawl

Interdire à Googlebot de crawler certaines URL

Attention, avec cette configuration, Google ne viendra plus du tout crawler ce genre de pages. Faites bien attention !

Besoin d’aide ?

Si vous êtes perdus, venez rejoindre la discussion sur ces paramètres d’URL dans Google Webmaster Tools dans le forum WebRankInfo. Sachez aussi que dans ma formation SEO, j’explique dans les détails comment utiliser Google Webmaster Tools pour son référencement, j’y réponds à toutes vos questions !

Je propose également d’effectuer un audit complet de votre compte Search Console.

Pour aller plus loin :

Et vous, comment gérez-vous les paramètres d’URL dans Search Console ?

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

33 commentaires

Benjamin

Sympas cet article mais il me fait me poser une question. si les paramètre dans les URL peuvent générer du duplicate content. Est ce que les url shortnener aussi?

Répondre
Olivier Duffez

s’ils passent pas une redirection 301 en théorie ça ne pose pas de pb (sauf s’ils redirigent vers une URL qui contient encore des paramètres de tracking)

Répondre
Olivier

Pour éviter le duplicat content du paramètre de tracking, on peut toujours inclure la balise link rel canonical dans la page concernée !

Répondre
Externalisation

Article très instructif méritant une réflexion.

Répondre
Ciboli

Je voudrais savoir si mon blog wordpress est concerné par ce que vous expliqué, je voudrais savoir pour ne pas perdre mon temps de tout lire et que je puisse pas le faire.

Répondre
Olivier Duffez

Si tu ne prends même pas la peine de lire mes explications (fournies gratuitement), ça ne me donne pas envie d’aller plus loin… Il faut faire un minimum d’effort ! Demande dans le forum sinon.

Répondre
David Séjourné

@Ciboli Le SEO ca prend du temps. Ne fais pas de SEO si tu as peur de perdre du temps.

@Olivier Duffez Merci de partager tous ces points. J’en ai justement besoin. Est ce que tu sais si GG est efficace/exhaustif pour trouver lui-même les paramètres des urls ?

Répondre
Olivier Duffez

@David : jusqu’à présent la gestion des paramètres d’URL n’était pas très efficace mais là ça n’a plus rien à voir, l’outil s’est vraiment amélioré. On verra d’ici quelques semaines quand on aura du recul.

Répondre
Ber Trandus

Effectivement il y a eu du changement de ce coté là. Très interressant cet article, j’avais paramétré les paramètres d’url il y a longtemps mais cet outil ne semblait pas marcher. Je vais m’y pencher plus précisément.
Un question, j’ai pas fini mes traduction de produits par exemple, avec cet outil je peux éviter le crawl (et le duplicate des non-traduits) de la partie anglaise (id_lang = 2 uniquement) pour l’instant puis permettre l’accès à l’avenir sans sanctions de DC c’est bien ça ?

Répondre
moinat.net

« Pour ma part j’ai du mal à voir la différence entre « Restriction » et « Spécification », si vous la voyez n’hésitez pas à l’indiquer dans les commentaires ».
@Olivier Duffrez. Merci pour ces précieuses informations.
Après avoir configuré mes paramètres d’URL, il me semble que « Restriction » concernerait un filtre pour réduire le nombre de résultats (exemple : voitures.php?motorisation=diesel) alors que « Spécification » concernerait un identifiant unique (ex: test-auto.php?modele=Toyota-Yaris-1.2), mais c’est effectivement assez ambigu.

Répondre
Olivier Duffez

Merci pour ce retour d’expérience et ces explications…

Répondre
Chemises Homme

J’ai paramétré tout ça comme il se doit, l’outil à l’air plutôt efficace en revanche existe-t-il un outil chez GG qui permette de voir les résultats d’indexation sur les pages du site (Diminution du nombre de pages avec contenu dupliqués)?
Les outils externes à GG n’étant pas très efficace dans ce cas puisqu’ils n’incluent pas ces paramètres liées aux variables.

Répondre
b-vibes

@Oivier Super article ! Grand merci :o)

Répondre
Jcwebmaster

bon très bon tuto mais une question primordiale subsiste quel différences entre spécification et restriction.

Je filtre un catalogue par marque il s’agit bien d’une restriction mais il s’agit bien d’une page spécifique à la marque avez vous des infos depuis ?

Répondre
lausti

Bonjour,

J’ai modifié les paramètres mais j’ai l’impression que rien n’est pris en compte. Il en va pour toute la configuration dans google webmaster tools. Y a t’il un temps d’attente pour que soit inventorié les modifications car là depuis la nouvelle mise ne ligne de mon site plus rien ne va .

Merci

Bien à vous

Répondre
Remiwebmast

Bonsoir, merci pour votre article très complet et enrichissant !

Vous y parlez de configurer les paramètres d’URL « problématiques » car comportant des variables. Si je comprends bien, ce qui les rend problématiques, c’est le fait qu’elles soient indexées et visibles par les crawlers…
Ma question est la suivante : Comment est-il possible de savoir si les urls contenant des variables sont déjà indexées dans les moteurs de recherche ? (en essayant mon url exotique avec la fonction « site: » celle ci apparait dans Google, cela veut-il dire que la page est indéxée et visible par les crawlers ?)

Merci

PS : J’ai essayé d’être le plus clair possible, j’espère que ma question n’est pas trop ridicule au point de figurer dans votre bêtisier 2012 :-)

Répondre
Olivier Duffez

Le meilleur moyen pour savoir si une URL précise est indexée, c’est d’utiliser la commande info:

Répondre
Remiwebmast

Merci Olivier, c’est exactement ce dont j’avais besoin !

Répondre
EGA

Bonjour…

Et merci pour cet article…
Petite question concernant la partie « Interdire le crawl »…

Quid si Google a déjà été fouiner une série d’url avec le param « toto », et que je le configure comme vous le conseillez ?

1) Il ne va plus crawler ces url’s ET DEREFERENCER celles qu’il a déjà dans son index ?
2) Il ne va plus crawler ces url’s ET GARDER celles qu’il a déjà dans son index ?

Merci :)

Répondre
#So#

Merci pour cet article !
par contre, j’ai dans mes paramètres d’URL des start=0 et task=view qui me remontent des erreurs dans GWT.. Savez vous comment paramétrer ces URL pour que GWT ne me sorte plus de title ou description en double ?
Merci pour votre aide !

Répondre
jc-l-oiseau

Hi tout simple utilise l’attibut rel= canonical

comme ça pas de duplicate

regarde çà ca peut t’aider
à plus J-c
l’oiseau de bonne augure.

J-c

Répondre
#So#

Merci JC, mais en fait, je ne vois pas comment je pourrai mettre en place des Canonical. Ces pages ne sont pas physiquement présentes en base, ce sont uniquement des paramètres d’URL qui génèrent ce « doublonage » de titre et description…
J’ai essayé de rajouter des paramètres d’URL sur GWT comme expliqué ci dessus.. Mais visiblement, cela ne lui convient pas..
Est ce que start=0 et task=view sont des paramètres d’URL à part entière ? Merci !

Répondre
Bertrand

Dans cette partie de GWT, on parle bien de crawling et non pas d’indexation.
Dons si on a des pages avec des paramètres qui sont déjà indexées et qu’on indique à Google Bot de ne plus les crawler, elles ne seront jamais désindexées?

Répondre
Olivier Duffez

@Bertrand : ce tableau indique les paramètres trouvés dans les URL crawlées par Google. Mais si tu indiques que pour tel paramètre, il ne doit plus indexer la page, Google est censé en tenir compte.
Par contre en pratique, je déconseille de passer par cet outil pour régler ce genre de pb.
1. parce que ça marche mal (j’ai eu de nombreux témoignages)
2. parce que le pb concerne tous les moteurs et qu’ici on ne le corrige que pour Google.

il faut donc utiliser d’autres standards type robots.txt et balise meta robots noindex

Répondre
Bertrand

@Olivier : Merci pour cette réponse rapide et pour les explications.
J’en profite pour vous dire que je pense que Google tient de moins en moins compte du fichier robots.txt : j’ai acheté il y a quelques jours un plugin pour l’un de mes sites, celui est installé dans un dossier « modules ». Il est indiqué depuis longtemps dans le fichier robots.txt de ne rien crawler qui soit contenu dans le dossier « modules » et pourtant, je me retrouve aujourd’hui avec une centaine de pages indexées en rapport avec ce plugin et se trouvant bien dans le dossier « modules »…
Si vous voulez un exemple, contactez moi par email.

Répondre
christophe

Un petite question au sujet des paramètres d’URL :
Si on veut désindexer des pages, par exemples toutes les urls contenant « &page=* », le mieux est de le faire via le serveur avec un robots noindex. Bon, mais si Google met du temps à enlever toutes les pages, est-ce que l’indiquer via les paramètres d’URL servira à quelque chose, ou est-ce que ça ne sert qu’à empêcher le robot google de lire la page ? Auquel cas il ne verra même pas le meta noindex et n’enlèvera pas la page de l’index ?
Merci !

Répondre
Olivier Duffez

@christophe : la plupart des retours d’expérience montrent que ce réglage ne semble pas bien marcher. Mieux vaut régler le problème en amont et ne pas générer du tout les pages concernées, ou bien y inclure une meta robots noindex et attendre (éventuellement en faisant un sitemap des URL concernées).

Répondre
Emry

Bonjour, Pardonnez-moi mais toutes ces phrases sont trop techniques pour moi. Je suis novice et j’ai créé un site: bantoozone.com et je m’efforce chaque jour à lui donner un meilleur positionnement. bref, j’ai une préoccupation concernant google webmaster tools. En effet, dans la partie Sitemaps, il y a inscrit:102 Nombre d’URL fournies et 46 URL indexées. Pourquoi cet écart? Est-ce parce que j’ai effectué beaucoup de redirections? Si oui, quelle manipulation dois-je effectuer? Sauf s’il y a des réglages à faire au niveau de mes liens? J’ai lu sur https://support.google.com/webmasters/answer/2642366?hl=fr que les url en double, les url non cannoniques et les meta noindex ne sont pas inclus. Bref, comment vérifier et régler tout ça?
Merci beaucoup.

Répondre
Olivier Duffez

@ Emry : ça n’est pas très pratique de répondre à un cas spécifique au sein des commentaires. Il faudrait mieux créer une discussion dans le forum de ce site, il y aura plus de réponses et ce sera donc plus efficace. Merci d’avance !

Répondre
frankie

Merci Olivier pour cet article clair et utile.

Restriction / Spécification ? La restriction est le terme adéquat lorsqu’une page présente une liste d’items (produits, personnes, adresses, sociétés, documents…) plus ou moins importante que l’on peut filtrer grâce au paramètre. C’est la même chose par exemple qu’un filtre dans un tableur, pour ne retenir que certaines lignes parmi toutes celles possibles.

Dans l’exemple ci-dessus de la voiture, « motorisation » est clairement une restriction si on présente une liste de véhicules Diesel alors que sans paramètre on a une liste exhaustive des véhicules.

C’est une spécification si on trouve un article présentant les moteurs Diesel alors qu’on a d’autres pages (/voiture?moteur=essence ou /voiture?moteur=electricite, /voiture?moteur=hybride…) présentant les autres systèmes, mais pas une liste restreinte de résultats issus d’une base de données plus large.

Autre exemple, dans des pages /france?aspect=politique, /france?aspect=economie, /france?aspect=culture, « quoi » est clairement un paramètre de spécification, on précise le sujet, on ne filtre pas une liste de résultats.

Répondre
cristal

Bonjour,
Vous ne donnez pas une indication importante : Comment les supprimer ces paramètres d’url (quand on s’est trompé par exemple) ?

Répondre
Olivier Duffez

Merci de poser la question dans le forum, en précisant les choses, car comme ça c’est peu pratique et difficile

Répondre