Vous êtes ici : Dossiers référencement > Techniques de référencement

Membre WebRankInfo ?

S'inscrire Aide

Gestion des paramètres d'URL dans Google Webmaster Tools

Par Olivier Duffez , Vendredi 22 juillet 2011

Sur les sites dynamiques, on trouve parfois/souvent des paramètres passés dans les URL (derrière le signe ?). Ils peuvent servir à configurer le contenu à afficher ou à gérer des options pour liées à l'internaute. Mais ils peuvent générer des contenus dupliqués (en donnant accès au même contenu via des URL différentes). Lisez ce tutoriel pour apprendre comment paramétrer ce nouvel outil complet intégré dans Google Webmaster Tools.


Remarque : la 1ère version de ce tutoriel date de septembre 2009, quand Google a sorti cet outil pour la première fois. A l'époque, il ne permettait que d'indiquer pour chaque paramètre si Google devait en tenir compte ou l'ignorer. Désormais les options de configuration sont bien plus nombreuses, ce qui explique que j'ai réécrit entièrement ce dossier.

Avant de commencer, si vous n'êtes pas à l'aise avec la notion de duplicate content (DC), lisez mon tutoriel sur les contenus dupliqués (incluant les solutions pour améliorer votre référencement naturel).

Quels sites sont concernés ?

Certains sites dynamiques

Si vous avez un site dynamique, il est fort probable que cela vous concerne, sauf si vous avez déjà pris les mesures nécessaires. Si dans les URL de vos pages il y a parfois des variables (= paramètres) d'un des types suivants, alors vous êtes concerné :

  • paramètres de pagination
  • paramètres de gestion du tri (nom du critère de tri et valeur, par exemple ascendant ou descendant)
  • paramètres de filtrage (pour restreindre un listing en fonction de certaines valeurs)
  • paramètres de traduction
Si les paramètres ne modifient pas le contenu de la page (par exemple des identifiants de session ou des paramètres optionnels), vous devez malgré tout les gérer, comme je l'explique un peu plus bas.

Si vous utilisez du tracking

Imaginons que vous ayez configuré votre flux RSS pour que les URL qui y figurent ne pointent pas directement vers vos articles mais incluent un paramètre de tracking, vous permettant de mesurer l'impact de votre flux RSS sur votre site web. AT Internet (XiTi) est par exemple connu pour son paramètre xtor. et Google Analytics pour ses paramètres commençant par utm_ (par exemple utm_source, utm_medium, utm_campaign).

Ce type de paramètre crée du contenu dupliqué puisque votre contenu est accessible à plusieurs URL (avec ou sans ce paramètre, ou selon ses valeurs).

Google vous permet de lister ces variables dans votre compte Google Webmaster Tools. L'idée est que Google pourra fusionner les URL concernées et réduire les problèmes de contenus dupliqués pour votre site.

Remarque : la notion de tracking est essentielle pour le webmarketing ; si vous ne savez pas bien ce que cela signifie, je vous conseille de lire mon tutoriel sur le tracking des URL.

Si vous utilisez la réécriture d'URL

Si vous avez mis en place l'URL rewriting, vous ne pourrez pas configurer les paramètres dans GWT comme décrit ci-après. Mais cela ne veut pas dire que vous n'avez pas potentiellement des problèmes de contenus dupliqués ! Si ce n'est pas clair pour vous, voyez ici comment obtenir de l'aide.

Mise en place pas à pas...

Allez dans GWT (lisez comment créer un compte Google Webmaster Tools si besoin) dans la rubrique Configuration du site > Paramètres d'URL. Jusqu'à présent, ceci était dans un onglet de Configuration du site > Gestion des paramètres.

Tableau récapitulatif des paramètres d'URL

Google affiche un tableau listant tous les paramètres déjà détectés automatiquement ou configurés manuellement par une des personnes ayant accès à votre compte GWT. Voici à quoi il peut ressembler :

Tableau parametres URL Google Webmasters Tool

Exemple de tableau des paramètres d'URL dans Google Webmaster Tools, quand aucune configuration manuelle n'a encore été effectuée

Pour chaque paramètre, Google indique :

  • paramètre : nom de la variable présente dans l'URL
  • URL surveillées : nombre d'URL trouvées par Google incluant ce paramètre
  • Dernière configuration : date de la dernière modification de la configuration
  • Effet sur le contenu : indique si ce paramètre a un effet sur le contenu de la page ou pas
  • Ce que Googlebot doit explorer : indique ce que Google va faire et quel genre d'URL son robot va crawler ("explorer")

Pour chaque paramètre, vous pouvez modifier sa configuration ou la réinitialiser (Google déterminera à nouveau de façon automatique quelle configuration appliquer au paramètre concerné).

Vous remarquez que vous pouvez télécharger la configuration de tous les paramètres (format CSV) ce qui peut être pratique pour la traiter autrement ou la transmettre à votre référenceur / prestataire / collègue.

Configurer un paramètre sans effet sur le contenu

Si vous trouvez dans ce tableau des paramètres qui n'ont aucun effet sur le contenu (ils peuvent avoir n'importe quelle valeur, le contenu de la page restera inchangé), alors configurez-les comme tel :

Tableau parametres URL Google Webmasters Tool

Exemple de paramètre d'URL sans impact sur le contenu de la page

En indiquant à Google que ce paramètre n'affecte pas le contenu de la page, Google se débrouillera pour ne crawler qu'une seule URL (je suppose l'URL sans ce paramètre, à vérifier).

En théorie ceci permet de résoudre le problème des sites avec des identifiants de session dans les URL qui freinent considérablement le crawl (et donc l'indexation).

Configurer un paramètre avec effet sur le contenu

Si au contraire vous trouvez dans ce tableau des paramètres qui ont un effet sur le contenu (le contenu de la page diffère selon les valeurs du paramètres), alors il faut les configurer au cas par cas. Une fois que vous avez indiqué que le contenu change en fonction du paramètre, vous devez indiquer comment ce paramètre affecte le contenu :

  • Tri : Cette option permet de trier le contenu comme indiqué dans le paramètre. Par exemple, vous pouvez afficher des fiches de produits triées par nom, marque ou prix.
  • Restriction : Affiche un sous-ensemble de contenu spécifié par le paramètre (par exemple, des filtres pour afficher seulement les robes en taille M).
  • Spécification : Spécifie de quoi traite la page (par exemple, le sujet, l'audience, le numéro de l'article, etc.).
  • Traduction : Affiche le contenu dans la langue (par exemple, anglais ou klingon) spécifiée par le paramètre.
  • Pagination : Affiche le contenu d'une page de type listing, pour un numéro de page donné.
  • Autre : pour les autres cas.

Pour ma part j'ai du mal à voir la différence entre "Restriction" et "Spécification", si vous la voyez n'hésitez pas à l'indiquer dans les commentaires.

Une fois que vous avez indiqué l'impact du paramètre sur le contenu, vous devez dire à Google ce qu'il doit faire :

  • Par exemple, www.example.com/robes/real.htm?productid=1202938 et www.example.com/robes/real.htm?productid=5853729 sont considérées comme deux URL totalement distinctes. Avant de sélectionner cette option, assurez-vous que le paramètre modifie vraiment le contenu de la page. Dans le cas contraire, il peut amener Googlebot à explorer inutilement des contenus en double sur votre site.
  • Aucune URL : Googlebot n'explore pas les URL contenant ce paramètre. Cette option est utile si votre site utilise de nombreux paramètres pour filtrer le contenu. Par exemple, vous pouvez demander à Googlebot de ne pas explorer les URL incluant des paramètres moins importants, comme pricefrom et priceto (http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38&pricefrom=10&priceto=1000). Ainsi, le contenu déjà présent sur la page http://www.examples.com/search?category=chaussure&brand=nike&color=rouge&size=38, qui ne contient pas ces paramètres, ne sera pas exploré une seconde fois.

Gérer les langues

Si vous utilisez un paramètre qui code la langue, choisissez l'option traduction. A priori vous demandez à Google de crawler toutes les URL (quel que soit le code de langue) mais c'est à vous de voir en fonction de votre site. Voici un exemple :

Configurer le crawl sur un site multilingue

Gestion des sites multilingues avec paramètre de langue dans l'URL

Interdire le crawl

Si vous repérez des URL que Google n'aurait pas dû crawler du tout (a priori c'est rare), vous pouvez configurer le paramètre pour interdire Googlebot de venir explorer les pages concernées :

Bloquer le crawl

Interdire à Googlebot de crawler certaines URL

Attention, avec cette configuration, Google ne viendra plus du tout crawler ce genre de pages. Faites bien attention !

Besoin d'aide ?

Si vous êtes perdus, venez rejoindre la discussion sur ces paramètres d'URL dans Google Webmaster Tools dans le forum WebRankInfo. Sachez aussi que dans ma formation SEO, j'explique dans les détails comment utiliser Google Webmaster Tools pour son référencement, j'y réponds à toutes vos questions !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur LinkedIn

Olivier DuffezConsultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).

Vous avez aimé cet article ? Partagez-le !

Vous aimez WebRankInfo ? Suivez-nous !

Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

18 commentaires

  1. Benjamin dit :

    Sympas cet article mais il me fait me poser une question. si les paramètre dans les URL peuvent générer du duplicate content. Est ce que les url shortnener aussi?

  2. Olivier Duffez dit :

    s'ils passent pas une redirection 301 en théorie ça ne pose pas de pb (sauf s'ils redirigent vers une URL qui contient encore des paramètres de tracking)

  3. Olivier dit :

    Pour éviter le duplicat content du paramètre de tracking, on peut toujours inclure la balise link rel canonical dans la page concernée !

  4. Externalisation dit :

    Article très instructif méritant une réflexion.

  5. Ciboli dit :

    Je voudrais savoir si mon blog wordpress est concerné par ce que vous expliqué, je voudrais savoir pour ne pas perdre mon temps de tout lire et que je puisse pas le faire.

  6. Olivier Duffez dit :

    Si tu ne prends même pas la peine de lire mes explications (fournies gratuitement), ça ne me donne pas envie d'aller plus loin... Il faut faire un minimum d'effort ! Demande dans le forum sinon.

  7. David Séjourné dit :

    @Ciboli Le SEO ca prend du temps. Ne fais pas de SEO si tu as peur de perdre du temps.

    @Olivier Duffez Merci de partager tous ces points. J'en ai justement besoin. Est ce que tu sais si GG est efficace/exhaustif pour trouver lui-même les paramètres des urls ?

  8. Olivier Duffez dit :

    @David : jusqu'à présent la gestion des paramètres d'URL n'était pas très efficace mais là ça n'a plus rien à voir, l'outil s'est vraiment amélioré. On verra d'ici quelques semaines quand on aura du recul.

  9. Ber Trandus dit :

    Effectivement il y a eu du changement de ce coté là. Très interressant cet article, j'avais paramétré les paramètres d'url il y a longtemps mais cet outil ne semblait pas marcher. Je vais m'y pencher plus précisément.
    Un question, j'ai pas fini mes traduction de produits par exemple, avec cet outil je peux éviter le crawl (et le duplicate des non-traduits) de la partie anglaise (id_lang = 2 uniquement) pour l'instant puis permettre l'accès à l'avenir sans sanctions de DC c'est bien ça ?

  10. moinat.net dit :

    "Pour ma part j'ai du mal à voir la différence entre "Restriction" et "Spécification", si vous la voyez n'hésitez pas à l'indiquer dans les commentaires".
    @Olivier Duffrez. Merci pour ces précieuses informations.
    Après avoir configuré mes paramètres d'URL, il me semble que "Restriction" concernerait un filtre pour réduire le nombre de résultats (exemple : voitures.php?motorisation=diesel) alors que "Spécification" concernerait un identifiant unique (ex: test-auto.php?modele=Toyota-Yaris-1.2), mais c'est effectivement assez ambigu.

  11. Chemises Homme dit :

    J'ai paramétré tout ça comme il se doit, l'outil à l'air plutôt efficace en revanche existe-t-il un outil chez GG qui permette de voir les résultats d'indexation sur les pages du site (Diminution du nombre de pages avec contenu dupliqués)?
    Les outils externes à GG n'étant pas très efficace dans ce cas puisqu'ils n'incluent pas ces paramètres liées aux variables.

  12. Olivier Duffez dit :

    Merci pour ce retour d'expérience et ces explications...

  13. b-vibes dit :

    @Oivier Super article ! Grand merci :o)

  14. Jcwebmaster dit :

    bon très bon tuto mais une question primordiale subsiste quel différences entre spécification et restriction.

    Je filtre un catalogue par marque il s'agit bien d'une restriction mais il s'agit bien d'une page spécifique à la marque avez vous des infos depuis ?

  15. lausti dit :

    Bonjour,

    J'ai modifié les paramètres mais j'ai l'impression que rien n'est pris en compte. Il en va pour toute la configuration dans google webmaster tools. Y a t'il un temps d'attente pour que soit inventorié les modifications car là depuis la nouvelle mise ne ligne de mon site plus rien ne va .

    Merci

    Bien à vous

  16. Remiwebmast dit :

    Bonsoir, merci pour votre article très complet et enrichissant !

    Vous y parlez de configurer les paramètres d'URL "problématiques" car comportant des variables. Si je comprends bien, ce qui les rend problématiques, c'est le fait qu'elles soient indexées et visibles par les crawlers...
    Ma question est la suivante : Comment est-il possible de savoir si les urls contenant des variables sont déjà indexées dans les moteurs de recherche ? (en essayant mon url exotique avec la fonction "site:" celle ci apparait dans Google, cela veut-il dire que la page est indéxée et visible par les crawlers ?)

    Merci

    PS : J'ai essayé d'être le plus clair possible, j'espère que ma question n'est pas trop ridicule au point de figurer dans votre bêtisier 2012 :-)

  17. Olivier Duffez dit :

    Le meilleur moyen pour savoir si une URL précise est indexée, c'est d'utiliser la commande info:

  18. Remiwebmast dit :

    Merci Olivier, c'est exactement ce dont j'avais besoin !

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).

WebRankInfo sur Twitter

Suivez-moi sur Twitter !
WebRankInfo Twitter

Hébergement web

Hebergement web mutualise, dedie

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.