Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Référencement naturel : dans les URL, le tiret meilleur que l'underscore

Si vous avez déjà passé un peu de temps sur un forum dédié au référencement, vous avez sans doute participé à des discussions enflammées à propos du tiret (-) et du underscore (_). Lequel faut-il utiliser ? Voilà une réponse claire issue d'un test de 2004 toujours valable, complété d'une réponse en vidéo par Matt Cutts...

Cet article fut d'abord publié en 2004, puis complété en 2011 avec la vidéo de Matt Cutts et enfin en mai 2013 pour les résultats d'un test de confirmation.

Underscore séparateur URL
L'underscore n'est pas un séparateur de mots dans l'URL. Est-ce grave pour le SEO ?

Le test qui prouve que l'underscore ne sépare pas les mots

Vous trouverez dans ce paragraphe les résultats du test effectué en 2004 : depuis, les pages de test peuvent avoir changé mais le résultat est toujours là. Voyez aussi ci-dessous le test renouvelé en 2013.

Referencement Google : tirets (dashes) ou tirets bas (underscores) ?
Référencement Google : tiret ou underscore ?

Le problème du choix entre le tiret et l'underscore se pose à la fois pour les noms de fichiers ou de répertoires (plus généralement, les URL), et également pour le texte situé dans la page. La question est de savoir si les deux servent de séparateur de mots. Pour le tiret tout le monde est d'accord, il sépare bien les mots, mais pour l'underscore certains avaient encore des doutes.

En résumé, quand j'écris stade_toulousain, Google arrive-t-il à distinguer le mot stade et le mot toulousain ?Pour vous prouver qu'il n'arrive pas à le faire, j'ai mis en place un test dont je vous dévoile aujourd'hui les résultats (NDLR : cet article a été mis en ligne pour la première fois le 14 août 2004).

J'ai créé une page nommée wagatukepo-sitynozfau-mazidipole_vukertalet.php dont le nom est constitué de 4 mots séparés par des tirets ou des underscores, et je l'ai faite indexer par Google (sans utiliser aucun de ces mots dans le texte de lien, pour ne pas fausser le test). Au moment du test, ces mots n'existaient pas encore sur le web indexé par Google. Si en cherchant un de ces mots sur Google on obtient en résultat cette page, c'est qu'il est entouré de bons séparateurs, en tout cas pour la question de l'URL.

Résultats : seuls les mots wagatukepo et sitynozfau font ressortir la page. mazidipole et vukertalet ne font pas ressortir la page, tandis que mazidipole_vukertalet le fait. Conclusion : pour l'URL, l'underscore ne permet pas de séparer les mots.

Sur cette page, j'ai placé ces expressions : bozaketerp-boujulanbi et vorismetapalu_terplamili constitués de mots séparés par un tiret et un underscore. Ici également au moment du test ces mots n'existaient pas encore sur le web indexé par Google. Résultats : seuls les mots bozaketerp et boujulanbi font ressortir la page lorsqu'on les cherche dans Google, vorismetapalu et terplamili ne retournant pas la page en résultat. Par contre vorismetapalu_terplamili fait bien ressortir la page. Conclusion : pour le texte également, l'underscore ne permet pas de séparer les mots.

J'espère que cette démonstration est suffisamment convaincante pour qu'on ne pose plus la question dans le forum... sauf si Google change la règle du jeu !

Test renouvelé en mai 2013

Comme je trouve de temps en temps des gens dans des forums qui disent que l'underscore ne pose plus de problème, j'ai refait le test avec une page créée et indexée le 15/05/2013. Son URL est /erpgokldfgkjf_lfjgkhfd.php. Google ne la fait pas sortir sur les requêtes erpgokldfgkjf ou lfjgkhfd ce qui prouve que pour Google, l'underscore n'est toujours pas un séparateur de mots. Par contre Google fait sortir la page sur la requête erpgokldfgkjf_lfjgkhfd.

Pourtant Google semble distinguer les mots, il les met en gras dans les SERP !

Ce qui est perturbant dans cette histoire, c'est que pour certaines requêtes, Google met en gras dans les pages de résultats les mots de la requêtes, même s'ils sont séparés par un underscore. C'est même le cas parfois quand les mots sont collés ! Alors, Google sait-il reconnaître les mots même s'ils n'ont pas un bon séparateur ?

La réponse est encore non ! Il s'agit uniquement d'un post-traitement effectué sur la page de résultats. Google met en gras les termes de la recherche comme pour prouver à l'internaute qu'il a bien fait de sélectionner ces pages web, qu'elles sont pertinentes.

Alors pourquoi le tiret est-il meilleur pour le SEO ?

Je viens de montrer que Google ne sait pas distinguer les mots si on utilise un mauvais séparateur (par exemple l'underscore). L'impact direct est vraiment très faible car même si Google tient compte des mots dans les URL, c'est un facteur de second rôle.

En fait l'impact est indirect, par le biais des liens. Dans de nombreux cas, quand des internautes font des liens vers vos pages dans des blogs, des forums, des commentaires, ils utilisent vos URL par un simple copier/coller. L'URL devient cliquable, si bien que le texte du lien (le fameux anchor text si stratégique pour le référencement) n'est optimisé que si vos URL contiennent des mots distinguables par Google.

Faut-il modifier ses URL si elles contiennent un underscore ?

Ca dépend... Voici quelques conseils :

  • Si votre site est très récent (quelques mois maximum) ou si votre référencement est mauvais, autant changer et supprimer l'underscore
  • Si vous prévoyez une refonte de votre site incluant une modification des URL, profitez-en pour changer et supprimer l'underscore
  • Si au contraire vous pensez que votre référencement est déjà bon malgré vos underscores, ne changez pas

Si vous décidez de changer :

  • Chaque page doit être redirigée en 301 de l'ancienne URL vers la nouvelle (testez avec cet outil)
  • Chaque lien sur votre site pointant vers une ancienne URL doit être modifié pour pointer vers la nouvelle

D'autres conseils sur les URL

Si vous souhaitez optimiser à fond votre référencement, lisez mes conseils sur le format des URL.

Explications de Matt Cutts en 2011

Voici une vidéo dans laquelle Matt Cutts explique pourquoi encore en 2011 il vaut mieux utiliser le tiret. Il donne d'autres explications et informations :

  • Quand Google a été créé, les ingénieurs ont appliqué les règles en vigueur chez les programmeurs / informaticiens : le signe underscore (tiret bas) n'est pas un séparateur (il peut donc être utilisé dans des noms de variables)
  • Google n'a pas souhaité modifier cette prise en compte
  • L'impact est très faible (NDLR : en réalité de façon directe l'impact est très faible mais par le biais des liens qui reprennent l'URL, l'impact n'est plus si faible que ça)
  • Pour des nouvelles URL (nouveau site, nouvelle rubrique, refonte de site), Matt Cutts conseille malgré tout d'utiliser le tiret classique et non pas l'underscore.
  • Si vous avez des underscores dans vos URL, ne vous précipitez pas à les remplacer par des tirets, ce n'est pas une priorité (NDLR : si vous décidez de le faire, n'oubliez surtout pas de faire des redirections 301 de page à page).

Discutez de l'article Tiret ou underscore ? Enfin la réponse ! dans le forum

Cet article vous a-t-il plu ?

Note : 5.0 (1 vote)
Cliquez pour voter !

36 commentaires

Seal

Bonjour,
l'article ne veut pas dire, qu'il faut mieux un NDD avec un tiret qu'une NDD sans tiret, il faut mieux webrankinfo.com que web-rank-info.com, non ?

Olivier Duffez

Cet article ne parle pas des noms de domaine mais du reste de l'URL. Pour un NDD, il est parfois plus efficace de ne pas utiliser de tiret, car c'est plus simple au quotidien. D'un point de vue strictement SEO, ça serait sans doute un peu mieux d'avoir des tirets (s'il y a des mots-clés bien entendu).

locmerlette

bonjour, tapez sur le moteur de recherche locmerlette_alpes et dites moi pourquoi on trouve mon blog locmerlette-alpes.blogspot.com, alors qu'on ne le trouve pas en tapant locmerlette-alpes .
merci de m'aider

Olivier Duffez

Je ne sais pas pourquoi on le trouve pour locmerlette_alpes (il faut dire qu'il n'y a que 3 résultats, c'est une requête hors normes), mais je le trouve bien en tapant locmerlette-alpes

Castle

Perso sur mon site j'avais mis dans les premières années des underscores...dans les liens. Au fut et à mesure je les ai remplacé par des tirets, il y a pas photo le résultat est bien meilleur. Quand aux espaces dans un lien je pense qu'il y a rien de pire quand quelqu'un veut le diffuser sur un forum etc

En clair sur ma petite expérience, le tiret est sans aucun doute à utiliser, il reste logique, l'underscore n'est pas utilisé dans le language courant mais uniquement ou principalement en informatique et google reste à mon avis dans cette logique, on écrit pas par exemple Saint_Germain_en_Laye mais Saint-Germain-en-Laye...

En tout cas merci pour cette précision :)

Reglysse

@Olivier : Ok avec cet exemple j'ai bien compris :), ça fonctionne.

Reglysse

Mais les mots utilisés n'existent pas dans la langue française. Je ne vois pas trop l'intêret de ce test. Dans "qmdsjfqsjdfjinternetsdjflkqsdj" google est capable de retrouver internet.

Je ne vois pas en quoi ce test prouve que google ne peut pas distinguer stade de toulousain dans stade_toulousain.

https://www.google.fr/search?q=site:fr.wikipedia.org%20%22toulousain%22

Olivier Duffez

@Reglysse : ça ne change rien. Pour te le prouver, j'ai encore fait un autre test, cette fois avec dans l'URL des mots existant dans la langue française : test_url_pour_stade_toulousain.php
ça donne les mêmes résultats : Google ne repère pas les mots puisqu'ils sont séparés par l'underscore

Mzalbil

Je me demande si il est vraiment important de bien référencer les images. Sur mon site en 6 mois, j'ai eu 2 visiteurs sur des images ou j'ai bien tout optimisé...

Claire

Bonjour
Merci pour ce test !
Une petite question : qu'en est -il pour les images ? Il vaut donc mieux séparer les mots clés par des tirets et pas des underscores du coup ?

Olivier Duffez

@Claire : oui c'est mieux mais ce n'est pas un critère majeur du référencement des images

Chasseur immobilier

Le chantier serait effectivement important sur mes sites et cette décision délicate à prendre, d'autant que je n'ai pas constaté de réelles différences de positionnement entre une URL avec - et une avec _, bien entendu toute notion d'ancienneté et de linking égale par ailleurs.

aquariophilie

Excellente la vanne sur le positionnement de Wikipedia devant les Adwords des pages de recherches.^^

Figures Ambigues

On ne peut être que d'accord avec le constat de la supériorité du tiret sur l'underscore. Mais dans ce cas comment expliquer que Wikipedia persiste à utiliser l'underscore ?

Olivier Duffez

Pour en avoir parlé directement avec Florence Devouard (ancienne directrice de Wikimédia, structure qui gère Wikipedia), ça a été envisagé mais c'est finalement une modification de trop grande ampleur pour le peu d'intérêt pour l'utilisateur. Heureusement qu'ils ne l'ont pas fait, sinon ils seraient positionnés au-dessus des AdWords...

Nicolas

@leica69 : je lirais http://www.pdimension.net/w3c/QA-Tips/uri-choose et ne mettrais ni d'ID de base de données, ni d'extension de fichiers dans l'URL :).

L'application doit gérer les URL, ce qui n'est pas le cas puisqu'elles sont écrites à la volée : stockez-les en base, cela vous permettra d'éviter les erreurs 404, de mieux gérer les redirections 301, de rendre automatique la mise à jour du sitemap.xml et d'implémenter facilement la balise pour pallier d'éventuelles duplications de contenus.

leica69

Et comment adapterais-tu le code dans de l'URL rewriting?
Actuellement j'ai des pages nommées mon_mot_clef-123.html
J'utilise justement le tiret pour séparer les mots clés de l'ID. Ce serait problématique avec
mon-mot-clef-123.html ou
mes-10-astuces-123.html

Olivier Duffez

Pourquoi cela poserait-il problème ? il suffit d'un motif du genre (.+)-([0-9]+)\.htm$

Tutoriaux Webmasters

Parfait comme article. J'avais eu quelques discussions animées avant de pouvoir leur clouer le bec grâce à cet exemple. ;)

C3M

Si tout marche ne pas se poser de questions ! ;)

Nicolas

Si le site affichait l'URL correctement, il n'y aurait pas de problème :)

Nicolas

Olivier : le standard définit que les caractères d'une URL sont à écrire dans le jeu de caractères ASCII (et encodés en UTF-8), ce qui se traduit par une nécessité d'écrire l'espace en %20 (dans les documents en ISO-8859-1 par exemple, pas ceux en UTF-8 où l'espace peut être écrit comme tel), mais cela ne veut pas dire que l'outil qui affiche ces caractères à l'utilisateur (navigateurs, moteurs de recherche, etc.) ne doit pas l'afficher comme un espace (ce qu'ils font d'ailleurs tous mais pas toujours correctement) : même IE6 fin 2008 a été patché pour cela, à savoir afficher dans la barre d'adresse les caractères accentués, synogrammes, etc. au lieu des caractères ASCII (% quelque chose), ce qui permet par ailleurs d'avoir des chemins d'URL en arabe, chinois, japonais, russe, etc.

Utiliser l'espace dans un nom de dossier et/ou de fichier correspond à notre comportement sur un ordinateur. Cela me paraît être plus naturel que d'utiliser le tiret (d'ailleurs notre langue exploite l'espace plutôt que le tiret pour séparer des mots).

Maintenant le vrai problème reste l'interprétation et la restranscription de ces caractères par les outils : comment identifient-ils une URL (par exemple pour la convertir automatiquement en lien) ? en particulier si elle contient des espaces ?

C'est parce que leur détection des URL n'est pas optimale qu'il reste aujourd'hui nécessaire d'utiliser les tirets : en effet lorsque la valeur d'un attribut HTML (href dans notre cas) est délivrée sans délimiteur (/sans les guillemets), l'outil va mal interpréter cette valeur et prend seulement en compte tous les caractères jusqu'au 1e espace (exemples : navigateurs web, suite MS Office, etc.).

Alors certes utiliser le tiret semble nécessaire aujourd'hui parce que les outils sont à améliorer.

Olivier Duffez

Mis à part les outils... quand quelqu'un fait un copier-coller d'une URL dans un forum, tu trouves ça efficace pour l'internaute de voir des %20 et autres %C3%A9 ? moi je préfère largement les tirets...

Nicolas

@Aleric,fruit rouge,olivier : ceux sont les contenus qui sont positionnés, les URL ne font que les localiser ; leur rendu graphique (en gras) dans les SER sert juste à inciter (ou pas) au clic.

Le underscore est un caractère de développeurs : restons naturel et utilisons l'espace séparer des mots (comme dans la langue française) et le tiret pour les rapprocher (pique-nique).
Cela permettra une meilleure lisibilité de l'URL dans les SERP et donc d'accroître leur propension au clic. Bref, choisissez judicieusement vos URL : http://www.pdimension.net/w3c/QA-Tips/uri-choose.

Olivier Duffez

Nicolas : mettre un espace dans l'URL n'a pas vraiment de sens, d'ailleurs ce n'est pas prévu, l'espace sera remplacé par %20
Résultat, ceux qui dont des copier-coller de l'URL ne comprennent plus grand chose à la signification de l'URL...
Je préfère donc largement utiliser le tiret (ou d'autres bons séparateurs)

Olivier

Merci de mettre les points sur les i avec cet article. Underscore ou non est sujet a des trolls sans fin dans les forums. Je suis donc ravi d'avoir une réponse claire.

Concernant les ancre de lien, je n'avais jamais pensé au fait que les gens puissent copier-coller les url. C'est vrai que c'est une très bonne idée dans ce cas de mettre des tirets.

Michel Besson

On n'est pas un peu en train d'essayer de déterminer le sexe des anges, là? Google me semble assez clair dans ses directives; créez du contenu, clair si vous en êtes capables, sans passer votre temps à essayer de bidouiller le code. Alors, les tirets et les underscores...

Olivier Duffez

On prouve qu'il est indéniable que le tiret est à préférer à l'underscore, ce qui permet de créer des sites optimisés. Ca ne va pas plus loin mais c'est déjà ça.

christophe

Est ce que pour bing on a le même behaviour ? Car j'ai l'impression qu'il donne un poids très important au NDD et aux urls à la différence de GG.
En essayant de regarder dans bing, je ne trouve pas la page de test dans bing, on dirait qu'il ne veut pas du test ou peut-être que son contenu est trop faible à ses yeux ...

Foie Gras Canard

et bien, j'ai bien fait de mettre uniquement que des tirets dans mes url.
Car quand l'on propose un produit unique, mais avec une centaine de recettes différentes, j'avais décidé de mettre des tirets pour bien séparer les mots.
En tout cas, pour moi cela paye !
Je suis en 1ère page sur quasiment tous mes mots clés.
mais j'avais pas mal hésité avant de le faire.
merci et bonne journée.

Tajimanokami

Article intéressant, merci pour sa rédaction.

@Aleric : il est possible que tes pages soient bien référencées parce que les mots clés apparaissent ailleurs que dans l'url (titre, contenu de la page, balise description, ...)

vaince

Tout d'abord, merci pour cet article sur l'impact des différents séparateurs ( tiret ou underscore ) dans les URL et l'enjeu que cela peut impliquer en terme de SEO.

Le format des URL et leur optimisation pour un meilleur référencement a été un vrai casse tête pour moi lors de la création de mon site perso. Voir qu'il existe des articles comme celui-ci avec test à l'appui sur la bonne démarche à avoir est vraiment très appréciable.

Bref, un article extrêmement intéressant à lire, surtout avant de se lancer corps et âme dans le développement ou dans l'optimisation des URL d'un site !

anémone de mer

@Fruit rouge : j'ai dans mon site perso sur les poissons-clowns créé les liens avec des underscores, un peu innocemment. Ce serait à faire aujourd'hui, je ne me poserais plus la question et mettrait un tiret, c'est certain. Mais dans un site de niche, le nombre de "concurrents" sur les requêtes est tellement faible que la différence ne se fait pas au niveau de la qualité du lien, mais selon bien d'autres critères avant celui du match underscore vs. tiret.

Toutefois, on peut remarquer que les noms de domaines acceptent le tiret, et pas l'underscore : la recherche de mot-clé par les moteurs de recherche dans cette partie (NDD) de l'URL subit peut-être un traitement différent de la suite de l'URL qui suit.

Fruit rouge

Très interessant!
Néanmoins, je remarque que de nombreux sites disposant d'une URL composée de plusieurs mots mis les uns à à côté des autres sans séparation (ex : undeuxtrois.fr)sont très bien référencés. De plus, google semble reconnaître des mots clés à l'intérieur de ces groupes de mots sans séparation puisqu'il les mets en gras lors des recherches. Je me demande donc si la séparation des mots dans une URL est a vraiment un impact pour la lecture de google?

Olivier Duffez

J'ai encore mis à jour mon article avec de nombreuses explications pour répondre à tes interrogations.

Aleric Brei-Lefebvre

Je pensais que ce conseil était valable. Donc je l'ai suivit jusqu'a ce que je decouvre que l'un de mes sites avait des pages referencées tres correctement pour des pages avec le _ entre deux mots clefs dans le titre.

Donc je doutes. Cela ne peut etre qu'une simpe coincidence, peut-etre faudrait-il refaire des tests.

Les commentaires sont fermés