Guide d'optimisation des URL pour un bon référencement
Par Olivier Duffez
, Mercredi 19 avril 2006
Que faut-il savoir au sujet de l'optimisation des URL pour le référencement ? Cet article rappelle les principaux éléments à connaître.
Le format des URL
Avant tout chose, assurez-vous d'avoir lu le guide complet de la syntaxe des URL (sous-domaine, nom de domaine, extension, répertoires, etc.).
Présence de mots-clé dans les URL
Il est préférable d'utiliser des mots-clés stratégiques dans les URL, plutôt que des nombres ou des éléments dénués de sens. En effet, comme je l'avais montré dans un test publié sur WRI, les moteurs tiennent compte de la présence de mots-clés dans les URL. Par contre, ne vous attendez pas à des miracles avec cette optimisation, ce critère étant peu pris en compte. En résumé : si vous le pouvez (aidez-vous de la réécriture d'URL), utilisez des mots ayant du sens dans vos URL.
Tant qu'à faire, évitez d'utiliser dans ces URL certains mots apportant trop peu de sens (les articles par exemple). Mais dans certains cas il est nécessaire d'en garder (soit parce qu'ils sont importants en terme de référencement comme dans La Rochelle
ou l'article La
est important, soit pour rendre l'URL compréhensible).
Bonus pour AdSense
Si l'URL contient les mots-clés associés à la page, AdSense pourra s'en servir pour mieux cibler les publicités, surtout pour les tout premiers affichages quand la page vient d'être publiée.
Séparateurs de mots dans les URL
Pour séparer correctement les mots dans les URL, il faut utiliser des caractères interprétés comme des séparateurs par les moteurs de recherche. L'espace est déconseillé, mieux vaut utiliser le tiret, la virgule, la barre en biais (/) ou la barre verticale, mais pas le tiret bas (underscore : _). Ne vous fiez pas à la mise en gras de certains mots ou expressions dans les pages de résultats de Google, la gestion de l'affichage des résultats et l'algorithme de classement des résultats sont deux processus distincts. Pour l'instant, MSN Search indexe rarement les pages dont l'URL comporte plus de 2 tirets.
Longueur des URL
La longueur n'est pas un problème pour les moteurs, qui indexent des URL très longues. Par contre, ce n'est pas très pratique à exploiter, par exemple quand une URL est copiée dans un forum ou un blog, elle est souvent tronquée pour éviter de déformer l'affichage. Dans ce cas, les éventuels mots-clés qui la composent risquent de ne pas apparaître. Certains disent qu'il faut se limiter à 255 caractères, ce qui laisse déjà de la marge !
Le signe # dans les URL
Dans une URL, ce qui suit le signe # correspond traditionnellement à une ancre nommée, c'est-à-dire un signet interne à la page. On parle aussi parfois de "fragment". Cela permet de faire un lien vers une partie d'une page. Par exemple voici un lien vers la rubrique du signe # pour les URL.
Certaines technos utilisent ce signe d'une autre façon (c'est le cas notamment de Flex).
Soyez simplement conscients que pour les moteurs de recherche, tout ce qui suit le signe # est ignoré. Si des paramètres importants pour l'affichage du contenu sont passés derrière le signe #, cela risque d'être un problème pour votre référencement.
Extension : .html ou .htm ou .php ou .aspx ou aucune ?
Quelle extension faut-il utiliser ? Au moins cette question est simple : peu importe votre extension de fichier ! Vous n'êtes même pas obligé d'en utiliser (voyez l'exemple de Wikipédia). Ce n'est pas parce que cela se termine par .html qu'il s'agit d'un document HTML. Ce qui compte c'est que votre page soit effectivement codée en HTML (si possible sans trop d'erreurs !).
URL multiples
Si une page est accessible à deux URL (ou plus), il y a un risque de contenu dupliqué (duplicate content). Si un même contenu est accessible à plusieurs endroits, les moteurs de recherche tentent de déterminer ce qu'on appelle l'URL canonique, c'est-à-dire l'URL de la page la plus légitime (par exemple celle qui reçoit le plus de liens). Ils n'indexent alors que cette URL canonique, et n'indexent pas les autres (par exemple, Google vient d'améliorer son algorithme à ce sujet depuis la mise en place de BigDaddy). Le problème est qu'il est difficile de prévoir quelle URL va être retenue par les moteurs. Par ailleurs, avoir une page accessible à plusieurs URL est mauvais également en terme de stratégies de liens, puisque l'optimisation s'éparpille sur plusieurs URL plutôt que de se concentrer sur une seule. Voilà pourquoi il faut faire attention de ne pas avoir d'URL multiples pour une page donnée.
A ce propos, comme l'indique SuperPJ dans les commentaires, si on utilise l'URL Rewriting, il ne faut pas oublier de désindexer les pages dynamiques ayant l'ancien format d'URL. Pour cela, le mieux est de rediriger de façon permanente (code HTTP 301) chaque ancienne URL vers la nouvelle équivalente. Si ce n'est pas possible, utilisez la balise URL canonique ou le fichier robots.txt. Dans le cas contraire, une même page sera accessible sur 2 URL ce qui posera des problèmes de duplicate content.
Autres conseils
Ce type de conseil d'optimisation du référencement fait partie des points abordés au cours des journées d'étude sur le référencement que j'organise régulièrement au sein de Ranking Metrics. Dans ce cas précis, l'optimisation des URL est largement abordée au cours de la journée consacrée à l'optimisation des sites dynamiques (avec des explications détaillées sur les problèmes de contenus dupliqués ainsi que sur l'URL Rewriting).
Si j'ai oublié des éléments à prendre en compte pour bien optimiser ses URL pour le référencement, ou si certains points ne sont pas ou plus exacts, n'hésitez pas à me les indiquer en commentaires, j'essaierai de mettre à jour cet article. Merci à tous ceux qui ont joué le jeu et grâce à qui j'ai déjà complété mon article.
On en parle dans le forum : optimisation des URL pour le référencement
A propos de l'auteur : Olivier Duffez
![]()
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
17 commentaires
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
Catégories des dossiers
- Actualité
- Android
- Autres produits Google
- Brèves
- Conseils référencement
- Débuter en référencement
- Droit et Internet
- e-marketing
- Ecrire pour le web et le référencement
- Gmail
- Google AdSense
- Google AdWords
- Google Analytics
- Google Chrome
- Google Images
- Google Labs
- Google Maps
- Google Mobile
- Google News
- Google Search
- Google Toolbar
- Google Webmaster Tools
- Google+
- Indexation Google
- L'entreprise Google
- Les API de Google
- Livres sur le référencement et les moteurs de recherche
- Outils
- PageRank
- R&D référencement
- Ranking Metrics
- Référencement Bing
- Référencement des images
- Référencement et PHP
- Référencement local
- Référencement Yahoo
- Référencement Yandex
- Réseaux sociaux
- Sitemaps
- Stratégies de liens
- Stratégies de mots-clés
- Techniques de référencement
- Webmastering
- WebRankInfo
- YouTube
Sites de l'annuaire
- Référencement de site internet à Valence
- Redirection web gratuite par Xewing
- Formation au référencement et à Google Analytics
- Blog sur le référencement et les formations Ranking Metrics
- AnoWeb : l'annuaire de sites Web de qualité !
- Centre de recherche en référencement, organisme de formation
- Noogle
- Les Pages du Keroinsite - Annuaire de sites Internet généraliste



19 avril 2006 à 9:15
Très bon article, comme souvent sur Webrankinfo.
J'ai juste une petite chose à ajouter. Si on utilise l'url-rewriting, il ne faut pas oublier de désindexer les liens dynamiques grace au fichier robots.txt, sans quoi une même page sera accessible sur 2 urls (l'adresse dynamique et l'adresse non dynamique), ce qui posera des problèmes de duplicate content. Cela peut être grave si un webmaster malintentionné génère des milliers de liens vers les url dynamiques.
19 avril 2006 à 11:09
Bonjour
Si c'est interessant d'avoir les mots clés dans l'url, pourquoi le forum de wri n'utilise pas des mots clés dans les url?
j'hésite beaucoup moi meme avec le forum, j'avais mis des mots clés, puis je les ai ensuite enlevé... quelle est le mieux?
19 avril 2006 à 14:33
Salut
Certains portail (infosdunet par exemple) mettent des mots clé dans l'url est c'est réussi car ils sont trés présents dans les mots clé de leur domaine.
Pour ceux qui utilisent dotclear, ils ont sans doute remarqué l'importance de l'url dans le référencement.
19 avril 2006 à 15:28
Bonjour,
je reviens sur la longueur des URL. La limite est effectivement de 255 caractères, tout simplement parce que cette URL est encodé sur 1 Kilo octets soit 256 octets et dont un octet pour le bit de parité. Du moins, c'est un problème dans ce genre, merci de me corriger.
Sinon une URL de plus de 200 caractères, c'est très moyen niveau accessibilité.
19 avril 2006 à 16:24
Au-delà du référencement à proprement parler, ne pas oublier l'aspect sémantique. Une url contenant des mots-clés peut faite la petite différence, qui va faire qu'un internaute va cliquer sur votre site plutôt que sur celui de vos concurrents, même si ils sont un peu devant vous... Si vous éditer un rapport de réunion sur votre traitement texte préféré, comment allez-vous appeler votre fichier : doc0578.pdf ou rapport-reunion-avril2006.pdf ? Pour le web, c'est pareil...
22 mars 2009 à 18:44
Enlever dans l'url les mots de liaison de type "de,des,le,la...." est-il est bon conseil ?
Il faut mieux, quand c'est possible, une url de type ?
ou example.com/optimiser-les-url.htm
example.com/actualites/200604-optimiser-les-url.htm
ou encore example.com/actualites-referencement/optimiser-les-url.htm
Merci de vos réponses.
23 mars 2009 à 10:43
Ca dépend des cas... Si l'URL devient trop peu compréhensible sans les mots de liaison, je pense qu'il faut les mettre. Même chose si l'URL reste courte malgré leur utilisation. Dans les autres cas, je trouve que c'est préférable de les enlever pour se concentrer sur les mots-clés stratégiques.
12 septembre 2009 à 11:08
J'ai remarqué que certaines personnes se méfient des pages ne finissant pas par .html (ou à la limite .htm, mais ça fait un peu vintage). Ca donne l'impression d'une page qui aurait une volonté propre. J'évite les .php sauf pour les forums et les formulaires de contact à cause de ça.
Je ne sais pas ce que ça vaut comme avis mais si ça met à l'aise 2% des visiteurs c'est toujours ça.
25 octobre 2011 à 12:20
Lors de la création de mon site perso je me suis posé énormément de questions en ce qui concerne le format de mes URL car c'est une étape très importante lors du développement. Si j'avais eu en ma possession un article comme ça, cela m'aurait surement permis d'avoir moins de sueurs froides car je le trouve très complet en ce qui concerne les questions que l'on peut se poser sur les URL.
J'ai toute fois une question : Est-il meilleur pour le référencement de garder une extension de page ( .htm, .php, ... ) ou bien de faire un rewriting pour s'en séparer ?
25 octobre 2011 à 12:50
L'extension n'a aucun impact, d'ailleurs la notion d'extension n'existe pas sur le web, tout comme celle de fichier ou de dossier. Ce n'est que par habitude du temps où les pages web étaient statiques et que les fichiers HTML avaient des extensions.
26 décembre 2011 à 21:38
Au-delà du référencement à proprement parler, ne pas oublier l'aspect sémantique. Une url contenant des mots-clés peut faite la petite différence, qui va faire qu'un internaute va cliquer sur votre site plutôt que sur celui de vos concurrents, même si ils sont un peu devant vous... Si vous éditer un rapport de réunion sur votre traitement texte préféré, comment allez-vous appeler votre fichier : doc0578.pdf ou rapport-reunion-avril2006.pdf ? Pour le web, c'est pareil...
26 janvier 2012 à 8:02
j'aime quand Google confirme ce que je pensais dans mon billet "Fermez vos URLs !" - http://lb.tc/um
Si c'est Matt Cutts qui le dit http://www.youtube.com/watch?v=dSG6C33GwsE
26 janvier 2012 à 10:17
s'il le dit c'est sûrement vrai, on connait bien Matt ;-)
Je crois que chacun gardera son avis sur ce sujet !
3 février 2012 à 10:51
J'ai un doute sur l'emploi des virgules dans les urls comme préconisé ici pour séparer les mot-clés dans les urls
un extrait de la RFC 1738 :
characters are unsafe because
gateways and other transport agents are known to sometimes modify such characters. These characters are "{", "}", "|", "\", "^", "~",
"[", "]", and "`".
3 février 2012 à 11:12
Par expérience, Google considère bien la virgule comme un séparateur, mais je suis d'accord que ce n'est pas l'idéal et qu'il vaut mieux utiliser des signes plus "simples".
3 février 2012 à 11:45
Merci, pour la réponse, je continuerai à utiliser mes tirets par sureté.
par ailleurs, il faut mettre des liens nofollow des moteurs de recherche interne ?
Cela évite de suivre les liens générés par la validation "à vide" du formulaire par le bot des moteurs ?
3 février 2012 à 16:06
@Fred : je n'ai pas compris sur quels liens tu demandes s'il faut mettre du nofollow.
en ce qui concerne le moteur de recherche interne, il faut interdire l'indexation des pages de résultats avec une balise meta robots noindex.