Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Référencement : les mots à connaître pour les URL

Dans une URL, savez-vous identifier un schéma, un hôte, un sous-domaine, un nom de domaine, un TLD, un ccTLD, le chemin d’accès, un identifiant de fragment ? Voici un aide-mémoire pour ceux qui découvrent ou qui ont oublié…

Article mis à jour le 16/07/2015, publié initialement le 24/08/2007

Glossaire des URL

Tous les mots à savoir liés aux URL

Je reprends l’idée de Matt Cutts qui a publié un article sur ce sujet, en le traduisant et en ajoutant des remarques…

Je reprends son exemple d’URL pour la décortiquer :

http://video.google.co.uk:80/videoplay?docid=-7246927612831078230&hl=en#00h02m30s

Le schéma dans l’URL

http est le schéma, parfois appelé aussi protocole. On trouve parfois https pour les environnements sécurisés (qui peuvent très bien être indexés par les moteurs, il suffit qu’il n’y ait pas d’authentification obligatoire pour qu’ils y aient accès).

Attention à ne pas faire l’erreur de faire indexer votre site à la fois en http et en https (si le contenu est identique) car sinon vous vous créez des problèmes de contenus dupliqués internes… Si avez ce genre de problème ou que vous souhaitez l’anticiper, jetez un oeil au code à mettre dans votre fichier .htaccess.

Au fait, le saviez-vous ? Google favorise les URL en HTTPS (par rapport à celles en HTTP). Le boost est très faible, mais autant le savoir.

Le nom d’hôte

video.google.co.uk est le nom d’hôte (hostname)

Le sous-domaine

le sous-domaine est video. On trouve parfois des sous-domaines contenant des points (et donc ce qu’on pourrait appeler des sous-sous-domaines), par exemple dans http://georgesbrassens.artistes.universalmusic.fr/, georgesbrassens.artistes est un sous-domaine de universalmusic.fr.

Autre exemple : dans www.webrankinfo.com, www est un sous-domaine de webrankinfo.com.

En général, vous pouvez créer autant de sous-domaines que vous voulez, c’est gratuit et pas très compliqué techniquement. Cependant, limitez l’utilisation de sous-domaine aux grandes parties de votre site : créer de très nombreux sous-domaines pour optimiser le référencement est vu comme du spam par Google.

Le nom de domaine

le nom de domaine est google.co.uk

Remarque : j’ignore si l’exemple de Matt est correct à 100%… google ne peut-il pas être considéré comme un sous-domaine de co.uk ? Les spécialistes donneront leur avis dans les commentaires ;-)

Le domaine de 1er niveau (TLD)

uk est appelé TLD (domaine de premier niveau). Dans cet exemple il s’agit plus précisément d’un ccTLD (domaine national de premier niveau), car il concerne spécifiquement un pays. Dans un cas plus classique comme www.webrankinfo.com, le TLD est com.

Le saviez-vous ? A part les TLD qui sont associés à des pays (ccTLD), Google traite tous les TLD de la même façon. En tout cas, pas de traitement spécial pour les nouveaux TLD.

Le domaine de 2nd niveau (SLD)

co.uk est appelé SLD (domaine de second niveau).

Le numéro de port dans l’URL

le numéro de port est le 80. Dans cet exemple il est mentionné explicitement, mais dans la plupart des cas on ne l’indique pas, le port 80 étant le port par défaut d’un serveur web.

Le chemin d’accès (répertoires)

le chemin d’accès (répertoire) est /videoplay. Si on prend un exemple plus complet comme http://www.webrankinfo.com/dossiers/debutants/vocabulaire-url, le chemin d’accès est /dossiers/debutants/. Dans certains cas (utilisation d’URL Rewriting par exemple, comme dans l’URL du billet de Matt Cutts), on ne peut pas vraiment distinguer le chemin d’accès du nom de fichier. D’ailleurs le path inclut peut-être les répertoires et le nom du fichier, je ne sais pas trop…

URL dynamique

cette URL est qualifiée de dynamique car elle contient des paramètres situés derrière le point d’interrogation. D’ailleurs tout ce qui suit ? jusqu’à la fin de l’URL (ou jusqu’au caractère # s’il est présent) est appelé query string. Le W3C recommande que la query string soit constituée d’une série de paires {nom de paramètre}={valeur du paramètre}, séparées par le signe & (ou le point-virgule). Dans l’exemple de Matt, hl est un paramètre dont la valeur est en. On appelle aussi ces paramètres des variables, et on dit qu’on les passe dans l’URL. S’il y a trop de paires dans l’URL, les moteurs risquent de ne pas indexer la page, c’est pourquoi on conseille soit de limiter leur nombre, soit de mettre en place la réécriture d’URL. Notons que Matt a indiqué récemment que Google traitait de la même façon les URL statiques et dynamiques : aucune n’est avantagée dans le référencement.

Le fragment (ancre nommée)

#00h02m30s est appelé un identifiant de fragment ou parfois une ancre nommée. Traditionnellement, on utilise les identifiants de fragments dans les URL afin de pointer à un endroit précis de la page web (le fragment) identifiée par le reste de l’URL. Dans ces cas là, il est courant de trouver un lien d’une page vers elle-même, vers une ancre nommée particulière. Ce qui est intéressant dans l’article de Matt c’est qu’il précise que Google ignore les identifiants de fragments dans les URL (il ne semble pas vraiment catégorique mais c’est en effet ce qui est courramment retenu). Il faut préciser que dans cet exemple l’identifiant de fragment n’est pas valide car il ne doit pas commencer par un chiffre.

Les fragments sont désormais utilisés dans d’autres cas, par exemple avec AJAX ou Flex. Dans certains cas particuliers, Google peut tenir compte de l’ensemble de l’URL, fragment inclus, mais d’une manière générale il vaut mieux considérer que tout ce qui suit le signe # est ignoré des moteurs.

Matt termine son article en donnant sa définition des pages dynamiques : il s’agit pour lui de pages qui nécessitent un traitement du serveur web pour calculer le contenu de la page, par opposition aux pages statiques. On ne peut en effet pas se baser sur la présence du signe ? dans une URL pour savoir si elle est dynamique car il y a des contre-exemples (Matt parle de http://news.google.com qui est une page dynamique, mais la réécriture d’URL peut aussi masquer le point d’interrogation). Je trouve sa définition intéressante, elle rejoint celle que je donne dans mes formations au référencement : une page statique existe en tant que fichier sur le serveur qui héberge le site, tandis qu’une page dynamique n’existe pas physiquement (mis à part sa version en cache), elle est générée à la volée. Sur les sites actuels, les pages statiques se font rares…

Pour revenir sur le référencement proprement dit, vous pouvez (re)lire mes conseils d’optimisation des URL pour le référencement.

Cet article vous a-t-il plu ?

Note : 5.0 (1 vote)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

3 commentaires

b_adele

Pour la remarque 5, je dirais non, puisque tu donne la réponse en 7 :)

Répondre
Nurgle

Au contraire, pour la remarque la réponse est plutôt oui.
Quand on demande une URL, l’hôte final n’est pas contacté directement, le navigateur doit en trouver l’adresse IP, et donc passer par les serveurs DNS (Server de Nom de Domaine) "racines" qui eux-même connaissent les adresses IP des serveurs DNS qui gèrent les domaines de 1er niveau (TLD), qui eux possèdent une liste des serveurs DNS du niveau inférieur (SLD), et ainsi de suite jusqu’à l’arrivée au serveur web. Ainsi dans "google.co.uk", "google" est bien sous-domaine de "co", lui même de "uk", et lui même du domaine racine du web (qui n’a pas de nom).
La notion de sous-domaine ne commence pas après les SLD, tout le web est basé sur cette hiérarchie de domaines. Chaque autorité qui gère un domaine (des domaines nationaux, domaines génériques, aux domaines déposés par les webmasteurs) gère une liste de "sous-domaines".

Néanmoins, pour parler correctement, "le sous-domaine est ‘video’" est faux. Il n’y a pas de sous-domaine dans une URL, seulement un FQDN (Full Qualified Domain Name) qui ici est "video.google.co.uk".
Mais "le sous-domaine de ‘google.co.uk’ est ‘video’", ça c’est vrai :p

Répondre
alex de Référencement Blog

Bonjour Nurgle, je te trouve très pointilleux, il faut parfois savoir simplifier.

Le plus simple est de dire que les domaines (.uk) et sous-domaines (.co.uk) gérés par des organismes nationaux (AFNIC) ou internationaux (ICANN) sont des extensions.

Ce qui est achetés (google.co.uk) par des entreprises ou particuliers auprès de Registars (OVH, Amen…) sont des domaines.

Et tout ce qui est générés à la volé gratuitement par le client de ce Registar est un sous-domaine (video.google.co.uk).

Répondre