HTML 5 : quel impact sur le référencement ?
Par Olivier Duffez, vendredi 25 janvier 2008
Le W3C vient de publier une version de travail décrivant la future version du langage HTML : la version 5. Même si on a largement le temps avant qu'elle soit utilisée, voici quelques informations sur ce qui change et surtout l'impact sur le référencement.

Remarque importante : ces listes sont loin d'être exhaustives et seront sans doute complétées par la suite.
Les nouvelles balises de HTML5
Voilà certaines balises qui me semblent nouvelles dans la version 5 de HTML (mais je me trompe peut-être... je me suis basé sur le brouillon qui décrit HTML 5) :
section: représente un groupement thématique de contenu sur la page (a priori surtout textuel si j'ai bien compris). Je pense que cette balise n'aura pas d'impact direct dans le référencement, car elle est plutôt neutre comme l'est la balisediv. Cela dit il faut nuancer cette remarque car la balisesectionpeut jouer un rôle particulier si on la combine avec d'autres (voir la balisehpar exemple). Une section possède généralement un entête défini par la baliseheaderet une fin de section définie par une balisefooter.header: entête d'une section située bien entendu au début. Elle peut contenir d'autres balises, y compris des paragraphes (p) ou des sous-titres (h1...h6). La baliseheadera le même niveau d'importance qu'une baliseh1, donc elle sera importante pour le référencement.footer: fin de section, comprenant par exemple le nom de l'auteur, des données de copyright, etc. Cette balise ne me semble pas spécialement importante pour le référencement.- Entêtes (
header), niveaux de titres et sous-titres (h1...h6) et sections (section) : les sections peuvent démarrer avec n'importe quel niveau de titre, mais le W3C encourage de commencer avec une balise h1. Je constate que le W3C laisse supposer qu'il peut tout à fait y avoir plusieurs balisesh1dans un même document... article: représente un élément de contenu de la page (a priori textuel si j'ai bien compris). C'est par exemple un post de forum ou de blog, un article entier ou un commentaire dans un blog. On peut imbriquer plusieurs balisesarticle, par exemple dans le cas de commentaires d'un blog si quelqu'un commente le commentaire d'un autre. J'imagine que les moteurs en tiendront compte de façon similaire à ce qu'ils font avec la balisep.aside: une partie du document qui n'est que faiblement en relation avec le reste du documentnav: une partie du document destinée à la navigationdialog: permet de retranscrire une conversation. On l'utilise en général avec les balisesdt(pour donner le nom de la personne qui va parler) etdd(pour indiquer ce que cette personne dit).progress: indique le degré d'avancement d'une tâchemeter: indique une valeur scalaire mesurée dont on connait l'intervalle de valeurs possibles, ou bien une valeur fractionnairefigure: représente une zone de contenu de type prose incluant généralement une légende (legend).video: représente une vidéo (ça alors !)audio: représente un son ou un flux audio
Les balises qui disparaissent dans la version 5
frameframesetnoframes
D'autres balises (pas nouvelles mais pas tellement connues j'ai l'impression...)
samp: représente un exemple de texte produit en sortie par un système informatiqueins: représente une partie du document qui a été ajoutée à la version initiale du documentdel: représente une partie du document qui a été supprimée de la version initiale du documentkbd: représente une donnée entrée par un utilisateur (en général par le clavier)address: contient des informations de contact concernant la section en cours. On la trouve typiquement dans une balisefooter. Cette balise n'est pas nouvelle mais change légèrement de signification.legend: représente la légende de l'élément parent (ça peut êtrefigure)
Optimiser le référencement d'un site en HTML 5
C'est bien joli tout ça, mais qu'est-ce que ça va changer pour le référencement ? Difficile à dire, alors voici quelques conjectures qui n'engagent que moi :
- il va se passer encore pas mal de temps avant que la norme HTML5 soit définitivement définie par le W3C ; tant que ce n'est pas fait, il ne devrait pas y avoir de sites codés en HTML 5
- les moteurs de recherche vont certainement s'intéresser de près à cette nouvelle norme, puisqu'ils devront être en mesure de
comprendre
les documents codés en HTML5. J'imagine que dans un premier temps leurs algorithmes ne seront pas encore adaptés aux changements apportés par cette nouvelle version, si bien qu'il leur sera difficile de juger la pertinence de ces documents-là. - même quand HTML 5 sera sorti et pris en compte par les moteurs, ils continueront évidemment à indexer les pages en HTML 4
- de nombreuses balises introduites par HTML5 sont certes très utiles pour le concepteur web mais restent relativement neutres pour les moteurs de recherche. Il s'agit de balises qui ne servent pas à mettre en valeur certaines parties de la page web, mais à indiquer à quoi elles correspondent. Cependant, il est évident que les moteurs vont malgré tout exploiter les nouvelles balises, pour mieux indexer le contenu. Par exemple, il sera plus facile aux moteurs d'extraire des entités nommées (par exemple des lieux, des dates ou des mesures).
- la gestion des sections (avec entête et pied-de-section) et des articles va permettre plus de liberté dans le codage du contenu textuel, qui reste l'ingrédient principal de l'optimisation du référencement. L'optimisation des différents niveaux de titres et sous-titres va changer, il faudra faire de nouveaux tests...
Et vous qu'en pensez-vous ? N'hésitez pas à donner votre avis dans les commentaires ou dans le forum (discussion HTML5)
Pour en savoir plus :
- une première version du document décrivant HTML5 (encore au stade de brouillon)
- les différences entre HTML5 et HTML4
- une meilleure vision des choses par un spécialiste des normes
- la discussion dans le forum sur HTML 5

Ajoutez ce blog à vos favoris Technorati !




Commentaires
1. Le vendredi 25 janvier 2008 à 19:47, par TOMHTML
2. Le samedi 26 janvier 2008 à 12:19, par dehen
3. Le samedi 26 janvier 2008 à 14:33, par Yves
4. Le samedi 26 janvier 2008 à 16:11, par Seebz
5. Le samedi 26 janvier 2008 à 17:12, par Bilel
6. Le dimanche 27 janvier 2008 à 14:32, par Ludo
7. Le dimanche 27 janvier 2008 à 17:12, par carole heinz
8. Le lundi 28 janvier 2008 à 08:31, par Olivier Duffez
9. Le lundi 28 janvier 2008 à 19:21, par erno
10. Le mardi 29 janvier 2008 à 08:43, par Patrice
11. Le mardi 29 janvier 2008 à 09:11, par aboyeur
12. Le mardi 29 janvier 2008 à 09:29, par Etienne
13. Le mardi 29 janvier 2008 à 09:32, par Fabrice Bonny
14. Le mardi 29 janvier 2008 à 11:10, par Crocxx
15. Le mercredi 30 janvier 2008 à 11:07, par Guillaume
16. Le mercredi 30 janvier 2008 à 12:03, par ben
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.
A lire dans le forum WebRankInfo