Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

schema.org : standard de données structurées (microdata)

Pour mieux comprendre la sémantique des données présentes dans les pages web, les moteurs ont besoin que les données structurées soient formatées avec un standard connu. Jusqu’à présent, plusieurs standards cohabitaient (microformats, RDFa, microdata, etc.). Les 3 moteurs de recherche Google, Bing et Yahoo ont décidé de se regrouper pour créer un nouveau standard commun intitulé schema.org, à la manière du standard sitemaps.org. Explications…

Le site officiel schema.org

Le site officiel schema.org fournit toutes les informations nécessaires aux développeurs web

Qu’est qu’un format de données structurées ?

Prenons l’exemple d’une page web sur laquelle vous listez des films de cinéma, en indiquant pour chacun les principales informations (son titre, le nom du réalisateur, la date de sortie, le genre, etc.).

Si vous ne faites qu’utiliser les balises standard de la norme HTML (H1, H2…, P, etc.), les moteurs qui viennent crawler votre page ne sauront pas qu’il s’agit d’une liste de films, ils ne sauront pas à quoi correspondent toutes les caractéristiques que vous affichez.

Par contre, si vous utilisez un format reconnu de données structurées, vous pouvez faire en sorte que les robots qui supportent ce format « comprennent » à quoi correspondent vos données. Bien entendu, cela ne change rien pour l’internaute, sensible uniquement au rendu à l’écran.

A quoi ça sert de coder son site avec des données structurées ?

Si vous utilisez un format de données structurées reconnu par les moteurs de recherche, vous vous donnez une chance d’avoir vos contenus qui s’affichent de façon évoluée sur les pages de résultats de recherche. Au fur et à mesure que les moteurs enrichissent leurs pages de résultats (SERP) de nouvelles fonctionnalités, vos contenus pourront être mis en valeur.

Parmi les exemples les plus connus figurent sans doute les avis (reviews). Quand l’internaute voit parmi les différents résultats un résultat accompagné d’étoiles jaunes, son regard est attiré !

La principale utilisation de ces données structurées sera donc l’enrichissement des pages de résultats de recherche. Il est logique de voir Yahoo participer à cette alliance, car Yahoo reste maître du look de ses pages de résultats (même si la liste des résultats est fournie désormais par Bing, depuis leur alliance).

Mais rien n’empêche les moteurs Google et Bing d’utiliser ces données à d’autres fins, que ce soit pour mieux comprendre la signification d’une page ou même pour enrichir leur propre base de données structurées (je pense à Google Adresses)…

Peut-on aller jusqu’à dire que les données structurées améliorent le référencement ? J’aborde ce sujet dans mon dossier Les données structurées, prises en compte pour le référencement.

Comme Vanessa Fox le fait remarquer dans son article, Google a déjà construit un produit basé sur les données structurées : la recherche de recettes (disponible seulement sur google.com à ce jour il me semble). L’internaute dispose d’un moteur à facettes pour affiner sa recherche, par exemple pour un fondant au chocolat :-)

Recherche de recettes sur google.com

Sur google.com on peut chercher des recettes avec des options de recherche avancée

Pourquoi un nouveau standard de données structurées ?

Jusqu’à présent, aucun format n’a vraiment réussi à s’imposer : mes microformats posent parfois des problèmes de conflit avec les noms de classe CSS tandis que RDFa est jugé parfois trop complexe.

Les microdata (micro données) retenues par l’alliance Google – Microsoft – Yahoo se situent à peu près à mi-chemin.

Si vous avez déjà codé votre site avec les microformats (c’est le cas sur WebRankInfo) ou RDFa, vous pouvez les conserver, les moteurs continueront à les supporter. Mais il est conseillé dans la mesure du possible de vous mettre à jour pour utiliser le nouveau standard schema.org !

Une fois que vous aurez intégré ces microdonnées, testez votre page sur l’outil de Google de test des Rich Snippets.

Vous trouverez toutes les informations nécessaires sur le site officiel schema.org, malheureusement pour l’instant uniquement en anglais (des traductions arriveront plus tard).

Venez discuter sur le forum WRI de ce nouveau protocole schema.org : vous pourrez poser toutes les questions que vous souhaitez.

Vous pouvez également consulter les 3 annonces officielles :

Cet article vous a-t-il plu ?

Cliquez pour voter !

14 commentaires

Achat de voiture sur internet

Olivier,

Je tenais à réagir à votre post, suite à différents messages trouvés sur la toile, de certains qui s’indignaient contre « cette entente ». Je pense que tous les webmasters ont intérêt à passer aux données structurées, qui va être d’ici peu de temps très utilisé sur internet (l’union des moteurs le montre).

Pourquoi s’indigner ? Je pense que l’on a tout intérêt à avoir un seul format, structuré, avec des exemples pour faire le travail correctement. Les différents formats acceptés auparavant par les moteurs étaient certes très documentés, mais on manquait de cohérence entre les différents moteurs.

Chers collègues webmasters, ne vous indignez pas, mais profitez de l’occasion pour mettre en place ce nouveau format, et pourquoi pas par la même occasion l’arrivée d’une hausse de trafic ?

jérôme

C’est bizarre car je trouve au contraire le concept intéressant. Pour une fois que l’uniformisation à du bon. Je me dis que ce serait génial si on pouvait classer l’information dans les bibliothèques aussi facilement que sur les moteurs de recherche

oodoc

C’est pas trop tôt, ça faisait un moment que j’attendais ça.
On va pouvoir enfin mettre en avant des critères (comme le prix) dans les SERP.
Du coup, quand on a un produit payant, ça évitera que le visiteur clique, puis se rende compte ensuite seulement que c’est payant, s’il cherche quelque chose de gratuit.
Car personnellement, sur un de mes sites en particulier, je ne vois pas l’intérêt de générer du trafic si le visiteur n’est pas prêt à payer (ou n’a pas de moyen de paiement).

Laurent Bazet

Intéressant ces formats mais ils ouvrent aussi un nouveau chantier pour GG pour la lutte contre le spam.

Dans le cas de hrecipe pour les recettes, il suffit de faire quelques recherches (le format est actif en FR) pour constater que les infos affichées dans les SERP ne correspondent en rien avec les pages correspondantes. Misère…

Janolapin

Il me semble aussi que c’est une opportunité pour tous.. à une seule condition, c’est que ce nouveau format soit compatible avec tous les outils sémantiques déjà existants.

Parce qu’il ne s’agît jamais que de taggage du contenu. Et que le plus importnat reste les outil d emanipulation de se taggage.

Un petit lien pour avancer sur le sujet:
http://semanticweb.com/guided-tour-of-the-semantic-web-at-semtech-2011_b20388

poppyto

Dans l’absolu c’est cool, après j’ai mis en place le format sur toutes mes ressources d’avis il y a quelques mois et aucune n’a été prise en considération.

C’est là où il y a du mou, google sélectionne les sites mais comment ???!

Olivier Duffez

poppyto, as-tu rempli le formulaire pour déclarer avoir utilisé des données structurées sur ton site ?

poppyto

C’est chose faite ! Il ne reste plus qu’à attendre. Merci pour l’indication Olivier (Néanmoins je trouve potentiellement dommage que ça ne se fasse pas tout seul)

David

Bonjour,
Merci pour cet article. Je suis débutant dans le domaine et je me posais justement la question de savoir comment certains sites (notamment pour les recettes) faisaient pour afficher des informations spéciales dans les recherches Google (notamment).
Je vais de ce pas voir comment implémenter ces données structurées.
David

asma

Visiblement, pour certains sites, c’est très claires et plus facile de choisir les microdata à insérer. (Comme, dans l’exemple, pour les sites des recettes …)
Cependant, je trouve du mal à trouver quel genre de microdata insérer dans un site comparateur de devis par exemple (à part le nombre d’avis)
Des pistes ?
Merci

Marklin

Quelqu’un a t’il pu constater un réel mieux suite à la mise en place de ces nouveaux formats ?

FemmeTaureau

Bonjour,
Merci pour nous présenter ce format des données structurées. Je pense que le web tend, avec ce genre de format, à être plus logique et plus lisible notamment avec le concept linked data qui constitue vraiment l’avenir du web sémantique.

Samar

Bonjour
Je trouve l’article interessant car j’utilise justement les microformat pour mes recettes Mais j’aimerai passer au schema.org j’ai tente plusieurs fois d’implanter les balises Mais rien n’y fait ils disparaissent des que je valide le code html. Donc si qlq’un a déjà utilise le schema.org dans ses articles je suis ouverte a toute proposition. Merci

Les commentaires sont fermés