Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google Data Highlighter, un outil d’aide au marquage de données structurées

Google a sorti un nouvel outil dans Google Webmaster Tools, facilitant le marquage de données structurées sans avoir à toucher au code HTML. Il fonctionne pour 8 types de données (événements, articles, avis sur les livres, commerces locaux, restaurants, films, émissions TV, applications).

L'outil Google Data highlighter (pour les données de type event)

L’outil Google Data highlighter (pour les données de type event)

Fonctionnement en mode WYSIWYG

Avec cet outil, Google devrait grandement faciliter le marquage de données structurées, permettant aux éditeurs de site n’ayant pas un profil technique de déclarer à Google où leur site contient des données de certains types (8 sont actuellement reconnus). En gros, on peut gérer des données structurées avec un outil de type WYSIWYG.

Son fonctionnement est assez simple : directement dans une vue de votre navigateur, vous consultez vos contenus. Vous sélectionnez par exemple le texte du titre  d’un événement puis vous sélectionnez dans un menu le type de donnée pour indiquer qu’il s’agit du nom de l’événement. Idem pour la date et les autres éléments. Une fois que vous avez terminé de gérer un événement, vous « publiez » les informations, afin que Google les enregistre.

Au fur et à mesure que vous taguez vos contenus, Google apprend automatiquement et au bout de 5 ou 10 marquages de ce genre, il est en mesure de reconnaitre sur votre site tous les autres endroits où vous publiez des contenus du même type (ici les événements). Inutile d’aller déclarer un par un 100% de vos contenus.

Ensuite, quand votre compte Google Webmaster Tools aura été mis à jour, vous pourrez dénombrer les entités nommées identifiées par Google.

Vous trouverez en fin d’article un tutoriel sur le marqueur de données de Google.

Intérêt pour vous et pour Google

L’intérêt pour vous est de mieux faire comprendre à Google la sémantique de vos contenus afin qu’il puisse enrichir les SERP avec ces informations et mettre en valeur vos pages quand elles apparaissent dans les résultats. Voici un exemple d’affichage de rich snippet d’événement :

Extrait enrichi pour des dates d'événements dans les SERP Google

Extrait enrichi pour des dates d’événements dans les SERP Google

L’intérêt pour Google est d’enrichir son index avec des données structurées plutôt que du texte brut sans information sémantique. Ceci lui permet de mieux « comprendre » le contenu de votre site, mais surtout d’étoffer son Knowledge Graph. Ne vous y trompez pas, ce « graphe de la connaissance » que Google est en train de bâtir est un élément capital du moteur de recherche (lisez mon point de vue sur l’impact sur le référencement). Après de longs mois de présence aux USA uniquement, le KG est arrivé sur google.fr donc nous sommes directement concernés.

Avec cet outil Data Highlighter, Google passe pour celui qui nous facilite la vie (il n’est plus nécessaire de s’embêter à intégrer un codage particulier, par exemple schema.org). Mais à bien y réfléchir, on réalise qu’avec ce système, Google va acquérir une énorme quantité d’informations riches que ses concurrents ne pourront pas obtenir, puisque l’information sémantique n’est pas disponible dans le code source. Bing et son timide Knowledge Graph auront donc du mal à se développer…

Comment utiliser le marqueur de données de Google ?

D’abord limité à l’anglais à sa sortie en décembre 2012, il est disponible depuis février 2013 dans toutes les langues supportées par Google Webmaster Tools (soit 40 à l’heure actuelle) (source).

Voici un tuto de conseils pour utiliser le marqueur de données structurées.

Types de données prises en charge

Data Highlighter prend en charge les types de données suivants :

Organisation des pages en ensembles de pages

Pour indiquer au marqueur de données les pages de votre site qui contiennent des données, vous devez créer un ou plusieurs ensembles de pages. Un ensemble de pages est composé de plusieurs pages d’un site, qui affichent des données de façon cohérente (par exemple des pages créées à partir du même modèle) et sont organisées de manière à ce que les URL respectent un format simple. Le marqueur de données ne renseigne Google que sur les pages contenues dans un ensemble de pages.

Le marqueur de données ne nous renseigne pas sur les pages dont la structure de données est déjà spécifiée par un balisage HTML. Vous pouvez utiliser le marqueur de données malgré tout. Dans ce cas, il ne nous renseignera que sur les pages sans balisage HTML.

Si les données de votre site sont organisées de plusieurs façons différentes (avec des modèles distincts pour les concerts et les conférences, par exemple), vous pouvez créer un ensemble de pages pour chaque organisation.

Prenons par exemple un site qui contient des informations sur des concerts et des conférences sur les pages suivantes :

  • www.example.com/events/music/pop/pop-music.html
  • www.example.com/events/music/classical/classical-music.html
  • www.example.com/events-speaking/europe/europe-reviews.html
  • www.example.com/evenements-conferences/asie/etudes-asie.html

Les deux premières pages peuvent être placées dans le même ensemble, car elles décrivent toutes les deux des événements musicaux, et leurs URL suivent un format simple :www.example.com/evenements/musique/*/* (où chaque * est un caractère générique pour un élément unique de l’URL).

De même, la troisième et la quatrième page peuvent être placées dans un autre ensemble de pages, car elles décrivent toutes les deux des conférences, et leurs URL suivent un format simple :www.example.com/evenements-conferences/*/*

Détection des modifications dans un ensemble de pages

Chaque fois que Google explore votre site, le marqueur de données extrait des données et les rend utilisables sous forme d’extraits enrichis. Lorsque vous apportez d’importantes modifications à la façon dont vos pages affichent les informations, ou aux URL du site, vous devez supprimer les ensembles de pages d’origine et informer le marqueur de données de la nouvelle structure de votre site.

Outil d’aide au balisage de données structurées

Google propose désormais un outil en 3 étapes pour aider les webmasters. Testez-le ici.

Pour en savoir plus, consultez l’aide de Google.

Une vidéo d’explications

http://www.youtube.com/watch?v=WrEJds3QeTw

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

14 commentaires

Nicolas

Comme dit dans l’article, c’est vraiment pour les néophytes car les webmasters de gros sites ecommerce ou autres contenant des milliers d’adresses, de produits ou de commentaires ont plutot à intérêt à baliser leurs contenus dynamiquement

Répondre
Guillaume

Attention: cet outil ne doit pas dissuader les webmasters qui s’intéressent aux bénéfices du web sémantique de continuer à tagger leur contenu: sous prétexte de facilité, cela reviendrait à offrir au seul Google les infos d’ordre sémantique.

Or -et pas seulement pour les sites à vocation professionnelle-, de nombreux autres moteurs peuvent avoir besoin de l’info… à commencer par le propre moteur de recherche intégré de votre site.

Répondre
TOMHTML

« Concrètement, j’avoue ne pas bien voir ce que ça donne pour ce cas précis des événements, mais nous sommes bien habitués à voir par exemple les étoiles jaunes des avis ».
Apparemment, Olivier, tu n’as jamais recherché des choses du type « dates concert johnny hallyday » ou « prochains spectacles à l’olympia » dans Google…

Répondre
Olivier Duffez

merci, j’ai corrigé mon article ;-)

Répondre
J-Luc

Il serait préférable que les développeurs de Google passent leur temps sur des outils un peu plus utiles que celui-là…
Ceux qui ne savent pas taguer n’ont peut-être pas non plus installé GWT ?

Répondre
Limonads

Vraiment pas mal cet outil. :) Ça devrait effectivement simplifier la tâche et rendre plus accessibles les micros datas. Ou bien alors, lorsque ceux-ci ne fonctionnent pas… Mais en sachant que Google a tendance à garder le contrôle et donc de ne pas afficher les micros-données de certains sites, sans en connaitre la/les raisons… Et ce que ça changera quelque chose? Enfin, de toute façon il faut que la structure réponde déjà à un minimum d’informations pour pouvoir indiquer à Google les parties susceptibles de pouvoir enrichir les résultats… à suivre..

Répondre
Awily

Merci pour l’info.

Ca répond en partie à l’une des interrogations que je soulevais précédemment sur le knowledge graph, en prenant l’exemple des horaires d’ouverture du Louvre. Google est en train de « donner la main » aux webmasters pour qu’ils guident les robots Google.

Répondre
Eddy

Cet outil n’est pas essentiel pour un web-master.
Google proposes des outils surtout dans son intérêt.
Je ne suis pas en train de dire qu’il nous laisse tomber, mais il se privilège.
Il n’y a pas eu de grosses nouveauté pour les internautes depuis un petit moment.

Répondre
freelancer

très bonne initiative enfin quelque chose de bon proposé par google

Répondre
France Partners

C’est vrai effectivement, l’outil proposer n’est adapter pour les webmasters.

Répondre
AD Lyon

Merci de l’info, j’avais remarqué cela il y a peu de temps. L’outils n’est peut être pas adapter au webmaster, mais cela suffit à marquer les données de son site simplement.
Ma question en combien de temps à peu prêt GG fait des mises à jour pour que cela soit reconnu?

Répondre
clejar

@AD Lyon,

Simplement le temps pour que les robots GG passe sur ton site (temps variable en fonction de la fréquence de modifications de contenu, pages, etc, sur ton site).

Je ne sais pas si cela est récent ou non, mais une 8ème catégorie de marqueur est apparu (du moins, elle n’est pas citée dans les 7 catégories de cet article) : Produit
Des liens ou autres pour avoir des infos sur cette catégorie de marqueur de données ?
Merci.

Répondre
AD Lyon

@clejar,

Merci de ta réponse.

Répondre
clejar

Olivier, je vois que l’article a été mis à jour : « Produits (pas de page dans l’aide Google, mais c’est pris en compte) »
Peux-tu nous en dire plus ou nous montrer des exemples ?
Merci !

Répondre