Google Data Highlighter, un outil d'aide au marquage de données structurées
Par Olivier Duffez, Mercredi 19 décembre 2012
Google a sorti un nouvel outil dans Google Webmaster Tools, facilitant le marquage de données structurées sans avoir à toucher au code HTML. Il ne fonctionne pour l'instant que pour les données de type événement.

L'outil Google Data highlighter (pour les données de type event)
Avec cet outil, Google devrait grandement faciliter le marquage de données structurées, permettant aux éditeurs de site n'ayant pas un profil technique de déclarer à Google où leur site contient des données de certains types (pour l'instant les événements). En gros, on peut gérer des données structurées avec un outil de type WYSIWYG.
Son fonctionnement est assez simple : directement dans une vue de votre navigateur, vous consultez vos contenus. Vous sélectionnez par exemple le texte du titre d'un événement puis vous sélectionnez dans un menu le type de donnée pour indiquer qu'il s'agit du nom de l'événement. Idem pour la date et les autres éléments. Une fois que vous avez terminé de gérer un événement, vous "publiez" les informations, afin que Google les enregistre.
Au fur et à mesure que vous taguez vos contenus, Google apprend automatiquement et au bout de 5 ou 10 marquages de ce genre, il est en mesure de reconnaitre sur votre site tous les autres endroits où vous publiez des contenus du même type (ici les événements). Inutile d'aller déclarer un par un 100% de vos contenus.
Ensuite, quand votre compte Google Webmaster Tools aura été mis à jour, vous pourrez dénombrer les entités nommées identifiées par Google.
L'intérêt pour vous est de mieux faire comprendre à Google la sémantique de vos contenus afin qu'il puisse enrichir les SERP avec ces informations et mettre en valeur vos pages quand elles apparaissent dans les résultats. Voici un exemple d'affichage de rich snippet d'événement :

Extrait enrichi pour des dates d'événements dans les SERP Google
L'intérêt pour Google est d'enrichir son index avec des données structurées plutôt que du texte brut sans information sémantique. Ceci lui permet de mieux "comprendre" le contenu de votre site, mais surtout d'étoffer son Knowledge Graph. Ne vous y trompez pas, ce "graphe de la connaissance" que Google est en train de bâtir est un élément capital du moteur de recherche (lisez mon point de vue sur l'impact sur le référencement). Après de longs mois de présence aux USA uniquement, le KG est arrivé sur google.fr donc nous sommes directement concernés.
Avec cet outil Data Highlighter, Google passe pour celui qui nous facilite la vie (il n'est plus nécessaire de s'embêter à intégrer un codage particulier, par exemple schema.org). Mais à bien y réfléchir, on réalise qu'avec ce système, Google va acquérir une énorme quantité d'informations riches que ses concurrents ne pourront pas obtenir, puisque l'information sémantique n'est pas disponible dans le code source. Bing et son timide Knowledge Graph auront donc du mal à se développer...
D'abord limité à l'anglais à sa sortie en décembre 2012, il est disponible depuis février 2013 dans toutes les langues supportées par Google Webmaster Tools (soit 40 à l'heure actuelle) (source).
Une vidéo d'explications :
A propos de l'auteur : Olivier Duffez
![]()
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
8 commentaires
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Cherchez dans tous les dossiers
Cherchez par mots-clés dans ~2000 articles :
Dernières brèves :
- 16 mai : Jouer au casse-briques dans Google Images (Easter Egg)
- 6 mai : SERP : Google teste l'affichage de résultats sans leur URL
- 13 mars : Les lunettes Google sur des lunettes de vue
- 12 mars : Penguin 4 sera le + important changement d'algo Google de 2013
- 3 mars : Do the Harlem Shake : vidéo de l'easter egg sur YouTube
- 21 février : Bing améliore son outil de suggestion automatique
- 9 février : Eric Schmidt va vendre pour 2,5 milliards de $ d'actions Google
- 28 janvier : Balise Title : longueur max en nombre ET chasse de caractères
- 15 janvier : El BrowZer: le navigateur de Baidu sur les mobiles Android d'Orange
- 20 décembre : Google Actualités intègre des citations dans les SERP
Catégories des dossiers
Consultez les dossiers par thématiques :
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).
Hébergement web
Hébergement web mutualisé et dédié
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.
A partir de 3€ HT/mois.


19 décembre 2012 à 12:48
Comme dit dans l'article, c'est vraiment pour les néophytes car les webmasters de gros sites ecommerce ou autres contenant des milliers d'adresses, de produits ou de commentaires ont plutot à intérêt à baliser leurs contenus dynamiquement
19 décembre 2012 à 13:54
Attention: cet outil ne doit pas dissuader les webmasters qui s'intéressent aux bénéfices du web sémantique de continuer à tagger leur contenu: sous prétexte de facilité, cela reviendrait à offrir au seul Google les infos d'ordre sémantique.
Or -et pas seulement pour les sites à vocation professionnelle-, de nombreux autres moteurs peuvent avoir besoin de l'info... à commencer par le propre moteur de recherche intégré de votre site.
19 décembre 2012 à 14:21
"Concrètement, j'avoue ne pas bien voir ce que ça donne pour ce cas précis des événements, mais nous sommes bien habitués à voir par exemple les étoiles jaunes des avis".
Apparemment, Olivier, tu n'as jamais recherché des choses du type "dates concert johnny hallyday" ou "prochains spectacles à l'olympia" dans Google...
19 décembre 2012 à 15:31
merci, j'ai corrigé mon article ;-)
19 décembre 2012 à 16:49
Il serait préférable que les développeurs de Google passent leur temps sur des outils un peu plus utiles que celui-là...
Ceux qui ne savent pas taguer n'ont peut-être pas non plus installé GWT ?
19 décembre 2012 à 22:28
Vraiment pas mal cet outil. :) Ça devrait effectivement simplifier la tâche et rendre plus accessibles les micros datas. Ou bien alors, lorsque ceux-ci ne fonctionnent pas... Mais en sachant que Google a tendance à garder le contrôle et donc de ne pas afficher les micros-données de certains sites, sans en connaitre la/les raisons... Et ce que ça changera quelque chose? Enfin, de toute façon il faut que la structure réponde déjà à un minimum d'informations pour pouvoir indiquer à Google les parties susceptibles de pouvoir enrichir les résultats... à suivre..
20 décembre 2012 à 1:32
Merci pour l'info.
Ca répond en partie à l'une des interrogations que je soulevais précédemment sur le knowledge graph, en prenant l'exemple des horaires d'ouverture du Louvre. Google est en train de "donner la main" aux webmasters pour qu'ils guident les robots Google.
20 décembre 2012 à 12:49
Cet outil n'est pas essentiel pour un web-master.
Google proposes des outils surtout dans son intérêt.
Je ne suis pas en train de dire qu'il nous laisse tomber, mais il se privilège.
Il n'y a pas eu de grosses nouveauté pour les internautes depuis un petit moment.