Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
En résumé :
- Google Data Highlighter est un vieil outil proposé ici dans l'ancienne version de Google Webmaster Tools
- Il sert à générer des données structurées sans avoir à coder, en mode WYSIWYG
- Le problème est que ces données seront difficiles à maintenir
- Je vous conseille de générer les données structurées à l'aide d'un plugin ou d'un développement sur-mesure
Fonctionnement en mode WYSIWYG
Avec cet outil, Google devrait faciliter le marquage de données structurées, permettant aux éditeurs de site n'ayant pas un profil technique de déclarer à Google où leur site contient des données de certains types (8 sont actuellement reconnus). En gros, on peut gérer des données structurées avec un outil de type Google.
Son fonctionnement est assez simple : directement dans une vue de votre navigateur, vous consultez vos contenus. Vous sélectionnez par exemple le texte du titre d'un événement puis vous sélectionnez dans un menu le type de donnée pour indiquer qu'il s'agit du nom de l'événement. Idem pour la date et les autres éléments. Une fois que vous avez terminé de gérer un événement, vous "publiez" les informations, afin que Google les enregistre.
Au fur et à mesure que vous taguez vos contenus, Google apprend automatiquement et au bout de 5 ou 10 marquages de ce genre, il est en mesure de reconnaitre sur votre site tous les autres endroits où vous publiez des contenus du même type (ici les événements). Inutile d'aller déclarer un par un 100% de vos contenus.
Ensuite, quand votre compte Google Webmaster Tools aura été mis à jour, vous pourrez dénombrer les Google nommées identifiées par Google.
Vous trouverez en fin d'article un tutoriel sur le marqueur de données de Google.
Intérêt pour vous et pour Google
L'intérêt pour vous est de mieux faire comprendre à Google la sémantique de vos contenus afin qu'il puisse enrichir les Google avec ces informations et mettre en valeur vos pages quand elles apparaissent dans les résultats. Voici un exemple d'affichage de rich snippet d'événement :
L'intérêt pour Google est d'enrichir son index avec des données structurées plutôt que du texte brut sans information sémantique. Ceci lui permet de mieux "comprendre" le contenu de votre site, mais surtout d'étoffer son Knowledge Graph. Ne vous y trompez pas, ce "graphe de la connaissance" que Google est en train de bâtir est un élément capital du moteur de recherche (lisez mon point de vue sur l'impact sur le référencement). Après de longs mois de présence aux USA uniquement, le KG est arrivé sur google.fr donc nous sommes directement concernés.
Avec cet outil Data Highlighter, Google passe pour celui qui nous facilite la vie (il n'est plus nécessaire de s'embêter à intégrer un codage particulier, par exemple schema.org). Mais à bien y réfléchir, on réalise qu'avec ce système, Google va acquérir une énorme quantité d'informations riches que ses concurrents ne pourront pas obtenir, puisque l'information sémantique n'est pas disponible dans le code source. Bing et son timide Knowledge Graph auront donc du mal à se développer...
Comment utiliser le marqueur de données de Google
Où trouver l'outil Data Highlighter de Google ?
Il est encore dans l'ancienne Search Console : https://www.google.com/webmasters/tools/data-highlighter
Voici un tuto de conseils pour utiliser le marqueur de données structurées.
Types de données prises en charge
Data Highlighter prend en charge les types de données suivants :
- Articles
- Commentaires (avis) sur des livres
- Événements
- Commerces et services de proximité
- Films
- Restaurants
- Applications logicielles
- Épisodes de série télévisée
Organisation des pages en ensembles de pages
Pour indiquer au marqueur de données les pages de votre site qui contiennent des données, vous devez créer un ou plusieurs ensembles de pages. Un ensemble de pages est composé de plusieurs pages d'un site, qui affichent des données de façon cohérente (par exemple des pages créées à partir du même modèle) et sont organisées de manière à ce que les Google respectent un format simple. Le marqueur de données ne renseigne Google que sur les pages contenues dans un ensemble de pages.
Le marqueur de données ne nous renseigne pas sur les pages dont la structure de données est déjà spécifiée par un balisage Google. Vous pouvez utiliser le marqueur de données malgré tout. Dans ce cas, il ne nous renseignera que sur les pages sans balisage Google.
Si les données de votre site sont organisées de plusieurs façons différentes (avec des modèles distincts pour les concerts et les conférences, par exemple), vous pouvez créer un ensemble de pages pour chaque organisation.
Prenons par exemple un site qui contient des informations sur des concerts et des conférences sur les pages suivantes :
- www.example.com/events/music/pop/pop-music.html
- www.example.com/events/music/classical/classical-music.html
- www.example.com/events-speaking/europe/europe-reviews.html
- www.example.com/evenements-conferences/asie/etudes-asie.html
Les deux premières pages peuvent être placées dans le même ensemble, car elles décrivent toutes les deux des événements musicaux, et leurs Google suivent un format simple :www.example.com/evenements/musique/*/*
(où chaque * est un caractère générique pour un élément unique de l'Google).
De même, la troisième et la quatrième page peuvent être placées dans un autre ensemble de pages, car elles décrivent toutes les deux des conférences, et leurs Google suivent un format simple :www.example.com/evenements-conferences/*/*
Détection des modifications dans un ensemble de pages
Chaque fois que Google explore votre site, le marqueur de données extrait des données et les rend utilisables sous forme d'extraits enrichis. Lorsque vous apportez d'importantes modifications à la façon dont vos pages affichent les informations, ou aux Google du site, vous devez supprimer les ensembles de pages d'origine et informer le marqueur de données de la nouvelle structure de votre site.
Outil d'aide au balisage de données structurées
Google propose aussi un autre outil en 3 étapes pour aider les webmasters. Testez-le ici.
Pour en savoir plus, consultez l'aide de Google.
Olivier, je vois que l'article a été mis à jour : "Produits (pas de page dans l'aide Google, mais c'est pris en compte)"
Peux-tu nous en dire plus ou nous montrer des exemples ?
Merci !
@clejar,
Merci de ta réponse.
@AD Lyon,
Simplement le temps pour que les robots GG passe sur ton site (temps variable en fonction de la fréquence de modifications de contenu, pages, etc, sur ton site).
Je ne sais pas si cela est récent ou non, mais une 8ème catégorie de marqueur est apparu (du moins, elle n'est pas citée dans les 7 catégories de cet article) : Produit
Des liens ou autres pour avoir des infos sur cette catégorie de marqueur de données ?
Merci.
Merci de l'info, j'avais remarqué cela il y a peu de temps. L'outils n'est peut être pas adapter au webmaster, mais cela suffit à marquer les données de son site simplement.
Ma question en combien de temps à peu prêt GG fait des mises à jour pour que cela soit reconnu?
C'est vrai effectivement, l'outil proposer n'est adapter pour les webmasters.
très bonne initiative enfin quelque chose de bon proposé par google
Cet outil n'est pas essentiel pour un web-master.
Google proposes des outils surtout dans son intérêt.
Je ne suis pas en train de dire qu'il nous laisse tomber, mais il se privilège.
Il n'y a pas eu de grosses nouveauté pour les internautes depuis un petit moment.
Merci pour l'info.
Ca répond en partie à l'une des interrogations que je soulevais précédemment sur le knowledge graph, en prenant l'exemple des horaires d'ouverture du Louvre. Google est en train de "donner la main" aux webmasters pour qu'ils guident les robots Google.
Vraiment pas mal cet outil. :) Ça devrait effectivement simplifier la tâche et rendre plus accessibles les micros datas. Ou bien alors, lorsque ceux-ci ne fonctionnent pas... Mais en sachant que Google a tendance à garder le contrôle et donc de ne pas afficher les micros-données de certains sites, sans en connaitre la/les raisons... Et ce que ça changera quelque chose? Enfin, de toute façon il faut que la structure réponde déjà à un minimum d'informations pour pouvoir indiquer à Google les parties susceptibles de pouvoir enrichir les résultats... à suivre..
Il serait préférable que les développeurs de Google passent leur temps sur des outils un peu plus utiles que celui-là...
Ceux qui ne savent pas taguer n'ont peut-être pas non plus installé GWT ?
"Concrètement, j'avoue ne pas bien voir ce que ça donne pour ce cas précis des événements, mais nous sommes bien habitués à voir par exemple les étoiles jaunes des avis".
Apparemment, Olivier, tu n'as jamais recherché des choses du type "dates concert johnny hallyday" ou "prochains spectacles à l'olympia" dans Google...
merci, j'ai corrigé mon article ;-)
Attention: cet outil ne doit pas dissuader les webmasters qui s'intéressent aux bénéfices du web sémantique de continuer à tagger leur contenu: sous prétexte de facilité, cela reviendrait à offrir au seul Google les infos d'ordre sémantique.
Or -et pas seulement pour les sites à vocation professionnelle-, de nombreux autres moteurs peuvent avoir besoin de l'info... à commencer par le propre moteur de recherche intégré de votre site.
Comme dit dans l'article, c'est vraiment pour les néophytes car les webmasters de gros sites ecommerce ou autres contenant des milliers d'adresses, de produits ou de commentaires ont plutot à intérêt à baliser leurs contenus dynamiquement