Knowledge
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Un meilleur SEO grâce aux entités (et aux données structurées)

Google étant un moteur de recherche sémantique, il s'appuie énormément sur les entités. Voici comment optimiser votre référencement basé sur les entités, avec une utilisation avancée des données structurées.

Le saviez-vous ? Il y a bien longtemps que Google est devenu un moteur de recherche sémantique.

Les conséquences pour le SEO sont énormes, j'espère que vous en avez tenu compte depuis des années, sinon vous êtes vraiment dépassé...

Je vais vous expliquer de façon simplifiée pourquoi SEO va de pair avec entités.

Egalement, ce que cela change pour l'optimisation de vos contenus.

Et surtout, pourquoi vous devez investir sérieusement dans les données structurées. Je ne parle pas seulement d'avoir des rich snippets, ça va vraiment bien au-delà.

Comment Google est devenu un moteur de recherche sémantique

C'est quoi un moteur de recherche sémantique ?

Au lieu d'analyser les mots présents dans les pages, il cherche à identifier les entités (et ensuite les relations entre elles). En gros, Google s'intéresse aux sujets/concepts/choses évoqués dans une page et non pas à la présence de tel ou tel mot.

Si votre site n'est pas organisé autour des entités, si vous vous focalisez encore sur des "mots-clés", alors vous avez au moins 10 ans de retard… Et ça pourrait expliquer pourquoi vous avez des difficultés à améliorer votre référencement naturel.

Revenons rapidement en arrière pour comprendre l'évolution de l'algo de Google.

La montée en puissance du Knowledge Graph

En 2012, alors qu'on se remettait à peine des filtres Google Panda et Google Penguin, Google sort le Knowledge Graph (source). Google annonce que son moteur de recherche s'intéresse aux "things, not strings" (les choses, pas les mots). A l'époque, leur base de connaissances a été créée en complétant des bases connues (Freebase, Wikipedia et le CIA World Factbook) par une analyse des données disponibles sur le web. Pour le lancement, elle comptait 500 millions d'entités et 3,5 milliards de relations entre elles. On s'est depuis habitué à trouver un Knowledge Panel dans les SERP. En 2020, Google connait 5 milliards d'entités et 500 milliards de relations entre elles (source).

En 2013, Google annonce Hummingbird, un de ses plus gros changements d'algorithme. Concrètement, Google cherche alors davantage à répondre au sens complet de la requête, exploitant tous les indices constitués des différents mots, plutôt que de trouver la page web correspondant le mieux à ces mots. C'est l'avènement de la recherche sémantique, qui a permis de s'orienter depuis vers la recherche conversationnelle.

En 2015, Google obtient un 1er brevet intitulé "Ranking Search Results Based On Entity Metrics" (littéralement "Classement de résultats de recherche en fonction de métriques d'entités"). D'autres ont suivi.

Depuis, RankBrain ou BERT ont largement aidé Google à améliorer encore sa compréhension du langage humain, grâce aux techniques de l'IA. Les entités sont plus facilement repérées.

A quoi sert l'analyse des entités pour Google ?

En se basant sur les entités, Google peut :

  • mieux estimer l'intention de recherche de l'internaute (que veut-il exactement, au travers des mots tapés ou prononcés ?)
  • mieux comprendre de quoi parle une page, s'assurer que son objectif correspond à celui de son utilisateur (navigation vers un site précis, information, préparation d'une transaction, transaction, etc.)
  • évaluer la notoriété/popularité/réputation d'un site, de la personne physique ou morale rattachée, des produits ou services rattachés, tout ça sans forcément se baser sur les liens mais plutôt sur les relations entre entités
  • à répondre aux questions posées, par oral ou pas, à l'Assistant Google ou directement dans le moteur de recherche, ainsi qu'à développer un mode conversationnel (chatbot)
  • etc.

Pour moi, plus aucun doute : on est dans l'ère du SEO basé sur les entités. Je l'évoque dans mon dossier central listant les bonnes pratiques SEO du moment, mais je le détaille ci-dessous.

Un bon SEO grâce aux entités

Le contenu

La meilleure technique du moment en termes d'optimisation des contenus pour le SEO, c'est peut-être le topic clustering. Vous trouverez toutes sortes d'autres appellations plus ou moins proches, selon ce que l'on cherche à vous vendre.

L'idée est de travailler par sujets (thématiques, topics en anglais) et de montrer à Google que notre site fait le tour de la question (sur chaque sujet). Pour ça, chaque cluster contient une page pilier (la page centrale qui va se positionner au top des SERP) et des pages secondaires qui abordent tout ce qu'il faut sur le sujet. Le maillage entre elles doit être fait minutieusement, avec un bon choix pour l'anchor text.

Le fait de travailler par sujet (et non par mots-clés) est directement lié à l'approche par entités. On doit montrer à Google que notre page est complète sur un sujet, qu'elle mentionne toutes les autres entités qu'il s'attend à trouver. La mention peut se résumer à un lien vers une autre page.

Obtenez une optimisation de vos contenus Demandez-moi un devis

Les backlinks

Petit à petit, je pense que les backlinks ont pris moins d'importance dans Google, au fur et à mesure que Google réussissait à exploiter l'analyse des entités. Quand un contenu mentionne une entité, cela forme un triplet : 2 entités et une relation entre elles. Google peut se baser sur toutes ces relations pour évaluer la notoriété, la réputation, l'autorité.

L'algo de Google se basera encore longtemps sur les backlinks, mais on peut obtenir d'excellents résultats avec une approche basée sur les entités.

Déclarer les entités explicitement : les données structurées

Là où ça peut devenir vraiment efficace, c'est quand on aide Google (et tous les autres moteurs ou outils qui veulent exploiter ces données publiquement disponibles !). Pour cela, il faut déclarer des données structurées afin de préciser de quelles entités on traite. Il faut être très précis, pour lever toute ambiguïté, et c'est d'ailleurs une grande force de ce mécanisme.

C'est bien mieux que de rien faire en pensant que Google réussira à tout comprendre sans faire la moindre erreur ou le moindre oubli.

Balisage données structurées
Balisage de données structurées (structured data markup)

Si vous ne voyez pas bien à quoi ça correspond, pas de souci, j'ai un dossier complet : le guide des données structurées.

Créer son propre Knowledge Graph et viser au-delà de Google

Aujourd'hui encore, Google est le maître des lieux, il domine totalement le "search". Fournir à Google toutes ces données structurées, ça peut sembler une mauvaise idée, car il aura accès à encore plus de connaissance, et répondra parfois directement à l'internaute. Ce n'est pas faux ! Mais pour le moment, c'est aussi une très bonne façon de lui faire comprendre parfaitement de quoi parle une page, et donc de mieux la faire sortir pour les bonnes recherches.

En fait, en plus d'utiliser schema.org pour déclarer ses données structurées (un référentiel actuellement dominé par Google, alors que ça pourrait être le rôle du W3C…), vous pouvez faire mieux. Il s'agit de créer votre propre référentiel d'entités, avec leurs relations, tout en indiquant pour chacune à quoi elles correspondent.

créer son propre knowledge graph
Créer son propre knowledge graph pour un meilleur SEO

Pour cela, non seulement il faut utiliser le référentiel schema.org (pour être bien reconnu par Google, notamment pour ce qui déclenche des rich snippets), mais vous devez aussi utiliser d'autres bases de données telles quel DBpedia et WikiData. N'importe quelle startup (ou géant d'Internet) peut exploiter à son tour les données connues par DBpedia et WikiData. Et si elles font référence à votre site, vous serez dans la course !

Surtout, en ayant votre propre référentiel, vous êtes fournisseur de données structurées (qui restent déclarées chez vous, avec leur propre identifiant reconnu par d'autres bases ouvertes). C'est fondamental pour tenter de limiter le pouvoir de Google qui vient se servir chez vous et gère sa propre base de connaissances.

Comment les données structurées peuvent aider le SEO concrètement ?

Comme déjà indiqué, ça aide Google (et les autres) à mieux comprendre votre contenu, de quoi vous parlez exactement.

Mais je vais essayer d'être plus concret ici.

Ajouter les bonnes données structurées dans les pages de votre site permet aussi :

  • d'obtenir plus facilement des extraits enrichis (rich snippets). Il peut s'agir par exemple d'avis (avec étoiles), d'annonces d'événements, de photos de recettes de cuisine, etc.
  • d'obtenir un meilleur taux de clics dans les SERP (conséquence de la présence d'un rich snippet)
  • d'être positionné sur de nouvelles requêtes, grâce à l'analyse sémantique
  • d'augmenter vos chances d'être optimisé pour la recherche vocale (Alexa et bien d'autres peuvent exploiter vos données structurées et s'assurer que votre contenu répond bien à la requête)

Créer votre propre knowledge graph (associé au site) permet en outre d'améliorer l'engagement de l'utilisateur sur le site. On peut par exemple proposer des liens vers d'autres pages en se basant sur les entités mentionnées (sans dépendre d'un plugin), créer un lexique, trouver des images en relation avec le thème de la page, proposer un carrousel pour parcourir les autres contenus centrés autour des mêmes entités...

Envie de passer au SEO avancé ? Détails de mon offre ici

Cet article vous a-t-il plu ?

Note : 4.0 (30 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

2 commentaires

Ms nas

Merci pour cet article très bien fait. Vs avez réussi à rendre accessible un sujet très technique. Manque plus qu'un petit lien vers un tuto pour créer un knowledge graph.

Répondre
Olivier Duffez

c'est un peu trop compliqué pour pouvoir fournir un tuto. Merci en tout cas du commentaire

Répondre