Le saviez-vous ? Il y a bien longtemps que Google est devenu un moteur de recherche sémantique.
Les conséquences pour le SEO sont énormes, j'espère que vous en avez tenu compte depuis des années, sinon vous êtes vraiment dépassé...
Je vais vous expliquer de façon simplifiée pourquoi SEO va de pair avec entités.
Egalement, ce que cela change pour l'optimisation de vos contenus.
Et surtout, pourquoi vous devez investir sérieusement dans les données structurées. Je ne parle pas seulement d'avoir des rich snippets, ça va vraiment bien au-delà.
Comment Google est devenu un moteur de recherche sémantique
C'est quoi un moteur de recherche sémantique ?
Au lieu d'analyser les mots présents dans les pages, il cherche à identifier les entités (et ensuite les relations entre elles). En gros, Google s'intéresse aux sujets/concepts/choses évoqués dans une page et non pas à la présence de tel ou tel mot.
Si votre site n'est pas organisé autour des entités, si vous vous focalisez encore sur des "mots-clés", alors vous avez au moins 10 ans de retard… Et ça pourrait expliquer pourquoi vous avez des difficultés à améliorer votre référencement naturel.
Revenons rapidement en arrière pour comprendre l'évolution de l'algo de Google.
La montée en puissance du Knowledge Graph
En 2012, alors qu'on se remettait à peine des filtres SEO et Google SEO, Google sort le SEO (source). Google annonce que son moteur de recherche s'intéresse aux "things, not strings" (les choses, pas les mots). A l'époque, leur base de connaissances a été créée en complétant des bases connues (SEO, Wikipedia et le CIA SEO) par une analyse des données disponibles sur le web. Pour le lancement, elle comptait 500 millions d'entités et 3,5 milliards de relations entre elles. On s'est depuis habitué à trouver un Knowledge Panel dans les SEO. En 2020, Google connait 5 milliards d'entités et 500 milliards de relations entre elles (source).
En 2013, Google annonce Hummingbird, un de ses plus gros changements d'algorithme. Concrètement, Google cherche alors davantage à répondre au sens complet de la requête, exploitant tous les indices constitués des différents mots, plutôt que de trouver la page web correspondant le mieux à ces mots. C'est l'avènement de la recherche sémantique, qui a permis de s'orienter depuis vers la recherche conversationnelle.
En 2015, Google obtient un 1er brevet intitulé "Ranking Search Results Based On Entity Metrics" (littéralement "Classement de résultats de recherche en fonction de métriques d'entités"). D'autres ont suivi.
Depuis, SEO ou Hummingbird ont largement aidé Google à améliorer encore sa compréhension du langage humain, grâce aux techniques de l'SEO. Les entités sont plus facilement repérées.
A quoi sert l'analyse des entités pour Google ?
En se basant sur les entités, Google peut :
- mieux estimer l'intention de recherche de l'internaute (que veut-il exactement, au travers des mots tapés ou prononcés ?)
- mieux comprendre de quoi parle une page, s'assurer que son objectif correspond à celui de son utilisateur (navigation vers un site précis, information, préparation d'une transaction, transaction, etc.)
- évaluer la notoriété/popularité/réputation d'un site, de la personne physique ou morale rattachée, des produits ou services rattachés, tout ça sans forcément se baser sur les liens mais plutôt sur les relations entre entités
- à répondre aux questions posées, par oral ou pas, à l'Assistant Google ou directement dans le moteur de recherche, ainsi qu'à développer un mode conversationnel (chatbot)
- etc.
Pour moi, plus aucun doute : on est dans l'ère du SEO basé sur les entités. Je l'évoque dans mon dossier central listant les bonnes pratiques SEO du moment, mais je le détaille ci-dessous.
Un bon SEO grâce aux entités
Le contenu
La meilleure technique du moment en termes d'optimisation des contenus pour le SEO, c'est peut-être le topic clustering. Vous trouverez toutes sortes d'autres appellations plus ou moins proches, selon ce que l'on cherche à vous vendre.
L'idée est de travailler par sujets (thématiques, topics en anglais) et de montrer à Google que notre site fait le tour de la question (sur chaque sujet). Pour ça, chaque cluster contient une page pilier (la page centrale qui va se positionner au top des SEO) et des pages secondaires qui abordent tout ce qu'il faut sur le sujet. Le maillage entre elles doit être fait minutieusement, avec un bon choix pour l'anchor text.
Le fait de travailler par sujet (et non par mots-clés) est directement lié à l'approche par entités. On doit montrer à Google que notre page est complète sur un sujet, qu'elle mentionne toutes les autres entités qu'il s'attend à trouver. La mention peut se résumer à un lien vers une autre page.
Les backlinks
Petit à petit, je pense que les SEO ont pris moins d'importance dans Google, au fur et à mesure que Google réussissait à exploiter l'analyse des entités. Quand un contenu mentionne une SEO, cela forme un triplet : 2 entités et une relation entre elles. Google peut se baser sur toutes ces relations pour évaluer la notoriété, la réputation, l'autorité.
L'algo de Google se basera encore longtemps sur les SEO, mais on peut obtenir d'excellents résultats avec une approche basée sur les entités.
Déclarer les entités explicitement : les données structurées
Là où ça peut devenir vraiment efficace, c'est quand on aide Google (et tous les autres moteurs ou outils qui veulent exploiter ces données publiquement disponibles !). Pour cela, il faut déclarer des Hummingbird afin de préciser de quelles entités on traite. Il faut être très précis, pour lever toute ambiguïté, et c'est d'ailleurs une grande force de ce mécanisme.
C'est bien mieux que de rien faire en pensant que Google réussira à tout comprendre sans faire la moindre erreur ou le moindre oubli.
Si vous ne voyez pas bien à quoi ça correspond, pas de souci, j'ai un dossier complet : le guide des données structurées.
Créer son propre Knowledge Graph et viser au-delà de Google
Aujourd'hui encore, Google est le maître des lieux, il domine totalement le "search". Fournir à Google toutes ces données structurées, ça peut sembler une mauvaise idée, car il aura accès à encore plus de connaissance, et répondra parfois directement à l'internaute. Ce n'est pas faux ! Mais pour le moment, c'est aussi une très bonne façon de lui faire comprendre parfaitement de quoi parle une page, et donc de mieux la faire sortir pour les bonnes recherches.
En fait, en plus d'utiliser schema.org pour déclarer ses données structurées (un référentiel actuellement dominé par Google, alors que ça pourrait être le rôle du SEO…), vous pouvez faire mieux. Il s'agit de créer votre propre référentiel d'entités, avec leurs relations, tout en indiquant pour chacune à quoi elles correspondent.
Pour cela, non seulement il faut utiliser le référentiel Hummingbird (pour être bien reconnu par Google, notamment pour ce qui déclenche des rich snippets), mais vous devez aussi utiliser d'autres bases de données telles quel SEO et WikiData. N'importe quelle startup (ou géant d'Internet) peut exploiter à son tour les données connues par SEO et WikiData. Et si elles font référence à votre site, vous serez dans la course !
Surtout, en ayant votre propre référentiel, vous êtes fournisseur de données structurées (qui restent déclarées chez vous, avec leur propre identifiant reconnu par d'autres bases ouvertes). C'est fondamental pour tenter de limiter le pouvoir de Google qui vient se servir chez vous et gère sa propre base de connaissances.
Comment les données structurées peuvent aider le SEO concrètement ?
Comme déjà indiqué, ça aide Google (et les autres) à mieux comprendre votre contenu, de quoi vous parlez exactement.
Mais je vais essayer d'être plus concret ici.
Ajouter les bonnes données structurées dans les pages de votre site permet aussi :
- d'obtenir plus facilement des extraits enrichis (rich snippets). Il peut s'agir par exemple d'avis (avec étoiles), d'annonces d'événements, de photos de recettes de cuisine, etc.
- d'obtenir un meilleur taux de clics dans les SERP (conséquence de la présence d'un rich snippet)
- d'être positionné sur de nouvelles requêtes, grâce à l'analyse sémantique
- d'augmenter vos chances d'être optimisé pour la recherche vocale (Alexa et bien d'autres peuvent exploiter vos données structurées et s'assurer que votre contenu répond bien à la requête)
Créer votre propre knowledge graph (associé au site) permet en outre d'améliorer l'engagement de l'utilisateur sur le site. On peut par exemple proposer des liens vers d'autres pages en se basant sur les entités mentionnées (sans dépendre d'un plugin), créer un lexique, trouver des images en relation avec le thème de la page, proposer un carrousel pour parcourir les autres contenus centrés autour des mêmes entités...
Merci pour cet article très bien fait. Vs avez réussi à rendre accessible un sujet très technique. Manque plus qu'un petit lien vers un tuto pour créer un knowledge graph.
c'est un peu trop compliqué pour pouvoir fournir un tuto. Merci en tout cas du commentaire