Annonces Google

Vous êtes ici : Dossiers référencement > Google Search

Google Hummingbird (= colibri), algorithme majeur du moteur de recherche

Par , le 18 octobre 2013

Du fin fond du garage où Google a démarré, lors d'une conférence de presse pour fêter les 15 ans de Google, Amit Singhal a annoncé qu'ils ont sorti un nouvel algo pour leur moteur de recherche, intitulé Hummingbird ("colibri"). Voici en quoi consiste cet algoet ce que ça change pour vous...

Article mis à jour le 18/10/2013, publié initialement le 26/09/2015

Mise à jour de l'article du 18 octobre :

La conférence de presse a eu lieu dans le garage des débuts de Google (photo Danny Sullivan) :

Le garage des débuts de Google

Le garage des débuts de Google, chez Susan Wojcicki

L'algo Hummingbird (colibri)

Voici tout ce qu'on sait pour l'instant (c'est encore un peu tôt)... En large partie grâce au travail de Danny Sullivan.

Google Hummingbird

Image de colibri projetée par Google pendant sa conférence de presse, pour l'annonce de l'algo Hummingbird

Qu'est-ce que l'algo colibri et de quand date-t-il ?

Il s'agit bien d'un algorithme visant à sélectionner les réponses à afficher dans les résultats de Google, c'est même l'ensemble du processus qui a été revu. Le nom Hummingbird ("colibri") a été choisi pour signifier qu'il était "rapide" et "précis".

Il a été mis en ligne au mois d'août (ou début septembre) mais annoncé seulement le 26/09/2013. Il est déployé a priori dans le monde entier et 90% des requêtes sont concernées dans le monde actuellement.

Quel rapport avec Caffeine, Panda et Pingouin ?

Voici un petit rappel :

  • Caffeine était un changement de l'infrastructure technique de Google, qui lui a permis de mieux crawler et indexer le web ainsi que de s'adapter aux différents types de services de Google (le moteur de recherche mais aussi la messagerie électronique, les cartes, la vidéo, etc.). Caffeine n'était donc pas un changement d'algorithme.
  • Panda et Pingouin sont des changements de l'algorithme de référencement naturel, ayant pour objectif de pénaliser les mauvais sites. Panda s'intéresse particulièrement à la qualité du contenu, Pingouin aux techniques SEO utilisées.

Hummingbird est un changement global de la façon de déterminer la pertinence des pages en réponse à une requête. Cela concerne surtout la compréhension de la demande de l'internaute. Panda et Pingouin n'ont pas été retirés de l'algo de Google depuis l'arrivée de Colibri !

Comment fonctionne-t-il et qu'est-ce que ça change pour nous ?

L'objectif de cet algo est de fournir des meilleures réponses aux questions complexes des internautes (mais il s'applique aussi à tous types de requêtes). Un des principaux défis de Hummingbird est de savoir répondre à des demandes formulées sous forme d'une conversation ("recherche conversationnelle" ? (conversational search en anglais).

Concrètement, Google cherche désormais davantage à répondre au sens complet de la requête, exploitant tous les indices constitués des différents mots, plutôt que de trouver la page web correspondant le mieux à ces mots.

Prenons l'exemple utilisé par Danny Sullivan dans son article (sans doute un exemple fourni par Google) : la requête [quel est l'endroit le plus près de chez moi pour acheter un iPhone 5S] (sans les crochets bien entendu, ils délimitent la requête). Si vous avez déjà indiqué à Google le lieu où vous habitez, il peut en tenir compte ; vous parlez d'"endroit" donc il s'agit d'un magasin physique, ce qui va être pris en compte ; le nom du smartphone est reconnu et Google va tenter de sélectionner les magasins qui le vendent.

L'idée est vraiment de comprendre le sens de la requête, grâce à certains mots certes, mais la meilleure réponse ne vient pas forcément de la page qui utilise tous ces mots. Nous ne sommes vraiment plus à l'ère de la recherche par mots-clés mais par entités. Ce n'est pas pour ça que j'ai envie d'être privé des mots-clés générateurs de trafic (not provided)...

Impact de l'update Hummingbird sur le référencement naturel (SEO)

Il est sans doute un peu tôt pour l'évaluer, mais a priori ce changement n'a pas d'impact sur le référencement naturel. On peut imaginer toutefois qu'il devrait favoriser les sites au contenu riche et de qualité, mais rien n'est prouvé. On peut aussi s'attendre à ce que cela amplifie encore l'intérêt d'une stratégie longue traine pour le SEO (elle est valable aussi pour le SEA d'ailleurs).

Selon Google, bien entendu, les résultats sont plus pertinents qu'avant. Difficile à dire, car de l'extérieur, près d'un mois après la mise en ligne, nous ne pouvons pas le vérifier. La seule chose qu'on peut dire, c'est qu'il n'y a pas eu de plaintes des utilisateurs (ou des webmasters et référenceurs !). Donc a priori le bouleversement n'a pas été important et la pertinence n'a sans doute pas diminué.

Un brevet de Google en rapport avec Hummingbird

Bill Slawski a déniché un brevet obtenu par Google, qui fait penser au fonctionnement de Colibri. Mais rien ne dit que c'est effectivement lié.

Le brevet, intitulé "Synonym identification based on co-occurring terms", a été déposé le 3 avril 2012 et obtenu le 17 septembre 2013 (juste avant les annonces liées au 15ème anniversaire de Google).

Schéma brevet Google Hummingbird

Schéma d'ensemble du brevet qui fait penser à l'algo Google Hummingbird

Un des éléments les plus importants de ce brevet est l'analyse de la requête de l'internaute ("query reviser engine"). Pour bien le comprendre, prenons l'exemple fourni par les auteurs du brevet : l'internaute tape [What is the best place to find and eat Chicago deep dish style pizza?]. Notez que l'internaute a utilisé un terme peu précis : "place" (qui signifie "endroit"). L'algo identifie que ce terme est peu précis et cherche des "substituts", c'est-à-dire d'autres termes qui pourraient être plus efficaces. Concrètement, par exemple le terme "restaurant" serait plus adapté car :

  • il ne modifie pas le sens de la requête (en tout cas ce que semble chercher l'internaute)
  • il améliore la qualité des résultats obtenus pour la requête modifiée

Pour trouver ces "substituts", Google utilise toutes sortes d'analyses effectuées par le moteur de synonymes. Mais ce n'est pas forcément uniquement des synonymes : "endroit" et "restaurant" ne sont pas des synonymes (pour mes participants à ma formation Référencement Editorial, il savent qu'il s'agit d'hyperonymie !).

L'algo étudie pour cela tous les termes qui co-occurent avec les autres mots de la requête. Idem dans l'analyse de co-occurrence sur les pages qui utilisent ces mots. Il peut ainsi se rendre compte que de nombreux internautes utilisent "restaurant" quand ils font des requêtes qui parlent d'endroits où manger des pizzas. Et que ceux qui rédigent des contenus sur cette thématique utilisent aussi ce terme.

Voici le schéma de ce processus de recherche de termes de substitution pour la requête :

Brevet Google Colibri analyse requête

Schéma du brevet d'analyse des termes d'une requête qui pourraient être remplacés par d'autres (fait penser à Google Colibri)

Vous vous rendez donc compte qu'il faut sans doute s'écarter de la notion stricte de mots-clés et plutôt s'intéresser à la notion d'entités, de concepts. Faites tout pour que Google comprenne bien de quoi vous parlez dans vos pages ! Intégrer les données structurées dans son site va sans doute devenir incontournable.

S'agit-il d'un gros changement pour les ingénieurs de Google ?

Oui, il s'agit d'un très gros changement technique pour les ingénieurs : c'est comme si vous aviez  totalement changé le moteur de votre voiture. Comme indiqué plus haut dans cet article, le dernier gros changement selon Google fut Caffeine en 2010, mais rappelons qu'il ne s'agissait pas d'une modification de l'algo mais de l'infrastructure technique de Google qui lui a permis entre autres de crawler plus efficacement et rapidement. Sinon, il faut remonter à 2001, vers les débuts de Google... Des parties de l'ancien algorithme sont reprises, notamment Panda et Penguin (je sens que vous êtes déçus ?)

On parle aussi de l'update Hummingbird dans le forum.

Google Search Timeline

Voici une frise chronologique des évolutions importantes du moteur de recherche Google (cliquez pour la version grand format) :

Historique du moteur de recherche Google

Historique des évolutions du moteur de recherche Google

Autre nouveauté : comparatifs via le Knowledge Graph

Ca ne fait sans doute pas partie de l'update Hummingbird, mais Google a annoncé également une nouvelle fonctionnalité, la possibilité de comparer 2 éléments en exploitant le Knowledge Graph.

Sur google.com (interface en anglais), tapez par exemple (sans les crochets qui délimitent la requête) [eiffel tower vs tokyo tower] . Vous obtiendrez au-dessus des résultats traditionnel un tableau issu du Knowledge Graph, listant quelques caractéristiques communes des 2 tours : la hauteur, la date de démarrage de la construction, le nom de l'architecte, le nombre d'étages, la date d'ouverture et la fonction du monument. Vous verrez avec cette exemple que la fiabilité des données n'est pas encore au rendez-vous : Google ne considère pas que la Tour Eiffel soit une attraction touristique !

Tableau comparatif Knowledge Graph

Grâce à son Knowledge Graph, Google affiche des tableaux comparant des caractéristiques communes à certaines entités

Retrouvez plus d'explications dans mon article dédié aux tableaux comparatifs du Knowledge Graph.

Google a également annoncé un certain nombre de nouveautés pour la recherche sur mobile, avec une nouvelle interface.

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le référencement (+290.000 membres, 1,5 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (SEO, AdWords, Analytics, réseaux sociaux).

Article (Google Hummingbird (colibri), algo du moteur de recherche) publié par WebRankInfo dans la rubrique Google Search. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

30 commentaires

  • Link@ a dit le

    Bonjour Olivier, et bien j'ai l'impression qu'on a pas fini de parler des mises à jour de Google!!
    Et à votre avis ça va être aussi néfaste que les autres mises à jour?

  • Sobuso a dit le

    Pour ma part, avec les anciens peu de modification sur les petits sites au pire un -1 ou -2 sur la premiere page.. et pour les plus gros sites, c'etait plutot une belle surprise.. surtout au niveau du positionnement des pages "profondes"..

    Mais ils me font flipper qd meme !

    Auront-ils mis en place une couche de moteur de recommandation par dessus le moteur de recherche ??

  • Jean-marc a dit le

    Horreur de toutes ces bêbêtes...!

  • Daweide a dit le

    Mouai, refaire un moteur avec d'anciennes pièces détachées, pas certains que ce soit top... Personnellement, j'ai remarqué que sur certaine requêtes il y avait beaucoup plus de redondance dans les sites. Un même site peut apparaître plus de 3 fois sur la même page !

  • aquaportail a dit le

    A propos du KG, l'exemple en fin d'article montre quelques limites de ce KG : la tour Eiffel n'est une "tourist attraction" contrairement à sa soeur japonaise. Belle comparaison, en effet : pas honnête et pas juste.

  • foreigner a dit le

    La Tokyo Tower est une attraction touristique alors que la Tour Eiffel n'est qu'un relais TV...

    Il est temps de passer à un nouvel algo update...

  • Nicolas a dit le

    Bel exemple de pertinence pour le comparatif, la tour Eiffel n'est clairement pas une attraction touristique :p

  • Bertrand a dit le

    Mouaif, je constate beaucoup de redondance dans les SERP moi aussi.
    Ce changement est dans la continuité d'arrêter de faire bloquer les référenceurs sur de simple "mots-clé" et de travailler plus le contenu global du texte.
    Le not-provided qui passe à 100% en est la preuve.

  • Jean-marc a dit le

    Hummingbird : pas très joli comme nom je trouve. Ici au Brésil, le colibri s'appelle un "bejaflo" (baise-fleur). Avouez que c'est nettement plus poétique...

  • Jean a dit le

    C'est marrant de jouer "la compréhension de la phrase" d'une part et de vendre des mots clés d'autre part...

  • télécharger gratuit a dit le

    Personnellement je pense que humingbird va nous fournir des réponses à nos recherches plus précises et plus rapide et j’espère que ça va éviter
    l'apparition du même site plusieurs fois sur la même page.

  • téléch a dit le

    Google n'a cessé d'inventer des jolies fonctionnalités, personnellement j'ai essayer de faire quelques expl de comparaison et j'ai trouvé çà génial ;)

  • Limonads a dit le

    Bonjour,
    Je crois que le Colibri à un coup dans l'aile ! ^^
    Quand je ne vois un site sorti de nulle part arrivé en 2e position sur "Annuaire gratuit"
    - Il ne valide plus depuis des années
    - Les balises ... je n'en parle pas, elles sont quasiment tout identiques.
    - Le contenu.. je n'ai pas passé un coup d'intergity,
    mais j'imagine qu'il doit y avoir un paquet de liens HS
    - Les commentaires sont libres, aucune modération, ouverte à tout et n'importe quoi

    - Et la meta description de l'annuaire, est identique sur toutes les pages...

    Bref, je vous laisse jeter un coup d'oeil ! ^^
    ( Un petit -site:www.clikeo.fr dans Google )

  • tchat a dit le

    Bonjour ,
    Personellement, Il s’agit avant tout d’un changement de fonctionnement fondamental de mon avis cette architecture apprendra, s’adaptera aux évolutions de langage, pour encore et toujours améliorer la pertinence.
    Hummingbird C'est la couche manquante actuellement, mais qui devrait arriver bientôt. Parler en langage naturel, engager un dialogue et récupérer des données. C'est le doux rêve de l'intelligence artificielle, et google a les moyens d'y arriver ...

  • Yoorika a dit le

    Merci Olivier, Ce qui est étrange au changement de l'algo c'est la lenteur d'attribution de page rank.est ce normal?

  • Olivier Duffez a dit le

    Yoorika : je ne m'intéresse plus au PageRank depuis des années... ce critère est dépassé mais surtout son indicateur n'a jamais été assez précis. Alors quand il n'est plus mis à jour, autant l'oublier, non ?

  • VLC a dit le

    Le référencement naturel est la discipline qui consiste à positionner un site le plus haut possible dans les résultats des moteurs de recherche et ce sans verser le moindre centimes pour son positionnement, contrairement aux liens sponsorisés. Toutefois si être positionné est gratuit, la rude concurrence régnant sur le web rend de plus en plus difficile la prise de bonnes positions

  • Benoit a dit le

    Plus ça va et plus je me dis que Google n'a plus que ça pour faire parler de lui. Les mises à jour d'algo...Ils doivent rêver d'être aussi sexy qu'Apple et aussi moderne que Twitter.

  • Olivier Duffez a dit le

    @Benoit : tu dis ça sans rien savoir de ce qu'ils ont changé. Quand le big boss de l'algo dit à tous les journalistes qu'il s'agit de leur plus gros changement depuis des lustres, ça veut sans doute dire qu'il y a réellement eu du travail derrière. Je ne comprends pas bien l'intérêt de les dénigrer de cette façon ?

  • Ilan Freoua a dit le

    Avec ce genre d'innovations, on voit bien vers ou Google tend à évoluer :

    - Améliorer l'utilisation de la recherche, (smartphones,google glass), grâce à la synthèse vocale : en gros, l'utilisateur parle à son téléphone : "google, peux tu me donner la comparaison entre la tour eiffel et la tour de tokyo" , google envoie directement le contenu sur son moteur et renvoie son knowledge graph

    - Améliorer la comparaison entre sites : Je pense que Google veut clairement tuer tous les sites de comparaison en s'emparant du marché. On peut voir qu'il a déjà commencé avec les assurances, mais je pense que bientôt ce sera un comparateur de vol, d'hotels, etc...

    Enfin, je pense que pour Google, l'interface du moteur de recherche tel que nous le connaissons (barre de recherche sur un site internet) n'est plus d'actualité depuis bien longtemps et qu'ils se concentrent sur une recherche vocale (un peu comme Siri mais en beaucoup plus évolué)

  • Professeur Gang a dit le

    C'est au final pour Google un bon moyen de garder l'internaute sur ses propres pages en le dissuadant de visiter un site web, un vrai.
    C'est parfaitement logique, c'est dans l'intérêt de Google qui n'a même pas à forcer, l'intérêt de l'internaute n'est qu'un alibi.

  • xoox a dit le

    Le panda m'a pas posé de soucis par contre le collibri
    chutte de 10 à 15 places sur tous les mots clé et je remonte péniblement
    (des 4 premieres places je me retrouve dans les 15)
    en plus les sites qui m'ont dépassé moins bon page rank moins de contenu et moins de backlink (6 ou 7 fois moins que faire?

  • Olivier Duffez a dit le

    @xoox : une chute à quelle date ?

  • Aulouste a dit le

    Bonjour à tous.
    Nous avons constaté une modification (positive) de notre référencement sur les longues traines.
    Pour faire le lien avec adwords, le 17 octobre, le QS s'est subitement amélioré (+1 à +2) sur des campagnes qui existent depuis 2 à 3 mois, sans modification majeure des enchères.
    D'autres ont ils constaté des évolutions?

  • voila a dit le

    Voila comment un moteur de recherche bénéficiant d'une dominance sur le ????? peut décider que en somme, la recherche doit correspondre a des critéres qu'il définiera lui même, adjoignant dans la foulée des services de référencement payants .... cassant donc, le naturel et le réel. Le résultat n'est pas ce que l'on cherche, mais ce que google souhaite vous proposer.

    En somme, le moteur de recherche google est finement pipé, pour des raisons commerciales et collectes de donnés personnelles dont l'usage et le but restent encore abstrait.

    Le moteur google donne, le choix google.

    Des sites disparaissent du jours au lendemain, ne laissant que des sites a pub, infos, commerces. Google commencent a magouiller en fixant eux-même la ligne a ne pas dépasser, magouillent l'impots, puis ses produits.

    Dans la mesure ou ce moteur de recherche n'est plus viable, personnellement et j'ai remarqué que tout le monde commence a le faire, on passe sur Bing. J'ai prolongé en supprimant tout ce qui est d'origine google et je vous garantis que google n'a rien d'essentiel.

  • Olivier Duffez a dit le

    @voila : vos affirmations n'engagent que vous... Personne n'a hurlé ou critiqué les résultats de Google quand ils ont mis en ligne Hummingbird, d'ailleurs personne ne s'en était rendu compte. Simplement car personne ne réagit quand les choses s'améliorent, seulement quand elles se dégradent.

  • Stéphane a dit le

    La recherche sémantique sur le web existe depuis des années, un des pionniers fut Wolfram qui a créé sa propre société en 1987 (étrange que Google n'ait pas envisagé son acquisition).
    Regardez le lien suivant et vous trouverez une grande similitude !
    http://www.wolframalpha.com/input/?i=tour+eiffel+vs+tokyo+tower
    Bonne journée à tous.

  • Olivier Duffez a dit le

    En effet Stéphane, merci pour la précision.

  • Morgatix a dit le

    Concernant l'intégration des données structurées, quelqu'un a-t-il déjà procédé à des tests d'optimisation de ces données depuis l'arrivée du colibri ?

    Si oui, pour quels résultats ?

  • takihanane a dit le

    Je vous remercie pour votre article

    Je travaille autant que referenceur depuis 9 ans et durant tous ces années j'ai respecté les algorithmes Google.

    J'ai une remarque ; il n'a pas un changement depuis l'arrivée de Google Hummingbird!

    Par défaut, tout le monde doit préciser les requêtes pour avoir des résultats pertinentes.

    Je vous remercie encore une fois.

    Hanane Taki

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Annonces Google

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.