Fonctionnement de l'équipe qualité chez Google Search
Olivier Duffez, Mardi 6 octobre 2009
Savez-vous combien de fois Google cherche à améliorer ses algorithmes chaque année ? Comment Google mesure la qualité de ses résultats de recherche ? Qui sont les évaluateurs humains, à quoi servent-ils ? Voici quelques explications sur ces mystères de Google…
Cet article reprend seulement quelques éléments publiés par Business Week dans une série d'interviews d'ingénieurs de Google (Udi Manber, Amit Singhal, Scott Huffman). Il n'en reste pas moins que ça m'a pris pas mal de temps à lire et à vous le résumer !
En 2008, Google a effectué entre 5000 et 6000 expériences visant à améliorer le moteur de recherche. Celles-ci aboutissent à environ 100 à 120 modifications dans l'algorithme chaque trimestre.
Chaque jour, environ un tiers des requêtes effectuées sur Google n'avaient jamais été effectuées auparavant ! Un grand nombre d'entre elles ne seront sans doute jamais refaites…
Parmi les éléments surveillés, Google cherche à analyser les requêtes pour lesquelles l'internaute n'a cliqué sur aucun résultat, car c'est en général signe d'une mauvaise qualité de résultats. Il y a des contre-exemples, par exemple les internautes qui utilisent Google pour vérifier l'orthographe : ils tapent quelque chose et regardent la suggestion de Google puis repartent sans rien cliquer. Autre exemple : parfois l'internaute trouve ce qu'il cherchait directement dans le texte du snippet (le petit descriptif sous chaque résultat).
Pour vérifier l'intérêt d'une modification de l'algorithme, Google utilise des évaluateurs humains et effectue des expériences :
- En ce qui concerne les évaluateurs humains (Google Quality Raters) : il y en a partout dans le monde (on ne sait pas combien…). Ces beta-testeurs de Google sont des indépendants recrutés via des petites annonces, payés par Google (autour de 16$ de l'heure pour les USA). Ils ont accès à un outil leur permettant de réaliser des tâches bien précises qui servent à analyser la qualité des résultats. Par exemple ils doivent indiquer si une URL répond vraiment bien à une requête donnée.
- En ce qui concerne les expériences : un échantillon d'utilisateurs voient les résultats du nouvel algorithme (sans le savoir) tandis que d'autres voient l'ancien : par comparaison de nombreux indicateurs (pas seulement les clics), Google évalue les performances du nouvel algorithme. 1% des utilisateurs de Google est déjà un échantillon suffisamment représentatif.
Chaque résultat se voit attribuer un score de qualité, calculé par l'algorithme à partir de plusieurs centaines de critères. Il est très fréquent qu'un changement dans l'algorithme modifie très légèrement le score d'un des résultats, passant par exemple de 5,000 à 5,001 et par conséquent passer devant d'autres résultats.
Tous les ingénieurs qui travaillent à améliorer l'algo ont à leur disposition une plateforme de tests très efficace, qui leur permet de valider une hypothèse en une seule journée, en mesurant des données réelles. Si les chiffres sont bons, la modification peut être approuvée en 5 minutes !
Un très très bon ingénieur met environ 2 ans à vraiment bien comprendre comment fonctionne la recherche chez Google.
Un grand nombre d'adaptations sont faites sur l'algorithme pour tenir compte des spécificités de chaque pays (en plus des langues).
Souvent, quand un ingénieur Google remarquait un problème avec des résultats de mauvaise qualité, il avait du mal à le montrer car les résultats changent sans arrêt. Alors, pour régler ce problème, une équipe a développé un système appelé Replay : c'est une sorte de « magnétoscope de Google » qui permet en quelque sorte de figer l'index. Ainsi, il devient possible de lancer une requête pour analyser les résultats qui auraient été renvoyés par Google à un autre moment dans le passé !
On discute de tout ça dans le forum WebRankInfo.
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Google teste la recherche locale (Google Search by Location)
- Des résultats issus de Google blog search dans Google web
- [Google] On-Demand Indexing feature with Google Site Search
- Bouton Google Search Desktop dans la barre Google
- [Info] Google Afrique du Sud et Google Desktop Search
- [Google] Accessible View [Google Experimental Search]
- Difference entre Google.com/searchFR et Google.fr/search
- Google search vu par les employés Google
- Google Music Trends, Google Music Search et Google Talk
- Google:non Google blog search:oui
- google custom search et annonces google
- Google Trends : Personalized Search on Google
- Google Earth Et Google Search Appliance
- Mise à jour du quality score Google AdWords
- Google et Earthlink équipe SF en Wifi
Consultez la description détaillée des produits ou services de Google suivants : Marques de Google
5 commentaires sur “L’équipe qualité dans la recherche Google”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Concepteur Multimédia et design sonore à Montpellier
- Hotel restaurant Le Pont Neuf à Florac Lozère dans les Gorges du Tarn
- Organisation coordination de tout type d'évènement en Haute Savoie
- Agence immobilière Somacimmo - Somain
- Hôtel de Bordeaux à La rochelle
- Vente en ligne de cactus plantes grasses et tillandsia
- TETRADIS, Distributeur spécialisé solutions interconnexion très haut débit
- Cartes, faire-parts et articles de papeterie à imprimer soi-même
- 17WebStore - Achetez aujourd'hui la technologie de demain
- Location de musique DJ pour trouver chaque soirée
- Santé des chiens et des chats : des vétérinaires répondent à vos questions
- Outils interactifs pour un développement durable facile en entreprises
- Must Animation : Dj animateur, organisation et l'animation évènementielle
- Location de villa et appartement à koh Samui en Thailande
- Le club des amateurs et passionnés des jeux de grille



merci pour l’article
Vraiment impressionnant !
L’intervention humaine de Google, peut elle servir également à déclasser certains sites ?
Bel article qui met encore une fois en évidence la quantité de travail et la puissance de calcul mise en oeuvre par google pour être pertinent. En tous cas merci pour cet article qui nous ouvre les yeux !
L’article est un bon constat de la technologie croissante et de moyens déployés pour une performance toujours à la pointe de l’actualité, mais l’ensemble sera vraiment performant quand la totalité des critères visera à un meilleur ciblage. Un « détraceur de route » pourrait etre Twitter, bon outil social mais tendant à dépister la pertinence d’une recherche, tenu compte de son indexation dans les SERP. Inutile d’avoir un outil qui calcule en un milliardième de seconde si son résultat aboutit à coté de la plaque…