Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Bing s’inspire des résultats de Google !

Google vient de prouver que Bing exploite le comportement des utilisateurs de Google pour certaines requêtes et utilise cette information pour l’aider à classer également les résultats. Dans certains cas, notamment la longue traîne, le 1er résultat chez Bing se retrouve étrangement égal à celui de Google. Les ingénieurs de Google se plaignent de cette triche… qui est révélée bizarrement au moment où Google est malmené sur le plan de la lutte contre le spam. Explications…

Le scoop a été révélé par Danny Sullivan, à qui Amit Singhal (le boss de l’algo Google) et Matt Cutts (le boss de la lutte anti-spam de Google) ont tout révélé. Vous trouverez de explications très détaillées dans son post, que je vous résume ici.

En résumé

Google a acquis la conviction que Bing surveille certains internautes (via Internet Explorer) lorsqu’ils font des recherches sur Google. En plus des sites visités, Bing a accès aux requêtes qui ont été effectuées. Ainsi, le moteur de recherche de Microsoft peut se baser sur les choix faits par l’algorithme de Google (et ses utilisateurs) pour améliorer le sien. C’est justement ce que Google a prouvé, montrant que dans certains cas le 1er résultat d’une requête créée sur-mesure pour des tests est identique sur Bing et Google. Interrogé, Bing n’a pas démenti… (Edit : voir en fin d’article la réaction officielle)

Le résultat sur Google

Sur Google, les résultat correspondent à une correction de la requête

Le résultat sur Bing

Sur Bing il n'y a pas de correction, pourtant le 1er résultat est identique à celui de Google

Le détail de l’histoire

L’histoire a commencé en mai 2010. Google a remarqué que pour des requêtes avec erreur d’orthographe ou de typographie (misspelling), Bing parvenait à renvoyer en 1er résultat le même que Google. Ce qui étonnait surtout Google, c’est que leur algorithme effectuait une correction automatique (dont l’algorithme est jugé pas si simple que ça) alors que Bing ne semblait pas en faire (en tout cas ce n’était pas indiqué). En fait, si ça a piqué tant que ça les ingénieurs de Google, c’est qu’ils sont très fiers de leur système de détection des erreurs de frappe (ou d’orthographe) : ils prétendent que cela fonctionne même pour des requêtes erronées qui n’avaient jusqu’alors jamais été faites.

En octobre 2010, les ingénieurs de Google sont alertés par les valeurs de 2 métriques (apparemment observées régulièrement, on vient de l’apprendre et ça peut faire débat) :

  • parmi les résultats affichés sur les SERP, le pourcentage de résultats identiques (sur Bing et Google) a fortement augmenté
  • le nombre de cas où le tout premier résultat est identique (sur Bing et Google) a lui aussi augmenté

Après ces observations, les équipes de Google ont pensé que Bing utilisait sans doute son navigateur Internet Explorer. En effet, dans ses conditions générales d’utilisation, on peut lire que non seulement la liste des sites web visités peut être transmise à Microsoft, mais aussi les mots-clés tapés dans des formulaires (donc les requêtes Google et les résultats cliqués).

Les ingénieurs de Google ont alors mis en place des tests, que certains pourraient qualifier de vicieux, ayant pour objectif de tendre un piège à Bing afin de prouver cette recopie de résultats. Pour la 1ère fois dans l’histoire de Google (enfin c’est ce qu’on nous raconte), certaines pages web ont été placées manuellement en tête de résultats pour certaines requêtes. On nous rassure en précisant que c’était seulement une centaine de requêtes, que très peu d’internautes peuvent faire sur Google, et qu’une fois l’opération terminée, cette transgression à la règle a pris fin.

Ces requêtes avaient été choisies car elles ne renvoyaient aucun résultat pertinent. Ni Google ni Bing n’était capable de trouver des pages web pertinentes pour ces requêtes. Ensuite Google modifie arbitrairement ses résultats en plaçant en 1er des pages préalablement choisies.

Il a suffi d’une vingtaine d’ingénieurs Google, qui pendant environ 15 jours ont fait ces fameuses requêtes sur leur ordinateur à la maison, avec Internet Explorer muni de la barre d’outils Bing (Bing Toolbar) et la fonctionnalité Suggested Sites activée. Au bout de ces 15 jours, les pages présélectionnées par Google sont apparues en 1ère position sur Bing. Bingo !

Le procédé utilisé par Google pour prouver le comportement de Bing s’appelle en informatique « pot de miel » (honeypot ou honeytrap). Il s’agit en général d’un ordinateur ou d’un logiciel volontairement vulnérable, qui sert à attirer et donc piéger les pirates informatiques…

Explications

En réalité, ce test n’a fonctionné que pour 7 à 9 des 100 requêtes. Danny pense que la raison est que Bing se sert des résultats de Google comme d’un critère pour son algorithme de pertinence. Pour les requêtes « faciles », où les critères traditionnels permettent de trouver les bons résultats sans doute, Bing n’a pas besoin de « l’aide de Google ». Par contre pour les requêtes qui sortent de l’ordinaire, ce critère devient prépondérant, car Bing ne dispose pas de « signaux » autres que le résultat de Google. Donc ces des cas-là, les résultats de Bing se mettent à ressembler furieusement à ceux de Google. Ça ne vous rappelle pas la triche à l’école ? ;-)

Ce qu’il faut en penser

Il est clair que le procédé employé par Bing est très discutable. Pour ma part, j’estime que ce n’est pas correct d’aller ainsi s’inspirer du travail du concurrent. Pour l’instant Google crie à la triche, on verra si l’affaire prend des plus grandes proportions, éventuellement devant les tribunaux. Cela étant, voici quelques points que je soumets à votre réflexion :

  • Les termes utilisés par Google : particulièrement bien choisis, ils simplifient un peu trop la situation, laissant croire au monde entier que Bing n’est plus qu’un clone de Google. En réalité, les résultats cliqués par les utilisateurs de Google ne sont qu’un parmi des centaines de critères utilisés par Bing. Si bien qu’il n’y a en réalité qu’une partie des requêtes qui sont concernées (personne ne pouvant évaluer la proportion).
  • Le calendrier choisi par Google : cela faisait 1 mois que Google avait terminé son fameux test et acquis la certitude que Bing « triche ». Entre temps, la presse a publié plusieurs articles accusateurs, expliquant que la qualité des résultats Google avait fortement baissé, que Google n’arrivait plus à lutter correctement contre le spam. Hier, le 1er février, avait justement lieu un sommet sur l’avenir de la recherche sur Internet et particulièrement de la qualité (search quality). La révélation du scoop quelques heures avant ce sommet a évidemment permis à Google d’éclipser totalement l’ordre du jour…
  • Edmond Lau, ancien employé de Google dans l’équipe qualité, estime que cette pratique est « très raisonnable » et que Bing aurait tort de s’en priver. Il ajoute que Google analyse également les données de navigation des internautes (via sa barre d’outils). Il conclut que si Google se plaint, s’est surtout qu’il a bien plus à perdre que Bing, ce dernier ayant un algorithme pas aussi abouti que le géant des moteurs de recherche.

Qu’en pensez-vous ? On discute de cette affaire dans le forum WebRankInfo.

Voici quelques liens pour vous faire votre propre opinion :

  • l’article de Danny Dullivan sur SearchEngineLand, qui a révélé le scoop
  • la réaction officielle de Bing par Harry Shum, qui « avoue » que Bing utilise les données de surf des internautes, mais qui fournit des justifications
  • l’article de Ami Singhal sur le blog de Google qui officialise la plainte (pas encore devant la justice…) et qui demande à Bing de cesser cette pratique
  • L’avis d’Edmond Lau

Source des images : Danny Sullivan

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.