Brevet de Microsoft sur l'analyse des textes de backlinks
Par Olivier Duffez, mercredi 2 avril 2008
Microsoft vient d'obtenir un brevet intitulé Using anchor text to provide context
, qui décrit comme l'analyse des textes de liens peut aider un moteur de recherche à en savoir plus sur une page web mais aussi à créer des snippets pour les pages qui ont très peu de texte.

Le brevet de Microsoft
Intitulé Using anchor text to provide context, il a été attribué à Girish Kumar, Gaurav Sareen, Namita Gupta, Charles Lester Alexander Clarke, Junhua Wang le 20 mars 2008 (1 an et demi après le dépôt). Comme le résume Bill Slawski, ce brevet décrit une méthode d'analyse du contexte d'une page web à partir de l'étude des anchor text des backlinks (les textes des liens pointant vers cette page). En plus de permettre à la page de sortir sur des requêtes incluant des mots absents de la page, les travaux de Microsoft permettent de créer des snippets (descriptions situées sous chaque résultat de recherche) pour les pages qui n'ont pas (ou très peu) de texte.
Dans le cas des pages ayant très peu de texte, et notamment les pages n'incluant pas les mots choisis par l'internaute pour faire sa requête, le moteur peut utiliser des informations issues de l'analyse de textes de backlinks. Par exemple, s'il y a du texte autour d'un lien pointant vers cette page, et si ce texte est jugé pertinent pour la requête, le moteur peut l'utiliser en guise de snippet.
Evidemment la page pauvre en contenu textuel peut bénéficier de plusieurs backlinks ; dans ce cas le moteur pourra bâtir le snippet à partir du contexte de backlink jugé le plus pertinent, en se basant sur les critères suivants :
- nombre de mot en commun entre le texte du backlink et la requête
- la similarité globale entre le texte du backlink et la requête
- la longueur du texte du backlink
- le positionnement des pages offrant ces backlinks
- etc.
Que peut-on tirer de l'étude de ce brevet ?
Pas grand chose en ce qui concerne la plupart des pages web, qui ne sont pas concernées (car elles contiennent suffisamment de texte). Pour les pages ayant très peut de texte, ce brevet nous rappelle l'importance de soigner (autant que possible) le "profil sémantique" des backlinks. Enfin, dans les cas où une page sort en bonne position dans un moteur sans que les mots de la requête n'apparaissent sur la page, cela vaut sans doute le coup de les ajouter dans le texte au sein d'une phrase. D'une part cela permettra sans doute d'améliorer son positionnement, et d'autre part ce fameux snippet sera sans doute plus pertinent.
Schémas




Réactions
Et vous, qu'est-ce que ça vous inspire ?

Ajoutez ce blog à vos favoris Technorati !




Commentaires
1. Le jeudi 3 avril 2008 à 07:19, par Simon Dor
2. Le mercredi 9 avril 2008 à 09:26, par cooperben
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.
A lire aussi dans l'actualité WebRankInfo
Inévitablement, nous aurons sans doute bientôt des publicités de Google dans nos téléphones portables... Google a déjà déposé un brevet !
Google vient d'améliorer l'outil de statistiques offert aux webmasters dans Google Webmaster Central Tools, permettant de connaître les anchor text (intitulés des liens pointant vers votre site).
Google vient d'obtenir un brevet sur les calculs de similarité qui pourraient servir à la détection de contenu dupliqué.
Google a lancé la semaine dernière un nouveau service intitulé Google Patents, qui permet de chercher parmi 7 millions de brevets. Petite description...
Après Microsoft et Google, c'est au tour de Yahoo de faire parler de lui au sujet de l'analyse de la mise en page des sites Internet disséqués par son robot d'indexation. Cet article résume les techniques décrites par ces 3 moteurs de recherche...
Microsoft vient d'ajouter une commande de plus à son moteur Live Search, à destination des webmasters et référenceurs : LinkFromDomain. Elle permet de lister tous les sites vers lesquels on fait un lien...
Microsoft Live Search vient de décider de désactiver temporairement les opérateurs
link:etlinkdomain:qui permettent respectivement de lister les backlinks d'une URL et d'un site dans sa globalité. La raison évoquée est une utilisation trop massive par des outils automatisés.Depuis l'été 2007, Google a considérablement amélioré son système de crawl : non seulement le moteur semble arriver à indexer les très nombreuses pages créées chaque jour sur le web, mais il n'est plus rare de voir des pages indexées en quelques minutes à peine ! Voici quelques explications issues d'un brevet de Google qui décrit les différents types de crawlers et leurs rôles respectifs.
Même s'il part avec du retard sur ses concurrents, notamment Yahoo, Google s'intéresse de plus en plus à l'aspect social de la recherche d'informations, comme le montre ce brevet.