Description du TrustRank de Google
Par Olivier Duffez, lundi 6 juin 2005

© TrustRank
L'algorithme du TrustRank propose une méthode semi-automatique de classification des pages web (spam ou pas spam). Il est basé sur une liste de pages de référence garanties "propres" après une analyse manuelle faite par un humain. Par propagation et analyse des liens entre pages, l'algorithme détermine si les autres pages sont également "propres" ou si au contraire elles sont du spam, en partant du principe que les pages "propres" font très rarement des liens vers des pages de spam.
L'algorithme nécessite une très bonne sélection des sites de référence (une simple liste de 200 sites a donné de bons résultats d'après l'article).
Au final, il attribue une note à chaque page, son TrustRank (TR). Comprise entre 0 (spam) et 1 (page de référence), elle indique le degré de confiance que l'on peut attribuer à la page.
Le TrustRank peut être utilisé seul pour filtrer l'index d'un moteur de recherche, ou en complément du PageRank pour aider à classer les résultats d'une recherche.
Google utilise peut-être déjà cet algorithme (ou une variante) depuis des mois... ou bien prévoit de le faire bientôt. Difficile d'être catégorique dans ce domaine.
Source : Web Rank Info
Discutez de l'article Description du TrustRank de Google dans le forum

Ajoutez ce blog à vos favoris Technorati !




Commentaires
Aucun commentaire pour le moment.
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.
A lire dans le forum WebRankInfo