Dans un article rédigé par Matt Cutts (on n'entend plus parler que de lui en ce moment !), Google explique les bases de son fonctionnement, en traitant de l'indexation puis du classement des pages (How does Google collect and rank results?).

Il aborde donc :

  • le crawl
  • la création de l'index inversé
  • l'utilisation de milliers de serveurs dans les data centers
  • la recherche des documents ayant chacun des mots de la requête de l'internaute
  • le PageRank
  • l'existence de nombreux autres critères (la proximité des mots, le nombre d'occurrences des mots, etc.)
  • le nombre de liens issus de sites réputés (trusted sites)
  • la création des snippets (descriptif de chaque résultat)

Il rappelle que pour chaque requête, environ 500 machines sont utilisées pour renvoyer la réponse à l'internaute, et tout ça en une demi seconde en moyenne.

Bref, rien de nouveau pour les habitués de WebRankInfo. Google cherche-t-il à créer de bonnes relations avec les bibliothécaires ?