Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Au fait, voilà à quoi ça ressemble un centre de données :

Tous les data centers étaient donnés avec une adresse IP se terminant par 100. Il se trouve que certains data centers ne sont plus accessibles par cette adresse. Le tableau suivant liste les data centers dans l'ordre chronologique de leur découverte.Nom, emplacement, description Nom de domaine Adresses IP Santa Clara (Californie, Etats-Unis)
Hébergé par Exodus Communications
En service depuis 1998www-ex.google.com 216.239.33.98
216.239.33.99
216.239.33.100
216.239.33.101
216.239.33.102
216.239.33.103
216.239.33.104
216.239.33.105San Jose (Californie, Etats-Unis)
Hébergé par Global Crossing, mis en service début 2000.
Hors-service depuis octobre 2003www-sj.google.com hors-service Herndon (Virginie, Etats-Unis)
Adresse 216.239.37.100 hors-servicewww-va.google.com 216.239.37.98
216.239.37.99
216.239.37.102
216.239.37.103
216.239.37.104
216.239.37.105
216.239.37.147Washington DC (Etats-Unis)
Adresse 216.239.39.100 hors-servicewww-dc.google.com 216.239.39.98
216.239.39.99
216.239.39.102
216.239.39.103
216.239.39.104
216.239.39.105
216.239.39.147Virgnie (Etats-Unis)
Adresse 216.239.41.100 hors-servicewww-fi.google.com 216.239.41.98
216.239.41.99
216.239.41.102
216.239.41.103
216.239.41.104
216.239.41.105Sterling (Virginie, Etats-Unis)
Hébergé par Exodus Communications
Adresse 216.239.51.100 hors-servicewww-ab.google.com 216.239.51.99
216.239.51.102
216.239.51.103
216.239.51.104
216.239.51.105
216.239.51.147Santa Clara (Californie, Etats-Unis)
Hébergé par Exodus Communications
Adresse 216.239.53.100 hors-servicewww-in.google.com 216.239.53.98
216.239.53.99
216.239.53.104
216.239.53.105Zurich (Suisse) depuis juin 2002.
Adresse 216.239.55.100 hors-service depuis novembre 2003www-zu.google.com 216.239.55.104 Palo Alto (Virginie, Etats-Unis) depuis janvier 2003.
Hébergé par Cable & Wireless.
Adresse 216.239.53.100 hors-servicewww-cw.google.com 216.239.57.98
216.239.57.99
216.239.57.104
216.239.57.105Dublin (Irlande)
Mis en service le 1er août 2003
Adresse 216.239.59.100 hors-servicewww-gv.google.com 216.239.59.98
216.239.59.99
216.239.59.102
216.239.59.103
216.239.59.104
216.239.59.105Connu depuis septembre 2003. Irlande
Adresse 66.102.11.100 hors-servicewww-kr.google.com 66.102.11.99
66.102.11.101
66.102.11.104Connu depuis octobre 2003.
Semble être situé à Santa-Clara (Californie, Etats-Unis)
Adresse 66.102.7.100 hors-servicewww-mc.google.com 66.102.7.98
66.102.7.99
66.102.7.102
66.102.7.104
66.102.7.105
66.102.7.147Connu depuis novembre 2003.
Semble être situé à Dublinwww-lm.google.com 66.102.9.99
66.102.9.100
66.102.9.101
66.102.9.104
A quoi ça sert de connaître tout ça ? Pas à grand chose pour la plupart des gens... Mais pour ceux qui veulent analyser de près ce qui se passe sur Google, il est important de pouvoir faire des requêtes sur l'un ou l'autre des data centers.
Pendant une Google Dance, il peut y avoir de grosses différences de positionnement selon les data centers. Les PageRank peuvent être différents également. A tout moment, il peut y avoir des différences sur le nombre de pages indexées affiché pour un site donné, selon les data centers. C'est le cas surtout pour les très gros sites (plusieurs dizaines de milliers de pages indexées dans Google).
Que sont les data centers de Google ?
L'index global est découpé en petits bouts, hébergés chacun sur un cluster de 40 serveurs. Le trafic est à son maximum environ une fois par mois quand Google met à jour sa base. Des dizaines de tera-octets doivent alors transiter sur les réseaux internes...
Lors de la Google Dance, les centres de données reçoivent les uns après les autres la nouvelle version de l'index (contenant l'ensemble des pages indexées par Google). Ceci a pour conséquence que pendant cette phase (qui dure en général 2 ou 3 jours), la réponse à une requête faite sur Google peut provenir d'un centre de données mis à jour ou d'un centre de données contenant les anciennes données.
Chacun des domaines listés ci-dessus pointe directement sur un des centres de données. En plus de l'index principal accessible sur www-XX.google.com, il est possible d'accéder via www-XX2.google.com à l'autre version de l'index.
Les autres serveurs : www2.google.com et www3.google.com
Ces autres serveurs pointaient vers l'un des centres de données, et servaient à Google à tester le nouvel index au moment de la Google Dance. Pendant la Google Dance, les résultats diffèraient beaucoup entre www, www2 et www3. A la fin de la Google Dance, les résultats redevenaient identiques.
Ensuite, entre deux mises à jour, les résultats pouvaient légèrement varier, car les index des différents centres de données n'étaient pas toujours strictement identiques.
Pour en savoir plus
- description de la société Google
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.

