Depuis le premier index de Google en 1998, qui comptait 26 millions de pages, le leader des moteurs de recherche a bien progressé. La barre du 1er milliard de pages indexées a été franchie en 2000. Pendant les années qui ont suivi, Google et Yahoo se sont livrés à une petite guerre de communication sur le thème C'est moi qui ai le plus gros index
... Quand ils ont décidé d'arrêter ce petit jeu et de ne plus communiquer, on en était resté aux environs de 20 milliards de pages.
Aujourd'hui, la barre des 1000 milliards aurait donc été franchie. Aurait
, car qui peut vérifier ce qu'avancent ces ingénieurs de Google ? D'après eux, leur système a détecté plus d'un trillion d'URL mais en a retenu seulement 1 trillion d'uniques (après détection de contenus dupliqués). Toutes ces pages ne sont pas forcément indexées ; on imagine d'ailleurs assez bien qu'il existe quantité de pages sur le web qui ne sont que des contenus dupliqués ou des pages vides (les ingénieurs donnent l'exemple des liens jour suivant
que l'on trouve sur des calendriers, qui mènent à des pages construites automatiquement mais sans forcément de contenu).
Au sujet de ce fameux PageRank, les ingénieurs nous donnent quelques chiffres assez étonnants. Avec le 1er index de 26 millions de pages, le PageRank pouvait être recalculé en quelques heures par un seul serveur, ce qui peut se comprendre. Mais ils prétendent qu'ils ont encore aujourd'hui la capacité à traiter les calculs plusieurs fois par jour, avec une matrice de 1000 milliards de colonnes ! Quand on sait qu'en plus de l'augmentation considérable du nombre de pages, l'algorithme est lui aussi largement plus complexe, on réalise à quel point l'infrastructure de serveurs de Google est un bijou de technologies unique au monde ! Avis aux concurrents qui aimeraient rattraper Google...
On en parle dans le forum WebRankInfo.
Remarque : le terme anglais trillion
utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).
Goudie, voici la dernière phrase de mon article :
Remarque : le terme anglais "trillion" utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).
Mais Archernar a raison dans la mesure où ce sont des américains qui s'expriment, on sait à quoi correspond 1 trillion (US) : c'est 1000 milliards. Par contre, je ne comprends pas pourquoi Archernar dit que pour les anglophones billion équivaut à 1 million de millions, car en réalité cela équivaut à mille millions (1 milliard).
Je vous conseille de lire cet article (que j'avais indiqué dans le forum) : http://www.anglaispratique.fr/mi...
Peu, pas, d'ambiguïté mathématique : Google "communique" des Etats-Unis ; la majorité des pays anglophones et le Brésil communiquent "long scale", système de noms numériques dans lequel billion signifie un million de millions, les francophones communiquent, actuellement, "short scale" le mot billion y signifie un millier de millions.
Euh.. Désolé, j'ai bien tout lu, l'explication est sûrement là, mais bien cachée ;) ...
Faut lire mon article jusqu'au bout, remarque incluse concernant trillion, billion, milliards etc.
"1 trillion, c'est-à-dire mille milliards"
C'est pas plutôt un billion ? Enfin j'me trompe peut-être...
Quand je vois sur le forum un nombre importants de webmasters qui se plaignent de ne pas voir leurs pages sur GG ! ;-)
En effet, cela fait beaucoup de pages. Je comprends aussi, désormais, pourquoi mon PageRank est amené à baisser irrémédiablement : je ne suis pas en mesure, à moi seul, de suivre la cadence de production des sites web les plus conséquents.
chez Google rien n'est laissé au hasard
Si on enleve toute les pages inutiles du web (spam et autres...) combien en reste t'il ...
Effectivement, 1000 milliards de pages sur le web, ça devient colossal !!
Petit précision, c'était fin 2005 que Google a décidé de ne plus communiquer le nombre de page indexées sur sa page d'accueil.
On regardant 1.000.000.000.000 on dirait c'est un train! je ne sais pas comment ils font.
Thanks Olivier