Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google a répertorié 1000 milliards de pages sur le web !

1 trillion, c'est-à-dire mille milliards (1.000.000.000.000) : voilà le nombre de pages web distinctes que Google a répertorié ! Jesse Alpert et Nissan Hajaj (2 ingénieurs de Google de l'équipe en charge de l'infrastructure de la recherche) donnent quelques chiffres qui donnent le tournis...

Depuis le premier index de Google en 1998, qui comptait 26 millions de pages, le leader des moteurs de recherche a bien progressé. La barre du 1er milliard de pages indexées a été franchie en 2000. Pendant les années qui ont suivi, Google et Yahoo se sont livrés à une petite guerre de communication sur le thème C'est moi qui ai le plus gros index... Quand ils ont décidé d'arrêter ce petit jeu et de ne plus communiquer, on en était resté aux environs de 20 milliards de pages.

Aujourd'hui, la barre des 1000 milliards aurait donc été franchie. Aurait, car qui peut vérifier ce qu'avancent ces ingénieurs de Google ? D'après eux, leur système a détecté plus d'un trillion d'URL mais en a retenu seulement 1 trillion d'uniques (après détection de contenus dupliqués). Toutes ces pages ne sont pas forcément indexées ; on imagine d'ailleurs assez bien qu'il existe quantité de pages sur le web qui ne sont que des contenus dupliqués ou des pages vides (les ingénieurs donnent l'exemple des liens jour suivant que l'on trouve sur des calendriers, qui mènent à des pages construites automatiquement mais sans forcément de contenu).

Au sujet de ce fameux PageRank, les ingénieurs nous donnent quelques chiffres assez étonnants. Avec le 1er index de 26 millions de pages, le PageRank pouvait être recalculé en quelques heures par un seul serveur, ce qui peut se comprendre. Mais ils prétendent qu'ils ont encore aujourd'hui la capacité à traiter les calculs plusieurs fois par jour, avec une matrice de 1000 milliards de colonnes ! Quand on sait qu'en plus de l'augmentation considérable du nombre de pages, l'algorithme est lui aussi largement plus complexe, on réalise à quel point l'infrastructure de serveurs de Google est un bijou de technologies unique au monde ! Avis aux concurrents qui aimeraient rattraper Google...

On en parle dans le forum WebRankInfo.

Remarque : le terme anglais trillion utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

Cet article vous a-t-il plu ?

Note : 1.0 (1 vote)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

11 commentaires

Olivier Duffez

Goudie, voici la dernière phrase de mon article :
Remarque : le terme anglais "trillion" utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

Mais Archernar a raison dans la mesure où ce sont des américains qui s'expriment, on sait à quoi correspond 1 trillion (US) : c'est 1000 milliards. Par contre, je ne comprends pas pourquoi Archernar dit que pour les anglophones billion équivaut à 1 million de millions, car en réalité cela équivaut à mille millions (1 milliard).

Je vous conseille de lire cet article (que j'avais indiqué dans le forum) : http://www.anglaispratique.fr/mi...

Répondre
Archernar

Peu, pas, d'ambiguïté mathématique : Google "communique" des Etats-Unis ; la majorité des pays anglophones et le Brésil communiquent "long scale", système de noms numériques dans lequel billion signifie un million de millions, les francophones communiquent, actuellement, "short scale" le mot billion y signifie un millier de millions.

Répondre
Goudie

Euh.. Désolé, j'ai bien tout lu, l'explication est sûrement là, mais bien cachée ;) ...

Répondre
Olivier Duffez

Faut lire mon article jusqu'au bout, remarque incluse concernant trillion, billion, milliards etc.

Répondre
Goudie

"1 trillion, c'est-à-dire mille milliards"

C'est pas plutôt un billion ? Enfin j'me trompe peut-être...

Répondre
MC

Quand je vois sur le forum un nombre importants de webmasters qui se plaignent de ne pas voir leurs pages sur GG ! ;-)

Répondre
Martin

En effet, cela fait beaucoup de pages. Je comprends aussi, désormais, pourquoi mon PageRank est amené à baisser irrémédiablement : je ne suis pas en mesure, à moi seul, de suivre la cadence de production des sites web les plus conséquents.

Répondre
abseo

chez Google rien n'est laissé au hasard

Répondre
pbi

Si on enleve toute les pages inutiles du web (spam et autres...) combien en reste t'il ...

Répondre
Dan

Effectivement, 1000 milliards de pages sur le web, ça devient colossal !!
Petit précision, c'était fin 2005 que Google a décidé de ne plus communiquer le nombre de page indexées sur sa page d'accueil.

Répondre
Nejib

On regardant 1.000.000.000.000 on dirait c'est un train! je ne sais pas comment ils font.

Thanks Olivier

Répondre