Annonces Google

Vous êtes ici : Dossiers référencement > Indexation Google

Google a répertorié 1000 milliards de pages sur le web !

Par , le 25 juillet 2008

1 trillion, c'est-à-dire mille milliards (1.000.000.000.000) : voilà le nombre de pages web distinctes que Google a répertorié ! Jesse Alpert et Nissan Hajaj (2 ingénieurs de Google de l'équipe en charge de l'infrastructure de la recherche) donnent quelques chiffres qui donnent le tournis...

Depuis le premier index de Google en 1998, qui comptait 26 millions de pages, le leader des moteurs de recherche a bien progressé. La barre du 1er milliard de pages indexées a été franchie en 2000. Pendant les années qui ont suivi, Google et Yahoo se sont livrés à une petite guerre de communication sur le thème C'est moi qui ai le plus gros index... Quand ils ont décidé d'arrêter ce petit jeu et de ne plus communiquer, on en était resté aux environs de 20 milliards de pages.

Aujourd'hui, la barre des 1000 milliards aurait donc été franchie. Aurait, car qui peut vérifier ce qu'avancent ces ingénieurs de Google ? D'après eux, leur système a détecté plus d'un trillion d'URL mais en a retenu seulement 1 trillion d'uniques (après détection de contenus dupliqués). Toutes ces pages ne sont pas forcément indexées ; on imagine d'ailleurs assez bien qu'il existe quantité de pages sur le web qui ne sont que des contenus dupliqués ou des pages vides (les ingénieurs donnent l'exemple des liens jour suivant que l'on trouve sur des calendriers, qui mènent à des pages construites automatiquement mais sans forcément de contenu).

Au sujet de ce fameux PageRank, les ingénieurs nous donnent quelques chiffres assez étonnants. Avec le 1er index de 26 millions de pages, le PageRank pouvait être recalculé en quelques heures par un seul serveur, ce qui peut se comprendre. Mais ils prétendent qu'ils ont encore aujourd'hui la capacité à traiter les calculs plusieurs fois par jour, avec une matrice de 1000 milliards de colonnes ! Quand on sait qu'en plus de l'augmentation considérable du nombre de pages, l'algorithme est lui aussi largement plus complexe, on réalise à quel point l'infrastructure de serveurs de Google est un bijou de technologies unique au monde ! Avis aux concurrents qui aimeraient rattraper Google...

On en parle dans le forum WebRankInfo.

Remarque : le terme anglais trillion utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

Cet article vous a-t-il plu ?
Cliquez pour voter !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC,...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le SEO (+300.000 membres, 1,5 million de posts). Il est aussi cofondateur de Ranking Metrics, leader des formations webmarketing en France (SEO, AdWords, Analytics, réseaux sociaux) et éditrice de la plateforme MyRankingMetrics (crawler et audit SEO en ligne).

Article publié par WebRankInfo dans la rubrique Indexation Google. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

11 commentaires

  • Nejib a dit le

    On regardant 1.000.000.000.000 on dirait c'est un train! je ne sais pas comment ils font.

    Thanks Olivier

  • Dan a dit le

    Effectivement, 1000 milliards de pages sur le web, ça devient colossal !!
    Petit précision, c'était fin 2005 que Google a décidé de ne plus communiquer le nombre de page indexées sur sa page d'accueil.

  • pbi a dit le

    Si on enleve toute les pages inutiles du web (spam et autres...) combien en reste t'il ...

  • abseo a dit le

    chez Google rien n'est laissé au hasard

  • Martin a dit le

    En effet, cela fait beaucoup de pages. Je comprends aussi, désormais, pourquoi mon PageRank est amené à baisser irrémédiablement : je ne suis pas en mesure, à moi seul, de suivre la cadence de production des sites web les plus conséquents.

  • MC a dit le

    Quand je vois sur le forum un nombre importants de webmasters qui se plaignent de ne pas voir leurs pages sur GG ! ;-)

  • Goudie a dit le

    "1 trillion, c'est-à-dire mille milliards"

    C'est pas plutôt un billion ? Enfin j'me trompe peut-être...

  • Olivier Duffez a dit le

    Faut lire mon article jusqu'au bout, remarque incluse concernant trillion, billion, milliards etc.

  • Goudie a dit le

    Euh.. Désolé, j'ai bien tout lu, l'explication est sûrement là, mais bien cachée ;) ...

  • Archernar a dit le

    Peu, pas, d'ambiguïté mathématique : Google "communique" des Etats-Unis ; la majorité des pays anglophones et le Brésil communiquent "long scale", système de noms numériques dans lequel billion signifie un million de millions, les francophones communiquent, actuellement, "short scale" le mot billion y signifie un millier de millions.

  • Olivier Duffez a dit le

    Goudie, voici la dernière phrase de mon article :
    Remarque : le terme anglais "trillion" utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

    Mais Archernar a raison dans la mesure où ce sont des américains qui s'expriment, on sait à quoi correspond 1 trillion (US) : c'est 1000 milliards. Par contre, je ne comprends pas pourquoi Archernar dit que pour les anglophones billion équivaut à 1 million de millions, car en réalité cela équivaut à mille millions (1 milliard).

    Je vous conseille de lire cet article (que j'avais indiqué dans le forum) : http://www.anglaispratique.fr/mi...

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.

Annonces Google