Vous êtes ici : Dossiers référencement > Actualité

Membre WebRankInfo ?

S'inscrire Aide

Google a répertorié 1000 milliards de pages sur le web !

1 trillion, c'est-à-dire mille milliards (1.000.000.000.000) : voilà le nombre de pages web distinctes que Google a répertorié ! Jesse Alpert et Nissan Hajaj (2 ingénieurs de Google de l'équipe en charge de l'infrastructure de la recherche) donnent quelques chiffres qui donnent le tournis…

Depuis le premier index de Google en 1998, qui comptait 26 millions de pages, le leader des moteurs de recherche a bien progressé. La barre du 1er milliard de pages indexées a été franchie en 2000. Pendant les années qui ont suivi, Google et Yahoo se sont livrés à une petite guerre de communication sur le thème C'est moi qui ai le plus gros index… Quand ils ont décidé d'arrêter ce petit jeu et de ne plus communiquer, on en était resté aux environs de 20 milliards de pages.

Aujourd'hui, la barre des 1000 milliards aurait donc été franchie. Aurait, car qui peut vérifier ce qu'avancent ces ingénieurs de Google ? D'après eux, leur système a détecté plus d'un trillion d'URL mais en a retenu seulement 1 trillion d'uniques (après détection de contenus dupliqués). Toutes ces pages ne sont pas forcément indexées ; on imagine d'ailleurs assez bien qu'il existe quantité de pages sur le web qui ne sont que des contenus dupliqués ou des pages vides (les ingénieurs donnent l'exemple des liens jour suivant que l'on trouve sur des calendriers, qui mènent à des pages construites automatiquement mais sans forcément de contenu).

Au sujet de ce fameux PageRank, les ingénieurs nous donnent quelques chiffres assez étonnants. Avec le 1er index de 26 millions de pages, le PageRank pouvait être recalculé en quelques heures par un seul serveur, ce qui peut se comprendre. Mais ils prétendent qu'ils ont encore aujourd'hui la capacité à traiter les calculs plusieurs fois par jour, avec une matrice de 1000 milliards de colonnes ! Quand on sait qu'en plus de l'augmentation considérable du nombre de pages, l'algorithme est lui aussi largement plus complexe, on réalise à quel point l'infrastructure de serveurs de Google est un bijou de technologies unique au monde ! Avis aux concurrents qui aimeraient rattraper Google…

On en parle dans le forum WebRankInfo.

Remarque : le terme anglais trillion utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

Olivier Duffez, Vendredi 25 juillet 2008


Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google PageRank, Google Directory

  • Calcul d'indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Analyse des backlinks
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.


11 commentaires sur “Google a répertorié 1000 milliards de pages sur le web !”

  1. Dan dit :

    Effectivement, 1000 milliards de pages sur le web, ça devient colossal !!
    Petit précision, c’était fin 2005 que Google a décidé de ne plus communiquer le nombre de page indexées sur sa page d’accueil.

  2. Nejib dit :

    On regardant 1.000.000.000.000 on dirait c’est un train! je ne sais pas comment ils font.

    Thanks Olivier

  3. pbi dit :

    Si on enleve toute les pages inutiles du web (spam et autres…) combien en reste t’il …

  4. abseo dit :

    chez Google rien n’est laissé au hasard

  5. Martin dit :

    En effet, cela fait beaucoup de pages. Je comprends aussi, désormais, pourquoi mon PageRank est amené à baisser irrémédiablement : je ne suis pas en mesure, à moi seul, de suivre la cadence de production des sites web les plus conséquents.

  6. MC dit :

    Quand je vois sur le forum un nombre importants de webmasters qui se plaignent de ne pas voir leurs pages sur GG ! ;-)

  7. Goudie dit :

    "1 trillion, c’est-à-dire mille milliards"

    C’est pas plutôt un billion ? Enfin j’me trompe peut-être…

  8. Faut lire mon article jusqu’au bout, remarque incluse concernant trillion, billion, milliards etc.

  9. Goudie dit :

    Euh.. Désolé, j’ai bien tout lu, l’explication est sûrement là, mais bien cachée ;) …

  10. Archernar dit :

    Peu, pas, d’ambiguïté mathématique : Google "communique" des Etats-Unis ; la majorité des pays anglophones et le Brésil communiquent "long scale", système de noms numériques dans lequel billion signifie un million de millions, les francophones communiquent, actuellement, "short scale" le mot billion y signifie un millier de millions.

  11. Goudie, voici la dernière phrase de mon article :
    Remarque : le terme anglais "trillion" utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).

    Mais Archernar a raison dans la mesure où ce sont des américains qui s’expriment, on sait à quoi correspond 1 trillion (US) : c’est 1000 milliards. Par contre, je ne comprends pas pourquoi Archernar dit que pour les anglophones billion équivaut à 1 million de millions, car en réalité cela équivaut à mille millions (1 milliard).

    Je vous conseille de lire cet article (que j’avais indiqué dans le forum) : http://www.anglaispratique.fr/mi...

Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking