Google a répertorié 1000 milliards de pages sur le web !
1 trillion, c'est-à-dire mille milliards (1.000.000.000.000) : voilà le nombre de pages web distinctes que Google a répertorié ! Jesse Alpert et Nissan Hajaj (2 ingénieurs de Google de l'équipe en charge de l'infrastructure de la recherche) donnent quelques chiffres qui donnent le tournis…
Depuis le premier index de Google en 1998, qui comptait 26 millions de pages, le leader des moteurs de recherche a bien progressé. La barre du 1er milliard de pages indexées a été franchie en 2000. Pendant les années qui ont suivi, Google et Yahoo se sont livrés à une petite guerre de communication sur le thème C'est moi qui ai le plus gros index
… Quand ils ont décidé d'arrêter ce petit jeu et de ne plus communiquer, on en était resté aux environs de 20 milliards de pages.
Aujourd'hui, la barre des 1000 milliards aurait donc été franchie. Aurait
, car qui peut vérifier ce qu'avancent ces ingénieurs de Google ? D'après eux, leur système a détecté plus d'un trillion d'URL mais en a retenu seulement 1 trillion d'uniques (après détection de contenus dupliqués). Toutes ces pages ne sont pas forcément indexées ; on imagine d'ailleurs assez bien qu'il existe quantité de pages sur le web qui ne sont que des contenus dupliqués ou des pages vides (les ingénieurs donnent l'exemple des liens jour suivant
que l'on trouve sur des calendriers, qui mènent à des pages construites automatiquement mais sans forcément de contenu).
Au sujet de ce fameux PageRank, les ingénieurs nous donnent quelques chiffres assez étonnants. Avec le 1er index de 26 millions de pages, le PageRank pouvait être recalculé en quelques heures par un seul serveur, ce qui peut se comprendre. Mais ils prétendent qu'ils ont encore aujourd'hui la capacité à traiter les calculs plusieurs fois par jour, avec une matrice de 1000 milliards de colonnes ! Quand on sait qu'en plus de l'augmentation considérable du nombre de pages, l'algorithme est lui aussi largement plus complexe, on réalise à quel point l'infrastructure de serveurs de Google est un bijou de technologies unique au monde ! Avis aux concurrents qui aimeraient rattraper Google…
On en parle dans le forum WebRankInfo.
Remarque : le terme anglais trillion
utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).
Olivier Duffez, Vendredi 25 juillet 2008
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- L'algorithme BlockRank
- La Google Dance : description...
- Outil de test d'indexation Google + analyse de l'âge d'un site
- Google achète Kaltix
- Etude du BlockRank, un algorithme de calcul rapide du PageRank
- Google indexe plus de 8 milliards de pages
- Les deux échelles du PageRank
- Les 2 échelles de PageRank : toolbar et DMOZ
- 1000 milliards de pages web connues de Google !
- Nombre de pages Web recensées par Google : 8 168 684 336.
- Des résultats issus de Google blog search dans Google web
- chute brutale google web mais pas google français...
- Web 2.0 : google coop , wikio, mon web 2.0
- Valider un flux RSS par google -> Web clips - Google Desk
- google web api et google.fr d'ou viennent les differences ?
- Filtre Google FR Web et non sur Google FR Pages francophones
- disparus de google fr et toujours sur google web
- URL Google de calcul de pagerank ?
Consultez la description détaillée des produits ou services de Google suivants : Google PageRank, Google Directory
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Analyse des backlinks
Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
11 commentaires sur “Google a répertorié 1000 milliards de pages sur le web !”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Pikati - Création et gestion de votre micro crèche
- Atlas Assurances et Finances Courtier en Assurances
- Institut de beauté Nice Spa à Nice - Patricia Laurens: soins du corps soins visage nice
- Maisons d'Avenir, maisons à ossature bois, habitat bio-économique
- Information sur le ski à Gulmarg, Himalaya, Cachemire, Inde
- La Dynamique des Fluides, blog de l'innovation liquide (boissons, agroalimentaire)
- Assurances Axa Corinne Pagnon (78)
- Dépannage informatique à Nantes, site internet, sécurité informatique
- Bon Voyage China circuit personnalisé
- Micro-Puces Voiron Informatique dépannage ordinateurs Isère



Effectivement, 1000 milliards de pages sur le web, ça devient colossal !!
Petit précision, c’était fin 2005 que Google a décidé de ne plus communiquer le nombre de page indexées sur sa page d’accueil.
On regardant 1.000.000.000.000 on dirait c’est un train! je ne sais pas comment ils font.
Thanks Olivier
Si on enleve toute les pages inutiles du web (spam et autres…) combien en reste t’il …
chez Google rien n’est laissé au hasard
En effet, cela fait beaucoup de pages. Je comprends aussi, désormais, pourquoi mon PageRank est amené à baisser irrémédiablement : je ne suis pas en mesure, à moi seul, de suivre la cadence de production des sites web les plus conséquents.
Quand je vois sur le forum un nombre importants de webmasters qui se plaignent de ne pas voir leurs pages sur GG ! ;-)
"1 trillion, c’est-à-dire mille milliards"
C’est pas plutôt un billion ? Enfin j’me trompe peut-être…
Faut lire mon article jusqu’au bout, remarque incluse concernant trillion, billion, milliards etc.
Euh.. Désolé, j’ai bien tout lu, l’explication est sûrement là, mais bien cachée ;) …
Peu, pas, d’ambiguïté mathématique : Google "communique" des Etats-Unis ; la majorité des pays anglophones et le Brésil communiquent "long scale", système de noms numériques dans lequel billion signifie un million de millions, les francophones communiquent, actuellement, "short scale" le mot billion y signifie un millier de millions.
Goudie, voici la dernière phrase de mon article :
Remarque : le terme anglais "trillion" utilisé dans le blog de Google peut être ambigu à traduire : en anglais il signifie 1000 milliards (10^12) et en français 1 milliard de milliards (10^18).
Mais Archernar a raison dans la mesure où ce sont des américains qui s’expriment, on sait à quoi correspond 1 trillion (US) : c’est 1000 milliards. Par contre, je ne comprends pas pourquoi Archernar dit que pour les anglophones billion équivaut à 1 million de millions, car en réalité cela équivaut à mille millions (1 milliard).
Je vous conseille de lire cet article (que j’avais indiqué dans le forum) : http://www.anglaispratique.fr/mi...