Explications sur la formule du PageRank
Olivier Duffez, Samedi 6 septembre 2008
Le PageRank est une méthode inventée par Google pour mesurer l'importance relative des pages du web, que l'on appelle souvent la popularité. Elle est basée sur la topologie du web, c'est-à-dire sur l'étude des liens entre les pages. Voici des explications sur la formule initiale du PageRank.
Mise à jour : cet article date de plusieurs années, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé et les informations ou techniques décrites ici ne sont plus forcément applicables à 100%… En particulier le PageRank n'est plus un élément capital, de nombreux autres critères sont plus importants.
L'idée principale est que si une page A fait un lien vers une page B, alors c'est que la page A juge que la page B est suffisamment importante pour mériter d'être citée et d'être proposée aux visiteurs. Ce lien de A vers B augmente le PageRank de B.
Deux idées supplémentaires mais essentielles viennent la compléter :
- l'augmentation de PageRank de la page B est d'autant plus importante que le PageRank de la page A est élevé. En d'autres termes, il est bien plus efficace d'avoir un lien depuis la page d'accueil de Google que depuis une page du site de votre petit cousin (ou alors c'est un génie en puissance !).
- l'augmentation de PageRank de la page B est d'autant plus importante que la page A fait peu de liens. En d'autres termes, si la page A juge qu'il n'y a qu'une page qui mérite un lien, alors il est normal que le PageRank de la page B augmente plus que dans le cas où de nombreuses pages obtiennent un lien.
Maintenant que vous connaissez les principes du PageRank, passons à sa formulation mathématique… Nous nous basons sur un article rédigé par les deux fondateurs de Google (1), même si depuis l'algorithme a dû évoluer : la base reste la même.
Soient A1, A2, ..., An : n pages pointant vers une page B. Notons PR(Ak) le PageRank de la page Ak, N(Ak) le nombre de liens sortants présents sur la page Ak, et d un facteur compris entre 0 et 1, fixé en général à 0,85.
Alors le PageRank de la page B se calcule à partir du PageRank de toutes les pages Ak de la manière suivante :
PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )
Comme vous pouvez vous en rendre compte, cette formule est à la fois simple et compliquée. Simple parce qu'elle ne dépend que de quelques termes, compliquée parce qu'elle récursive : pour calculer le PageRank d'une page, il faut avoir calculé celui de toutes les pages pointant vers elle. Mais alors comment commencer ?
En fait c'est très simple, il suffit de commencer avec des valeurs arbitraires de PageRank (par exemple 1). Le choix de cette valeur n'a pas d'influence sur le résultat final à condition que toutes les pages commencent avec la même valeur. Une application de la formule permet de calculer un nouveau PageRank pour chaque page, plus proche de la réalité que la valeur par défaut que nous avons choisie au début.
Ensuite nous recommençons à calculer les PageRank de toutes les pages en appliquant de nouveau la formule, mais en partant cette fois des valeurs que nous avons calculées précédemment. Après un certain nombre d'itérations, le système converge : les valeurs de PageRank de chaque page ne bougent plus entre deux itérations.
En pratique la convergence est obtenue au bout de plusieurs dizaines d'itérations (tout dépend du nombre de pages considérées !).
Etape suivante : Premières constatations sur le PageRank.
(1) The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin et Lawrence Page, www-db.stanford.edu/~backrub/google.html
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Constatations sur le PageRank de Google
- Le PageRank et le promeneur aléatoire sur le web...
- Analyse complète du PageRank de Google
- L'algorithme BlockRank
- Solutions pour augmenter son PageRank Google
- Tout le monde parle du PageRank, mais c'est quoi ?
- PR10 : les meilleurs Google PageRank de la planète !
- Les 2 échelles de PageRank : toolbar et DMOZ
- Nouveau service donnant le PageRank sans la Toolbar
- Mise à jour du PageRank... non confirmée
- formule calcul temps chargement
- URL Google de calcul de pagerank ?
- PageRank et futur PageRank après la Google Dance
- Calcul du PageRank et backlinks Google, Altavista, AlltheWeb
- Calcul de pagerank
- Calcul Pagerank
- Calcul du PageRank
- Calcul théorique du pagerank
- pagerank 0 pour un site à pagerank 5. Quel effet ?
- Mode de calcul du PageRank
Consultez la description détaillée des produits ou services de Google suivants : Google PageRank, Google Directory, Google Toolbar
- Calcul du taux de backlinks vers pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés. - Calcul de l'indice de cooccurrence
Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes.
2 commentaires sur “La formule du PageRank de Google”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Pikati - Création et gestion de votre micro crèche
- Atlas Assurances et Finances Courtier en Assurances
- Institut de beauté Nice Spa à Nice - Patricia Laurens: soins du corps soins visage nice
- Maisons d'Avenir, maisons à ossature bois, habitat bio-économique
- Information sur le ski à Gulmarg, Himalaya, Cachemire, Inde
- La Dynamique des Fluides, blog de l'innovation liquide (boissons, agroalimentaire)
- Assurances Axa Corinne Pagnon (78)
- Dépannage informatique à Nantes, site internet, sécurité informatique
- Bon Voyage China circuit personnalisé
- Micro-Puces Voiron Informatique dépannage ordinateurs Isère



J’avais jamais fait attention, mais il y a une erreur dans cette présentation du PR.
La valeur de PR d’une page dépend du nombre de pages de l’index.
En effet, la somme des PR est toujours égal à 1.
La valeur initiale du PR d’une page est donc toujours de 1/N, sans compter le « coefficient de déperdition» .
La valeur d’un PageRank est donc toujours de 0,xx. Le chiffre donné par la Toolbar n’étant qu’un classement de la page dans le classement par PR, (l’échelle des tranches étant logarithmique).
Peux-tu préciser où se trouve l’erreur ? J’ai beau relire mon texte et ton commentaire, je ne vois pas. Que la valeur initiale soit 1 ou 1/N, ça ne change strictement rien, à part pour la vitesse de calcul. Mais aujourd’hui Google calcule le PR bien autrement et efficacement !
Le fait que le PR (réel) soit une valeur entre 0 et 1 découle de la formule et est rappelé dans l’article http://www.webrankinfo.com/dossiers/pagerank/promeneur-aleatoire qui présente le PR comme une probabilité.