[Etude] PageRank et nombre moyen de backlinks Google

Olivier Duffez (admin)
Membre du personnel
En novembre 2004, j'avais publié une étude portant sur la relation entre le PageRank et les backlinks sur Google. Depuis, les choses ont changé puisque Google a décidé de ne mettre à jour l'affichage du PageRank que tous les trimestres environ. En parallèle, la commande donnant les backlinks (link:URL) est toujours aussi incomplète (le nombre de résultats affiché ne correspond pas à la réalité, Google ignorant une grosse partie des liens dans l'affichage des résultats de cette commande). Dans les deux cas, nous savons que Google possède en interne une vision bien plus précise (le PageRank est sans doute mis à jour fréquemment, et les backlinks sont tous comptés). Malgré cela, voici aujourd'hui une mise à jour de cette étude...

https://www.webrankinfo.com/actualites/2 ... gerank.htm
 
WRInaute impliqué
Merci pour cette étude qui est assez utile malgré que la qualité des BLs ne soient pas être prise en compte.

Sa serait bien par exemple que le nombre de BLs sur les sites étudiés soient pris en compte.

Personnelement d'après l'étude, je devrais avoir un bon PR6 alors que je n'ais que PR4. :?
J'avais quelques liens de mauvaises qualité, je pense que sa provient de ça.
Il est donc important de prendre en compte la qualité des BL en se basant sur plusieurs critères pour pouvoir réaliser cette étude.

Par exemple, étudier les sites faisant seulement une 10ene de liens vers d'autres sites de façon à ce qu'on puisse avoir une idée un peu plus précise.

Voila, plus facile à dire qu'à faire malheureusement :?

Quel type de site à tu étudié dans cette analyse ?

Bonne soirée et merci pour l'étude, elle donne déjà une petite idée :wink:
 
WRInaute accro
Exact, l'étude semble de moins en moins représentative de la réalité, sur les quelques sites que j'observe (ma concurrence dans le bon sens du terme) certains ont plus de liens mais moins de PR que moi et certains autres moins de liens mais plus de PR.
En outre, s'agissant seulement de mon site le tableau ne concorde pas ex PR 4 le 22/04/05 avec seulement 64 BL soit 69 de moins que la colonne correspondante du tableau.
 
WRInaute occasionnel
pareil pour moi, un tout jeune PR 4 avec "seulement 104 BL" ... et n PR2 avec 13 et PR 3 a 20 BL ... voila ... mais c'est une moyenne! je me dis pour flatter mon ego que j'ai que des bons liens comme l'annuaire de WRI! :)
 
Olivier Duffez (admin)
Membre du personnel
j'ai oublié de préciser que les données proviennent de MyWri et qu'elles portent sur 337 387 relevés (de PR et de backlinks)...
 
WRInaute occasionnel
Si les courbes présentaient des nuages de points, on pourrait voir les écarts, minimum/maximum... Juste une suggestion de présentation.
 
WRInaute discret
Une amélioration pourrait être de mesurer le nombre de backlink donné par Yahoo et MSN.
 
Olivier Duffez (admin)
Membre du personnel
ams51 a dit:
Une amélioration pourrait être de mesurer le nombre de backlink donné par Yahoo et MSN.
en analysant toujours les pages par leur PR ? cad indiquer le nb de BL Yahoo (ou MSN) pour les pages ayant PR0, puis pour les pages ayant PR1, etc.

ou pensais-tu à autre chose ?
 
WRInaute accro
La théorie qui veut rapprocher le nombre de BL renvoyé par Gg et le nombre renvoyé par MSN n'est pas pertinente à mon avis.

Ex :
1er site = PR4 187BL/GG 1540BL/Yahoo 518BL/MSN
2e site = PR5 177BL/GG 9060BL/Yahoo 819BL/MSN
3e site = PR6 77BL/GG 9380BL/Yahoo 725BL/MSN
4e site = PR5 52BL/GG 619BL/Yahoo 449BL/MSN

Dès lors, je pense qu'il vaut mieux travailler dans le sens d'une annalyse de la valeur des BL plus que dans la comparaison d'un bombre de BL nombre entre les différents moteurs.
C'est-à-dire percer le secret du renvoi de BL avec la commande link sur GG.
Ou bien dans le sens d'une annalyse totale de la valeur des BL de GG, c'est à dire une nombre X de liens avec une valeur moyenne Z de chaque page renvoyée par la commande link et qui fait un lien .

Donc une équation du type Z*100/BL=PR.

J'avais également envisagé pour trouver Z l'hypothèse de calcul suivante (pour chacun des sites) :
4*100/187=Z=2.14
5*100/177=Z=2.82
6*100/77=Z=7.79
5*100/52=Z=9.62
Dans le but de trouver une correspondance minimale entre les Z et les PR mais évidemment ça tombe çà l'eau ;)

Il faudrait donc à mon avis développer avec plus de précision un outil similaire à celui de yagoort du calcul de PR des BL pour vérifier si Z ne serait pas la moyenne des PR des pages qui font le lien.

Edit : une erreur de manipulation m'a fait publier mon message avant que j'ai fini mon simulacre de théorie, le voici terminé.
 
WRInaute passionné
Tu as des relations qui existent entre le PR des liens entrants et le PR de la page liées. La formule de base a été publiée mais sans doute modifiée après.
Ce qui serait intéressant, c'est de séparer le nombre de BL de chaque site par classe de PR.
Si on veut comparer Yahoo, MSN et Google, ca serait intéréssant de comparer les répartitions des BL dans l'échelle du PR. Voir si on a une distribution centré sur le même PR moyen ou au contraire s'il y a des différences systématiques ou non.

François
 
Olivier Duffez (admin)
Membre du personnel
@serval2a : la commande link de Google étant tellement limitée, et l'affichage du PR tellement peu mis à jour, je ne pense pas qu'il soit efficace de pousser + loin les analyses, tu crois pas ? tu vas me dire que j'ai quand même publié cette étude, mais j'avais ces infos alors autant les publier...

@François : "Ce qui serait intéressant, c'est de séparer le nombre de BL de chaque site par classe de PR. "
Je crois bien que c'est ce que j'ai fait, non ?
Pour ton autre suggestion : sur une période à définir, tu veux afficher sur un graph 3 nuages de points (Google, Yahoo, MSN) nb de BL en fonction du PR, c'est ça ?
 
WRInaute accro
Avec donc si je comprend bien et en simplifiant un nombre A majoritaire de BL de pages PR Y conduirait à donner ce même PR Y au site concerné dans le cas où le nombre de BL provenant de pages PR Y-1 est équivalant au nombre de BL provenant de page PR Y+1.

Et donc si un site reçoit :
30% de BL<4
40% de BL PR4
30% de BL>4
il aura un PR de 4.

Mais si il reçoit :
20% de BL<4
40% de PR4
40% de PR>4
il aura un PR de 5

Pour Olivier, certes mais le sujet est tellement intéressant... :D
 
WRInaute occasionnel
en tout cas ca reste une bella analyse meme si elle n'est pas precise, elle peux permettre a chacun de s'evaluer a partir de ces chiffres et c'est deaj bien sympa! :)
 
WRInaute accro
serval2a a dit:
Il faudrait donc à mon avis développer avec plus de précision un outil similaire à celui de yagoort du calcul de PR des BL pour vérifier si Z ne serait pas la moyenne des PR des pages qui font le lien.
tu as raison ... il faut tenir compte de la qualité des BL ... j'ai d'ailleurs suggéré voila qq temps à zarlboro de nous proposer un outil d'analyse de BL qui m'a semblé retenir son attention ... cet outil permettrait d'analyser les BL d'un site en tenant compte des PR de chaque BL mais aussi du nombre de BL fait sur la page qui le donne ainsi que sa position sur cette page et le texte de l'ancre ... :wink:
 
Olivier Duffez (admin)
Membre du personnel
PR Weaver fait presque tout ce que tu souhaites Cendrillon. Il te donne pour une URL donnée :
- le nb de BL total
- le PR de chacun des BL
- la répartition des PR de ces BL
- le texte de l'ancre de chacun de ces BL
- l'IP du serveur de chacun de ces BL

pour le reste faut aller voir d'autres outils
 
WRInaute passionné
WebRankInfo a dit:
@François : "Ce qui serait intéressant, c'est de séparer le nombre de BL de chaque site par classe de PR. "
Je crois bien que c'est ce que j'ai fait, non ?
Pour ton autre suggestion : sur une période à définir, tu veux afficher sur un graph 3 nuages de points (Google, Yahoo, MSN) nb de BL en fonction du PR, c'est ça ?

Ce que je voulais dire c'etait de séparer les BL par classe de PR des BL et non pas du site audité. (a mon avis, tu dois avoir ca dans tes fichiers quelque part grace à PRweaver :roll: )
Ca devrait etre possible de faire une transformation qui permette de normaliser la courbe.

François
 
WRInaute discret
j'aimerais savoir quels sont les criters qui caractèrise un bon bl ?

le nombre de bl sur la page, le pr de cette page, la même thematique, quoi d'autres ?



d'avance merci :p
 
WRInaute passionné
WebRankInfo a dit:
Désolé François mais dans MyWri j'ai pas le PR de chaque BL...

Faut faire extraire de la base les sites et faire mouliner PRWeaver (ca fera plaisir à son créateur :) ).

François
 
WRInaute occasionnel
C'est sûr que si on avait le PR de chaque BL ce serait bien sympa. Il n'y demeure pas moins de l'article d'Olivier est quand même intéressant, bravo à lui ! Sans vouloir faire d'autopromo, vous pouvez avoir le classement d'un échantillon de 900 backlinks Google classés par PR sur le site suivant : -http://google.audiencestv.com/index.php?q=link%3Ahttp%3A%2F%2Fwww.webrankinfo.com&results=900 (pour ceux que ca intéresse). Il y a aussi PR Weaver évidemment. Encore merci pour l'article du jour ;)
 
WRInaute occasionnel
merci, pour l'effort
mais à mon avis, et vous le savez, peu de conlusions fiables. ce que je peux retenir c'est, relativement, l'évolution dans le temps et 'très' relativement une idée sur le nombre de backlinks.
cette analyse pourrait être affinée et contextualisé pour être plus significative, en introduisant les paramètre suivants:
Pertinence ancre/theme du site ( 0 à 10 par exemple)
PR de la page contenant le lien
Pertinence theme page source /theme destinataire ( 0 à 10 par exemple)
Nombre de Liens sortant de la page source.

je vous invite tous à définir une Sorte de Cahier des charges pour une analyse plus fines que certains parmis nous pouraient certainnement la réaliser.
 
WRInaute accro
Tu devrais supprimer le bruit et tracer les courbes de tendance, comme ça tu peux avoir la pente pour chaque PR... surtout pour 4,5,6 le reste n'est pas significatif. A priori la pente doit être la même... sinon ça veut dire que Google tend à faire "baisser" ou "augmenter" le pr moyen.
Si on a la pente, tu peux nous donne le nombre de BL par mois qu'on droit trouver pour aller plus vite que l'expansion de l'internet (et donc savoir si on est sur une tendance qui va vers l'augmentation de notre pr plutot que vers la baisse) :D
 
Olivier Duffez (admin)
Membre du personnel
pourquoi pas des courbes de tendance (linéaire, log, polynomiale, moyenne mobile ?)...
pour l'instant je ne peux pas les faire, car j'utilise Excel et mes courbes (significatives) ont plus de 32000 points, donc j'ai séparé en plusieurs séries, ce qui empêche de calculer une tendance sur l'ensemble des points :-(
 
WRInaute discret
Une question que je me pose à la vue de cet article : ok, c'est 20 000 BL pour un PR6 on peut se dire.

Mais est-ce que 20 000 BL d'un même site seront vraiment mieux que 20 000 BL de 20 000 sites différents ? Ne devrait-on pas compter aussi le nombre de sites différents qui nous font des liens ? Car je pense que même avec 20 000 BL d'un même site, on atteint pas un PR3 (sinon attention aux liens pour bluffer GG).
Edit : Ha oui, un autre point important il me semble : j'ai vu que les BL pouvaient aussi être internes, est-ce qu'ils sont aussi pris en compte dans l'étude ? Car j'aurais tendance à les éliminer du traitement, vu qu'ils ne doivent pas ajouter de PR à leur propre site, non ? C'est juste bon pour la transmission du PR intra-site n'est-ce pas ?

Dans cette optique, serait-il possible depuis l'étude en cours de sortir le nombre de sites différents en plus du nombre de BL total ? Peut-être que ça ne serait pas plus précis, mais je pense que ça rentre en ligne de compte chez Google. Dans le cas contraire, demain je me fais 2 domaines qui pointent l'un vers l'autre et paf, j'obtiens mon PR10 !

Sinon l'étude est bien sympa, mais j'ai le temps avant de monter à PR6 :) Je vais relancer mes partenariats moi !
 
Olivier Duffez (admin)
Membre du personnel
Désolé Yvan mais ce que tu demandes est presque impossible. Je me base sur la commande link de Google qui mélange liens internes et externes (donc je ne peux pas lui demander d'ignorer les liens internes).
Je pourrai filtrer après coup mais je ne peux analyser que les 1000 premiers BL.

Même pb pour compter le nb de sites différents qui font un lien.
 
WRInaute discret
Olivier, merci de ta réponse rapide. Ma remarque était peut-être trop critique, j'en suis désolé dans ce cas, les résultats actuels de ton étude sont intéressants, mais comme plusieurs personnes l'ont souligné c'est assez dur de le mettre en pratique. Ma remarque s'appuie là-dessus et sur certains points qui n'avaient pas été soulignés (tout au moins dans ce thread !).

Cependant, je comprends désormais les problèmes tehcniques rencontrés. Il est vrai que l'étude de 1000 BL serait déjà énorme, et donc il est presque impossible de traiter un gros site avec une telle méthode (le mien n'en a que 5000 dont la majorité sont des BL internes).

Est-ce que les 1000 premiers BL sont représentatifs à ton avis ? Si oui, on pourrait alors tenter de les traiter avec un filtre comme tu le suggérais. J'ai constaté que la majorité de mes BL sont mes BL internes, mais souvent sortent en début de page de résultat les BL des autres sites. J'ai testé les quelques urls données par les autres internautes, et certaines sont intéressantes (notamment celle qui donnait le PR pour chaque BL). Je sais que l'API est limité, mais on peut peut-être le faire tourner sur plusieurs jours pour trouver l'ensemble des PR et autres informations sur un site en particuliers (notamment récupérer tous les BL (ordonnés) que Google donne en 1 seule fois, un maximum, puis traiter les pages petit à petit).
 
WRInaute discret
pour mon cas en tout cas ça correspond bien. Il faut vraiment que je fasse plus de BL et surtout avec des mots-clés différents, parce que la SandBox c'est bien de s'en passer ... :roll:
 
Discussions similaires
Haut