Un petit bug dans le calcul du PageRank

WRInaute occasionnel
Je suis tombé par hasard sur un petit bug surprenant du PageRank et de la ToolBar : tapez dans un navigateur -http://www.

Cette page, bien qu'introuvable, est créditée d'un PageRank de 7. Mieux encore, elle est dotée de plus de 600,000 backlinks.
-https://www.google.com/search?sourceid=navclient&ie=UTF-8&oe=UTF-8&q=link:http%3A%2F%2Fwww%2E%2F

Alors qui a dit que c'était difficile d'avoir PR7 ? :)

Fred
 
Olivier Duffez (admin)
Membre du personnel
PR7 chez moi.
sinon -http://w.ww/ a PR2 : il doit y en avoir d'autres, c'est bizarre...
 
WRInaute occasionnel
en fait ca marche avec pas mal de noms incomplets !
-http://www.a PR3
-http://www.b PR4
etc..

On comprend alors mieux en regardant les Backlinks, si on prend le 2eme exemple, ca donne
-https://www.google.com/search?sourceid=navclient&ie=UTF-8&oe=UTF-8&q=link:http%3A%2F%2Fwww%2Eb%2F

On peut voir que tous les BL contiennent le texte suivant :
"link :http://www.e-[QUELQUE CHOSE]"
Google ne cherche donc pas les BL, mais bien le texte. La preuve en retirant le HTTP de la commande link: (en cherchant pour link:www.b). La commande link: n'est donc absolument pas fiable dans ce cas précis.

Pour l'origine du PR de ces pages, j'avais pensé que ca peut etre une conséquence de la limitation de la taille d'une page à 100ko. La page tronquée peut alors l'être dans un lien, genre

[Contenu de la page...
http://www." [Fin du lien mais on coupe ici car > 100ko]

Fred
 
WRInaute impliqué
moi j'arrive à avoir le 'Impossible d'afficher la page' (ok c'est normal) mais j'arrive pas à avoir le pr. (barre toute grise) :'(
 
Discussions similaires
Haut