Rapport entre nb de pages indexées par site et PageRank

Olivier Duffez (admin)
Membre du personnel
certains (dont je fais partie) pensent qu'il est nécessaire d'avoir un bon, voire très bon PageRank pour faire indexer un grand nombre de pages d'un même site sur Google.
Quand je dis grand nombre, c'est au moins plusieurs dizaines de milliers.

J'aimerais savoir si vous connaissez des sites avec un très grand nombre de pages indexées ?
Je commence la liste avec un que je viens de découvrir, en surfant sur l'actualité du rachat de Kelkoo : shopping.com : 1,5 million de pages indexées !

sinon évidemment en allant voir les très gros, on trouve (M = million) :
yahoo.com : 14,6 M - PR9
amazon.com : 3,8 M - PR8
cnn.com : 0,6 M - PR9
w3.org : 0,3 M - PR10
php.net : 0,6 M - PR10
microsoft.com : 0,8 M - PR10
dmoz.org : 0,4 M - PR9

Il faudrait aussi faire des relevés pour des sites plus proches des nôtres... Disons avec des PR5 à 7 par exemple.
Qui détient le record du nb de pages indexées pour un PR maximal de 5 sur son site ?
Idem avec chaque valeur de PR...

Pour lancer le jeu : WRI se positionne à environ 41 000 pages pour PR6.

PS: je précise que la notion de PR est ici très très imprécise car il faudrait relever le PR de toutes les pages de chaque site, celui de la page d'accueil ne donnant qu'une indication très très approximative.
 
WRInaute discret
Dans la catégorie PR 0

www.repertoire-sites.com est à 18 900 pages aujourd'hui

url de vérification :
https://www.google.fr/search?hl=fr&lr=&i ... .%2Bcom%22

Mais bon, repertoire-sites.com n'a eu qu'une Google Dance et on peut penser qu'il passera à PR5 ou 6 à la prochaine.

En fait, outre l'optimisation des pages basées sur un script php, ce site a surtout bénéficié de liens de sites à PR5 , 6 et 7 qui ont pu accélérer le référencement des pages internes.

Même non affiché, il est plus que probable que Google ait attribué déjà un fort PR que l'on ne voit qu'à l'occasion de la dance.

On pourrait en déduire que plus que le calcul du PR et des backlinks, la Google Dance ne sert en fait qu'à les afficher.

Ceci voudrait dire que PR et backlinks sont calculés en temps réel et que la Google Dance ne sert qu'à rendre compte d'une situation à un instant T.
C'est ce que je crois au vu notamment mais pas seulement du référencement de ces deux sites et de quelques autres.

Hypothèse à confirmer / infirmer.
 
Olivier Duffez (admin)
Membre du personnel
intéressant... comme ça on peut savoir combien il y a de pages dans l'annuaire DMOZ, car c'est bien l'annuaire DMOZ non ?

je ne pense pas que le PR soit recalculé tous les jours, mais ce qui est sûr c'est qu'il y a un décalage entre l'affichage du PR et son PR réel (ce dernier étant recalculé bien avant d'être affiché dans la toolbar)
 
WRInaute discret
WebRankInfo a dit:
intéressant... comme ça on peut savoir combien il y a de pages dans l'annuaire DMOZ, car c'est bien l'annuaire DMOZ non ?

je ne pense pas que le PR soit recalculé tous les jours, mais ce qui est sûr c'est qu'il y a un décalage entre l'affichage du PR et son PR réel (ce dernier étant recalculé bien avant d'être affiché dans la toolbar)

Oui, c'est une reprise de dmoz.org.
Google.fr recense aujourd'hui 339 000 pages de dmoz.org PR9 lorsqu'on en fait la recherche :

https://www.google.fr/search?hl=fr&lr=&i ... moz.org%22

Je vois sur le web des reprises de dmoz.org à PR 5 avec 95 000 pages internes recensées par google.fr pour l'un des sites en question, qui a repris le meme script que moi en le retravaillant aussi.
 
Olivier Duffez (admin)
Membre du personnel
juste par curiosité Philippe, ça signifie quoi "retravailler le script" ? Tu ajoutes quelque chose à l'annuaire de DMOZ sur ton site ?
 
Nouveau WRInaute
Philippe Batreau a dit:
En fait, outre l'optimisation des pages basées sur un script php, ce site a surtout bénéficié de liens de sites à PR5 , 6 et 7 qui ont pu accélérer le référencement des pages internes.

C'est le serpent qui se mord la queue, non? Vous faites des sites "à la volée" en utilisant des contenus Open Source, vous les liez entre eux et cela suffit à votre bonheur d'amateur de PR? Valeur ajoutée?Intérêt pour l'internaute?
J'espère qu'il reste quelques webmasters dans ce bas monde pour créer des sites avec du contenu unique, original, créé pour répondre aux besoins des visiteurs, mais j'ai de plus en plus de doutes!
 
WRInaute discret
WebRankInfo a dit:
juste par curiosité Philippe, ça signifie quoi "retravailler le script" ? Tu ajoutes quelque chose à l'annuaire de DMOZ sur ton site ?

Les deux sites cités utilisent un script php qui a été retravaillé par rapport à l'original et qui peut encore être amélioré.

L'intérêt du système est de permettre à l'internaute qui ne va pas spontanément sur dmoz.org de retrouver dans les moteurs une information y figurant. On sait qu'en règle générale l'internaute va rarement au-delà de la troisième page de résultats de sa recherche dans un moteur.

Deux facteurs jouent pour délivrer un résultat avant ceux de dmoz.org dans les moteurs :
- le PR des pages internes de dmoz.org par langue ou pays est très faible en règle générale. Des entrées régionales, linguistiques ou par pays pouvant bénéficier de liens propres et à fort PR délivrent plus rapidement des résultats dans les moteurs.
- les balises meta de dmoz.org ne sont pas optimisées, une optimisation alliée à un travail sur le PR va donc jouer sur les résultats.

A partir de là, la valeur ajoutée est réelle puisque ce type de site joue un rôle d'intermédiation entre l'internaute et le contenu de dmoz. Il permet d'y retrouver plus facilement une information, en l'occurence un site ou catégorie de sites, y figurant.

Pour répondre à la question suivante sur le 'serpent qui se mord la queue', il y a deux types d'iintervention dans les forums de discussion :
- celles des internautes qui cherchent une information ou souhaitent partager leur expérience,
- les autres, à leur intention : Quand le sage désigne la Lune du doigt, le sot regarde le doigt.
 
Nouveau WRInaute
Philippe Batreau a dit:
la valeur ajoutée est réelle puisque ce type de site joue un rôle d'intermédiation entre l'internaute et le contenu de dmoz. Il permet d'y retrouver plus facilement une information, en l'occurence un site ou catégorie de sites, y figurant.
Vous avez des exemples concrets de ce que vous avancez?

J'ai testé 2 recherches, en ne regardant que les 10 premiers résultats.
- Epictète sur google , donne en 1er et 2ème des liens vers des catégories sur le sujet.
- Aide aux devoirs donne en 2ème position une catégorie pertinente
Les mêmes recherches sur votre site ne donnent rien: Epictète n'est pas connu, quant à Aide aux devoirs, Atomz (votre moteur interne) ne donne rien de pertinent.

Un sot qui doit voir pour croire :lol:

[Edité pour ajouter des exemples de recherche]
 
Olivier Duffez (admin)
Membre du personnel
je n'ai toujours pas compris l'intérêt pour l'internaute, et la valeur ajoutée d'un tel site : je dois sûrement faire partie des sots...
tu nous dis que l'intérêt c'est de positionner ton site avant DMOZ dans les résultats de Google ?

PS: je vois qu'on a complètement dévié du sujet de discussion de départ
 
WRInaute discret
WebRankInfo a dit:
je n'ai toujours pas compris l'intérêt pour l'internaute, et la valeur ajoutée d'un tel site : je dois sûrement faire partie des sots...
tu nous dis que l'intérêt c'est de positionner ton site avant DMOZ dans les résultats de Google ?

PS: je vois qu'on a complètement dévié du sujet de discussion de départ

Je ne cherche à convaincre personne de la valeur ajoutée ou non de ces sites, ce n'est effectivement pas le sujet et je n'en éprouve pas le besoin.

J'ai donné ces deux sites en exemple pour le rapport entre PR et pages référencées et c'est assez parlant.

Les autres exemples sont les bienvenus.
 
WRInaute discret
pour revenir au sujet...
je pense qu' il y a un rapport entre nbr de pages indexées et l' ancienneté du site (mm si l' exemple de Philippe me fait douter...).

Voici se qui m' est arrivé:
j' avais un site sur le domaine site.com, age 3ans, PR3, 45pages, 45pages indexées
et un forum (le forum du site) sur forum.com, age 4mois, PR3, ~10000pages, 200pages indexées :?

Il y a une semaine, je passe le forum sur site.com/forum/ et en 2 jours j' avais 2000 pages indexées en plus, et les pages qui étaient déjà indexées sont maintenant mieu positionnées :p
 
WRInaute discret
bob23 a dit:
pour revenir au sujet...
je pense qu' il y a un rapport entre nbr de pages indexées et l' ancienneté du site (mm si l' exemple de Philippe me fait douter...).

Voici se qui m' est arrivé:
j' avais un site sur le domaine site.com, age 3ans, PR3, 45pages, 45pages indexées
et un forum (le forum du site) sur forum.com, age 4mois, PR3, ~10000pages, 200pages indexées :?

Il y a une semaine, je passe le forum sur site.com/forum/ et en 2 jours j' avais 2000 pages indexées en plus, et les pages qui étaient déjà indexées sont maintenant mieu positionnées :p

Si un site à PR0 affiché et qui n'a que quelques semaines d'existence peut avoir plus de 20.000 pages internes indexées, c'est que ce n'est ni l'ancienneté, ni le PR affiché qui comptent.

Je suis de plus en plus persuadé que le PR se calcule en temps réel et que le PR affiché n'est qu'une photo du PR à l'instant T de la dance.

Deux sites à PR3 affiché n'ont pas forcément le même PR effectif et il est plus que probable que dans ton cas site.com ait un PR et un nombre ou poids de backlink plus important que forum.com.

Mais le PR n'est pas tout et il y a d'autres facteurs tels que la fréquence de mise à jour des pages qui joue pour le positionnement dans les résultats.
 
WRInaute discret
Si un site à PR0 affiché et qui n'a que quelques semaines d'existence peut avoir plus de 20.000 pages internes indexées, c'est que ce n'est ni l'ancienneté, ni le PR affiché qui comptent.
pas le PR affiché, donc le PR réel compte pour le nbr de pages indexées alors ?

Je suis de plus en plus persuadé que le PR se calcule en temps réel et que le PR affiché n'est qu'une photo du PR à l'instant T de la dance.
on est d' accord

Deux sites à PR3 affiché n'ont pas forcément le même PR effectif et il est plus que probable que dans ton cas site.com ait un PR et un nombre ou poids de backlink plus important que forum.com.
site.com a quelques BL non visible, et je n' ai jamais fait la chasse aux BL pour celui là. En fait, je n' ai jamais compris comment il avait eu un PR3...
forum.com a 3BL visible a PR5, et plus d' une 10aine entre PR0 et 3, donc je pense pas que site.com est plus de PR que forum.com

Mais le PR n'est pas tout et il y a d'autres facteurs tels que la fréquence de mise à jour des pages qui joue pour le positionnement dans les résultats.
et par quoi est déterminée la fréquence de mise à jour ?


Sinon, je pensais que le nombre de pages indexées pouvais être limité par la similarité entre beaucoup de pages, mais en fait non: il m' a indexé une gallerie de 2000 photos entière (plus de 2000 pages exactement pareil, a part l' url des photos)...
donc avec tout ça j' ai un peut du mal à comprendre comment est fixé le nbr de pages indexées...

peut être en fonction du nombre de site parlant du même sujet ?
 
Discussions similaires
Haut