Index principal / secondaire

Nouveau WRInaute
bonjour,

ayant lu récemment le dernier livre d'Olivier Andrieu "Réussir son référencement Web" 2ème édition
il est fait allusion à cette problématique d'index primaire / secondaire ( aux US ils parlent de "Supplemental Index" )

pour résumer, toutes les pages considérées comme non pertinentes par GG sont classées dans cet index secondaire (pages à contenu dupliqué, pages peu populaires, etc ...) ... et donc mal positionnées - aucune chance d'être bien placé si expression concurentielles

pour rappel, les commandes pour mesurer :
site:www.monsite.com => donne le nombre pages total de votre site
et pour avoir les pages inclues dans l'index primaire (sont donc exclues celles de l'index secondaire)
il existe plusieurs variantes
site:www.monsite.com/*
site:www.monsite.com -url:www.monsite.com
ou bien depuis aol.fr vous pouvez lancer la même commande que sur google.fr "site:www.monsite.com" (Google fournissant tout ou partie de son index principal à Aol.fr)

si on fait le test avec WRI on obtient:
site:www.webrankinfo.com => 171.000 pages
site:www.webrankinfo.com -url:www.webrankinfo.com => 86.900 pages
soit environ 50% des pages dans l'index principal ce qui me parait excellent

pour ma part, les sites dont j'ai à m'occuper ont un taux très faible

voici donc mes quelques questions :
- le ratio primaire/total est-ce un indicateur pertinent, vaut-il la peine d'être travaillé ?
- travaillez vous cet aspect afin de favoriser le basculement de vos pages de l'index secondaire vers l'index principal ?
- dans mon cas, je suspecte un problème de duplicate content, comment faites-vous pour déterminer que vos pages sont considérées en DC par GG ? .... méthode ou outil de mesure ?
- de part votre expérience, quelles seraient vos pistes / méthodes (autres que Duplicate) pour faire augmenter le nombre de page dans l'index principal ?

merci pour vos réponses

si vous voyez autre chose n'hésitez pas à alimenter ce post
 
WRInaute passionné
Le problème c'est que cela fait 2 ans que la mention "supplemental" a été abandonnée. Google a aussi affirmé fin 2007 que les recherches étaient désormais faites sur l'ensemble de leur index. Difficile donc de savoir si les syntaxes données au dessus sont fiables. On ne sait même pas s'il y a toujours deux index.

Pour ce qui est du duplicate ou du near duplicate, le fait que google mentionne des fois lors d'une recherche "site:" la mention "afficher les pages similaires" peut être un indice, mais ça ne couvre pas tous les cas de duplicate. Il faut voir le site.
 
WRInaute accro
surtout, la commande site: sur des sites à gros volumes est totalement fausse (bridée) donc impossible de faire des tests avec cette commande
 
Nouveau WRInaute
oui la commande site: est incohérente dans mon cas et également pour mes concurrents
car si je fais le total avec la commande site: par type de page j'obtiens des valeurs supérieures
mais en fait la n'est pas la question en terme de quantité
mais plutôt de suivre dans le temps la progression ou régression

pour revenir sur l'index secondaire, j'avais lu quelque part que physiquement il n'existe peut-être plus mais d'une manière ou d'une autre il existerait encore
j'ai eu O.Andrieu au tél, pour lui un ratio correcte constaté serait de 30% ... mais après peut-être ça dépend de la thématique de site et de la volumétrie
lorsque je regarde mes concurrents, ils ont également des ratios faibles ... mais je ne m'en fais pas une excuse, je me dis c'est peut-être un levier intéressant à exploiter

Aux US, il en est encore question cette année du Supplemental index"
http://www.seroundtable.com/archives/019549.html
70% des responsables SEO se sentent concernés (Mars 2009)

http://www.searchmarketingandseo.com/blog/20092655/wheres-the-suppleme ... tal-index/
ici ils disent, pour les petits sites ce seraient un critère important à vérifier
pour les gros sites (plus de 100.000 pages) 75% des pages seraient dans l'index secondaire et ça serait normal

http://www.searcheditors.com/googles-supplemental-index-exists/140/ ( Article du 18/11/2009)

autres infos sur le sujet
http://www.seodesignsolutions.com/blog/how-to-reference-material/how-t ... tal-index/
http://www.seomoz.org/blog/testing-the-value-of-anchor-text-optimized- ... rnal-links

je vais continuer à creuser le sujet et tenter d'en identifier les causes
 
Discussions similaires
Haut