Commande site: sur Google et pages ignorées
Si vous êtes webmaster ou référenceur, vous avez sans doute déjà essayé de connaître le nombre (et la liste) de pages indexées de votre site avec la commande site: de Google. Voici une précision à connaître…
Vanessa Fox vient enfin de préciser ce que nous savons depuis longtemps mais que malheureusement encore beaucoup de monde méconnaît : quand la commande site: ne renvoie que quelques résultats et affiche ensuite Pour limiter les résultats aux pages les plus pertinentes (total : 1), Google a ignoré certaines pages à contenu similaire. Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées.
, il ne s'agit aucunement d'une pénalité ni d'un problème de pages dupliquées, mais d'un bug de la commande site: !
Le problème est que, pour Google, la commande site: effectuée sans mot-clé derrière (par exemple site:www.lemonde.fr) sort de l'ordinaire. En effet, sur quoi Google peut-il se baser pour classer les résultats par ordre de pertinence ? Comme le dit Vanessa Fox, le moteur essaie de ne pas afficher de contenus dupliqués dans ses résultats mais depuis un certain temps (quelques semaines ou mois), la commande site: ne renvoie souvent que quelques résultats, même pour des très gros sites bien référencés. C'est le cas pour WebRankInfo qui n'a semble-t-il d'après cette commande que 3 pages affichées sur 260 indexées. Ces chiffres sont amusants car on retrouve le nombre 260 dans un grand nombre de cas !
Bref vous l'aurez compris il ne faut pas s'inquiéter, si pour votre site aussi Google n'affiche que quelques résultats puis le message cité précédemment, cela ne veut pas dire qu'il y a un problème de contenus dupliqués.
Désolé pour les habitués de WebRankInfo qui n'apprendront sans doute pas grand chose dans cet article…
Par contre attention : tout ce qui précède ne concerne que les requêtes site: sans mot-clé derrière. Si en ajoutant un mot-clé vous avez encore le même message, dans ce cas il y a alors sans doute des problèmes de pages dupliquées. Sur WebRankInfo site:www.webrankinfo.com webrankinfo affiche de nombreux résultats sur un total d'environ 230000.
Olivier Duffez, Mardi 6 mars 2007
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Comment éviter les contenus dupliqués (avec/sans le www)
- Google Search et AdSense sur MySpace : un accord de 900M$
- link rel=canonical pour réduire les contenus dupliqués
- Gérer ses paramètres de tracking dans Google Webmaster Tools
- Google sait désormais suivre les liens JavaScript !
- Nouvelles fonctionnalités pour Google Sitemaps
- Liste d'erreurs classiques de duplicate content
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- Google a répertorié 1000 milliards de pages sur le web !
- Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)
- Référencement Flash : les conseils de Vanessa Fox
- Comment supprimer des pages duplicate content sur google?
- Pages suivantes = Duplicate content ?
- duplicate content et pages avec paramétres ID
- Voir les pages en duplicate content
- Pages grisées - taux de duplicate content acceptable
- Indexation des sections de pages et duplicate content
- duplicate content ? avec plusieurs pages Index
- Pages produits + version pdf = duplicate content ?
- voir uniquement les pages en duplicate content
- comment evité un duplicate content (Redirection de pages)
- Eviter un duplicate content avec des pages en liste
- Algorithme de similarité entre deux pages(Duplicate Content)
- Duplicate content avec les pages de mon site 301 ou robots ?
- Google + duplicate content
- Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
6 commentaires sur “Commande site: sur Google et pages ignorées”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Hotel restaurant Le Pont Neuf à Florac Lozère dans les Gorges du Tarn
- Organisation coordination de tout type d'évènement en Haute Savoie
- Agence immobilière Somacimmo - Somain
- Hôtel de Bordeaux à La rochelle
- Vente en ligne de cactus plantes grasses et tillandsia
- TETRADIS, Distributeur spécialisé solutions interconnexion très haut débit
- Cartes, faire-parts et articles de papeterie à imprimer soi-même
- 17WebStore - Achetez aujourd'hui la technologie de demain
- Location de musique DJ pour trouver chaque soirée
- Santé des chiens et des chats : des vétérinaires répondent à vos questions
- Outils interactifs pour un développement durable facile en entreprises
- Must Animation : Dj animateur, organisation et l'animation évènementielle
- Location de villa et appartement à koh Samui en Thailande
- Le club des amateurs et passionnés des jeux de grille
- Colat Clés le Serrurier - Professionnel de la serrurerie en Guadeloupe



Bonjour,
donc ci je comprend bien, si je tape:
site:www.pc-a-vue.com pc-a-vue,
je’aurais que les pages pertinantes?
Merci pour l’info.
De mon côté, je me suis toujours demandé d’où venait la variation du nombre de pages indéxées : j’ai remarqué de grandes variations entre deux mois.
Si quelqu’un a une idée ?
Merci
Android
Si la balise description est différente également sur chaque page (et pas seulement la balise title) les pages s’affichent-elles mieux ?
Comme je l’imaginais, je suis loin d’être le seul à n’avoir que "260 pages indexées". On va l’appeler le bug 260 ? Voir http://www.davidnaylor.co.uk/arc...
Je ne comprends pas le pb il suffit de mettre sans filtre et nous avons le nombre exacte de page référencé, actuellement 280000 pour WRI.
http://www.google.com/search?q=s...
Mon site aussi donne 1 seul résultat, mais si je rajout le mot "Toulon" alors 2590 résultats !
Merci pour cette info