0 pages avec site: mais des milliers indexées ??

Nouveau WRInaute
Je ne sais pas si c'est un bug momentané mais j'ai remarqué qu'avec la fonction site: utilisée seule, je n'ai aucun résultat sur un site :
https://www.google.fr/search?q=site%3Aww ... e-jeux.com

En revanche si on ajoute un critère, on se retrouve avec plein de résultats :
https://www.google.fr/search?q=site%3Aww ... com%20jeux
:?: :?: :?:

Vu le nombre de visiteurs reçus chaque jour sur ce site (PR6) via Google ça ne m'inquiète pas plus que ça (quoi que 8O) mais c'est étonnant non ?

Quelqu'un a une idée ou a déjà remarqué le même phénomène ?
 
WRInaute occasionnel
Backlink , link, lien, site, indexation, référencement

C'est effectivement étonnant...
J'ai testé ton site sur Link Popularity Check et, sauf erreur de ma part, tu as 37 000 backlink sur Google...
Google est actuellemnt dans une période "agitée" et peut-être que ces résultats ne sont que temporaire...
Des plus PRO que moi, vont sûrement te répondre bientôt..
 
WRInaute impliqué
C'est vrai que ce problème est très curieux, c'est d'ailleurs la première fois que je rencontre un pareil cas.

Je ne peux donc pas explicitement dire d'où ca provient, cependant quelques détails m'ont choqué sur ce site :

1/ La manière dont a été fait l'URL Rewriting : Les URLs utilisent de manière abusive les "-"

2/ J'ai également remarqué il y a environ 1 semaine qu'MSN avait indexé uniquement une page de Culture-jeux, à savoir l'index et que celle-ci contenait des caractères bizzarres, en regardant de plus près il s'est averé que ce soucis provenait d'un bug de compression gzip.

Si MSN est tombé dessus, Google a du également tombé dessus car je pense sincèrement que ce problème n'a pas coincidé exactement avec le crawl d'MSN mais qu'il a perduré plusieurs jours et vu le contenu de la page pendant ce problème, à savoir des milliers de caractères ASCII les uns à la suite des autres, il est probable que Google ait desindexé ou mis en suspend toutes les pages de ton site qu'il essayait de mettre à jour.

Je ne peux pas t'en dire plus car je connais absolument pas la manière dont Google traite ce genre de problème, si les autres ont déjà vécu une expérience similaire, leur avis est fortement attendu ;)
 
WRInaute passionné
Des articles parlent bien de différences entre site:lesite.com et site:lesite.com -motinexistant (filtrage bidon), mais pas tres fortes et surtout visibles sur les sites a fort nombre de pages.

Ici c'est encore plus fort 8O
 
WRInaute discret
Idem je viens d'utiliser cette commande et j'ai cru avaler mon bulletin de naissance en voyant que sur tous mes sites, ca donnait : 0 ! :evil:

Mais ca a l'air d'un bug ( enfin c même sur ).
 
Nouveau WRInaute
rituel a dit:
Si MSN est tombé dessus, Google a du également tombé dessus car je pense sincèrement que ce problème n'a pas coincidé exactement avec le crawl d'MSN mais qu'il a perduré plusieurs jours et vu le contenu de la page pendant ce problème, à savoir des milliers de caractères ASCII les uns à la suite des autres, il est probable que Google ait desindexé ou mis en suspend toutes les pages de ton site qu'il essayait de mettre à jour.

C'est possible mais la commande "site:www.culture-jeux.com jeux" ne devrait alors pas marcher ... à noter que le site n'a pas 5910 pages (il n'y en a que 1700 et quelques).
 
WRInaute impliqué
parisien94 a dit:
Idem je viens d'utiliser cette commande et j'ai cru avaler mon bulletin de naissance en voyant que sur tous mes sites, ca donnait : 0 ! :evil:

Mais ca a l'air d'un bug ( enfin c même sur ).

Ca n'est pas un bug, on ne le répetera jamais assez : Les chefs de projets et les developpeurs de chez Google sont pas nés de la dernière pluie et ne s'amusent certainement pas à mettre en ligne des outils défectueux.

Et puis c'est explicitement écrit Pour limiter les résultats aux pages les plus pertinentes, Google a ignoré certaines pages à contenu similaire.

Ce filtre intervient souvent sur les pages :

- Ayant trop d'arguments dans l'URL
- Etant parti intégrante d'un forum (Attenué en cas de rewriting)
- Trop similaires aux autres pages du site
- Rewriting abusif (Urls à rallonges)

Maintenant pour le cas de Cyrealis je ne sais pas si c'est dû à son rewriting ou à son problème de Gzip, mais je suis sûr que c'est dû à un des deux points si ce n'est les deux.
 
WRInaute impliqué
C'est possible mais la commande "site:www.culture-jeux.com jeux" ne devrait alors pas marcher ... à noter que le site n'a pas 5910 pages (il n'y en a que 1700 et quelques).

C'est pour ca que je n'ai pas parlé de désindexation mais de "suspend", mais je ne peux pas t'en dire davantage je ne sais pas comment réagit Google face à ce type de problèmes : Néamnoins je pense que s'il voit qu'un site part en sucette, je doute qu'il s'amuse à remplacer des données pertinentes par des milliers caractères ASCII ... L'idéal serait de demander à Googleguy ;)

Pour le nombre de pages, Google garde en base des pages n'existant plus, et cela peut remonter très loin (Des années parfois), c'est peut être une explication.
 
WRInaute discret
Ca n'est pas un bug, on ne le répetera jamais assez : Les chefs de projets et les developpeurs de chez Google sont pas nés de la dernière pluie et ne s'amusent certainement pas à mettre en ligne des outils défectueux.

La commande site ne fonctionnait pas tout a l'heure, elle fonctionne maintenant. Pour moi j'appelle ca un bug.

Merci
 
WRInaute impliqué
Bien vu Ocsima, c'est vrai que la description est un critère important pour échapper à ce petit filtre, mais je doute que cela explique totalement le problème de Culture Jeux. De nombreux sites ont une description équivalente sur toutes les pages et n'ont pas ce problème ...

Mais ta remarque soulève un problème ... Pourquoi pour Culture Jeux Google se contente t-il uniquement de la balise description et n'utilise pas le contenu de la page ? Je ne vois rien dans le code source qui l'en empêche ...
 
Nouveau WRInaute
Bien vu pour le champ description. Je le modifie pour voir ce que ça donne.

A noter que ce "phénomène" apparait / réapparait selon l'heure ou on essaye et/ou du datacenter.
 
WRInaute impliqué
rituel a dit:
Pourquoi pour Culture Jeux Google se contente t-il uniquement de la balise description et n'utilise pas le contenu de la page ? Je ne vois rien dans le code source qui l'en empêche ...
Pour la commande site:www.monsite.com il n'y pas de recherche donc il n'y arien pour guider une sélection à l'intérieur des pages
avec site:www.monsite.com blabla on effectue une requête blabla à l'intérieur du site donc l'interface extrait des passages à partir des pages retournées
Normalement avec site:www.monsite.com blabla les pages sont retournées dans leur ordre de pertinence par rapport à la requête blabla
 
Nouveau WRInaute
Histoire de conclure cette expérience, les balises dc.description sont bien celles affichées avec une commande site:url. C'est aussi celles-ci qui font en sorte que Google pense que ce sont des pages similaires ou pas (pour cette commande).

En effet, après avoir modifié l'ensemble de ces balises, les centaines de pages du sites sont à présent visibles en utilisant la commande "site:www.culture-jeux.com".

Tout est bien qui fini bien :)

Merci à ceux qui ont participé à la discussion et au diagnostic !
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut