Nb d'URL indexées : bug ou incompréhension ?

nguyenhaongnam

Nouveau WRInaute
Je trouve que mon petit Google préféré me transmet des infos bien étranges...

Pour un site qui bouge pas mal, je transmet mensuellement un sitemap bien propre qu'il traite gentiment. Quand je vais sur Search Console, il me dit que j'ai seulement 4 pages dans l'index (sur un total de 50). A priori on ne peut pas voir quelles seraient ces 4 pages (ou c'est bien caché).

Par contre avec la méthode "site:nom_de_domaine", il m'en affiche 184, dont de nombreuses pages qui n'existent plus, et il devrait le savoir vu que les derniers sitemap ne les contenaient pas et que ces pages ont été proprement supprimées il y a plusieurs mois.

Bref soit j'ai rien compris au film soit c'est du grand n'importe quoi.
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
Bienvenue sur WebRankInfo :)

quelques remarques
  • un sitemap doit être généré par un script sur le serveur, afin d'être automatisé et tout le temps à jour. ainsi, il n'est plus nécessaire de le redonner à Google tous les X jours
  • la nouvelle search console permet de connaître la liste des URL indexées, en tout cas quand il y en a moins que 1000. C'est dans la couverture de l'index
  • la commande site: n'est pas très fiable
  • Google ne se fie pas aux sitemaps pour savoir si une URL doit être indexée ou pas. S'il l'a trouvée un jour, qu'elle est techniquement indexable et que l'algo décide de l'indexer, alors elle est indexée. Même si elle n'est dans aucun sitemap.
  • "proprement supprimée" ça veut dire quoi ?
 

indigene

WRInaute accro
Les nombreuses pages qui n'existent plus doivent être redirigées par des redirections 301 dans le .htaccess et ensuite il faut attendre plusieurs mois que google les supprime de son index définitivement
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
plein de 301, j'ai remarqué que ce n'est pas super efficace. quand on peut, une 410 personnalisée c'est pas mal non plus
 

Discussions similaires

Haut