Bonjour,
Je travaille sur un site pour lequel il faut déréférencer un grand nombre de pages qui sont à la racine du site ( près de 50% des pages indexées par Google)
Je vois plusieurs pistes, mais en pesant le pour et le contre de chacune c'est dur de choisir :
1) Mettre un 404 ou mieux je pense 410 sur ces pages.
Ce qui fera un nombre très important de 410 (plus de 500 000), et donc via webmastertools google dira qu'à son dernier passage il a rencontré beaucoup de 410 et m'invitera à vérifier qu'il n'y a pas un problème sur mon site. Cela voudra t-il dire que s'il voit toujours autant de 410 lors de ses prochains crawl il finira par pénaliser l'ensemble du site. Ou ce type de message est il un simple message de courtoisie, au cas où il y aurait un problème dont le webmaster ne se serait pas aperçu ?
d'après le support google les 404 ou 410 ne pénalisent pas le site, et en plus cela lui donne moins de travail donc cela semble plutôt ok. De plus par rapport aux pistes 2 et 3, l'avantage est que l'expérience utilisateur est meilleure puisqu'il ne perd pas de temps avec des pages sans intérêt.
cependant pour un très grand nombre de pages qu'en est-il ? je ne trouve pas de doc là dessus
2) Déplacer ces pages dans un répertoire, faire une 301 des anciennes url vers les nouvelles qui sont dans le répertoire et mettre en disallow le répertoire dans le robot.txt
Google semble préconiser cette solution : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=59819
Cette solution implique de faire une redirection de ces pages. En effet elles sont à la racine du site.
Dire à Google l'adresse a changé, maintenant c'est ici mais je ne t'autorise pas à crawler ces pages (pour rappel ces pages aujourd'hui sont référencées par Google), ne risque t-il pas de poser problème ? Les Pages seront-elles désindexées ?
3) Mettre du noindex sur ces pages
Tout est dans le titre : mettre du noindex sur ces pages
Je précise que dans ce cas le site devrait me permettre de faire cela sans redirection dans un répertoire, contrairement à la piste 2
Je lis sur le post de WRI dans cette discussion qu'il faut procéder ainsi plutôt que la piste 2 : https://www.webrankinfo.com/forum/t/page-recherche-php-indexee-malgre-le-noindex.148390/
5) adopter une des solutions 1 à 3 en procédant par paquets de 50 000 par exemple par semaine
par paquet plus petit même ?
5) Ne rien faire
c'est à dire considérer qu'il vaut mieux laisser ces pages de mauvaises qualités pour l'instant plutôt que d'envoyer à google autant de changement
Pour toutes les autres pistes je pars du principe que les pages sans intérêt doivent être retirées. De plus je précise que dernièrement il y a eu de nouvelles pages de ce type et que le trafic global en valeur absolu sur ces pages a baissé ce qui tend à confirmer ce principe d'un point de vue référencement, c'est à dire que ces pages doivent au moins être retirées des résultats google ( voire carrément du site cf piste 1)
Merci à tous pour vos retours, et si vous voyez d'autres pistes n'hésitez pas
Je travaille sur un site pour lequel il faut déréférencer un grand nombre de pages qui sont à la racine du site ( près de 50% des pages indexées par Google)
Je vois plusieurs pistes, mais en pesant le pour et le contre de chacune c'est dur de choisir :
1) Mettre un 404 ou mieux je pense 410 sur ces pages.
Ce qui fera un nombre très important de 410 (plus de 500 000), et donc via webmastertools google dira qu'à son dernier passage il a rencontré beaucoup de 410 et m'invitera à vérifier qu'il n'y a pas un problème sur mon site. Cela voudra t-il dire que s'il voit toujours autant de 410 lors de ses prochains crawl il finira par pénaliser l'ensemble du site. Ou ce type de message est il un simple message de courtoisie, au cas où il y aurait un problème dont le webmaster ne se serait pas aperçu ?
d'après le support google les 404 ou 410 ne pénalisent pas le site, et en plus cela lui donne moins de travail donc cela semble plutôt ok. De plus par rapport aux pistes 2 et 3, l'avantage est que l'expérience utilisateur est meilleure puisqu'il ne perd pas de temps avec des pages sans intérêt.
cependant pour un très grand nombre de pages qu'en est-il ? je ne trouve pas de doc là dessus
2) Déplacer ces pages dans un répertoire, faire une 301 des anciennes url vers les nouvelles qui sont dans le répertoire et mettre en disallow le répertoire dans le robot.txt
Google semble préconiser cette solution : http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=59819
Cette solution implique de faire une redirection de ces pages. En effet elles sont à la racine du site.
Dire à Google l'adresse a changé, maintenant c'est ici mais je ne t'autorise pas à crawler ces pages (pour rappel ces pages aujourd'hui sont référencées par Google), ne risque t-il pas de poser problème ? Les Pages seront-elles désindexées ?
3) Mettre du noindex sur ces pages
Tout est dans le titre : mettre du noindex sur ces pages
Je précise que dans ce cas le site devrait me permettre de faire cela sans redirection dans un répertoire, contrairement à la piste 2
Je lis sur le post de WRI dans cette discussion qu'il faut procéder ainsi plutôt que la piste 2 : https://www.webrankinfo.com/forum/t/page-recherche-php-indexee-malgre-le-noindex.148390/
5) adopter une des solutions 1 à 3 en procédant par paquets de 50 000 par exemple par semaine
par paquet plus petit même ?
5) Ne rien faire
c'est à dire considérer qu'il vaut mieux laisser ces pages de mauvaises qualités pour l'instant plutôt que d'envoyer à google autant de changement
Pour toutes les autres pistes je pars du principe que les pages sans intérêt doivent être retirées. De plus je précise que dernièrement il y a eu de nouvelles pages de ce type et que le trafic global en valeur absolu sur ces pages a baissé ce qui tend à confirmer ce principe d'un point de vue référencement, c'est à dire que ces pages doivent au moins être retirées des résultats google ( voire carrément du site cf piste 1)
Merci à tous pour vos retours, et si vous voyez d'autres pistes n'hésitez pas