Meta noindex, follow et duplicate content

Nouveau WRInaute
Bonjour à tous,

Je rencontre énormément de difficultés à indexer un site internet sur Google.

J'utilise des variables en query string sur chaque url pour faciliter la navigation sur le site par chaque visiteur. Notamment une variable de pagination "page" et une autre variable "back" permettant de retourner sur la page visitée précédemment.

Le problème du "duplicate content" arrive alors car chacun des articles est accessible en parcourant le site web de plusieures manières différentes. Aussi, j'ai décidé de rajouter dynamiquement une balise meta robots "noindex, follow" sur les pages où les variables "page" et "back" apparaissent dans le querystring (le follow permettant donc de revenir plus rapidement sur les articles sans variable dans l'adresse car j'ai inséré un 'Vous êtes ici: accueil > section > article').

Cependant, je trouvais que Google n'indexait vraiment pas rapidement les articles cibles malgré tout. J'ai donc soumis un sitemap.xml complet reprenant les articles déjà créés et les sections principales.

Ca avait plutôt bien démarré. Mais je constate que des pages à indexer sont désindexées progressivement.

J'ai donc deux questions:
- Google interprète-t-il bien le "follow" ? On pourrait en effet imaginer que Google tombe sur la page noindex mais ne suivent pas les liens ...
- Google fait-il bien la différence entre la page avec querystring et celle sans (je pensais que oui mais avec cette histoire, j'ai comme un doute... s'il confond en effet l'article ayant le noindex avec celui ne l'ayant pas, je comprend que le processus d'indexation soit aussi mauvais) ?

Merci d'avance pour vos réponses :wink: !
 
WRInaute accro
La variable $page est nécessaire, mais pour le $back, si tu cherches quelquechose de plus "poussé" qu'une simple action javascript (qui devrait suffire à ramener ton visiteur à la page précédemment visitée), j'opterais plutôt pour getenv('HTTP_REFERER');.

Ca règlerait le problème, et ça t'éviterais de devoir "patcher".
 
Nouveau WRInaute
En effet, j'ai pensé à cette solution mais sans vraiment prendre la peine de la mettre en oeuvre... pas parce que je suis forcément paresseux :D mais parce que je pensais que je pensais que le patch fonctionnerait.

Sinon, pas d'idée sur le comportement précis de Google à ce niveau ?
 
Discussions similaires
Haut