Indexation des sections de pages et duplicate content

WRInaute discret
Dans certaines pages, on utilise parfois des sections qui sont référencées dans le code par un <a href=#toto> par exemple. Ensuite, on peut joindre ces pages directement par http://www.exemple.com/titi/#toto

Le problème est que http://www.exemple.com/titi/ contient http://www.exemple.com/titi/#toto (Le contenu de http://www.exemple.com/titi/#toto étant une partie de http://www.exemple.com/titi/).

Comment puis je faire pour éviter le duplicate content? J'ai l'impression que google ne se soucie pas trop des pages avec les # et les identifie bien comme des sections mais msn semble les indexer séparément.

Est ce qu'il y a un moyen de bloquer l'indexation des sections par le robots.txt?
 
WRInaute accro
As tu un exemple du cas que tu indiques pour MSN ? CAD une indexation multiple d'une même page selon les #ancres ?
Google en effet est assez intelligent pour ne pas tenir compte des "#ancre" dans une page ou un lien.
 
WRInaute discret
En fait, msn m'a référencé une page "ancrée", c'est à dire que l'url de la page indexée est celle avec l'ancre sans référencer la page principale (sans l'ancre), c'est vraiment très curieux.

Enfin bon, d'un autre côté, il me référence aussi des pages en noindex donc, je suis plus à ça prêt, l'important, c'est que google fasse les choses intelligemment...

Merci pour ta réponse en tout cas
 
Discussions similaires
Haut