Noindex sur google

WRInaute discret
J'ai ajouté de nombreuses pages sur mon site que je ne souhaitez pas indexer. J'ai donc mis un noindex dans les META.

Google m'a tout de même indexé les pages.......... wtf.... et j'me retrouve devant des pages indexées qui contiennent du duplicate content. merci google.... POURQUOI? :)
 
Olivier Duffez (admin)
Membre du personnel
zeb a dit:
Une noindex liée en externe peut être présentée par GG dans les SERPs il me semble.
non je ne pense pas. Par contre ça peut arriver quand il y a des interactions avec des blocages via robots.txt

je pense plutôt que la meta robots noindex n'était pas présente quand Google est venu la dernière fois...
 
WRInaute accro
http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=93710
Lorsque nous détectons la balise Meta noindex sur une page, nous supprimons totalement cette page de nos résultats de recherche, même si d'autres pages ont établi des liens pointant vers elle. Toutefois, d'autres moteurs de recherche peuvent interpréter cette instruction différemment. Par conséquent, un lien vers la page peut tout de même apparaître dans leurs résultats de recherche.
En effet j'ai fait un amalgame ...
 
WRInaute discret
WebRankInfo a dit:
zeb a dit:
Une noindex liée en externe peut être présentée par GG dans les SERPs il me semble.
non je ne pense pas. Par contre ça peut arriver quand il y a des interactions avec des blocages via robots.txt

je pense plutôt que la meta robots noindex n'était pas présente quand Google est venu la dernière fois...

Si j'y est pensé dès le début, parce que j'me suis fait la réflexion que ça ne serait pas très bon qu'il index ça.

Par contre la page était accessible sur le site sans rel nofollow. Du coup j'en ai ajouté un et en plus j'ai ajouté nofollow sur les dites pages. on verra bien si il desindexe ou pas.

Ses pages sont dans des sous répertoires donc je ne peut pas bloquer le repertoire avec le robots.txt au risque de ne plus indexer le répertoire parent....
 
WRInaute accro
Si, si tu peux :

Code:
Disallow: /directoryroot/directory2/*

ou

Code:
Disallow: /directoryroot/*/*

devrait fonctionner (à tester via GWT).
 
WRInaute accro
Moi je n'ai jamais compris avec le Robots.txt.

Lorsque je passais par le Robots.txt pour ne pas indexer certaines pages, Google avait plutôt la fâcheuse tendance à les indexer justement, et de surcroit il mettait ces pages en bonnes positions dans les SERPs

Mais en mettant uniquement la balise Meta noindex, nofollow, il n'y a pas de soucis

Pas très au point le robots.txt non? 8O
 
WRInaute accro
zeb a dit:
noren a dit:
la balise Meta noindex, nofollow,
Note bien que le nofollow a rien a voir avec l'histoire d'indexation ...

Oui oui bien sur c'est (d'ou la distinction entre noindex et nofollow) juste pour préciser que je suis passé uniquement via la balise Meta en ce qui me concerne :wink:
Ca m'a semblé bien plus efficace que le robots.txt

Cela dit je comprend pas l'intérêt de ne pas mettre nofollow si quoi qu'il en soit on ne veut pas que google index la page
 
WRInaute accro
noren a dit:
Cela dit je comprend pas l'intérêt de ne pas mettre nofollow si quoi qu'il en soit on ne veut pas que google index la page
Lol justement car ça n'a rien a voir avec l'indexation ... et que les liens présents dans la page ne sont pas pour autant systématiquement a ne pas suivre ...
 
WRInaute discret
UsagiYojimbo a dit:
Si, si tu peux :

Code:
Disallow: /directoryroot/directory2/*

ou

Code:
Disallow: /directoryroot/*/*

devrait fonctionner (à tester via GWT).

Dans mon cas je voudrais bloquer
/articles/chaussures/tri/

mais surtout pas /articles/chaussures/

sachant qu'il peut y avoir d'autres type d'articles (pantalon, casquette) mais toujours un répertoire enfant "tri"
 
WRInaute accro
UsagiYojimbo a dit:
Voilà. Ce n'est pas parce que tu dis à Google de ne pas indexer la page qu'il ne va pas la crawler.

Oui mais justement d'ou ma question. Quelle est l'intérêt qu'il crawl la page si on lui demande de ne pas l'indexer?
 
WRInaute accro
noren a dit:
Quelle est l'intérêt qu'il crawl la page si on lui demande de ne pas l'indexer?
1/ tant qu'il l'a pas crawlé il peut pas savoir qu'elle est noindex
2/ un noindex c'est pas forcement définitif heureusement qu'il repasse de temps en temps ...
3/ son contenu même si on demande qu'il ne figure pas a l'index fait parti du site et concoure a son appréciation même si il n'est pas indexable
 
WRInaute discret
par contre en théorie, un nofollow sur un lien d'une page qui ne doit pas être indexé, n'est pas non plus crawlé. Et un robot sachant crawlé sans s’assèché... ok je sort.
 
Discussions similaires
Haut