Noindex sur google

Tomybe · 5 Décembre 2012

J'ai ajouté de nombreuses pages sur mon site que je ne souhaitez pas indexer. J'ai donc mis un noindex dans les META.

Google m'a tout de même indexé les pages.......... wtf.... et j'me retrouve devant des pages indexées qui contiennent du duplicate content. merci google.... POURQUOI?

finstreet · 5 Décembre 2012

parce que t'as merdé pour mettre le noindex

zeb · 5 Décembre 2012

Une noindex liée en externe peut être présentée par GG dans les SERPs il me semble.

WebRankInfo · 5 Décembre 2012

zeb a dit:
Une noindex liée en externe peut être présentée par GG dans les SERPs il me semble.

non je ne pense pas. Par contre ça peut arriver quand il y a des interactions avec des blocages via robots.txt

je pense plutôt que la meta robots noindex n'était pas présente quand Google est venu la dernière fois...

zeb · 5 Décembre 2012

http://support.google.com/webmasters/bin/answer.py?hl=fr&answer=93710

Lorsque nous détectons la balise Meta noindex sur une page, nous supprimons totalement cette page de nos résultats de recherche, même si d'autres pages ont établi des liens pointant vers elle. Toutefois, d'autres moteurs de recherche peuvent interpréter cette instruction différemment. Par conséquent, un lien vers la page peut tout de même apparaître dans leurs résultats de recherche.

En effet j'ai fait un amalgame ...

Tomybe · 5 Décembre 2012

WebRankInfo a dit:
zeb a dit:

Une noindex liée en externe peut être présentée par GG dans les SERPs il me semble.

Cliquez pour agrandir...

non je ne pense pas. Par contre ça peut arriver quand il y a des interactions avec des blocages via robots.txt

je pense plutôt que la meta robots noindex n'était pas présente quand Google est venu la dernière fois...

Si j'y est pensé dès le début, parce que j'me suis fait la réflexion que ça ne serait pas très bon qu'il index ça.

Par contre la page était accessible sur le site sans rel nofollow. Du coup j'en ai ajouté un et en plus j'ai ajouté nofollow sur les dites pages. on verra bien si il desindexe ou pas.

Ses pages sont dans des sous répertoires donc je ne peut pas bloquer le repertoire avec le robots.txt au risque de ne plus indexer le répertoire parent....

UsagiYojimbo · 5 Décembre 2012

Si, si tu peux :

Code:

Disallow: /directoryroot/directory2/*

ou

Code:

Disallow: /directoryroot/*/*

devrait fonctionner (à tester via GWT).

noren · 5 Décembre 2012

Moi je n'ai jamais compris avec le Robots.txt.

Lorsque je passais par le Robots.txt pour ne pas indexer certaines pages, Google avait plutôt la fâcheuse tendance à les indexer justement, et de surcroit il mettait ces pages en bonnes positions dans les SERPs

Mais en mettant uniquement la balise Meta noindex, nofollow, il n'y a pas de soucis

Pas très au point le robots.txt non? 8O

zeb · 5 Décembre 2012

noren a dit:
la balise Meta noindex, nofollow,

Note bien que le nofollow a rien a voir avec l'histoire d'indexation ...

noren · 5 Décembre 2012

zeb a dit:
noren a dit:

la balise Meta noindex, nofollow,

Cliquez pour agrandir...

Note bien que le nofollow a rien a voir avec l'histoire d'indexation ...

Oui oui bien sur c'est (d'ou la distinction entre noindex et nofollow) juste pour préciser que je suis passé uniquement via la balise Meta en ce qui me concerne :wink:
Ca m'a semblé bien plus efficace que le robots.txt

Cela dit je comprend pas l'intérêt de ne pas mettre nofollow si quoi qu'il en soit on ne veut pas que google index la page

zeb · 5 Décembre 2012

noren a dit:
Cela dit je comprend pas l'intérêt de ne pas mettre nofollow si quoi qu'il en soit on ne veut pas que google index la page

Lol justement car ça n'a rien a voir avec l'indexation ... et que les liens présents dans la page ne sont pas pour autant systématiquement a ne pas suivre ...

UsagiYojimbo · 5 Décembre 2012

Voilà. Ce n'est pas parce que tu dis à Google de ne pas indexer la page qu'il ne va pas la crawler.

Tomybe · 5 Décembre 2012

UsagiYojimbo a dit:
Si, si tu peux :

Code:

Disallow: /directoryroot/directory2/*

ou

Code:

Disallow: /directoryroot/*/*

devrait fonctionner (à tester via GWT).

Dans mon cas je voudrais bloquer
/articles/chaussures/tri/

mais surtout pas /articles/chaussures/

sachant qu'il peut y avoir d'autres type d'articles (pantalon, casquette) mais toujours un répertoire enfant "tri"

UsagiYojimbo · 5 Décembre 2012

Code:

Disallow: /articles/*/tri/*

Mais je testerais la règle via Webmaster Tools avant de l'appliquer.

noren · 6 Décembre 2012

UsagiYojimbo a dit:
Voilà. Ce n'est pas parce que tu dis à Google de ne pas indexer la page qu'il ne va pas la crawler.

Oui mais justement d'ou ma question. Quelle est l'intérêt qu'il crawl la page si on lui demande de ne pas l'indexer?

finstreet · 6 Décembre 2012

Tout simplement trouver des liens à indexer

zeb · 6 Décembre 2012

noren a dit:
Quelle est l'intérêt qu'il crawl la page si on lui demande de ne pas l'indexer?

1/ tant qu'il l'a pas crawlé il peut pas savoir qu'elle est noindex
2/ un noindex c'est pas forcement définitif heureusement qu'il repasse de temps en temps ...
3/ son contenu même si on demande qu'il ne figure pas a l'index fait parti du site et concoure a son appréciation même si il n'est pas indexable

noren · 6 Décembre 2012

ok merci beaucoup pour vos réponses :wink:

Tomybe · 6 Décembre 2012

par contre en théorie, un nofollow sur un lien d'une page qui ne doit pas être indexé, n'est pas non plus crawlé. Et un robot sachant crawlé sans s’assèché... ok je sort.

Tomybe · 9 Décembre 2012

Bon... ce con là continue de m'indexer mes pages, ça 'm'rend dingue!