No follow sur des liens de pdf que je ne veux pas voir indexées

WRInaute discret
Bonjour,

J'ai mis un no follow sur des liens de pages que je ne veux pas indexables. En l'occurence il s'agit de PDF qui reprennent des articles de presse parlant de notre société.

Le pb c'est que mon logiciel d'audit de site me dit que mettre du no follow sur des liens internes n'est plus une bonne pratique SEO. Ok je veux bien mais dans ce cas comment faire en sorte que ces pdf ne soient pas indexables ?

De plus dans tous les cas je ne veux pas que les crawlers perdent leur temps sur des pages qui ne sont que des duplications de contenu...
 
WRInaute accro
Mettre un nofollow sur le lien ne garantit en aucun cas la non-indexation.

L'URL sera quand même crawlé un jour où l'autre, puis interprété et à terme indexé.

Un noindex sur le dossier des PDF, via robots.txt sera bien plus efficace.

A noter toutefois que Google est susceptible de reprendre les URLs dans ses résultats, même avec le noindex. Il indiquera par contre "contenu bloqué par robots.txt".
 
WRInaute accro
par le .htaccess

Exemple pour des fichiers que je ne veux pas faire indexer :
Code:
### Interdire le référencement du fichier robots.txt & sitemap.xml
<filesMatch "robots\.txt$">
  Header set X-Robots-Tag "noindex"
</filesMatch>
<filesMatch "sitemap\.xml$">
  Header set X-Robots-Tag "noindex, follow"
</filesMatch>
 
Nouveau WRInaute
un nofollow peut être crawlé mais aussi indexé, c'est juste pour dire au robot que vous ne transmettez pas de jus netlinking vers la page de destination.
 
Discussions similaires
Haut