Empêcher référencement fichiers PDF

shteevy

Nouveau WRInaute
Bonjour et merci de m'accueillir sur votre forum.

Avant de poster ce message, j'ai bien cherché si d'autres posts correspondaient à ma requête mais je n'ai pas trouvé de solution.

J'administre un site Joomla (http://www.campusnumerique.be) et je remarque que Google référenceme bien les articles mais tous au format PDF.

Pouvez vous me dire comment empécher Google de référencer ces PDF afin de pouvoir bénéficier de liens vers le site et non vers des fichiers PDF ?

Merci d'avance,

Shteevy.
 

Aye-Aye

WRInaute passionné
En plaçant un fichier robots.txt à la racine de ton site si tous tes fichiers .pdf sont dans le même répertoire :
Code:
User-agent: *
Disallow: /catalog/ressources/
User-agent: * signifie que l'accès est accordé à tous les agents (tous les spiders), quels qu'ils soient.
Le robot n'ira pas explorer le répertoire /catalog/ressources/
 

shteevy

Nouveau WRInaute
Hello Aye-Aye merci pour ta réponse.
Effectivement pour le catalogue produit c'est la solution mais pour les pages Joomla qui sont auto-converties en PDF, cela se fait à la lecture du site par le BOT GOOGLE donc impossible de bloquer un répertoire.

Si je désactive l'option PDF dans Joomla je pense que le problème sera résolu mais cela empêchera les utilisateurs d'exporter des articles en PDF.

L'idéal serait de pouvoir bloquer l'extension *.pdf

On ne peut pas bloquer directement un type de fichier ?
 

Aye-Aye

WRInaute passionné
A mon avis, il faut adapter en fonction des repertoires où se trouvent tes pdf...
Et prendre en compte la durée de désindexation...
 

shteevy

Nouveau WRInaute
Yoyos, que veux tu dire par rel=nofollow ?

AyeAye, j'ai bien ajouté le Disalow PDF dans le robot.txt et j'attends quelques jour ou semaines avant de voir le résultat. Je vous tient au courant.

Shteevy.
 

Aye-Aye

WRInaute passionné
Shteevy, tu n'as pas besoin d'adapter ton disallow :
:arrow: Pour supprimer tous les fichiers d'un type en particulier (.pdf, par exemple), utilisez l'entrée robots.txt suivante :

Code:
User-agent: Googlebot 
Disallow: /*.pdf$
Confirmation : Google
 

Discussions similaires

Haut