ne pas rendre indexable les images par les robots.. comment?

WRInaute passionné
Voilà, j'aimerais bien que google n'enregistre pas mes images du site...
car il me bouffe de mon traffic (que je paye) ... et donc sur toutes mes pages (142.000) c'est non négigleable..
j'ai pourtant (depuis le début de mon site) un robots.txt avec:

User-agent: *
Disallow: /themes/

mais il a bien prit (à tous les dernies crawl) les images qui etait dans /themes/Le_Jardin/images/

donc ya un autre truc à faire pour lui dire de pas choper les images ?
 
WRInaute passionné
a la page https://www.google.fr/intl/fr/webmasters/faq.html
ya ecrit

Googlebot supporte déjà certaines caractéristiques du standard robots.txt : les filtres d'interdiction/Disallow peuvent inclure le caractère * (toute séquence de caractères), et se terminer par le caractère $ (toute fin de nom). Exemple – Pour empêcher Googlebot d'explorer les fichiers à extension « .gif », utilisez le fichier robots.txt suivant :

User-agent: Googlebot
Disallow: /*.gif$

ce qui correspond à la reponse que je cherchais :wink:
 
WRInaute passionné
Mitirapa a dit:
Pour empêcher Googlebot d'explorer les fichiers à extension « .gif », utilisez le fichier robots.txt suivant :
User-agent: Googlebot
Disallow: /*.gif$
Attention, le robot qui indexe les images n'est pas Googlebot mais Googlebot-Image
La syntaxe est donc:
Code:
User-agent: Googlebot-Image
Disallow: /*.gif$
Dan
 
WRInaute passionné
ha ok de toute facon j'ai mis
User-agent: *
par contre pour les caches de google... on ne peut pas lui dire de ne pas mettre en cache les images des pages...
on ne peut que dire de ne pas mettre en cache la page...
ca serait bien qu'il laisse les images.. ca me ferait de la bande passante en plus..

à moins que qqun connait l'astuce ?
 
Olivier Duffez (admin)
Membre du personnel
c'est une bonne idée ça... moi je cherche à limiter le nombre de hits car je viens encore de dépasser le maximum autorisé par OVH, alors que j'ai changé de serveur il y a à peine 2 mois 1/2

et si on veut limiter aussi les JPG, il faut faire 2 lignes de Disallow: ???
 
WRInaute discret
L'analyse des logs montre souvent que ce sont les mêmes images qui consomment de la bande passante (du moins chez moi). Il n'y a pas de solution très simple à utiliser pour l'éviter (?).... à part changer le nom du fichier image...

Il faudrait une procédure automatique qui change les noms des images de temps en temps, avant la google dance par exemple, avec bien sûr changement automatique des liens qui s'y rapportent... :)

amicalement
jmm
 
WRInaute passionné
muratet>oauis mais la c'est chiant de faire ca lol... enfin je me vois mal faire ca sur mes 29Mo d'images..

WebRankInfo>moi pour etre sur j'ai fait:
User-agent: *
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /images/*.jpg$
Disallow: /images/*.gif$
Disallow: /modules/My_eGallery/gallery/Surf/Affiches/*.jpg$
Disallow: /modules/My_eGallery/gallery/Surf/Divers/*.jpg$
Disallow: /modules/My_eGallery/gallery/Surf/fondecran/1024x768/*.jpg$
Disallow: /modules/My_eGallery/gallery/Surf/fondecran/800x600/*.jpg$
Disallow: /modules/My_eGallery/gallery/Surf/Tahiti/*.jpg$
Disallow: /modules/My_eGallery/gallery/Surf/Tubes/*.jpg$
Disallow: /modules/My_eGallery/gallery/Sanssurfeurs/*.jpg$
Disallow: /modules/My_eGallery/gallery/Bodyboard/*.jpg$
Disallow: /images/articles/*.jpg$
Disallow: /images/articles/*.gif$
 
Olivier Duffez (admin)
Membre du personnel
tu l'as fait depuis combien de temps ? as-tu vérifié ce que ça donne dans tes logs ? sinon tiens-nous au courant...
 
Discussions similaires
Haut