Balise Robots, utile ou pas?

Nouveau WRInaute
Dieu sait si sur ce sujet j'ai lu mille fois que cette balise ne servait à rien si elle était du genre :
<META NAME="robots" CONTENT="index,follow">

Or, je la trouve partout, et même sous d'autre formes, genre <META NAME="robots" CONTENT="index,follow,all"> et inversement , alors qu'en plus le délicieux "Google, truc de pros" indiquait qu'il n'y avait que 2 attributs à cette balise...

Est-ce que quelqu'un pourrait m'éclairer?
 
WRInaute accro
Puce Galactique a dit:
Dieu sait si sur ce sujet j'ai lu mille fois que cette balise ne servait à rien si elle était du genre :
<META NAME="robots" CONTENT="index,follow">
Pour la 1001-ème fois, je confirme qu'elle ne sert à rien. :wink:

Pour plus de précisions, voir http://www.annuaire-info.com/robots/meta.html .

Jean-Luc
 
WRInaute accro
vpx a dit:
Google ne prend pas en compte les restrictions de cette balise. Par exemple:
http://72.14.207.104/search?sourceid=na ... Flogin.php


Pour ce que je vois:

Code:
<meta name="robots" content="noindex, nofollow">

:arrow: Ne pas indexer
:arrow: Ne pas suivre les liens

Cette page n'est pas indexée, et j'en veux pour preuve une recherche sur son url: http://72.14.207.104/search?hl=fr&q=%22 ... p%22&meta=

Par contre, vu que "NOARCHIVE" n'est pas indiqué, je suppose que c'est la raison pour laquelle la page est "EN CACHE" ;)
http://72.14.207.104/search?sourceid=na ... Flogin.php
 
WRInaute impliqué
HawkEye_TpfH a dit:
Par contre, vu que "NOARCHIVE" n'est pas indiqué, je suppose que c'est la raison pour laquelle la page est "EN CACHE" ;)
Est ce que rajouter NOARCHIVE dans cette META permet d'éviter de mettre en cache la page ?

Quelle est l'utilité d'éviter la mise en cache ?
 
WRInaute accro
Perso je n'utilise pas la balise robots, puisque je n'ai rien à "ne pas indexer"; mais il me semble avoir lu qqpart que NOARCHIVE "contrôle" la présence en cache.

Petit rappel: tout ceci n'est valable que pour les robots qui se conforment à la balise robots (ou à robots.txt, même problème).
 
WRInaute accro
HawkEye_TpfH a dit:
Pour ce que je vois:

Code:
<meta name="robots" content="noindex, nofollow">
:arrow: Ne pas indexer
:arrow: Ne pas suivre les liens

Cette page n'est pas indexée, ...

Par contre, vu que "NOARCHIVE" n'est pas indiqué, je suppose que c'est la raison pour laquelle la page est "EN CACHE"
Je confirme ton interprétation.

Pour faire des tests, j'avais mis ceci dans une page en novembre 2005:
Code:
<META NAME="robots" CONTENT="noindex">
La page est disparue de l'index Google après "un certain temps", mais je viens de vérifier sa présence en cache et elle est bien en cache! 8O

Jean-Luc
 
Discussions similaires
Haut