Empêcher de suivre certains éléments

Nouveau WRInaute
Bonjour,

J'ai remarqué que Yahoo et Yandex suivaient, pour le premier les liens se terminant par ".exe" et le second le ".css".
Est-il possible d'empêcher cela, si oui, comment ?

Merci :D
 
WRInaute accro
Mettre des nofollow noindex sur les liens et les ajouter à un robots.txt, peut-être?

Jacques.
 
WRInaute occasionnel
Bonjour,

Je confirme, la solution fonctionne.
Sinon tu peux coder les liens de façon à ce que Google ne puisse pas le voir ( style javascript )
 
WRInaute accro
ce qui est sidérant avec y! c'est qu'il veut absolument référencer le maximum d'url, y compris celles bloquées par robots.txt, alors qu'il est incapable de gérer les pages classiques
il n'affiche alors que le lien, pas de résumé, mais bon, avec robots.txt on souhaiterait que l'url n'apparaisse pas du tout
 
WRInaute accro
C'est pareil avec Google... Tu peux avoir une page dont il sait qu'elle existe (parce qu'il y a des liens vers elle) mais qu'il ne peut pas visiter (à cause du robots.txt). La page apparaît alors dans les résultats avec juste son adresse, pas de titre, pas de snippet, pas de cache. Et évidemment seuls les mots-clefs utilisés dans l'ancre des liens permettent de la trouver.

Jacques.
 
WRInaute accro
c'est arrivée incidemment sur google et en utilisant la suppression d'url elle disparait en 24h. Pour yahoo, malgré en dizaine de relances (un code 410 renvoyé, le blocage dans le robots.txt), mon url était restée quasiment 1 an dans ses serp
 
Nouveau WRInaute
Ok, merci, j'avais déjà ajouté le nofollow mais apparemment sans résultat, peut-être qu'il faut attendre quelques temps .. sinon dans le robots.txt j'ai ajouté ceci Disallow: /*.css$ par contre je ne comprends pas le $ à la fin de l'extension quel est son but ici ?

Merci
 
WRInaute accro
Le format "standard" du robots.txt n'autorise que des préfixes. Tout ce qui est wildcard, regex, etc n'est interprété que par certains robots, pas forcément tous, et pas forcément de la même façon.

D'ailleurs a priori aucun ne supporte le $ (dans une regex ce serait pour ancrer à la fin, i.e. dire qu'on veut que ça se finisse par css, et pas juste que css peut être n'importe où, mais si c'était une regex ce serait .* et pas * pour "n'importe quel caractère").

Le mieux dans un robots.txt est de s'en tenir à ce qui est standard, i.e. uniquement les préfixes (ou éventuellement le nom complet).

Jacques.
 
Discussions similaires
Haut