Vous utilisez un navigateur non à jour ou ancien. Il ne peut pas afficher ce site ou d'autres sites correctement. Vous devez le mettre à jour ou utiliser un navigateur alternatif.
J'ai remarqué que Yahoo et Yandex suivaient, pour le premier les liens se terminant par ".exe" et le second le ".css".
Est-il possible d'empêcher cela, si oui, comment ?
ce qui est sidérant avec y! c'est qu'il veut absolument référencer le maximum d'url, y compris celles bloquées par robots.txt, alors qu'il est incapable de gérer les pages classiques
il n'affiche alors que le lien, pas de résumé, mais bon, avec robots.txt on souhaiterait que l'url n'apparaisse pas du tout
C'est pareil avec Google... Tu peux avoir une page dont il sait qu'elle existe (parce qu'il y a des liens vers elle) mais qu'il ne peut pas visiter (à cause du robots.txt). La page apparaît alors dans les résultats avec juste son adresse, pas de titre, pas de snippet, pas de cache. Et évidemment seuls les mots-clefs utilisés dans l'ancre des liens permettent de la trouver.
c'est arrivée incidemment sur google et en utilisant la suppression d'url elle disparait en 24h. Pour yahoo, malgré en dizaine de relances (un code 410 renvoyé, le blocage dans le robots.txt), mon url était restée quasiment 1 an dans ses serp
Ok, merci, j'avais déjà ajouté le nofollow mais apparemment sans résultat, peut-être qu'il faut attendre quelques temps .. sinon dans le robots.txt j'ai ajouté ceci Disallow: /*.css$ par contre je ne comprends pas le $ à la fin de l'extension quel est son but ici ?
Le format "standard" du robots.txt n'autorise que des préfixes. Tout ce qui est wildcard, regex, etc n'est interprété que par certains robots, pas forcément tous, et pas forcément de la même façon.
D'ailleurs a priori aucun ne supporte le $ (dans une regex ce serait pour ancrer à la fin, i.e. dire qu'on veut que ça se finisse par css, et pas juste que css peut être n'importe où, mais si c'était une regex ce serait .* et pas * pour "n'importe quel caractère").
Le mieux dans un robots.txt est de s'en tenir à ce qui est standard, i.e. uniquement les préfixes (ou éventuellement le nom complet).