Empêcher de suivre certains éléments

Discussion dans 'Débuter en référencement' créé par bulle972, 12 Mai 2010.

  1. bulle972
    bulle972 Nouveau WRInaute
    Inscrit:
    13 Avril 2010
    Messages:
    14
    J'aime reçus:
    0
    Bonjour,

    J'ai remarqué que Yahoo et Yandex suivaient, pour le premier les liens se terminant par ".exe" et le second le ".css".
    Est-il possible d'empêcher cela, si oui, comment ?

    Merci :D
     
  2. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 579
    J'aime reçus:
    0
    Mettre des nofollow noindex sur les liens et les ajouter à un robots.txt, peut-être?

    Jacques.
     
  3. Daddyref
    Daddyref WRInaute occasionnel
    Inscrit:
    29 Avril 2010
    Messages:
    288
    J'aime reçus:
    0
    Bonjour,

    Je confirme, la solution fonctionne.
    Sinon tu peux coder les liens de façon à ce que Google ne puisse pas le voir ( style javascript )
     
  4. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    ce qui est sidérant avec y! c'est qu'il veut absolument référencer le maximum d'url, y compris celles bloquées par robots.txt, alors qu'il est incapable de gérer les pages classiques
    il n'affiche alors que le lien, pas de résumé, mais bon, avec robots.txt on souhaiterait que l'url n'apparaisse pas du tout
     
  5. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 579
    J'aime reçus:
    0
    C'est pareil avec Google... Tu peux avoir une page dont il sait qu'elle existe (parce qu'il y a des liens vers elle) mais qu'il ne peut pas visiter (à cause du robots.txt). La page apparaît alors dans les résultats avec juste son adresse, pas de titre, pas de snippet, pas de cache. Et évidemment seuls les mots-clefs utilisés dans l'ancre des liens permettent de la trouver.

    Jacques.
     
  6. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 274
    J'aime reçus:
    0
    c'est arrivée incidemment sur google et en utilisant la suppression d'url elle disparait en 24h. Pour yahoo, malgré en dizaine de relances (un code 410 renvoyé, le blocage dans le robots.txt), mon url était restée quasiment 1 an dans ses serp
     
  7. bulle972
    bulle972 Nouveau WRInaute
    Inscrit:
    13 Avril 2010
    Messages:
    14
    J'aime reçus:
    0
    Ok, merci, j'avais déjà ajouté le nofollow mais apparemment sans résultat, peut-être qu'il faut attendre quelques temps .. sinon dans le robots.txt j'ai ajouté ceci Disallow: /*.css$ par contre je ne comprends pas le $ à la fin de l'extension quel est son but ici ?

    Merci
     
  8. jcaron
    jcaron WRInaute accro
    Inscrit:
    13 Février 2004
    Messages:
    2 579
    J'aime reçus:
    0
    Le format "standard" du robots.txt n'autorise que des préfixes. Tout ce qui est wildcard, regex, etc n'est interprété que par certains robots, pas forcément tous, et pas forcément de la même façon.

    D'ailleurs a priori aucun ne supporte le $ (dans une regex ce serait pour ancrer à la fin, i.e. dire qu'on veut que ça se finisse par css, et pas juste que css peut être n'importe où, mais si c'était une regex ce serait .* et pas * pour "n'importe quel caractère").

    Le mieux dans un robots.txt est de s'en tenir à ce qui est standard, i.e. uniquement les préfixes (ou éventuellement le nom complet).

    Jacques.
     
Chargement...
Similar Threads - Empêcher suivre éléments Forum Date
Empecher GoogleBot de suivre une redirection Débuter en référencement 20 Juillet 2010
[resolu] empecher les robots de suivre un lien externe Netlinking, backlinks, liens et redirections 19 Août 2007
Comment empecher googlebot de suivre un lien ? Netlinking, backlinks, liens et redirections 2 Mai 2004
Empêcher le download mais autoriser la lecture mp3 URL Rewriting et .htaccess 17 Août 2021
WordPress Empêcher le scraping de mon site Administration d'un site Web 19 Novembre 2020
PHP empêcher form onsubmit si formulaire invalide Développement d'un site Web ou d'une appli mobile 29 Juin 2020
Comment empecher google d'indexer "une suite d'URL". Débuter en référencement 8 Mars 2020
Empêcher Googlebot de crawler/indexer tout un dossier Débuter en référencement 19 Avril 2019
désindexer et/ou empêcher crawl ? Crawl et indexation Google, sitemaps 4 Janvier 2019
Patron de Qwant : "Google essaye d'empêcher ..." Autres moteurs de recherche connus 1 Novembre 2018
Empêcher les majuscules dans les URL Débuter en référencement 27 Avril 2018
Empécher indexation Crawl et indexation Google, sitemaps 10 Avril 2018
Comment empêcher les gens de faire du copier coller ? Débuter en référencement 21 Janvier 2018
Empêcher des script javascript d'etre indexer Crawl et indexation Google, sitemaps 13 Mars 2017
Comment empêcher le crawl sur les pages "filter" et "order" Débuter en référencement 20 Janvier 2017
empêcher des caractères comme /?longurlwascutoff_0&& derrière l'url d'un site URL Rewriting et .htaccess 30 Avril 2016
Empêcher l'indexation de mon fichier sitemap Débuter en référencement 29 Avril 2016
empêcher une partie du site de visualisation Développement d'un site Web ou d'une appli mobile 30 Mars 2016
Empêcher google d'utiliser mon formulaire de filtre d'articles ? Développement d'un site Web ou d'une appli mobile 11 Mars 2016
Comment empêcher une page en php d' être partagé sur facebook? Facebook 10 Septembre 2015