Robots.txt, exclure un mot en fin d'url

Discussion dans 'Débuter en référencement' créé par PierreToo, 8 Février 2013.

  1. PierreToo
    PierreToo Nouveau WRInaute
    Inscrit:
    8 Février 2013
    Messages:
    2
    J'aime reçus:
    0
    Bonjour,

    Je n'arrive pas à trouvé une info clairement expliqué sur ce problème :

    Voila j'ai des url du type :
    mon-site/informations/add.html
    mon-site/decouvrir/add.html

    Est ce que je peux exclure toutes les url contenant le mot "add" avec le robots.txt ?

    Avec cette commande : Disallow:/add/

    Ou est que l'on ne peut exclure uniquement des paramètres se trouvant en début d'url ?
     
  2. 1eB
    1eB WRInaute discret
    Inscrit:
    26 Janvier 2012
    Messages:
    75
    J'aime reçus:
    0
    Bonjour,

    Disallow:/add/ indique que le répertoire /add/ et tout ce qu'il y a en dessous doit être ignoré.

    Pour votre exemple Il faut utiliser :

    Disallow: /*add.html$
     
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 653
    J'aime reçus:
    747
    je précise un détail : si ces URL sont déjà indexées, les bloquer dans le robots.txt ne suffira pas à les faire désindexer : il faudra aussi en faire la demande dans GWT
    ne pas confondre avec la balise meta robots noindex qui sert à interdire l'indexation d'une page
     
  4. PierreToo
    PierreToo Nouveau WRInaute
    Inscrit:
    8 Février 2013
    Messages:
    2
    J'aime reçus:
    0
    Merci à vous pour vos réponses clairs et précises !
     
Chargement...
Similar Threads - Robots exclure mot Forum Date
Exclure certaines pages contenant un mot avec robots.txt Débuter en référencement 15 Avril 2011
Robots : exclure certains mots? Référencement Google 20 Avril 2005
Exclure pages via robots.txt Débuter en référencement 24 Juillet 2012
Que faut il exclure avec le fichier robots.txt? Débuter en référencement 3 Août 2010
Robots.txt exclure tous les spiders sauf les plus gros Administration d'un site Web 22 Juillet 2007
Faut-il exclure le fichier index dans le robots.txt Débuter en référencement 9 Juillet 2007
[regle] peut-on exclure les repertoires // dans robots.txt ? Problèmes de référencement spécifiques à vos sites 11 Janvier 2007
Robots.txt : Exclure toute page sauf "telles pages&quot Problèmes de référencement spécifiques à vos sites 20 Février 2006
Exclure les robots des fichiers de log IIS Administration d'un site Web 20 Janvier 2005
Exclure les robots indésirable : 2 méthodes URL Rewriting et .htaccess 16 Septembre 2003
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021