Robots.txt: interdire un dossier mais autoriser une page de ce dossier

Discussion dans 'Crawl et indexation Google, sitemaps' créé par niou142, 3 Février 2016.

  1. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Bonjour tout le monde,

    J'ai une petite question concernant un site qui tourne sous Prestashop.

    Dans mon robots.txt, je refuse tout ce qui se trouve dans 'module' ce qui me donne :
    Code:
    Disallow: /*modules/
    Mais j'aimerai tout de même permettre à Google de prendre en compte 2 pages contenues dans ce dossier.

    J'ai tenté ceci:

    Code:
    Allow: /modules/sousdossier/mapage.php
    Disallow: /*modules/
    Via Search Console, j'ai testé ce petit bout de code mais cela me dit que ma page est en disallow (j'ai tenté en inversant l'ordre des deux ligne).

    Savez-vous comment procéder pour que cela fonctionne svp ?
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 969
    J'aime reçus:
    121
    C'est l'inverse qu'il convient de faire (et je vois difficilement l'intérêt de l'* dans ce cas) :

    Code:
    Disallow: /modules/
    Allow: /modules/sousdossier/mapage.php
    
     
  3. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Ah d'accord cela provient donc de l'étoile.

    Histoire de ne me coucher moins bête, pouvez-vous svp me dire quelle est la différence entre Disallow: /modules/ et Disallow: /*modules/.

    Merci UsagiYojimbo et Heddy pour votre aide :) !
     
  4. Furtif
    Furtif WRInaute accro
    Inscrit:
    9 Août 2005
    Messages:
    2 949
    J'aime reçus:
    311
  5. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Oui c'est bon ça fonctionne bien merci :)
     
Chargement...
Similar Threads - Robots interdire dossier Forum Date
Interdire un dossier sans htaccess no robots.txt ? Débuter en référencement 27 Février 2007
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
Interdire l'acces au fichier Robots Débuter en référencement 13 Février 2012
Interdire des pages dynamiques dans robots.txt Débuter en référencement 18 Mai 2010
Robots.txt Interdire une serie d'url issue d'une page avec paramètres Débuter en référencement 29 Avril 2010
Robots.txt interdire une url dynamique Débuter en référencement 24 Juin 2009
Interdire aspirateur et bot via le robots.txt Développement d'un site Web ou d'une appli mobile 10 Avril 2009
Interdire tous les robots sauf quelques uns Débuter en référencement 14 Avril 2008
Robots.txt : interdire tout sauf la racine Référencement Google 27 Janvier 2008
Robots.txt et url rewriting sur phpbb interdire profil URL Rewriting et .htaccess 15 Mars 2004
Interdire certains robots ? Comment ? Quels robots ? URL Rewriting et .htaccess 16 Décembre 2003
Robots.txt : interdire une partie de mon site Tests et études de cas 6 Août 2003
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021