Robots.txt: interdire un dossier mais autoriser une page de ce dossier

Discussion dans 'Crawl et indexation Google, sitemaps' créé par niou142, 3 Février 2016.

  1. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Bonjour tout le monde,

    J'ai une petite question concernant un site qui tourne sous Prestashop.

    Dans mon robots.txt, je refuse tout ce qui se trouve dans 'module' ce qui me donne :
    Code:
    Disallow: /*modules/
    Mais j'aimerai tout de même permettre à Google de prendre en compte 2 pages contenues dans ce dossier.

    J'ai tenté ceci:

    Code:
    Allow: /modules/sousdossier/mapage.php
    Disallow: /*modules/
    Via Search Console, j'ai testé ce petit bout de code mais cela me dit que ma page est en disallow (j'ai tenté en inversant l'ordre des deux ligne).

    Savez-vous comment procéder pour que cela fonctionne svp ?
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 942
    J'aime reçus:
    80
    C'est l'inverse qu'il convient de faire (et je vois difficilement l'intérêt de l'* dans ce cas) :

    Code:
    Disallow: /modules/
    Allow: /modules/sousdossier/mapage.php
    
     
  3. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Ah d'accord cela provient donc de l'étoile.

    Histoire de ne me coucher moins bête, pouvez-vous svp me dire quelle est la différence entre Disallow: /modules/ et Disallow: /*modules/.

    Merci UsagiYojimbo et Heddy pour votre aide :) !
     
  4. Furtif
    Furtif WRInaute accro
    Inscrit:
    9 Août 2005
    Messages:
    2 935
    J'aime reçus:
    279
  5. niou142
    niou142 WRInaute occasionnel
    Inscrit:
    5 Octobre 2009
    Messages:
    292
    J'aime reçus:
    0
    Oui c'est bon ça fonctionne bien merci :)
     
Chargement...
Similar Threads - Robots interdire dossier Forum Date
Interdire l'acces au fichier Robots Débuter en référencement 13 Février 2012
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020