robot.txt

  • Auteur de la discussion Auteur de la discussion benlargo
  • Date de début Date de début
Nouveau WRInaute
Salut,

j'aimerai désindexer toutes les pages de mon site finissant par .php

Est-ce qu'un fichier robot.txt contenant...

User-Agent: *
Disallow: /*.php

... vous semble correct ?

Sinon, quelle est la bonne écriture ?

Merci d'avance :)
 
WRInaute passionné
Selon robotstxt.org:
Note also that regular expression are not supported in either the User-agent or Disallow lines. The '*' in the User-agent field is a special value meaning "any robot". Specifically, you cannot have lines like "Disallow: /tmp/*" or "Disallow: *.gif".
En français, c'est non.
 
Nouveau WRInaute
En gros l'url rewriting a été mit en place pour un site ancien et déjà indexé dont toutes les url ne commencent pas par ../index.php?variable=xxx mais directement par ?variable=xxx

Du coup vu qu'il est impossible d'interdire un certain type de fichier, est-il possible de supprimer toutes les url contenant une variable précise, du style :

User-Agent: *
Disallow: /?variable=*

... ou alors il faut préciser à chaque fois la valeur de la variable et donc l'url précise ?

User-Agent: *
Disallow: /?variable=xxx
Disallow: /?variable=yyy
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut