robots.txt avec Disallow:/*.php

Discussion dans 'Débuter en référencement' créé par saluts92, 23 Juin 2018.

  1. saluts92
    saluts92 WRInaute impliqué
    Inscrit:
    12 Avril 2006
    Messages:
    828
    J'aime reçus:
    32
    Bonjour,

    Dans mes pages html, j'ai plusieurs fonctions ajax (javascript) qui font appel à des programmes formattés du genre /mon-pgm-.php

    j'ai vu que Google les avaient tous indexés
    j'ai donc rajouté la ligne suivante dans mon fichier robots.txt puis demandé une désindexation de ces qqes pages :
    Disallow:/*.php

    Mais j'ai la question suivante : peut il y avoir un impact sur ma page d'accueil (index.php)
    Ma page d'accueil est indéxé avec l'url suivante "/" (sans index.php)

    sachant que toutes mes autres pages sont nommées xxxxx.html (puis rewrité dans mon htaccess)
     
  2. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 105
    J'aime reçus:
    283
    Bonjour,

    noindex.

    N'hésitez pas entre deux messages à présenter vos avis sur les sujets : ici.

    Temps de réponse : 1 minute.
    Cordialement.
     
  3. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
    +1. En correctif, toujours préférer noindex. En bloquant avec le robots, vous aller empêcher le moteur de revenir dessus, vous n'aller pas désindexer ce qui l'a déjà été.

    S'agissant de pages chargées en asynchrone (a priori), le plus simple serait de forcer le noindex via le header, à mon sens.
     
  4. saluts92
    saluts92 WRInaute impliqué
    Inscrit:
    12 Avril 2006
    Messages:
    828
    J'aime reçus:
    32
    merci, mais j'ai désindexé avec l'outil de "Google search console" "URL à supprimer"
     
  5. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 887
    J'aime reçus:
    74
    Ta ligne n'aura un impact que sur les url dont l'url réelle est en .php.
     
  6. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 105
    J'aime reçus:
    283
    Bonjour,
    Remove URLs Tool.

    Noindex.

    Temps de réponse : 5 minutes.
    Cordialement.
     
  7. saluts92
    saluts92 WRInaute impliqué
    Inscrit:
    12 Avril 2006
    Messages:
    828
    J'aime reçus:
    32
    arrete de répondre, on ne te comprends pas
     
  8. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 105
    J'aime reçus:
    283
    Bonjour,

    Pour les humains :
    Donc :
    Sachant que pour l'outil de Google Search Console "URL à supprimer" :
    Lien Google explicatif.

    Edit - Spoiler : Les robots ne prennent pas toujours en compte le robots.txt .

    Temps de réponse : 10 minutes.
    Cordialement.
     
    #8 Madrileño, 30 Juin 2018
    Dernière édition: 30 Juin 2018
  9. saluts92
    saluts92 WRInaute impliqué
    Inscrit:
    12 Avril 2006
    Messages:
    828
    J'aime reçus:
    32
    Madrinelo, avant de répondre lit le post de départ, tu t'égares systématiquement
     
  10. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 105
    J'aime reçus:
    283
    Bonjour,

    Au temps pour moi, je remarque qu'on c'est tous focalisé sur l'autre problématique. :oops:
    Non, c'est bon, c'est le / qui est utilisé et non pas index.php .

    Temps de réponse : 5 minutes.
    Cordialement.
     
    #10 Madrileño, 30 Juin 2018
    Dernière édition: 30 Juin 2018
Chargement...
Similar Threads - robots Disallow php Forum Date
Sites de test indexés malgré Disallow dans robots.txt Crawl et indexation Google, sitemaps 7 Juin 2019
Robots.txt et syntaxe de Disallow Crawl et indexation Google, sitemaps 2 Juin 2017
Balise Noindex ou Disallow dans robots.txt Référencement Google 15 Septembre 2015
Robots.txt + sous domaine disallow Débuter en référencement 11 Août 2014
Page de liens spécifiées disallow dans le robots.txt Netlinking, backlinks, liens et redirections 18 Mars 2014
Robots.txt ok à 100% mais lu comme disallow dans GWT et Bing ? Crawl et indexation Google, sitemaps 16 Décembre 2013
Disallow robots.txt et pages sattellites Crawl et indexation Google, sitemaps 19 Juillet 2012
Disallow fichiers robots de facebook Débuter en référencement 16 Juillet 2012
Robots.txt : Disallow des pages sport-xxxx.html sans Disallow de sport-equestre.html Administration d'un site Web 8 Décembre 2010
Robots.txt Disallow:repertoire mais pas une URL Crawl et indexation Google, sitemaps 30 Octobre 2010