[PB Indexation] Robots.txt et sitemap.xml

Discussion dans 'Crawl et indexation Google, sitemaps' créé par Matt3738, 5 Février 2014.

  1. Matt3738
    Matt3738 Nouveau WRInaute
    Inscrit:
    5 Février 2014
    Messages:
    3
    J'aime reçus:
    0
    Bonjour à tous,

    J'ai donc mis en ligne un nouveau site la semaine dernière. http://pandadub.fr/

    Problème classique, lorsque j'envoie mon sitemap.xml à google, j'obtiens cette erreur :
    Le sitemap contient des URL qui sont bloquées par le fichier robots.txt

    Et ce pour l'intégralité de mes pages (18 pages)

    Pourtant, mon robots.txt semble OK.

    URL robots.txt : http://pandadub.fr/robots.txt
    URL sitemap : http://pandadub.fr/sitemap.xml

    Si quelqu'un peut regarder mes fichiers et m'éclairer.... ce serait très sympa.

    Merci beaucoup

    Bonne journée,

    matt
     
  2. webac
    webac WRInaute occasionnel
    Inscrit:
    4 Mars 2005
    Messages:
    385
    J'aime reçus:
    0
  3. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 807
    J'aime reçus:
    259
    Bienvenue sur WRI !

    refais ton robots.txt qui contient plein de lignes en trop : "allow" ne fait pas partie du standard initial, ça ne sert à rien de les mettre. A moins que tu aies confondu avec disallow ?

    ensuite, déclare ton sitemap dans GWT et pas dans le robots.txt

    si besoin, lis mon tuto sur le sitemap XML
     
  4. Matt3738
    Matt3738 Nouveau WRInaute
    Inscrit:
    5 Février 2014
    Messages:
    3
    J'aime reçus:
    0
    Merci pour vos réponses,

    En fait, à la base, mon robots.txt était tout simple

    Et google refusait mon sitemaps

    C'est pourquoi j'ai rajouté les ligne Allow, car Google me disait que mon sitemap était bloqué par robots.txt

    Suite à mes lignes Allow, Google a accepté mon sitemap mais m'indique que toutes mes pages sont bloquées par mon robots.txt
     
  5. Matt3738
    Matt3738 Nouveau WRInaute
    Inscrit:
    5 Février 2014
    Messages:
    3
    J'aime reçus:
    0
    En fait, ça vient peut être de là :

    "Googlebot n'a pas pu accéder à votre fichier robots.txt et a différé l'exploration de votre site plutôt que de risquer d'explorer des URL non autorisées."

    D'où cette erreur peut elle venir ?
     
Chargement...
Similar Threads - [PB Indexation] Robots Forum Date
[PB] Installation AdWords Editor Google : l'entreprise, les sites web, les services 20 Octobre 2010
[PBM] Dossier virtuel URL Rewriting et .htaccess 9 Mars 2009
[Soucis indexation] Classement page indexée + désindexation + 404 Crawl et indexation Google, sitemaps 21 Juillet 2014
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice