fichier xml réfusé par Google

Nouveau WRInaute
Mon fichier xml pour l'indéxation à Google est systématiquement refusé par celui-ci.
Le fichier robot.txt est pourtant valide. L'analyse le confirme : Référence à un plan Sitemap valide détectée.

Mon URL principal : http://www.sportsandmarks.com
mon lien de fichier xml pour Google : http://www.sportsandmarks.com/index.php?option=com_xmap&sitemap=1&view=xml
Mon lien de plan de site : http://www.sportsandmarks.com/index.php?option=com_xmap&sitemap=1

Je ne comprends pas ce qui se passe. Google le refuse par ça : URL à accès restreint par un fichier robots.txt
Nous avons rencontré une erreur en essayant d'accéder à votre sitemap. Assurez-vous que votre sitemap est conforme aux consignes et qu'il est accessible à l'emplacement que vous avez spécifié. Ensuite, essayez de nouveau.
Pourriez-vous m'aider SVP. Merci.

Mon fichier robot.txt :
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/

Sitemap: http://www.sportsandmarks.com/index.php?option=com_xmap&sitemap=1&view=xml
 
WRInaute accro
Il te donne une erreur?

Tu as essayé sans le <?xml-stylesheet...> ? Tu l'as passé à un validateur XML ou de sitemap quelconque?

Jacques.
 
Nouveau WRInaute
Oui il me donne cette erreur :
URL à accès restreint par un fichier robots.txt
Nous avons rencontré une erreur en essayant d'accéder à votre sitemap. Assurez-vous que votre sitemap est conforme aux consignes et qu'il est accessible à l'emplacement que vous avez spécifié. Ensuite, essayez de nouveau.

C'est quoi le <?xml-stylesheet...> ???

Je suis passé par xmap pour joomla qui m'a lui-même donné les liens correspondants.
 
WRInaute accro
Comme quoi avec le message d'erreur ça va nettement plus vite. Ton robots.txt est mal formaté, il y a une ligne vide entre chaque ligne. Enlève-les, et ça devrait marcher beaucoup mieux (mais il faudra peut-être attendre un petit peu que Google télécharge le nouveau fichier).

Jacques.
 
Nouveau WRInaute
Bon, je veux bien le croire. Mais j'ai pourtant vu des tonnes de fichiers identiques à celui-ci. C'est d'ailleurs le fichier "standard" joomla.
 
WRInaute accro
Tu es sûr que ce n'est pas plutôt parce qu'il y a eu un mélange d'édition DOS/Windows (avec des CR+LF) et Unix (avec juste des LF), voire Mac (avec que des CR)? Sinon c'est un peu grave, parce que ce n'est clairement pas un robots.txt conforme.

Jacques.
 
Nouveau WRInaute
Je ne peux que vous dire bravo. C'était bien le fichier robot.txt qui avait en effet des espaces qui n'auraient pas du y être.
C'est réglé. Le fichier xml a été accepté par Google.
Petite question qui traduit mon impatience : j'imagine que ce n'est pas parce que le fichier a été accepté que Google indexe tous les URL d'un coup ?! En l'occurrence, il a vu qu'il y avait 250 URL mais il n'en a pas indexé 1 encore...
 
WRInaute accro
Non, ça lui donne juste des indices de la même façon que s'il trouvait des liens vers ces pages. Il ne les consultera et ne les indexera qu'en fonction de son bon vouloir, i.e. en fonction de l'importance présumée des pages (liée au nombre de liens entrants vers ces pages et/ou le site).

En plus le robots.txt devait logiquement lui interdire d'accéder à ces pages, donc il faut qu'il se rende compte que maintenant il y a droit :)

Jacques.
 
Discussions similaires
Haut