Erreur dans Google Sitemaps à propos de Robots.txt

chucky

WRInaute discret
Bonjour ! Voilà j'utilise Google Sitemaps, et j'ai un message d'erreur qui s'afficher depuis peu :
pour "l'état du plan sitemaps", ya marqué "Robots.txt expiration du délai "; je n'utilise aucun fichier robots.txt ( qui je crois sert à restreindre l'indexation des pages ), je devrais ??
sinon la vérification de site ne marche toujours pas pour moi ( ca doit faire 2 mois bientôt ) et vous ??

merci beaucoup

p.s. mon fichier sitemap est un simple txt rédigé à la main
 

rottman

WRInaute passionné
Salut,

si ton sitemap est le fichier sitemap.txt, normal qu'il n'est pas pris en compte, voici la stucture qu'il faut utiliser :

Code:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="https://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://url1</loc>
</url>
<url>
<loc>http://url2</loc>
</url>
</urlset>

Ta structure est utilisable par Yahoo par contre.
 

jeanluc

WRInaute accro
Ton traitement des erreurs 404 n'est pas bon.

Quand j'essaie d'accéder à http://www.pikkitux.com/robots.txt, je suis renvoyé par une redirection 302 vers http://www.pikkitux.com/doc-not-found.html?refurl=%2Findex.php%3Fq%3Drobots.txt&err=1 qui affiche "Erreur ... 404! ( Page non Trouvée )" pour les humains, mais qui renvoie un code "200 OK" aux robots.

C'est, sans doute, ça qui perturbe ce pauvre Google Sitemaps. :wink:

Jean-Luc
 

jeanluc

WRInaute accro
chucky a dit:
@jeanluc, lis plus attentivement ;) j'avais dit que je n'utilisais pas de fichiers robots.txt
Elle est bonne, celle-là... :roll:

Je n'ai pas dit que tu utilisais un fichier robots.txt, j'ai dit que ton traitement des erreurs 404 n'est pas bon et cela ne peut que pénaliser ton référencement.

Jean-Luc
 

chucky

WRInaute discret
désolé j'avais lu trop vite :), tu pourrais préciser ? en gros tu veux dire que les erreurs 404 ne sont pas considérées comme telles par google ?
sinon j'utilise un CMS, dont je ne bidouille pas trop le code ...


merci
 

jeanluc

WRInaute accro
Ton problème est typique des systèmes où, dans le fichier .htaccess, on a mis
Code:
ErrorDocument  404  http://www.pikkitux.com/doc-not-found.html

La syntaxe correcte est :
Code:
ErrorDocument  404  /doc-not-found.html

As-tu ce genre de ligne dans ton .htaccess ?

Avec ton système, c'est peut-être plus compliqué, car je ne vois pas d'où ils sortent la "query string" (?refurl=%2Findex.php%3Fq%3Drobots.txt&err=1).

Jean-Luc
 

Discussions similaires

Haut