Robots.txt ok à 100% mais lu comme disallow dans GWT et Bing ?

lebonbuzz · 16 Décembre 2013

Bonjour à tous.

J'ai eu le bonheur de me faire hacker il y a quelques jours, mon fichier robots avait un beau disallow all. Depuis mon fichier robots.txt est mal interprété par GWT !

Mon fichier robots que j'ai pris directement sur wp-referencement : http://www.tohom.fr/robots.txt

Les répertoires importants sont bloqués.

Pourtant dans GWT, si je veux explorer comme google sur n'importe quelle page de mon site, j'obtiens la réponse : Refusée par le fichier robots.txt
SI j'essaye avec Bing : Statut: Représentation de la tentative de téléchargement non effectuée due à un problème de courtoisie.

Alors, que puis-je faire ? Un script a peut-être été placé sur mon serveur virtuel mais où ? Un conseil pour me driver ?

Merci d'avance

Koxin-L.fr · 16 Décembre 2013

Tu as testé avec un fichier robots vierge ?

lebonbuzz · 16 Décembre 2013

Oui mais rien à faire, peu importe le contenu de mon fichier robots.txt sur le ftp, j'aurai toujours ça :

http://www.hostingpics.net/viewer.php?id=687782robots.png

User-Agent DISALLOW

Merci pour ton aide.

spout · 16 Décembre 2013

Tu utilises cloudflare, par hasard, c'est pas un des CDN qui renvois pas la même chose ?

lebonbuzz · 16 Décembre 2013

spout a dit:
Tu utilises cloudflare, par hasard, c'est pas un des CDN qui renvois pas la même chose ?

Bonjour Spout,

C'est une possibilité, du coup, j'ai vidé le cache Cloudflare, c'est une possibilité mais pour pouvoir en être sûr, je vais devoir attendre jusqu'à 48 heures...

Google précise :
Impossible d'explorer la page pour le moment, car celle-ci est bloquée par la dernière version du fichier robots.txt téléchargé par Googlebot. Sachez que si vous avez mis à jour le fichier robots.txt dernièrement, son actualisation peut prendre jusqu'à deux jours.

La dernière version téléchargée par Google date du 14 décembre. Par contre, quand je teste une url avec le fichier robots pas de problème.

Que dois-je faire? Attendre ?

En tout cas, merci pour le coup de main

lebonbuzz · 17 Décembre 2013

Bonjour.

Pour vous informer, j'ai désactiver le cache, google est venu crawler, le fichier robots.txt est désormais correct.

Merci à vous !

Koxin-L.fr · 18 Décembre 2013

Le cache de quoi ? Du cloud ?
C'est un peu le but de réinitialiser le cache quand on fait des modif, non ?