Bloqué par le fichier robots.txt

WRInaute impliqué
:( google me refuse l'indexation d'un sous-domaine à cause du fichier robots.txt qui contiendrait (selon leur test) une interdiction pour ce répertoire précis .... après vérification elle existait bien, tant que cela était en 'travail' mais elle a été supprimée et continue d' apparaître dans la vérificaton et de poser problème ...
:oops: à quand la solution ?
@mitiés
b g
 
WRInaute occasionnel
Je te conseille d'aller faire un tour dans le compte webmaster si tu n'es pas passé par là et de faire une vérification de ton site, ensuite tu verras apparaître ce que Google voit dans ton fichier .txt si ça ne correspond pas fichier en ligne ça te permettra de t'aiguiller sur les manoeuvres à entreprendre... Sache aussi que certaines redirections 404 empêchent la vérification des sites par google et perturbe sa lecture du fichier robots.txt...
 
WRInaute impliqué
titifrim a dit:
Je te conseille d'aller faire un tour dans le compte webmaster si tu n'es pas passé par là et de faire une vérification de ton site, ensuite tu verras apparaître ce que Google voit dans ton fichier .txt si ça ne correspond pas fichier en ligne ça te permettra de t'aiguiller sur les manoeuvres à entreprendre... Sache aussi que certaines redirections 404 empêchent la vérification des sites par google et perturbe sa lecture du fichier robots.txt...
:cry: ben c'est justement ce que j'ai fait ! et google conserve dans "sa" vue du fichier une interdiction qui n'existe plus !!!
là je coince ...
@mitiés
b g
 
WRInaute impliqué
complément

j'ai ceci dans mon compte google:

http://blog.unesourisetmoi.info/robots.txt
Dernier téléchargement 3 juillet 2007 02:15:04 PDT
État 404 (Introuvable)
et il suffit de ckiquer sur ce lien et j'obtiens bien la page voulue avec ceci:
User-agent: *
disallow: /logs/

donc normalement ce devrait être bon ...
mais si ici j'essaie d'ouvrir le même lien pour voir s'il existe et sans erreur !!!
http://blog.unesourisetmoi.info/robots.txt/
le message d'erreur 404 y est !!!!!!!!

:?: je craque !
 
WRInaute occasionnel
As-tu la main sur les erreurs 404, ça passe par un fichier .htaccess ? a mon avis le problème se situe plus au niveau du .htaccess...
 
WRInaute accro
Ajoute un retour charriot (touche [ENTEE] si tu préfères...) à la dernière ligne "non vide".

Au lieu de ceci:

Code:
User-agent: *
disallow: /logs/

ça fera ceci:

Code:
User-agent: *
disallow: /logs/

Ca devrait règler le problème ;)
 
WRInaute impliqué
titifrim a dit:
As-tu la main sur les erreurs 404, ça passe par un fichier .htaccess ? a mon avis le problème se situe plus au niveau du .htaccess...
:evil: ben je n'ai pas de fichier de ce genre à la racine de ce lien !?!
@+
b g
 
WRInaute impliqué
HawkEye a dit:
Ajoute un retour charriot (touche [ENTEE] si tu préfères...) à la dernière ligne "non vide".

Au lieu de ceci:

Code:
User-agent: *
disallow: /logs/

ça fera ceci:

Code:
User-agent: *
disallow: /logs/

Ca devrait règler le problème ;)
merci j'ai fait la manip (en plus aussi sur le fichier à la racine du site principal ... au cas où !) j'ai raffraichi la page de google et j'ai toujours ceci:
robots.txt URL http://blog.unesourisetmoi.info/robots.txt
Dernier téléchargement 3 juillet 2007 02:15:04 PDT
État 404 (Introuvable) [?]
comprends raiment pas !
@+
b g
 
WRInaute impliqué
Re: complément

HawkEye a dit:
bg62 a dit:
donc normalement ce devrait être bon ...
mais si ici j'essaie d'ouvrir le même lien pour voir s'il existe et sans erreur !!!
http://blog.unesourisetmoi.info/robots.txt/
le message d'erreur 404 y est !!!!!!!!

:?: je craque !

/robots.txt/ ? :?

sans le slash ça ira mieux :)


--> http://blog.unesourisetmoi.info/robots.txt
:wink: merci ... petite erreur ! mais si l'on clique sur le lien (corrigé) il est bien valable ... :twisted: alors là !
@+
b g
 
WRInaute impliqué
Attendre un peu peut-être,
s'assurer aussi de la date du fichier robot.txt faire un touch si necessaire.
 
WRInaute impliqué
je tourne bourrique

je viens de lancer la vérification de nouveau, voici ce que j'ai eu:
Résultats URL
URL Googlebot
http://blog.unesourisetmoi.info/ Autorisé
Identifié comme répertoire ; certains fichiers peuvent être soumis à des restrictions différentes.
http://blog.unesourisetmoi.info/robots.txt Autorisé

et pourtant en haut de page j'ai toujours ceci:
Analyse du fichier robots.txt en cache [?]
Merci.
Évaluer cet outil:
robots.txt URL http://blog.unesourisetmoi.info/robots.txt
Dernier téléchargement 3 juillet 2007 02:15:04 PDT
État 404 (Introuvable) [?]
:? je commence vraiment à me poser des questions ....
@mitiés
b g
 
WRInaute impliqué
C'est la commande linux pour modifier la date d'un fichier je lance cette piste au cas ou car ce qui t'arrive est bizarre cela forcera peut-être google à une nouvelle fraicheur...
 
WRInaute accro
tu n'as qu'à créer un robots.txt vide, ça devrait le faire.
J'avais eu un problème comme cela avec la console et 2 jours après c'était résolu, même s'il me marquait encore des fichiers bloqués par le robots.txt ce qui n'était plus vrai.
 
WRInaute impliqué
Leonick a dit:
tu n'as qu'à créer un robots.txt vide, ça devrait le faire.
J'avais eu un problème comme cela avec la console et 2 jours après c'était résolu, même s'il me marquait encore des fichiers bloqués par le robots.txt ce qui n'était plus vrai.
:wink: merci je vais essayer !
mais s'il y a toujours un signalement d'erreurs ... comment savoir si cela a une incidence ou pas ?
@+
b g
 
WRInaute impliqué
patience ...

:? apparemment c'est la solution de 'patience' qui devait être la bonne, car aujourd'hui, j'ai ceci:
robots.txt URL http://blog.unesourisetmoi.info/robots.txt
Dernier téléchargement 3 juillet 2007 13:06:59 PDT
État 200 (Opération effectuée)
avec:
User-agent: *
disallow: /logs/
détecté dans le fichier robots.txt ce qui est bon ...
il y a trois pages indexées dans google, pour l'instant, mais sans "google preview" ....
@ suivre ...
@mitiés
b g
 
Discussions similaires
Haut