Googlebot visite des pages qui n'existent pas

Nouveau WRInaute
Bonjour,

J'ai dans mes logs les visites régulières de googlebot mais là je viens de remarquer des visites sur les pages suivantes :

wbessrzrh.html
kopekisss.html
irsksuygqi.html
wbessrzrh.html

Bien sur il reçoit une réponse 404 car ces pages n'ont jamais existé !

IL bugue ou il recherche ma page 404

Merci
 
WRInaute occasionnel
Les dangers de l'url rewrting...

Si quelqu'un fait un lien vers la page

www.example.com/dsfsfdqsf.html,

Google la référence, c'est normal puisqu'elle existe grace a l'url rewriting.

Vérifie, si tu peux, que personne ne fait de lien vers cette page, installe une petite sécurité sur ton script pour empecher ce genre de problemes.

Ca peut etre tres penalisant...


Maxib.
 
WRInaute occasionnel
Ca ne sert a rien de les bloquer avec le robots.txt, visiblement, ces nmos de pages sont générés automatiquement, alors il bloque celles la, et il faudra qu'il bloque les suivantes, jusqu'a avoir un fichier robots.txt de 500Mo...

Non, il faut qu'il se fasse un petit script, qui redirige vers une page 404 sur toutes les pages qui sont inconnues. C'est du 4-5 lignes de php max.


Maxib.
 
WRInaute impliqué
Pourquoi ce serait du à l'UR ?
Ce n'est pas plutôt du à une gestion des 404 mal configurée ? (genre 'ErrorDocument 404 adresse absolue' qui génère une 301)

Si kasteliane nous donne l'adresse de son site, on pourra lui dire si c'est cela qui ne va pas...
 
Nouveau WRInaute
Bonjour,
Avait un WE prolongé dsl de répondre si tardivement. L'url de mon site est biographe en .com

J'ai ceci dans mon fichier log :
2005-06-09 01:42:26 213.41.125.4 GET /biographe.com/euplsualmg.html - 80 - 66.249.65.41 Mozilla/5.0+(compatible;+Googlebot/2.1;++https://www.google.com/bot.html) - - 404 0 2 1042

J'ai de l'url rewriting (sous windows) pour les domaines

Merci
Kasteliane
 
WRInaute impliqué
Kasteliane, ta gestion des 404 est bien configurée, on reçoit un beau 404 tout propre.
Donc, tu as certainement quelq'un qui a placé des liens vers ces pages inexistantes. Mais bon, pas de quoi s'inquièter tant que tu renvoies des bons codes en retour (404).
 
Discussions similaires
Haut