Page erreur 404 : savoir quelle était la page demandée ?

WRInaute accro
Bonjour

Tout est dans le titre... En analysant mes stats serveur, je me suis aperçu que j'avais eu 8000 affichages de ma page 404.htm sur mon site principal depuis le début du mois 8O

(à priori ça dure depuis un certain temps, je n'y avais pas fait gaffe)


Par contre je n'ai AUCUNE ancienne page ayant changé, celles qui ont été renommées sont rewritées systématiquement : je ne comprends pas !

Y-a-t-il moyen de savoir quelles url ont été demandées ? Histoire de tracer les sources d'erreur ?


Merci
 
WRInaute passionné
En php, la vairable $REQUEST_URI donne la page qui a été demandé. Reste à les mémoirser. Ou, ce que je fais au début de mes sites, je m'envoi un mail a chaque erreur 404.
 
WRInaute accro
arnaudmn a dit:
En php, la vairable $REQUEST_URI donne la page qui a été demandé. Reste à les mémoirser. Ou, ce que je fais au début de mes sites, je m'envoi un mail a chaque erreur 404.
ne pas oublier de s'envoyer aussi HTTP_REFERER pour, éventuellement, modifier une url oubliée dans une page :wink:
 
WRInaute accro
ensuite, 3 possibilités :
1) ajouter une règle pour chaque dans le htaccess
2) supprimer ce lien dans les pages du site (ou le demander si externe)
3° supprimer cette url des moteurs (gg facile, yahoo très difficile), éventuellement en renvoyant un 410
 
WRInaute discret
Bonjour Cédric,
Bien sur on peut rediriger vers l'index.
Pour ma part j'ai choisi une page 404 personnalisée, qui de plus m'envoie un mail à chaque fois (sauf une liste d'url).

Il y a bien longtemps que cela ne décèle plus de liens rompus. Mais je reçois toujours pas mal de mails... Plus de 200 ces 30 derniers jours :

Plus de 150 tentatives d'inscription à un forum par des robots, ou tentatives de poster, ou autre tentatives d'arnaques.
Cela arrive en général par salve de plusieurs, correspondant aux divers types de scripts de forums possibles, exemples :
/forum/profile.php?mode=register
/forum/register.php?action=signup&who=adult
/liens/index.php?act=Reg&CODE=00
Forcément je n'ai pas tout ça à la fois (surtout que j'ai renommé la page) alors ça fait des 404.
De surcroît, beaucoup ont des adresses mal reconstituées (plusieurs fois le NDD de suite) ou cherchent dans le mauvais répertoire...
J'observe la même chose sur un site sans forum et où la seule page non statique est ma page 404 personalisée.

Plus 4 probables tentatives de crackers, du genre
/index.php?file=http://www.example.com.br/MesBoVirus/cse.jpg?

Et plusieurs dizaines de divers 404 avec souvent un bout de chaine collé à la fin du .htm :
/bulletin/149-7.htm&sa=X&oi=translate&resnum=82&ct=result&prev=/search%3Fq%3Dcedre
Rarement c'est mal tapé à la main :
/saison/feyrier.htm

Pour peu qu'un aspirateur ne sachant pas reconstituer proprement une adresse relative passe par là, les 404 s'emballent. Il m'est arrivé une fois de devoir bannir une IP pour ça.

Pascal :)
 
WRInaute discret
arnaudmn a dit:
En php, la vairable $REQUEST_URI donne la page qui a été demandé. Reste à les mémoirser. Ou, ce que je fais au début de mes sites, je m'envoi un mail a chaque erreur 404.

sur lycos ceci me renvoi le nom de la page d'erreur et pas le lien qui a renvyer sur cette page d'erreur:

Code:
$vr_lien_envoi_error404 = $REQUEST_URI; // On créer la variable qui récupere le lien qui a renvoyer ver la page d'erreur avec "$REQUEST_URI"
 echo $vr_lien_envoi_error404;
 
Discussions similaires
Haut