Robot, erreur 404 et redirection

Discussion dans 'Administration d'un site Web' créé par Djails, 1 Juin 2003.

  1. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    bonjour,

    J'ai récemment installé un fichier permettant de gérer les erreurs 404.

    ce fichier (erreur.php) doit normalement me renvoyer l'url de la page qui est demandé (lien mort). et un fichier log et un mail (mais ca ca marche pas chez free).

    j'ai quelque questionnement par rapport a ces résultats, hormis le fait que ce fichier renvoi le nom erreur.php et non l'url brisée, mais ce point n'est pas l'objet du forum (quoique si parmi vous il y en a qui sont au top avec le php chez free je suis preneur ;)

    La question en rapport avec les robots celui de google notamment, mais pas seulement, il y a régulièrement des demandes de ces robots pour des pages inconnues (voir plus haut) cela peut'il avoir ensuite une incidence sur le fait que google m'indexe?

    NB : comme préconisé dans le site j'ai fait un fichier robots.txt vide

    merci

    djails
     
  2. hetzeld
    hetzeld WRInaute passionné
    Inscrit:
    2 Décembre 2002
    Messages:
    1 586
    J'aime reçus:
    0
    Bonjour djails et bienvenue sur WebRankInfo !

    Pas de problème pour les moteurs -dont google- dans la mesure ou ton fichier renvoie bien une entête 404 et non 200 ou 302.
    Vérifie les entêtes d'une de tes pages d'erreur et tu seras fixé. :wink:

    Dan
     
  3. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    bonjour,

    merci de l'accueil :)

    concernant ta réponse quand tu dit entéte ca veut dire head?

    car la page généré se présente en html comme suit :

    "<html>
    <body>
    <p style="color:red"> <font face="arial" size=3 >La page /lesitededjails.free.fr/erreur.php n'existe pas.</p>

    <p>Dans 5 secondes, vous retrouverez automatiquement la page que vous venez de quitter.
    <br>Sinon, cliquez ici : <a href="http://lesitededjails.free.fr/">
    http://lesitededjails.free.fr/ </a>
    </font>
    <meta http-equiv='refresh' content='5;URL=http://lesitededjails.free.fr/'>.</body>
    </html>"

    donc la dedans pas de référence à une erreur 404 me semble t'il

    alors c'est grave docteur?


    Djails

    edit : j'ai modifié le lien "cliquez ici" qui renvoi a une page qui n'existe plus
     
  4. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    593
    J'aime reçus:
    0
    Non, Dan voulait parler de l'en-tête du fichier renvoyé par le serveur web, pas les instructions comprises entre < HEAD > ET < /HEAD >

    Tu peux "agir" sur les informations figurant en en-tête notamment avec la fonction header() en php, ou en utilisant les fichiers .htaccess.
     
  5. Kmacleod
    Kmacleod WRInaute passionné
    Inscrit:
    28 Novembre 2002
    Messages:
    2 456
    J'aime reçus:
    0
    Pour recupérer le nom du lien brisé, il faut que tu l'interroge par une variable
    $HTTP_REFERER par exemple.
    Puisque le mail de Free n'est pas activé, trouve un autre système d'écriture dans un fichier log, ou si tu as un acces chez lycos, le mail y est actif :wink:
     
  6. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    ben mon .htaccess indique que si 404 --> voir erreur.php
     
  7. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    le script (on dit script pour les php?) je l'ai récupéer sur .net et le voici

    <html>
    <body>
    <?php
    $url_origine=$HTTP_REFERER;
    function redirection($url_retour, $temps){
    print("<meta http-equiv='refresh' content='" . $temps . ";URL=".$url_retour ."'>");
    }
    ?>
    <p style="color:red"> <font face="arial" size=3 >La page <?php echo $REDIRECT_URL; ?> n'existe pas.</p>

    <p>Dans 5 secondes, vous retrouverez automatiquement la page que vous venez de quitter.
    <BR>Sinon, cliquez ici : <a href="<?php echo $url_origine ?>">
    <?php echo $url_origine ?>
    </a>
    </font>
    <?
    redirection($url_origine, 5);

    $mail=oui;
    $fichier=oui;
    $fichierlog = "erreurslog.dat";

    // ENVOI D'UN MESSAGE
    if($mail==oui){
    $message = "Adresse IP : $REMOTE_ADDR \n";
    $message .= "Host : $REMOTE_HOST \n";
    $message .= "Navigateur : $HTTP_USER_AGENT \n";
    $DATE=getdate(time());
    $daterreur="le $DATE[mday]/$DATE[mon]/$DATE[year] à $DATE[hours]h$DATE[minutes]\n";
    $message .= $daterreur;
    $message .= "\nErreur 404\nURL demandée : $REDIRECT_URL \nOrigine : $HTTP_REFERER";
    @mail ("monadresse@free.fr","Erreur 404 - $REDIRECT_URL",$message);
    }
    // FIN ENVOI D'UN MESSAGE

    // ENREGISTREMENT DANS UN FICHIER
    if($fichier==oui){
    $logdata .= $daterreur;
    $logdata .= "Page demandée: $HTTP_HOST$REQUEST_URI\n";
    $logdata .= "Page voulue: $REQUEST_URI\n";
    $logdata .= "Page d'origine: $HTTP_REFERER\n";
    $logdata .= "Adresse IP : $REMOTE_ADDR\n";
    $logdata .= "Host: $REMOTE_HOST\n";
    $logdata .= "Navigateur: $HTTP_USER_AGENT\n";
    $logdata .= "Type de requête : $REQUEST_METHOD\n";
    $logdata .= "--------------------\n";

    $fp = fopen("$fichierlog", "a");
    fputs($fp, $logdata);
    fclose($fp);

    }
    //FIN ENREGISTREMENT DANS UN FICHIER

    ?>
    </body>
    </html>


    en tout cas http_referer me renvoi l'url page ou se trouv ele lin cassé mais pas ce lien, je fini par me demander si c possible
     
  8. hetzeld
    hetzeld WRInaute passionné
    Inscrit:
    2 Décembre 2002
    Messages:
    1 586
    J'aime reçus:
    0
    Si tu utilises une directive "ErrorDocument", assures-toi que l'adresse que tu donnes n'est pas une "full URL", sinon tu retourneras un code 200 ou 302.

    ErrorDocument 404 /erreur404.php -> OK, retourne une entête 404
    ErrorDocument 404 http://monsite.tld/erreur404.php -> mauvais... retourne entête 200

    Dan
     
  9. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    le fichier .htaccess est ainsi rédige " ErrorDocument 404 /erreur.php" sans les guillemets évidemment donc si j'ai bien compris ca devrait rouler?
    néanmoins dans certain news on m'a dit que pour free il fallait mettre url entière..
     
  10. Tchinkatchuk
    Tchinkatchuk WRInaute discret
    Inscrit:
    22 Avril 2003
    Messages:
    248
    J'aime reçus:
    0
    De meme pour moi.

    Je recois 50 mails par heure avec soi-disant des 404. Se peut-il que les images renvoient cette erreur (je pense que oui) ?

    N'y a til toujours pas de moyen de trouver l'URL demandée en mettatn quelque chose dans le htaccess par exemple ?

    Merci
     
  11. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    20 669
    J'aime reçus:
    749
    essaie aussi d'afficher les variables $_SERVER['REQUEST_URL'] et $_SERVER['REQUEST_URI'] (je ne sais plus s'il y a une différence)
    au passage, ces variables globales doivent maintenant être accédées via le tableau $_SERVER il me semble
     
  12. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    je n'ai pas vraiment compris,

    en tous cas j'ai toujousr pas l'url de la page demandé et qui est inexistante :(
     
  13. Suede
    Suede WRInaute passionné
    Inscrit:
    4 Octobre 2002
    Messages:
    2 441
    J'aime reçus:
    0
    Salut,
    Essaye aussi $REDIRECT_URL;
    Ca dépend comment est la config de free.

    François
     
  14. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    ben dans mon fichier php c'est déja $REDIRECT_URL qui y est.
    J'ai intérrogé free mais pour l'instant pas de réponses à ma question...

    djails
     
  15. flopigeyre
    flopigeyre Nouveau WRInaute
    Inscrit:
    4 Avril 2006
    Messages:
    1
    J'aime reçus:
    0
    Bonjour,

    Je suis dans le même cas :

    Je suis chez online (free)

    Mon fichier .htaccess contient :
    ErrorDocument 404 /erreur404.php

    Mon fichier erreur404.php me retourne la valeur de REQUEST_URI
    Mais au lieu de me donner l’URL demandée (et mauvaise), REQUEST_URI me retourne /erreur404.php.

    Du nouveau depuis mai 2003 ?!

    Merci de votre aide.
     
  16. Djails
    Djails Nouveau WRInaute
    Inscrit:
    25 Mai 2003
    Messages:
    22
    J'aime reçus:
    0
    j'ai maintenant effectivement lapege demandé mais ca remonte un peu alors le code de mon fichier erruer 404 est
    Code:
          <?php
    $fichier=oui;
    $fichierlog = "erreurslog.dat"; 
    
    // ENREGISTREMENT DANS UN FICHIER
    if($fichier==oui){
    	$DATE=getdate(time());
    	$daterreur="le $DATE[mday]/$DATE[mon]/$DATE[year] à $DATE[hours]h$DATE[minutes]\n";
    
    	$logdata .= $daterreur;
    	$logdata .= "Page demandée: $HTTP_HOST$REQUEST_URI\n";
    	$logdata .= "Page voulue: $REDIRECT_URL\n";
    	$logdata .= "Page d'origine: $HTTP_REFERER\n";
    	$logdata .= "Adresse IP : $REMOTE_ADDR\n";
    	$logdata .= "Host: $REMOTE_HOST\n";
    	$logdata .= "Navigateur: $HTTP_USER_AGENT\n";
    	$logdata .= "Type de requête : $REQUEST_METHOD\n";
    	$logdata .= "--------------------\n";
    
    	$fp = fopen("$fichierlog", "a"); 
    	fputs($fp, $logdata);                                                     
    	fclose($fp);
    
    }
    //FIN ENREGISTREMENT DANS UN FICHIER
    
    ?>
    il y a des infos redondantes mais jen'ai fait le ménage qu'il faudrait que je fisse
     
Chargement...
Similar Threads - Robot erreur 404 Forum Date
/%5C et /\\ dans les log des erreurs 404 des robots Problèmes de référencement spécifiques à vos sites 14 Septembre 2003
Robot.txt et erreur 404 Crawl et indexation Google, sitemaps 19 Juin 2003
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020
Rattraper une erreur robot.txt Crawl et indexation Google, sitemaps 17 Septembre 2016
27 erreurs à éviter sur la meta robots noindex et les URL canoniques Crawl et indexation Google, sitemaps 9 Mai 2016
les erreurs du robot Domain Re-Animator Administration d'un site Web 18 Août 2015
[Robots.txt] Réindéxer un site suite à une erreur dans le fichier robots.txt Crawl et indexation Google, sitemaps 23 Janvier 2015
Robots de Google gênés par erreur FastCGI ? Débuter en référencement 26 Août 2014
Comment corriger des erreurs d'url détectées par le robot de google Problèmes de référencement spécifiques à vos sites 25 Avril 2014
GWT - erreurs d'exploration qui explosent - robots.txt Débuter en référencement 12 Juin 2013
Erreur rencontrée par googlebot dans fichier robots inexistant Crawl et indexation Google, sitemaps 19 Août 2012
Erreur Fichier Robots.txt > désindexation de site Problèmes de référencement spécifiques à vos sites 7 Août 2012
Fichier robots.txt : erreurs d'analyse dans GWT Crawl et indexation Google, sitemaps 19 Janvier 2012
WMT : erreur URL à accès restreint par un fichier robots.txt Crawl et indexation Google, sitemaps 15 Août 2011
Erreurs Fichier Robots.txt Crawl et indexation Google, sitemaps 26 Octobre 2010
[RESOLU] Erreur Google : Impossible d'atteindre robots.txt Problèmes de référencement spécifiques à vos sites 26 Octobre 2008
Erreur GG :URL à accès restreint par robots.txt Crawl et indexation Google, sitemaps 28 Juin 2008
[resolu]erreur 403 sur l'acces au robot.txt et l'index.php Crawl et indexation Google, sitemaps 20 Août 2007
Sitemap sur OSC --> google trouve une erreur robot.txt Crawl et indexation Google, sitemaps 14 Juin 2007
Robots.txt qui fait des erreurs apache Débuter en référencement 7 Septembre 2006