Cette page recherchée par Google n'existe pas

WRInaute occasionnel
Bonjour à tous.

Régulièrement, je trouve dans les erreurs 404 des appels du robot de Google du genre :

PROVENANCE : Pas de moteur reconnu. La connexion est directe.
PAGE : /aides/fiche6.php:1hz8zdoa
NAVIGATEUR : Mozilla/5.0 (compatible; Googlebot/2.1; +https://www.google.com/bot.html)
HÔTE : 66.249.66.142
IP : 66.249.66.142
NOM DE DOMAINE : crawl-66-249-66-142.googlebot.com


Le :1hz8zdoa mis en suffixe rend l'URL impropre.
Le lendemain, Google me signale une erreur d'exploration.

1. D'où vient ce genre d'URL farfelue ?
2. Comment les éviter ?

À noter qu'aucune URL du site ne possède d'arguments.

Merci pour vos explications.
 
WRInaute passionné
dans GWT tu n'as pas d'indication de page contenant ces liens ?

si tu ne trouves pas l'origine tu peux ajouter une redirection automatique :
Code:
#redirection url.phpnimportequoi vers url.php
RewriteRule (.*\.php).+$ /$1 [R=301,L,NC]
 
WRInaute impliqué
N'hésite pas aussi à fouiller dans le fichier journal de ton serveur pour étudier cela de plus prêt.
Regarde aussi le source de tes pages, c'est peut-être des liens qui sont mal formée ou qui ne sont pas visible depuis le navigateur (quelque fois des copier coller ou des fckedit mal nettoyés), mais qui sont bien sûr vus par GG puisqu'il travaille lui avec le code html.
 
WRInaute occasionnel
Cela fait un moment que je me demande d'où ça vient. Jusqu'à présent, je n'ai rien trouvé ni dans GWT ni dans les historiques.
Avant de lire vos réponses, j'avais finalement écrit le rewrite ci-dessus sans toutefois le L et le NC .

Merci Forty et F_trt. :D
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut