Erreurs 404 - pages "pirates"?

WRInaute discret
Bonjour

Je sais pas trop comment appeler le problème que je rencontre.

Depuis quelques temps, le nombre d'erreur 404 qui sont reportées par Xiti et Google Webmaster tools sur mon site à tendance à augmenter de façon exponentielle. Pour certaines, ok, c'est des fautes de frappe, des html transformés en htm par exemple. Par qui je sais pas mais bon apparemment soit il y en a qui linkent mal ou qui savent pas faire leurs copier coller dans des forums.

Jusque là aucun problème.

Ce que je comprends pas, c'est toutes la floppée de page bidons du style:
-http::/www.exemple.com/Forum/newmainsid1.html 404 (Introuvable) [?] 17 août 2007
-http::/www.exemple.com/Forum/newmaintop1.php 404 (Introuvable) [?] 17 août 2007
-http::/www.exemple.com/afisha/1.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/103.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/104.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/107.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/108.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/109.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/111.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/116.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/117.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/121.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/123.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/124.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/126.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/13.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/132.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/134.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/150.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/20.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/21.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/25.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/26.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/27.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/31.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/34.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/39.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/4.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/40.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/44.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/53.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/6.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/61.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/67.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/69.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/70.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/71.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/72.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/76.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/83.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/84.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/95.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/afisha/97.htm 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/deu_2_true_1.003.002_undefined_25_index.htm 404 (Introuvable) [?] 17 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=10373 404 (Introuvable) [?] 18 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=10375 404 (Introuvable) [?] 18 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=11417 404 (Introuvable) [?] 20 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=11425 404 (Introuvable) [?] 21 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=11497 404 (Introuvable) [?] 18 août 2007
-http::/www.exemple.com/job/index.asp?act=find&virk=11864

ect ect ect...

Ma question est de savoir à quoi ça peut être du, vu que ça semble être généré par autre chose que moi ces liens sur mon site. Est-ce que cela peut me pénaliser d'une façon ou l'autre sur Google? Je crois savoir qu'il n'aime pas trop les erreurs 404. Et comment savoir ou sont ces foutus liens qui renvoient vers ces pages? Parce que dans les logs d'analytics, aucun affichage pour ses pages.

Est-ce que quelqu'un à observé un phénomène similaire? Ca semble venir par vagues...
 
WRInaute passionné
Ces personnes recherches des scripts que tu aurais pu installer sur ton serveur sans savoir ce que c'est... Sur mon serveur dédié, cela est très fréquent... L'installation du module Apache No Script de fail2ban m'a permis de ceux qui recherchait des scripts malveillant.

Par exemple, tu installes un script PHP te permettant d'éxecuter des commandes sur ton serveur (dans le cas d'un dédié des commandes SSH).
Tu caches ce script en lui donnant un nom "bidon" que toi seul connait...
Ces personnes/bots essayent de trouver ces pages.

Si c'est un hébergement mutualisé et que tu ne te sers pas de pages avec des noms bateaux pour échanger tes mots de passe ou des infos avec des amis/autres webmaster, tu n'as pas trop de soucis à te faire...
 
WRInaute discret
Merci, ça me rassure. Reste à comprendre pourquoi Google webmaster tools les voit... il doit y avoir une page qui link quelque part.. mboh...
 
WRInaute passionné
Mumuri a dit:
Apache No Script est livré avec fail2ban ou il faut l'installer séparément ?
Dans /etc/fail2ban/jail.conf
Code:
[apache-noscript]

enabled = true
port    = http,https
filter  = apache-noscript
logpath = /home/web/logs/apache/www/error.log
maxretry = 8
Par défault seul le SSH est enabled = true, tu passes le false en true et c'est bon...
J'ai la version 0.8.1, je ne sais pas laquelle tu as... Il y a aussi le apache bad bot qui bloque les mauvais robots reconnnues...
A toi de bien faire pointer vers tes bons log... Je n'ai pas encore réussi à le configurer pour mes virtuals host... 5 sites web, je ne surveille que le principale...
 
Discussions similaires
Haut