Bizarre

Nouveau WRInaute
Salut,

Je voulais juste avoir un petit renseignement, voila cette nuit googlebot et passé sur mon site et visité des urls qui n'existe pas 8O , je ne sais pas du tout d'ou il a pu sortir ses url.....;
Est ce que c'est deja arrivé a quelqu'un ?

exemples : mes url sont du style index.php?val= et une valeur numerique
et lui a visité index.php?val=a
index.php?val=b

....... index.php?val=z
comme si il faisait une boucle, il m'en a fait plus de 500 comme ca :?:

J'ai verfifié mon code et pourtant aucune erreur .....
 
WRInaute passionné
Ca vient peut etre des crawlers Adsense.
Je m'explique :

Ce crawler crawl toutes les url ou il y a la pub adsense et qu'il ne connait pas.
J'ai eu le plaisir de voir il y a 3-4 jours un crawl sur ces url :

h-tp://www.jeuxgagnants.net/index.php?page=sites.php&cat=pedophilie
h-tp://www.jeuxgagnants.net/index.php?page=sites.php&cat=enfants%20à%louer
h-tp://www.jeuxgagnants.net/index.php?page=sites.php&cat=enfants%20prostitués

Autant dire qu'un pervers est passé sur mon site et que Google ne connaissait pas ces pages. Il est alors venu les crawler !!!
 
WRInaute impliqué
spoon a dit:
Est ce que c'est deja arrivé a quelqu'un ?
Bonjour,

Oui, cela m'est arrivé, Googlebot essayant d'accèder à des trous dans ma numérotation, mais ce n'était qu'une vingtaine de numéros (500 c'est beaucoup)
Le phénomène semble assez récent (depuis le changement d'algo de google) et peu de gens en parlent sans doute parce que très peu de gens regardent leurs logs. :wink:

Per contre, le phénomène mentionné par "le-phasme" est surprenant aussi. Ne serait-ce pas un moyen de chercher les sites qui cachent de telles activités dans un coin de leur site ?
 
Nouveau WRInaute
Oups j'avais pas vu qu'il y avait deja eu un topic sur le meme sujet .....

Oui le phenomene est vraiment bizarre , pour moi c'est le googlebot normal a part qu'il change d'ip a chaque url .
Et on dirait qu'il fait vraiment des boucles g deux parametres dans mon url
le premier il fait une boucle dessus de a j'usqua z et l'autre il la fait varier de 1a 7 d'ou le nom bre de page elevé :)
 
Olivier Duffez (admin)
Membre du personnel
dans les exemples que vous donnez, êtes-vous sûr qu'il ne s'agit pas du Mediapartner bot et bien du GoogleBot standard ?
 
Nouveau WRInaute
Alors la je ne sais pas :oops:

Robots stats le reconnait en tant que googlebot .Comment reconnaitre mediapartner ?

Plus d'infos sur ce passage bizarre :

DNS : crawl10.googlebot.com jusqu'a crawl16.googlebot.com sauf la 15
IP: 22 adresses differentes comprises entre 64.68.84.15------>64.68.84.160
et l'adresse 64.68.85.6.[/img]
 
WRInaute impliqué
C'est pas pour démasquer les as de l'url rewriting ou du php qui ont réponses à tous les mots clés de la terre ou les trucs comme fran*o ?
 
WRInaute impliqué
WebRankInfo a dit:
dans les exemples que vous donnez, êtes-vous sûr qu'il ne s'agit pas du Mediapartner bot et bien du GoogleBot standard ?

En ce qui me concerne : Oui...
Quand c'est le robot de MediaPartners, on ne peut pas le louper, c'est marqué dessus. :)
(Et j'ai vu cela dans mes logs, pas par un script quelconque)
 
WRInaute passionné
Je confirme aussi avoir trouvé dans mes logs apache des requetes sur mapage.h mapage.ht et mapage.htm avec en face le bot de googleadsense
 
Discussions similaires
Haut