Le bot Ezooms/1.0; ezooms.bot@gmail.com

WRInaute accro
Re: Bot

Sans réponse j'ai pas réfléchi 5 mn j'ai ban :wink: je m'en porte pas plus mal d'ailleurs. (juste pour te donner l'issue de mon histoire avec ce bot casse bonbon)
 
WRInaute discret
J'hésitais à faire la même solution.

Il n'existe aucune information sur ce bot, donc on peut supposer qu'il est mauvais... ;-)
 
WRInaute accro
bah j'inverserai plutôt ta proposition : sachant qu'on a aucune info sur ce bot il ne présente aucun intérêt ... de la à conclure qu'il est mauvais c'est peut être un soupçon exagéré.
 
WRInaute accro
Je Up ce sujet car il porte sur le même éternel souci (les bots) et pour savoir si quelqu’un connais celui ci :

-http://crawler.sistrix.net/ le domaine conduit a ceci : -http://www.sistrix.de/ qui ne m'inspire pas beaucoup j'ai donc bloqué ce truc.

Si vous connaissez je veux bien un retour.
 
WRInaute accro
Bah le pauvre il ira pointer aux abonnés 403 malgré sa bonne réputation. J'ai un peu de mal avec les outils SEO qui pompent un site complet pour leur services, si encore c'était un moteur de recherche ou un service dédié à tous le monde je dis pas mais un truc pour webmaster il ira se brosser.

Merci pour l'info en tous cas :wink:
 
WRInaute accro
Re: Bot

zeb a dit:
Sans réponse j'ai pas réfléchi 5 mn j'ai ban :wink: je m'en porte pas plus mal d'ailleurs. (juste pour te donner l'issue de mon histoire avec ce bot casse bonbon)

Viré aussi
Et à peine je lui rends le droit de passer qu'il scanne comme un fou
 
WRInaute accro
ça serait pas mal si on avait une liste d'IP / UA quelques part sur le forum histoire de partager ce qu'on bloque ou pas et pourquoi (j'ai pas cherché mais j'ai pas vue de mémoire car j'aurais surement mis en marque page).
 
WRInaute accro
Re: Bot

patapon87 a dit:
Sans avoir un dédié on a moyen d'avoir ce genre d'infos ?
normalement, sur les mutu tu dois avec accès à tes logs bruts, tu peux donc voir qui crawle et à quelle fréquence
 
WRInaute accro
Un UP pour vous demander votre avis sur eux -> -http://www.proximic.com/info/spider.php
Il commencent a crawler de plus en plus fort avec une large plage IP et je me demande si les laisser passer présente un intérêt quelconque.

exemple pour aujourd'hui sous la forme nombre de pages consultées / ip / UA / date :

232 75.101.248.35 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
224 23.20.43.64 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
217 23.20.83.140 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
213 107.22.85.152 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
213 184.73.56.184 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
207 50.19.193.105 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
205 50.17.55.6 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
166 107.22.48.215 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
153 107.22.134.64 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
119 23.23.14.131 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
118 67.202.41.178 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13
105 23.22.87.83 Mozilla/5.0 (compatible; proximic; +http://www.proximic.com/info/spider.php) 2012 September 13

C'est pas encore mortel pour le serveur (loin s'en faut mais si c'est pour des nèfles je préfère virer)
 
WRInaute accro
je ne laisser crawler mes sites qu'aux seuls grands moteurs francophones, vu que mes visiteurs ciblés sont de pays francophones
 
WRInaute accro
comme je ne les connais pas c'est ça qui me fait hésiter :

Proximic's content analysis enables advertising partners to determine the best matching campaign for a page's content to achieve the highest CPM for you as a publisher. Proximic works with many advertising partners and it is very likely that one of them is serving ads to your site.

Mais j'avoue avoir une furieuse envie de lâcher une rafale sur le truc.

Linux%20penguin-frag-eds.jpg
 
WRInaute accro
Un Up de ce sujet pour vous demander si vous connaissez :

IP : 198.211.124.200 / UA : Pingoscope

Rien que le nom m'amuse je pense que je vais bloquer mais si vous connaissez je veux bien quelques informations.
 
WRInaute accro
@webrankinfo: l'idée avancée par zeb d'unf forum dédiée à la liste des bots et de leurs ip associées me semble une idée intéressante à mettre en place, et surtout sur un forum: ça permettrait à chacun de commenter, enrichir, demander l'avis, etc.. On est donc loin d'une simple liste.

Reste la question de la MàJ de la dite liste, mais ça ne doit pas être ingérable collectivement.
 
WRInaute accro
Surtout qu'on entre dans un contexte web où on sera de plus en plus agressé par des bots de toutes sortes.

Dans 5 ans le premier gus qui dézipera un freeglobe aura dedans sont bot d'exploration des sites inscrits etc ... (je schématise mais c'est l'idée)

Le mois derniers j'avais un pèlerin allemand avec un blog de geek SEO derrière qui me crawlait le site (1M de page si tu prend toutes les urls). Bref laisser passer ce genre de gugus qui a que faire du robots txt c'est la plaie en ressource (d'un autre côté ça fait marcher les dédiés et c'est la mort du mutu (conspiration des hébergeurs :lol: )).

En plus faut qu'on mette un peut de bande passante de côté pour Qwant ... :D

edit > sinon il est deny chez moi celui là -> 198.211.124.200 (en attendant plus d'information ou une demande de permission de crawl)
 
WRInaute accro
Tjs dans la série des bots j'en ai un qui me casse les bombons :
Ip : 173.199.115.75
User agent : Mozilla/5.0 (compatible; AhrefsBot/4.0; +http://ahrefs.com/robot/)
Connection : 173.199.115.75.ahrefs.com
celui là il attaque les pages en POST sur mon formulaire de contact ! Le plus étrange c'est que je voie pas le rapport avec ahrefs.com
bash-4.0$ ping ahrefs.com
PING ahrefs.com (50.97.33.178) 56(84) bytes of data.
64 bytes from 50.97.33.178-static.reverse.softlayer.com (50.97.33.178): icmp_seq=1 ttl=50 time=115 ms
 
WRInaute accro
Je vois qu'on retrouve tous les mêmes :mrgreen:
Moi c'est les russes qui m'inquiètent: après s'être fait supprimé le contenu, deux aujourd'hui qui passe par le moteur Yandex.
Je viens aussi de supprimer 8.35.200.0 - 8.35.207.255 effectivement ca appartient à Google mais un peu trop de visites bizarres avec http://code.google.com/appengine. Quand on sait qu'aguena est hébergé chez Google, ca devient deplus en plus chaud.

31.204.152.0 - 31.204.153.255 plage de serveurs hollandais avec tentative de post sur le forum.

PS: si vous me laissez continuer ..... je remplis le Forum et plus de ralentissements sur le forum de WRI. :mrgreen:

PS2: attention à l'user_agent BOT/0.1 (BOT for JCE) , c'est probablement un virus mais il est repris sur des plages de serveurs ET de visiteurs (même des "attaques" d'adresse IP de Microsoft).
 
WRInaute accro
zeb a dit:
edit > sinon il est deny chez moi celui là -> 198.211.124.200 (en attendant plus d'information ou une demande de permission de crawl)

C'est une plage de serveurs de Digital Ocean (USA), tu peux carrément supprimer la plage 198.211.96.0 - 198.211.127.255. Par contre, il a déménagé (pas de visites chez moi en 5 mois.
 
Discussions similaires
Haut