PicSearch.com

WRInaute discret
Bonjour,

J'ai ce boot "PicSearch.com" qui est constament sur mon forum casiement 12h/ jours depuis 2 ou 3 semaines... Il se connecte assez sauvagement, avec 3 à 5 ip différente simultanément. Je crois meme qu'il ralenti complement mon forum, deja que mon hebergeur est pas au top entre 18h et 21h... il commence a me lourder lol ça serrai google, je ne dirrai rien, mais là...pff et en + , ça n'a l'air d'etre qu'un boot pour les recheche d'image, or je n'ai pas de galerie , ni image à référencer... Je n'ai pas trouver grand chose au sujet de "PicSearch.com" ... quelqu'un pourrait m'en dire + ici? il fait parti d'un autre grand groupe + connu, etc etc?

Extrait de mes logs:

Code:
217.212.224.145 - - [22/Dec/2005:04:01:12 +0100] "GET /forum/sutra24504.html HTTP/1.0" 200 95786 zero-complexe.com "-" "psbot/0.1 (+http://www.picsearch.com/bot.html)" "-"

217.212.224.143 - - [22/Dec/2005:04:02:34 +0100] "GET /forum/sutra24630.html HTTP/1.0" 200 95786 zero-complexe.com "-" "psbot/0.1 (+http://www.picsearch.com/bot.html)" "-"

217.212.224.159 - - [22/Dec/2005:04:03:16 +0100] "GET /robots.txt HTTP/1.0" 200 298 zero-complexe.com "-" "psbot/0.1 (+http://www.picsearch.com/bot.html)" "-"

217.212.224.144 - - [22/Dec/2005:04:05:21 +0100] "GET /forum/sutra24713.html HTTP/1.0" 200 95786 zero-complexe.com "-" "psbot/0.1 (+http://www.picsearch.com/bot.html)" "-"

Merci
 
WRInaute discret
En cas de gêne, deux lignes dans ton robots.txt : User-agent: psbot avec Disallow: / :wink:

Bon plus sérieusement, il semblerait que MSN Search, Ask Jeeves, Lycos Europe syndiquerait leur contenu pour la recherche d'image sur leur site.
 
Nouveau WRInaute
Met un petit code php pour lui evité qu'il ne charge les page,

<?php
if(strpos($_SERVER['HTTP_USER_AGENT'], "+http://www.picsearch.com/bot.html)") {
exit;
}
?>


Comme cela la page arretera de se charger et rien ne s'affichera. Après il faut que les gens qui visite ton site n'est pas cela dans leur uer_agent mais je pense pas
 
WRInaute discret
Merci bien ;-)

Mais avant de mettre dans le robot.txt , je voulais savoir si ça n'alais pas etre pénalisant pour moi au niveau du reférencement...
Car il n'y a qu'a aller voir sur mon forum (mon site dans www suivi de "/forum"), j'ai installé un mod qui permet de voir dans la liste des connecté tout en bas ainsi que les moteur de recherche également connecté en live... et picsearch.com y es quasiment tout le temps...

Et les autres, vous avez certain moteur que vous avez interdit dans votre robot.txt ?
 
WRInaute accro
Waip, là il est même présent 5x...

Pour un site qui traite de la b0ulimie, je crois que tu es honoré d'un exemple "live" ;)

Disallow !

Anyway, tu nous dis ne pas avoir d'images à indexer, donc... pas besoin qu'il te crawle...
 
WRInaute accro
Bonjour zerocomplexe,

J'ai jeté un coup d'oeil à ton robots.txt. L'emploi du caractère spécial "*" dans robots.txt n'est pas conforme au standard et n'est donc pas compris par la plupart des robots. Pour interdire les pages commençant par /forum/login.php, il suffit d'écrire :
Code:
Disallow: /forum/login.php
:wink:

Jean-Luc
 
Haut