isoler les print et clics des moteurs

WRInaute occasionnel
Bonjour
sur mon site, je compte à plusieurs endroits des affichages de bannières ainsi que des clics sur ces bannières. En épluchant les logs, je me rends compte que les bots des moteurs réalisent 90% des prints et 50% des clics. Y a-t-il des astuces pour ne pas compter ces clics et ces prints, sans mettre dans une table la liste de toutes les IP de tous les moteurs ? ce qui est lourd en traitement vu le nb de print (plusieurs 10 aines de milliers par jour). En gros comment font leguide.com ou analytics pour ne pas en tenir compte.
Merci,
Jerome
 
WRInaute accro
Une première méthode consiste à générer les affichages en Javascript, ça empêche normalement les moteurs de les lire. Tu peux aussi protéger les bannières et clics en les mettant sur des URLs bloquées par /robots.txt.

A part ça, la seule méthode un tant soit peu efficace consiste à filtrer par IP et/ou par UA, et notant par exemple dans une table toutes les IPs et UAs qui viennent chercher le fichier /robots.txt.

Jacques.
 
WRInaute occasionnel
merci pour cette première réponse. je ne souhaite pas bloquer les robots par un robots.txt mais je retiens l'idée de générer l'affichage par un javascript. comment cela peut marcher dans le détail ?
 
WRInaute accro
Quand je parle de bloquer les robots avec le robots.txt, ça ne veut pas dire les bloquer sur l'ensemble du site, hein... Je parle juste de les empêcher de charger les bannières et de suivre le lien associé, le reste sera accessible sans souci.

Pour le Javascript, tu peux par exemple faire quelque chose comme:

Code:
<div id="mondiv"></div>
<script type="text/javascript"><--
function installe_la_pub()
{
var a = document.createElement('a');
a.href='adresse_de_destination';
var i = document.createElement('img');
img.src='adresse de l'image';
img.style='width: xxxpx; height: yyypx';
a.appendChild(img);
document.getElementById('mondiv').appendChild(a);
}
installe_la_pub();
//-->
</script>

Il y aura probablement des adaptations à faire pour que ça marche avec tous les browsers.

Jacques.
 
WRInaute impliqué
comme le dit jcaron déjà avec un controle des user agent tu devrais filtrer pas mal...

vas voir sur wiki avec les mots "user agent" et tu verras pas mal d'exemples pour les principaux navigateurs.
 
Discussions similaires
Haut