Vos stats grimpent ? Attention aux désillusions !

WRInaute passionné
Bonjour à toutes et à tous,

Vous constatez que votre nombre de visiteurs vient d'augmenter de manière substantielle, jusque là, c'est le bonheur, en effet, c'est l'optique de tout bon webmaster qui se respecte.
Cependant, en consultant vos statistiques d'un peu plus près, vous constatez un élément qui vous fait vite déchanter.

En effet, ce que vous preniez comme une bonne nouvelle au départ s'avère être le début du cauchemar des referers. :(

Bien que n'étant pas vraiment dans le theme de mon blog, j'ai rédigé un petit article sur le spam referer

http://www.photomontages.org/photo/mont ... ferer.html
 
WRInaute impliqué
bravo !

super découverte !

article sans intérêt puisqu'aucune solution n'est avancée ...
tu fais du spam de backlinks ? à quand un article tout aussi passionant à ce sujet ?
 
WRInaute passionné
super découverte !

article sans intérêt puisqu'aucune solution n'est avancée ...
tu fais du spam de backlinks ? à quand un article tout aussi passionant à ce sujet ?

Au lieu de raconter des c.......s lis jusqu'au bout !!!

Tu n'as pas lu le code à incerer dans le htaccess ?
 
WRInaute impliqué
article de daube : attention aux désillusions !

oli004 a dit:
Au lieu de raconter des c.......s lis jusqu'au bout !!!

Tu n'as pas lu le code à incerer dans le htaccess ?
super ! :lol: :D :lol:
tu vas mettre un dictionnaire entre tes parenthèses ?

aller je la refais :
article sans grand intérêt puisqu'une unique solution, assez limitée et difficilement maintenable dans le temps face à l'imagination des sp4mm3rs, est avancée ...

c'est vrai, c'est un peu plus véridique ainsi :lol: :wink: :lol: :lol:
 
WRInaute passionné
Albert1, libre à toi d'appliquer la politique du je ne sais pas faire à 100% donc je ne fais rien !

Cela dit, sans aller juqu'au dictionnaire, ne peux-tu pas admettre qu'avec une quantité raisonable de mots, il y a de quoi réduire les spams par referer d'un enorme pourcentage ?

Comme je l'ai précisé dans l'article, il est utopique de penser l'éradiquer à 100%. Cela dit, doit-on ne rien faire pour autant ?
 
WRInaute passionné
(Comme d'hab, il a tout faux le beber1)

Bon article expliquant clairement le principe du "referer spamming" et incluant une solution simple pour l'eliminer a 90%.
Voici ma solution pour le cas ou le SetEnv n'est pas active:
Code:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^.*(phentermine|pyrokar|diazepam|viagra|tramadol|adipex|levitra|xanax).*$ [NC]
RewriteRule ^.*$ - [F,L]

Plutot qu'interdire l'acces, vous pouvez aussi reutiliser la puissance de feu a votre benefice...
 
WRInaute passionné
L'article est bon mais je pense qu'il mérite plus de clarté

Merci quand même. Une petite correction, Les fournisseurs gratuits permettent l'hébergement de site chez soi à domicile avec son propre serveur.
 
WRInaute impliqué
Albert 1er, je ne vois pas ici l'interêt d'être agressif...

Pour le spam referer, la solution la plus simple est de ne pas rendre ses stats publiques. Les sites cibles sont facilement trouvés sur les moteurs de recherche. Pas de stats publiques = pas de spam.
 
WRInaute impliqué
Franchement je trouve ce post plutôt instructif (moi je ne connaissais pas le problème !).

Albert1 : certes l'article est perfectible, mais cela ne justifie en aucune cas ton attitude agressive, inadmissible à mon sens sur ce forum.
 
WRInaute passionné
Serious a dit:
Bon article expliquant clairement le principe du "referer spamming" et incluant une solution simple pour l'eliminer a 90%.
Voici ma solution pour le cas ou le SetEnv n'est pas active:
Code:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^.*(phentermine|pyrokar|diazepam|viagra|tramadol|adipex|levitra|xanax).*$ [NC]
RewriteRule ^.*$ - [F,L]

Plutot qu'interdire l'acces, vous pouvez aussi reutiliser la puissance de feu a votre benefice...

Tant quà faire, je pense qu'il est préférable d'empecher l'accès, ceci permettant de ne pas fausser les statistiques.
 
WRInaute occasionnel
Pour le spam referer, la solution la plus simple est de ne pas rendre ses stats publiques. Les sites cibles sont facilement trouvés sur les moteurs de recherche. Pas de stats publiques = pas de spam.
J'utilise Dotclear 1 et le plugin bbclone, je ne pense pas que mes stats soient publiques pourtant regardez ce que j'observe depuis une semaine chaque nuit
Code:
viagrahere.blogspot.com
weightlosspill-survey.blogspot.com
matmice.com
weightlosspill-survey.blogspot.com
 
WRInaute passionné
vpx a dit:
Pour le spam referer, la solution la plus simple est de ne pas rendre ses stats publiques. Les sites cibles sont facilement trouvés sur les moteurs de recherche. Pas de stats publiques = pas de spam.

Je suis tout à fait d'accord avec toi, cela dit je ne diffuse pas les statistiques de mon site, même si google (exemple) indexe ce genre d'éléments
Je précise à toutes fins utiles que le répertoires /stats est disallow dans le robots.txt
 
WRInaute occasionnel
La mienne est plus grosse que les votres.


La preuve :
[Edit kazhar : et non loupé !]

Note en passant : félicitations à ceux dont les adsense s'afficheront sur ce post, y a que du gros mot.
 
WRInaute accro
Merci aussi à Malaiac pour avoir détruit la mise en page du forum ^^.

Justement, le problème du spamreferer était trop peu abordé je trouve, tant mieux qu'il y ait un article :p.
 
WRInaute occasionnel
bande de démagogues !! :wink:
c'est un faux probléme, les stats détaillés n'ont jamais à etre publique !!
 
WRInaute passionné
julk a dit:
c'est un faux probléme, les stats détaillés n'ont jamais à etre publique !!

Justement , le probleme c'est qu'il n'y a pas que les sites dont les stats sont publiées qui sont visés. Aujourd'hui, tous les sites sont visés !
c'est telement simple de faire crawler un site par un robot spammeur que les malfaisants (je les appelle comme ça :wink: ) n'hésitent pas viser tout et n'importe quoi. C'est comme pour le spamming de masse par email. Un brouette de 100 000 adresses emails à chaque fois, peut importe le nombre, plus il y a de potentiel, plus il y a de retour, c'est mathématique.
 
WRInaute accro
oli004 sur Photomontages.org >>

- Ce que vous preniez comme une bonne nouvelle au départ s'avère être le début du cauchemar.
- Le fléau du spam par referer !


Je comprend la réaction d'Albert1, c'est idiot de focaliser sur un problème aussi bénin.
 
WRInaute discret
petit webmaster amateur, mediocre technicien, je me permets cependant d'exprimer un point de vue qui l'espere sera constructif.

Le but des spammers cités n'est pas d'apparaitre dans les stats, mais d'inscrire leur pub, en fait un peu d'html "<A href=" dans les champs de saisie.
Par exemple, dans votre moteur de recherche, tapez "livre d'or penthermine" et vous comprendrez...

On retrouve ainsi des sites completement pollués sur des pages de ces messages. J'avais mis sur mon site la possibilité aux visiteurs de laisser un commentaire sur les articles, j'ai compris le resultat...

Ma question : je maitrise mal le htaccess, mais je voudrais empecher les sites spammer de voir mes pages, et pas seulement de figurer dans les stats. quelles instructions dois-je mettre ?

Mon probleme, ayant protegé mes commentaires avec une saisie genre "recopiez ceci", n'est pas le spam mais la fait qu'ils me bouffent mon quota de bande passante.
 
WRInaute passionné
KOogar a dit:
Je comprend la réaction d'Albert1, c'est idiot de focaliser sur un problème aussi bénin.

:wink:

********

J'ai ajouté un petit complément d'informations à l'article, le voici :

Ma définition du spam referer ou spam par referer :
Le spam par referer consiste en une technique permettant de laisser dans les outils de statistique une trace de passage mentionnant comme adresse de référence (celle par où l'internaute à accéder à votre page) une url de publicité.
Bien sur, cette url
- ne comporte aucun lien vers le site victime.
- aboutit sur une page proposant généralement à la vente des produits prohibés, contrefaits et réglementés.
- peut-être suivi par les robots des moteurs de recherche (c'est une forme de spamdexing)
- fausse les statistiques réelles de vos sites.


Si vous voyez d'autres éléments à mentionner, merci de les préciser et je les ajouterai
 
WRInaute discret
Oli, tu n'as pas lu mon message.

Ces robots spammer se moquent de figurer dans les stats, ils cherchent à placer des liens en dur sur nos sites, en exploitant les livres d'or et autres espaces d'expressions non protégés.

Caranet: oui, ils placent leurs backink ainsi. Et quand ils ratissent des millions de sites, ils arrivent à placer des milliers de backlinks ainsi, des bons liens en durs bien visibles.

ma question :

Code:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^.*(phentermine|pyrokar|diazepam|viagra|tramadol|adipex|levitra|xanax).*$ [NC]
RewriteRule ^.*$ - [F,L]

ca les empeche de figurer dans les stats, sans les empecher de lire toutes les pages, ou ca les empeche de charger les pages (rapport à la bande passante) ?
 
WRInaute passionné
@Cyclurba : Il y a d'aures méthodes pour les empêcher de poster dans les livres d'or et autres, celle-ci ne concerne que les stats c'est pour ça que ton message n'a pas eu plus d'echos...
Le htaccess au dessus les empêche juste d'être considéré comme des referer mais pas de crawler les pages, pour celà il faut utiliser le robots.txt mais la plupart des bots malsains ne respectent pas ce robots.txt...
 
WRInaute discret
Merci Keroin, ta reponse est precise et complete.

Personnellement, les stats je m'en tape, ce qui compte c'est les brouzoufs, car ça me permet de nourrir mes petits. Quand à afficher publiquement des stats, je n'en vois pas l'interet si on n'y est pas obligé (triomphe ?)

Ton idee d'agir sur robot.txt est bonne, mais il est sûr que les bots passeront la-dessus...
Nous reste à ajouter un ti script php pour stopper l'affichage des pages si mechant bot.
 
WRInaute passionné
Cyclurba a dit:
Oli, tu n'as pas lu mon message.

Si

Ces robots spammer se moquent de figurer dans les stats, ils cherchent à placer des liens en dur sur nos sites,

en exploitant les livres d'or et autres espaces d'expressions non protégés.

Je n'ai jamais dis le contraire. Les stats sont une cible de plus, tout comme les livres d'or ou les commentaires de blog.

cela dit, il existe tout de même des outils de type captcha pour éviter le spam sur les commentaires.



ma question :

Code:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^.*(phentermine|pyrokar|diazepam|viagra|tramadol|adipex|levitra|xanax).*$ [NC]
RewriteRule ^.*$ - [F,L]

ca les empeche de figurer dans les stats, sans les empecher de lire toutes les pages, ou ca les empeche de charger les pages (rapport à la bande passante) ?

Il s'agit d'une réécriture par conséquent ça n'empeche ni l'accès, ni de figurer dans les stats cela dit, l'url de referer n'apparaitra pas.

pour interdire l'accès, il faut l'autre méthode que j'ai donné dans l'article c'est a dire

Code:
SetEnvIfNoCase Referer ".*(mot1|mot2|baskets|......|motn).*" spammer=yes 
Order allow,deny 
allow from all 
deny from env=spammer

la dessus, tout referer comportant le terme "mot1" ou "baskets" ou ... "motn" se vera interdire d'accès par le serveur.

C'est du style : "Toi, t'as des baskets donc tu rentres pas" :wink:
 
WRInaute accro
Peut-être hors sujet :?
ce genre de mésaventure peut provoquer un dépassement de hits :?:
Existe t-il un script permettant de limiter l'accès et le dépassement de hits ?
Si oui quel est-il et comment l'installer
je sais je suis cake... :lol:
 
WRInaute discret
Bjr à tous,

Et merci Oli pour ce sujet important. Il est clair que si on a quelques pages statiques en pur html le problème ne se pose pas. En revanche ceux qui ont des sites interactifs et qui n'ont pas compris l'importance de ce sujet, le comprendront probablement un jour ou l'autre s'ils n'ont pas pris les dispositions nécessaires.

Pour ma part, j'ai pu mesurer l'ampleur néfaste de ce genre spam sur l'un de mes sites. En 48 heures, la taille de la base mysql avait considérablement grossit (+eurs Mo) ... J'y ai trouvé des MILLIERS d'urls commerciales dans les champs "commentaires" et surtout les champs "trackbacks". Les supprimer n'a servi à rien! L'attaque était permanente à raison d'environ 600 urls / heure ! Après quelques manips sans succès, j'ai fini par prendre des mesures drastiques: 1/ accès interdits aux anonymes pour les commentaires (en attendant une future intégration captcha), 2/ suppression de la fonction trackback dans le site (mon site est une plateforme blogs) !
 
WRInaute accro
Vient pas te plaindre Mister_G si tu laisses ta BDD ouverte en écriture et tu es spammé, 50% de la bande passante mondiale est du spam. Rien de nouveau.
 
WRInaute discret
KOogar a dit:
Vient pas te plaindre Mister_G si tu laisses ta BDD ouverte en écriture et tu es spammé, 50% de la bande passante mondiale est du spam. Rien de nouveau.

Je ne sais pas ce que tu entends par "BDD ouverte"; s'il s'agit de l'autorisation des commentaires aux anonymes ... c'était un état d'esprit. Abandonné par la force des choses.

"50% de la bande passante mondiale est du spam", on est bien d'accord, c'est justement le thème de ce fil.

"Rien de nouveau" -> pour TOI sans aucun doute, mais d'autres que TOI fréquentent ce forum.
 
WRInaute discret
fredwat a dit:
ah bon :!: :?:
je n'explique donc pas un dépassement de hits depuis 2 jours :?

Un site html ne risque pas le spam mais effectivement il n'est n'est pas à l'abri des aspirateurs ou des crawlers fous et là les hits s'envolent! Tu peux déjà regarder tes logs pour analyser les referers.
 
WRInaute accro
GG images en pagaille...
je viens d'ajouter un disallow/images/ dans mon fichier robots :!:
Quel dommage d'en être poussé à ce genre d'expédiant :?
 
WRInaute accro
Mister_G a dit:
KOogar a dit:
Vient pas te plaindre Mister_G si tu laisses ta BDD ouverte en écriture et tu es spammé, 50% de la bande passante mondiale est du spam. Rien de nouveau.

Je ne sais pas ce que tu entends par "BDD ouverte"; s'il s'agit de l'autorisation des commentaires aux anonymes ... c'était un état d'esprit. Abandonné par la force des choses.

"50% de la bande passante mondiale est du spam", on est bien d'accord, c'est justement le thème de ce fil.

"Rien de nouveau" -> pour TOI sans aucun doute, mais d'autres que TOI fréquentent ce forum.

cela fait des année que les moteurs de spam x made in USA font le tour des IP de la toile, maintenant qu'ils viennent hackés les stats, on va pas en faire un fromage. Faut vraiment être c... pour clicker sur le lien. <Et qu'on vienne pas me raconter que sur 1 site normalement fait ils arrivent à insérer des données que les moteurs peuvent suivrent à travers des stats..
 
WRInaute discret
KOogar a dit:
cela fait des année que les moteurs de spam x made in USA font le tour des IP de la toile, maintenant qu'ils viennent hackés les stats, on va pas en faire un fromage. Faut vraiment être c... pour clicker sur le lien. <Et qu'on vienne pas me raconter que sur 1 site normalement fait ils arrivent à insérer des données que les moteurs peuvent suivrent à travers des stats..

Chez moi les stats ont toujours été privées, aucun robot n'y est jamais rentré, ce n'est pas là le pb. En revanche, il est possible qu'un jour on voit des stats grossir artificiellement et lorsqu'on regarde de près, on comprends vite par l'adresse référente et parfois par la signature de l'user-agent qu'il s'agit de robots.

Ces robots ont été conçus et paramétrés pour spammer les sites dynamiques sur des fonctions précises telles que :

1 - livres d'or
2 - posts de forum
3 - commentaires d'articles
4 - trackbacks
5 - etc ....

- pour le 1, aucun pb car je n'ai pas de livres d'or
- le 2, cela m'est arrivé sur un autre site de recevoir des fausses inscriptions automatiques avec des posts en anglais sur le viagra et autres c....
- le 3 , classique si on autorise le postage anonyme
- le 4 est spécifique aux blogs car la technologie des trackbacks leur sont propres, je n'ai pas trouvé de moyen d'interdire les pub entrantes par TB, donc j'ai supprimé la fonction !!!!

Si vous avez des ruses pour les trackbacks, je suis preneur car les scripts htaccess qui filtrent les référents sont inopérants pour les TB entrants.

Je ne suis pas le seul :
https://www.google.fr/search?hl=fr&rls=G ... DcountryFR
 
WRInaute discret
oli004 a dit:
cela dit, il existe tout de même des outils de type captcha pour éviter le spam sur les commentaires.
Salut,
Ce genre de difficultés est déjà contourné par les robots spammeurs. Ils arrivent à s'inscrire sur les forums, confirmer l'inscription, contourner la protection par pictogrammes et poster les messages.
 
WRInaute accro
Cyclurba a dit:
Ces robots spammer se moquent de figurer dans les stats, ils cherchent à placer des liens en dur sur nos sites, en exploitant les livres d'or et autres espaces d'expressions non protégés.

T'as tout compris :lol:
Donc avec un mécanisme tout con de ce genre
Code:
Si message contient "<a href"
alors die("casse toi")

... on pourrait éliminer totalement le spam ? Et la réponse est : oui j'ai éliminé 100% des spams, que ce soit sur les forums, les blogs, les formulaires, etc. :wink:
 
WRInaute accro
hedonism a dit:
oli004 a dit:
cela dit, il existe tout de même des outils de type captcha pour éviter le spam sur les commentaires.
Salut,
Ce genre de difficultés est déjà contourné par les robots spammeurs. Ils arrivent à s'inscrire sur les forums, confirmer l'inscription, contourner la protection par pictogrammes et poster les messages.

ok ok mais ceux qui code ces moteurs de spam connaissent le source des forums dont tu parles, sinon ils seraient impossible pour eux de les spammer.

.
 
WRInaute passionné
Je fais un petit hors sujet juste pour donner une petite précision sur le spam de forum.

[HORS SUJET]

Bien que le sujet ai été aborder à plusieurs reprise, dans les grande ligne, il faut que le système anti spam type captcha sont complété d'une fonction que seul un humain peut décripter, par exemple :

Code:
Affichage de l'image :

12545875

Question posée :

Quelle est la somme des troisième et cinquième caratère

Réponse attendue : 11

On arrive déja à un niveau de sécurité relativement complexe pour un robot spammeur car on ne se contente pas de simplement recopier les caractères de l'image mais d'effectuer une opération mentale.

Personnellement, depuis que j'utilise conjointement le captcha et les questions, je n'ai plus aucun soucis de robots spammeurs sur mes forums.

Voir par exemple ce mod pour phpBB : Lien rendu cliquable non pas dans le but de faire de la recherche de BL mais pour faciliter l'accès à la page. Je fais comme ça parce que je ne comprends pas pourquoi le lien de mon premier post a été rendu innopérant. Peut-être que le modérateur à pensé que mon but était la recherche de BL. Si tel est le cas,ça devient une paranoia :(

[/HORS SUJET]
 
WRInaute passionné
kéroin, j'ai mentionné dans mon post précédant la source d'origine, c'est tout de même mieux non :wink: ?
 
WRInaute accro
j'ai même des user agent avec un lien à l'intérieur. J'ai ainsi eu hier ce navigateur qui a surfé sur mon site (y compris robots.txt)
Code:
<a href='http://www.netf0rex.org'> F0rex Trad1ng Network 0rganization </a> (inf0@netf0rex.0rg)
du moins, avec sans les 0 et 1 :lol:
 
Discussions similaires
Haut