bloquer les proxys et spammeurs

Discussion dans 'Développement d'un site Web ou d'une appli mobile' créé par Topsitemaker, 18 Février 2007.

  1. Topsitemaker
    Topsitemaker WRInaute impliqué
    Inscrit:
    19 Novembre 2006
    Messages:
    527
    J'aime reçus:
    0
    Bonjour,

    Je souhaite bloquer les spammers qui créer pleins de messages dans les forums, livre d'or tentatives d'injection de code SQL, tricheries sur les votes... bref que des sales choses indésirables et nuisibles qui proviennent pour la majorité de proxies ouvert, anonyme ou hautement anonyme, car on peut être anonyme.

    Au début les protections CAPTCHA (on tape le code fourni par une image pour vérifier que l'on n'est pas un robot) fournissaient une bonne chose, mais force et de constater qu'elles sont facilement détourner par des logiciels (appelé OCR) qui décryptent les images.
    La protection CAPTCHA installé sur phpBB en est devenu quasiment inutile car trop simple face aux spammers de cette nouvelle génération.

    Je fais ma petite recherche sur le sujet et j'en conclus que concrètement cela revient à bloquer les proxy anonymes. Bon c'est vrai que tout les marketeurs ne viennent pas que des proxy, d'autres sources comme des ordis vérolés ou non avec IP dynamique, mais elles représentent la porte d'entrée des spammers et autres hackers.

    Sur internet, si on diffuse une information (tel l'IP d'un proxy) on est considéré comme du mauvais coté, les serveurs anti-spam comme Sorbs sont donc obligés de ne pas diffuser leurs blacklists d'IP (appelé blackhole lists) pour servir la bonne cause, on leur demande si un IP ou nom de domaine est blacklist ou pas, ca ne concerne que pour les mails et s'arrête là. Je voudrais pour le HTTP aussi.

    La question est donc connaissez-vous :
    1 - un script qui référence les IP déjà alloué dans le monde pour contre-carrer les IP aléatoires des proxy.
    2 - un script de détection de proxys (donc 'bassement anonyme') à partir des données comme l'IP ou les variables $_SERVER
    3 - un script qui fait des requetes à un server de blackhole list comme sorbs, apparemment Sorbs semble donner un accès à une liste HTTP à l'adresse http.dnsbl.sorbs.net, mais rien n'indique comment en tirer profit.
    4 - un script qui alerte sur une hausse anormale de requetes HTTP émanant de pays 'exotiques' comme l'Arabioe Saoudite ou la malaisie et si possible paramétrable.

    Merci pour toutes réponses
     
  2. arnaudmn
    arnaudmn WRInaute passionné
    Inscrit:
    11 Mai 2005
    Messages:
    1 038
    J'aime reçus:
    2
    Je connais aucun des systèmes indiqués :)
    Pour les mails, il existe des listes d'ip référencée comme étant celle de spammeur ; peut-être que la même chose peut-être appliqué pour un forum .... sauf que si c'est aussi mauvais que pour les mails, ca va filtrer beaucoup trop de vrai message.
    Sinon, pour le captcha, il y en a qui fonctionne autrement qu'avec des images. J'ai vu un site qui utilise un captcha en posant une question sur des maths. Du style : "combien font quarante-quatre et quatre ? (chiffres)". A mon avis y'a plein de solution, suffit de pas utiliser les mêmes que la majorité des autres sites (j'vois mal spammeur s'emmerder a passer du temps pour un système de protection spéciale d'un site).
     
  3. Digit
    Digit WRInaute occasionnel
    Inscrit:
    18 Avril 2003
    Messages:
    451
    J'aime reçus:
    3
    On peut fonctionner sans captcha. Il suffit d'analyser le comportement de l'internaute, d'effectuer un scoring, et lors d'un dépassement de seuil on n'accepte pas son envoi par le formulaire. J'ai mis en oeuvre un tel système qui a un taux de réussite de plus de 99%, mais il est délicat de gérer le seuil : un seuil trop faible et on se fait spammer, un seuil trop fort et on bloque les utilisateurs. Ca m'a pris plus de 6 mois à régler en comparant avec les logs. Maintenant le système est opérationnel et m'a permis de constituer une liste de plus de 9000 IP "méchantes". Il n'y a pas que les proxy anonymes, il y a surtout les PC zombies. J'avais lu un article de Microsoft sur la sécurité qui indiquait qu'il y a 6 mois plus de 70% des PC étaient infectés par un troyen, et donc étaient qualifiés de PC zombie (PC dont on peut prendre le controle à distance), ce qui relativise mes quelques milliers de machines identifiées par rapport aux millions potentielles. Du spam dans les forums provient très rarement de la machine de l'attaquant, ce sont essentiellement les PC zombies mis à contribution.
    Comme l'indique fort justement arnaudmn, il est très intéressant de mettre en place un système différent des autres, il a beaucoup moins de chances de se faire attaquer, les pirates préférant s'attaquer à l'immensité des sites standards, avec très peu d'effort ils ratissent très large. Un site avec protection spécifique risque de ne pas les intéresser.
     
  4. Serious
    Serious WRInaute passionné
    Inscrit:
    21 Novembre 2005
    Messages:
    1 834
    J'aime reçus:
    0
    - change de captcha
    - change les noms des champs des formulaires
    Il ne te restera plus que le spam manuel. Qui est inevitable mais rare (et tu peux encore en eliminer une partie par filtrage de mots-clef).
     
  5. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 857
    J'aime reçus:
    5
    Un captcha "texte" du genre:

    "Combien font deux plus treize, le tout multiplié par trois ?"

    ...et tu positionnes les éléments par CSS, alors qu'ils sont répartis différemment dans le code.

    --> viens, petit robot, viens :roll:

    (ok c'est p'tet lourd à mettre en oeuvre ;) ).
     
  6. PigeonDeCombat
    PigeonDeCombat WRInaute discret
    Inscrit:
    6 Août 2006
    Messages:
    178
    J'aime reçus:
    0
    Personnellement, j'utilise entre autres IPToCountry qui permet de connaitre le pays d'origine d'une IP. Et quand c'est un pays qui me plait pas ou tout simplement indeterminé bhé il vont ce faire mettre pour les POSTS ;-) Ca marche du tonnerre de dieu.

    Pour les CAPTCHA : Dans ton script qui te génére ton image ajoute un truc du genre : if ($_SERVER['HTTP_REFERER'] != 'lapagequiestcenserappellermonscript.html') { echo "dans ton culcul"; exit; }

    Pour les champs de formulaire utilise ta variable de session pour nommer les NAMES : <input type="text" name="montruc<? echo session_id(); ?>" />.

    En regle general partout ou tu a un post vérifie que le referer est "logique" sinon tu renvoie directos sur la page d'accueil. Ca évite les bots en appelle directe en POST.

    Fais le test : compte ton meilleur chrono entre le moment ou tu rempli ton formulaire et le moment ou tu post. Et bloque tout ceux qui vont plus vite que toi ;)
     
  7. Digit
    Digit WRInaute occasionnel
    Inscrit:
    18 Avril 2003
    Messages:
    451
    J'aime reçus:
    3
    Attention PigeonDeCombat, avec le filtre sur le referrer tu bloques parfois de vrais utilisateurs.
    Certains PC sont équipés de systèmes masquant le contenu de l'en-tête HTTP_REFERER
    Ces utilisateurs ne comprendront jamais pourquoi ils ne peuvent pas utiliser le formulaire
     
  8. PigeonDeCombat
    PigeonDeCombat WRInaute discret
    Inscrit:
    6 Août 2006
    Messages:
    178
    J'aime reçus:
    0
    Oui je le sais bien mais perso ca ne me dérange pas.
     
  9. Topsitemaker
    Topsitemaker WRInaute impliqué
    Inscrit:
    19 Novembre 2006
    Messages:
    527
    J'aime reçus:
    0
    Merci pour toutes ses réponses,
    Je n'avais pas pensé à toutes ses techniques CAPTCHA, le calcul c'est pas mal, le CSS aussi.
    Le HTTP_referrer peut etre modifié donc ce n'est pas une variable auquel il faut faire 100% confiance.

    IPToCountry je ne connaissais pas,
    Pour info j'ai trouvé cette page qui rassemblent tous les DNSBL http://www.moensted.dk/spam/, faut maintenant que je regarde dans le détail.

    Mon approche est plus global que le CAPTCHA, je veux m'attaquer à la source , quelque soit la techno utilisée il y aura toujours une évolution. En gros je souhaite coder pour le long terme, être moins sensible à la techno.

    D'accord avec l'idée, mais la source qui coordonne les messages provient toujours des proxy.
     
  10. ACth
    ACth WRInaute impliqué
    Inscrit:
    11 Novembre 2006
    Messages:
    686
    J'aime reçus:
    0
    Attention avec les propositions de modifier la mise en place des CAPTCHA de type "texte".

    S'ils sont de type texte, c'est principalement pour des raisons d'accessibilité. Ainsi si vous procédez de tel manière à ce qu'un robot s'y perde car il n'a pas la mise en page "visuelle" vous perdrez aussi l'accessibilité de votre CAPTCHA.
     
  11. arnaudmn
    arnaudmn WRInaute passionné
    Inscrit:
    11 Mai 2005
    Messages:
    1 038
    J'aime reçus:
    2
    Sauf que pour avoir fait un antispam qui utilise les dnsbl, je peux te dire que c'est loin d'être fiable. Non seulement ça laisser passer des spammeurs, mais encore pire, ça bloque beaucoup d'ip qui n'appartiennent pas a des spammeurs.
     
  12. bilos
    bilos WRInaute impliqué
    Inscrit:
    11 Octobre 2005
    Messages:
    629
    J'aime reçus:
    0
Chargement...
Similar Threads - bloquer proxys spammeurs Forum Date
Bots scrapers et impact SEO : comment les bloquer ? Crawl et indexation Google, sitemaps 21 Mai 2022
Bloquer les IP d'un pays Administration d'un site Web 4 Mars 2022
Comment bloquer à coup sûr l'indexation par les moteurs de recherche Crawl et indexation Google, sitemaps 7 Décembre 2020
Chrome va bloquer les ressources HTTP sur pages HTTPS Référencement Google 5 Octobre 2019
Bloquer accès admin Google Analytics par adresse IP Google Analytics 19 Septembre 2019
Comment bloquer les vidéos automatiques ? Facebook 28 Juillet 2019
Réseau de site backlinks : comment bloquer par htaccess ? Tests et études de cas 6 Juin 2019
Bloquer une section dans mon fichier robots.txt Débuter en référencement 9 Novembre 2018
Chrome 70 va bloquer de nombreux sites web Google : l'entreprise, les sites web, les services 10 Octobre 2018
WordPress Bloquer ou non WP include dans le robots.txt ? Référencement Google 5 Septembre 2018
fichier robots.txt bloquer paramètre p= Crawl et indexation Google, sitemaps 4 Septembre 2018
Adsense - Impossible de bloquer des annonceurs ! AdSense 19 Avril 2018
bloquer l'accès au site à certains "mauvais'bots Administration d'un site Web 26 Mars 2018
Débloquer un modem, légal ou interdit ? Le café de WebRankInfo 6 Février 2018
Comment bloquer des URLs externes Crawl et indexation Google, sitemaps 4 Novembre 2017
Comment bloquer les voleurs de contenu ? Débuter en référencement 7 Juin 2017
Bloquer l'indexation de la recherche Débuter en référencement 18 Janvier 2017
bloquer un spammeur ( boston ) que je vois sur analytics ? Crawl et indexation Google, sitemaps 16 Janvier 2017
Débloquer ressources dans Search Console Débuter en référencement 14 Mai 2016
Bloquer toute une plage IP en n'en laissant passer qu'une seule URL Rewriting et .htaccess 1 Avril 2016