Comment bloquer les voleurs de contenu ?

Discussion dans 'Débuter en référencement' créé par refweb, 7 Juin 2017.

  1. refweb
    refweb WRInaute discret
    Inscrit:
    28 Mars 2008
    Messages:
    221
    J'aime reçus:
    0
    Bonjour,

    Je ne sais pas si vraiment des astuces existent, mais je pose la question, on ne sait jamais. Apparemment bloquer des pays, des ips dans htaccess, robots.txt ca sert à rien quand un mec utilise des logiciels de black hat, du coup comment se protéger ? il n'y a aucune solution ?? :?
     
  2. arnaudmn
    arnaudmn WRInaute passionné
    Inscrit:
    11 Mai 2005
    Messages:
    1 038
    J'aime reçus:
    2
    Bonjour,

    Si tu connais des adresses IPs à bloquer par exemple, tu peux le faire via htaccess ou dans le code (en testant $_SERVER['REMOTE_ADDR']). Ou sur le $HTTP_USER_AGENT ... Mais encore faut-il connaitre ce qui sera utilisé par les logiciels.
     
  3. refweb
    refweb WRInaute discret
    Inscrit:
    28 Mars 2008
    Messages:
    221
    J'aime reçus:
    0
    Et tu fais comment ????? car oui bloquer les ips ca sert à rien surtout quand c'est un pro BH.
     
  4. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    9 207
    J'aime reçus:
    365
    Code:
    service nginx stop
     
  5. rick38
    rick38 WRInaute passionné
    Inscrit:
    23 Février 2013
    Messages:
    2 096
    J'aime reçus:
    380
    Charger en AJAX le contenu de l'article à partir du moment où l'utilisateur a commencé à scroller.
    Les scripts qui chargent une page ne déclenchent pas l'événement de scroll en général.

    Mais il n'y a pas de solution quand une personne vise spécifiquement une page, si la personne peut y accéder, alors elle peut la copier.
     
  6. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    9 207
    J'aime reçus:
    365
    @rick38: même avec cette technique, c'est copiable. Comme tu dis, si on te cible c'est peine perdue.
     
  7. elas
    elas WRInaute impliqué
    Inscrit:
    26 Février 2008
    Messages:
    752
    J'aime reçus:
    30
    bloquer ponctuellement des copies de pages, il n'y a pas beaucoup de solutions sauf administratives.
    Par contre, bloquer des scrappeur de sites complet c'est tout à fait faisable et nécessaire.

    Par contre je ne sais pas si c'est le bon forum pour en parler techniquement, ca n'a pas grand rapport avec le référencement. C'est plutôt dans le secteur : sécurité web.

    Donc dans les grandes lignes : les spiders et toutes les sortes d'outils tels que des scrappeur n'ont pas du tout le même comportement que les humains. Dans les logs (même des logs de plusieurs centaines de mo par jours), c'est très facile de les repérer. Tellement repérables qu'on peut avec de très simple algorithmes les détecter pour la plupart à la volée (on parlait du javascript sur d'autres threads de ce forum, et bien aucun ne lit le javascript par exemple alors que les browsers les lisent et font les requetes demandées par le javascript....) .
    Et oui, on bloque les ip, mais on bloque les ip automatiquement.

    Pour résumer : si c'est un humain qui copie colle des contenus, a part une solution administratives : on ne peut rien faire
    Si c'est un logiciel, en face on développe un logiciel (d'ailleurs c'est aussi plaisant des fois d'envoyer des requêtes en provenance de certains pays dans un pot de miel)
     
Chargement...
Similar Threads - bloquer voleurs contenu Forum Date
Astuce Bloquer ip utilisateur actions étranges sur mon site Le café de WebRankInfo 13 Août 2022
Bots scrapers et impact SEO : comment les bloquer ? Crawl et indexation Google, sitemaps 21 Mai 2022
Bloquer les IP d'un pays Administration d'un site Web 4 Mars 2022
Comment bloquer à coup sûr l'indexation par les moteurs de recherche Crawl et indexation Google, sitemaps 7 Décembre 2020
Chrome va bloquer les ressources HTTP sur pages HTTPS Référencement Google 5 Octobre 2019
Bloquer accès admin Google Analytics par adresse IP Google Analytics 19 Septembre 2019
Comment bloquer les vidéos automatiques ? Facebook 28 Juillet 2019
Réseau de site backlinks : comment bloquer par htaccess ? Tests et études de cas 6 Juin 2019
Bloquer une section dans mon fichier robots.txt Débuter en référencement 9 Novembre 2018
Chrome 70 va bloquer de nombreux sites web Google : l'entreprise, les sites web, les services 10 Octobre 2018
WordPress Bloquer ou non WP include dans le robots.txt ? Référencement Google 5 Septembre 2018
fichier robots.txt bloquer paramètre p= Crawl et indexation Google, sitemaps 4 Septembre 2018
Adsense - Impossible de bloquer des annonceurs ! AdSense 19 Avril 2018
bloquer l'accès au site à certains "mauvais'bots Administration d'un site Web 26 Mars 2018
Débloquer un modem, légal ou interdit ? Le café de WebRankInfo 6 Février 2018
Comment bloquer des URLs externes Crawl et indexation Google, sitemaps 4 Novembre 2017
Bloquer l'indexation de la recherche Débuter en référencement 18 Janvier 2017
bloquer un spammeur ( boston ) que je vois sur analytics ? Crawl et indexation Google, sitemaps 16 Janvier 2017
Débloquer ressources dans Search Console Débuter en référencement 14 Mai 2016
Bloquer toute une plage IP en n'en laissant passer qu'une seule URL Rewriting et .htaccess 1 Avril 2016