Bots scrapers et impact SEO : comment les bloquer ?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par Isa, 21 Mai 2022.

  1. Isa
    Isa WRInaute discret
    Inscrit:
    31 Août 2002
    Messages:
    199
    J'aime reçus:
    4
    Bonjour,

    J'ai remarqué que des bots scrapers copiaient sur des sites (sans mentions légales) le contenu des articles avec photos / titres etc.. C'est de l'automatique. Aussitôt posté sur le site original, quelques secondes ou minutes après c'est le site "copieur".
    Je voulais savoir quel est l'impact pour le SEO ? car j'ai pu les voir indexés dans Google (malgré dénonciation via le formulaire à Google, mais bon je dénonce tel ou tel article mais il y en a des centaines ou plus..). Donc Google supprime la page en question, mais d'autres voient le jour.

    Vous avez une technique pour bloquer ces robots via wordpress ? J'ai vu quelques plugins mais je ne sais pas trop ce qu'ils valent. Merci pour vos retours d'expérience.
     
  2. erwinol2
    erwinol2 WRInaute discret
    Inscrit:
    19 Juillet 2020
    Messages:
    61
    J'aime reçus:
    10
    Faut peut-être commencer par là et voir ce que ça donne, non ?
     
  3. rick38
    rick38 WRInaute passionné
    Inscrit:
    23 Février 2013
    Messages:
    2 094
    J'aime reçus:
    378
    En général Google sait très bien quelle est la page originale, la plus ancienne quoi, donc je ne m'en préoccupe pas.
     
  4. Isa
    Isa WRInaute discret
    Inscrit:
    31 Août 2002
    Messages:
    199
    J'aime reçus:
    4
    Oui c’est ce que je me disais de be pas y prêter attention… mais certains sites (populaires aussi pourtant) n’ont pas ce problème… quand on fait des recherches google.
    pour les plugins, j’ai vu Wordfence mais je ne sais pas s’il fait le job…jd voudrais avoir dss retours pour savoir s’il est efficace pour ce problème ou s’il y a autre chose à faire techniquement !
    merci
     
  5. GoodCity.fr
    GoodCity.fr Nouveau WRInaute
    Inscrit:
    30 Mai 2022
    Messages:
    13
    J'aime reçus:
    2
    Hello,
    Alors il y a des methodes "payante" (ex: leboncoin et d'autres gros sites utilisent DataDome) .. mais c'est toujours possible de passer dans les mailles du filet.

    Une methode "simple" mais couteuse en tant .. changer régulierement les positions de tes div, changer leur nom (id) et .. modifier régulierement le nom de tes class .. donc en gros .. lourd ... mais le robot de l'utilisateur devra également être mis à jour à chaque fois que tu fais une MAJ.

    En gros, je pense que tu vas perdre plus (d'énergie) que en gagner.
     
  6. Isa
    Isa WRInaute discret
    Inscrit:
    31 Août 2002
    Messages:
    199
    J'aime reçus:
    4
    merci GoodCity, on est ok ça prend beaucoup de temps... :(
     
Chargement...
Similar Threads - Bots scrapers impact Forum Date
Audit SEO : questions techniques sur robots.txt Demandes d'avis et de conseils sur vos sites 19 Septembre 2022
Page de Login et fichier Robots.Txt Débuter en référencement 11 Septembre 2022
Duplicate content "?p=..." et robots.txt Crawl et indexation Google, sitemaps 7 Septembre 2022
Meta robots noindex WordPress Problèmes de référencement spécifiques à vos sites 9 Août 2022
Comment expliquer l'augmentation du trafic venant des bots? Administration d'un site Web 18 Juillet 2022
robots.txt bloque l'accès à mon site par Google Débuter en référencement 7 Juillet 2022
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
canonical et robots=index sur une même page Débuter en référencement 7 Décembre 2021
le noindex dans le robots.txt Débuter en référencement 19 Novembre 2021
suppression des pages bloquées par robots.txt Débuter en référencement 18 Octobre 2021
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps 14 Juillet 2021
Les mots-clés de mon site ne sont pas détectés par les robots de référencement Problèmes de référencement spécifiques à vos sites 7 Juillet 2021
Wordpress et le robots.txt Débuter en référencement 21 Juin 2021
Search Console noindex détecté dans la balise Meta robots Débuter en référencement 21 Mai 2021
Urls filtrées indexées et crawl robots.txt Crawl et indexation Google, sitemaps 19 Mai 2021
404/410 vides pour les bots ? Débuter en référencement 17 Mai 2021
Robots : n'autoriser que les 4 ou 5 moteurs de recherche principaux Crawl et indexation Google, sitemaps 15 Janvier 2021
erreurs robots.txt Crawl et indexation Google, sitemaps 23 Décembre 2020
Comment éviter un piège à bots avec un crawler ? Crawl et indexation Google, sitemaps 3 Décembre 2020
Google me dit que ma page est bien indexée mais bloquée par robots.txt Crawl et indexation Google, sitemaps 25 Novembre 2020