WRInaute discret
Bonjour,
Comme certains (Bollywood fait bloquer le site en Inde) je n'apprécie pas du tout Archive.org. Clairement ils s'assoient sur le droit d'auteur et pompe à tout va no sites web.
Il y avait un script qu'ils avaient proposé il y plus de 5 ans à mettre dans robots.txt, on s'est aperçu rapidement que ce script n' a pas marché très longtemps :
User-agent: ia_archiver
Disallow: /
User-agent: archive.org_bot
Disallow: /
User-agent: ia_archiver-web.archive.org
Disallow: /
Donc certains ont eu l'idée de bloquer carrément le moteur dans le htaccess et ça a marché !
# BANNISSEMENT DE ARCHIVE.ORG ET WAYBACK MACHINE
RewriteEngine on
SetEnvIfNoCase User-Agent ^archive.org_bot bad_bot
SetEnvIfNoCase User-Agent ^ia_archiver bad_bot
SetEnvIfNoCase User-Agent ^ia_archiver-web.archive.org bad_bot
Deny from env=bad_bot
JUSQU'À DÉCEMBRE 2021 !!!!!
Je viens de me rendre compte qu'ils ont recommencé à passé outre et qu'ils recommencent à pomper mes sites.
Quelqu'un à une idée ou un script pour les bloquer ??
Alors je ne veux pas parler de la procédure manuelle qui est de les contacter que j'ai déjà employé 5 fois et qui est ultra ch... (il faut faire une copy d'un email juridique en anglais pour les astreindres à le virer dans le cadre des données informatiques...) pour leur demander de virer des sites, ça marche mais je veux le faire aussi pour mes clients de façon automatique, donc pas à la main.
Merci d'avance si vous avez des tuyaux. Je sais qu'il y avait un script qui bloquaient carrément leurs adresses IPs, je l'avais mais je l'ai pas retrouvé.
Comme certains (Bollywood fait bloquer le site en Inde) je n'apprécie pas du tout Archive.org. Clairement ils s'assoient sur le droit d'auteur et pompe à tout va no sites web.
Il y avait un script qu'ils avaient proposé il y plus de 5 ans à mettre dans robots.txt, on s'est aperçu rapidement que ce script n' a pas marché très longtemps :
User-agent: ia_archiver
Disallow: /
User-agent: archive.org_bot
Disallow: /
User-agent: ia_archiver-web.archive.org
Disallow: /
Donc certains ont eu l'idée de bloquer carrément le moteur dans le htaccess et ça a marché !
# BANNISSEMENT DE ARCHIVE.ORG ET WAYBACK MACHINE
RewriteEngine on
SetEnvIfNoCase User-Agent ^archive.org_bot bad_bot
SetEnvIfNoCase User-Agent ^ia_archiver bad_bot
SetEnvIfNoCase User-Agent ^ia_archiver-web.archive.org bad_bot
Deny from env=bad_bot
JUSQU'À DÉCEMBRE 2021 !!!!!
Je viens de me rendre compte qu'ils ont recommencé à passé outre et qu'ils recommencent à pomper mes sites.
Quelqu'un à une idée ou un script pour les bloquer ??
Alors je ne veux pas parler de la procédure manuelle qui est de les contacter que j'ai déjà employé 5 fois et qui est ultra ch... (il faut faire une copy d'un email juridique en anglais pour les astreindres à le virer dans le cadre des données informatiques...) pour leur demander de virer des sites, ça marche mais je veux le faire aussi pour mes clients de façon automatique, donc pas à la main.
Merci d'avance si vous avez des tuyaux. Je sais qu'il y avait un script qui bloquaient carrément leurs adresses IPs, je l'avais mais je l'ai pas retrouvé.