Pompage de mon site - Mirror and index made by HTTrack...

WRInaute impliqué
Bonjour,

j'ai découvert un site qui récupère absolument tout ce qui est sur mon site avec la mise en forme, images, texte... Lorsque je fait site:sitequispam.com dans google il y a les titles, descriptions... de mon site !

Lorsque je vais sur l'accueil du site il y a une page qui apparait pendant 1 secondes à peine et j'ai réussit à l'avoir C'est écrit "Mirror and index made by HTTrack Website Copier [XR&CO'2002]"

Je souhaiterai bloquer totalement ce site en lui interdisant de récupérer les données.

Je peut donner l'adresse du site en question par mp.


merci.
 
WRInaute passionné
c'est pas le site que tu dois blacklister. En tout cas pas uniquement. Il faut blacklister aussi l'IP du PC du proprio du site...

Sinon il faut coder un truc dans le htaccess pour refuser les connexions de ce logiciel. Cherche sur le forum.

lolo
 
WRInaute impliqué
Oui j'ai peur d'un duplicat content, et dans le whois du site il y a le numéro de téléphone de la proprio (en plus elle est du nord).
J'ai cherché pour bloquer l'ip du site et j'ai trouvé un truc mais sa fonctionne pas.
 
WRInaute passionné
HTTrack est un aspirateur, une fois qu'il a aspiré, c'est fait.
Simplement, ce logiciel ajoute sa signature dans le code des pages.

A priori, quelqu'un a aspiré ton site et mis en ligne sous un autre nom de domaine.

Le truc rigolo à faire, si tu avais certaines images avec des URL absolues, c'est de modifier le nom des tiennes, et pour lui, tu remplaces les images par d'autres du genre "Ce site est une copie frauduleuse de xxxx" ou autre idées de ton cru.

Plus d'info sur les petites histoires du vol de contenu :
-http://blog.axe-net.fr/plagiat-liste-voleurs-contenu/
http://www.lejournaldublog.com/que-fair ... e-plagiat/
-http://blog.axe-net.fr/duplicate-content-plagiat/
 
WRInaute passionné
Si tu veux éviter que l'hémorragie se propage plus, interdit l'accès à HTTrack via htaccess; cela évitera au moins que le pompage intégral continue. ;-)
 
WRInaute impliqué
Merci SR je vais voir sa.

anemone-clown a dit:
Si tu veux éviter que l'hémorragie se propage plus, interdit l'accès à HTTrack via htaccess; cela évitera au moins que le pompage intégral continue. ;-)

J'ai mis ceci (source)
Code:
RewriteCond  %{HTTP_USER_AGENT}  wget [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  Gigabot [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  Xenu\ Link\ Sleuth [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  larbin [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  HTTrack [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  PhpDig [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  WebCopier [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  LWP::Simple [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  libwww [NC,OR]
RewriteCond  %{HTTP_USER_AGENT}  lwp-trivial    [NC,OR]
RewriteCond %{X-moz} prefetch
RewriteRule  .*   -   [F]

Mais le site qui aspire mon site fonctionne toujours.



Il y a aussi un blog ifrance qui me vol aussi du contenu un simpel copié/collé de l'index du même site touché par cet aspirateur. Le blog ifrance fait sa avec plusieurs sites web; j'ai prévenu ifrance... Je n'ai décidément pas de chance !
 
WRInaute passionné
!!!!!!!!!!!!!!!!!!!!!!!!!

Rajoute des balises de type commentaire !!!

Cela t'aidera en cas de problème. N'oublie pas d'en mettre plusieurs, avec des phrases différentes, et disséminées (de manière automatique, et pas au même endroit, cela permet d'éviter de les enlever facilement)

Exemple :

<!-- Cette page provient de ... -->

ou

<!-- Le contenu de cette page a été volé sur ... -->

ou sinon ajoute des backlinks cachés :) :) :) via z-index ou sur un div bien positionné !

Lolo
 
WRInaute impliqué
anemone-clown a dit:
Si tu veux éviter que l'hémorragie se propage plus, interdit l'accès à HTTrack via htaccess; cela évitera au moins que le pompage intégral continue. ;-)

il suffira de changer l'identification dans httrack pour mettre l'id d'un navigateur quelconque.

aurelien59 a dit:
C'est écrit "Mirror and index made by HTTrack Website Copier [XR&CO'2002]"

il est pas malin, car c'est une option que l'on peut retirer et ne rien mettre au moment du back up !
 
WRInaute impliqué
aurelien59 a dit:
J'ai cherché pour bloquer l'ip.

ce logiciel gére aussi les proxy !


le seul truc serait d'éviter d'autoriser un trop grand nombre de pages dans un temps limité, mais faut voir à pas bloquer les spiders de google ! et ce log peut aussi faire de la temporisation !
 
WRInaute accro
Tu peux aussi faire du cloaking et balancer de GROSSES images aléatoires, prises sur un autre serveur (genre google.com, flickr.com ...) comme ça le type va être "vénére" quand il découvrira que non seulement il n'a pas pompé le site, mais en plus qu'il a rempli son disque dur pour rien.
 
WRInaute impliqué
Franchement je comprend rien à se que vous dites :|

si je change les images sur mon site tout les visiteurs le verront !!?

Je souhaite juste que ce site qui pompe mes infos devienne HS , j'ai mis le code cité plus haut et sa change absolument rien !


Ensuite tout sa me dépasse, pourquoi pomper un site si les pubs me rapporte à moi je vois pas l'intérêt de l'action du site qui pompe si se n'est d'emmerder son monde !
 
WRInaute impliqué
tu as contacté la personne qui a recopié ton site ? J'ai deja eu le cas. . un étudiant qui faisait un test .. Ca doit se regler rapidement ..
 
WRInaute accro
mariea a dit:
tu as contacté la personne qui a recopié ton site ? J'ai deja eu le cas. . un étudiant qui faisait un test .. Ca doit se regler rapidement ..

C'est toujours un test... ou "de la faute d'un stagiaire"... :roll:
 
WRInaute passionné
Kounte a dit:
il suffira de changer l'identification dans httrack pour mettre l'id d'un navigateur quelconque.
Il faut alors supposer que l'utilisateur est chevronné, auquel cas, pas grand chose ne peut arrêter un véritable "plagieur". En revanche, cela aura le mérite de stopper, ou pour le moins de limiter, les véléités des débutants!!!

La preuve :
aurelien59 a dit:
C'est écrit "Mirror and index made by HTTrack Website Copier [XR&CO'2002]"
il est pas malin, car c'est une option que l'on peut retirer et ne rien mettre au moment du back up !
Je ne suis pas persuadé que la majorité des utilisateurs de logiciels de ce type savent réellement exploiter la quintescence de ces outils.
 
WRInaute passionné
Kounte a dit:
le seul truc serait d'éviter d'autoriser un trop grand nombre de pages dans un temps limité, mais faut voir à pas bloquer les spiders de google ! et ce log peut aussi faire de la temporisation !
Je suis tout à fait d'accord :wink: , c'est certainement la meilleure solution : il faut bannir les IP qui chargent des pages trop vite. Mais cela reste l'apanage des administrateurs de serveurs dédiés... Avec un hébergement mutualisé, il n'y a guère de salut. :?

Et quand bien même de nombreuses solutions seraient mises en place, un "pro" passera au travers de toutes ces parades avec un nouvel outil, avec un nouvelle possibilité, etc.

L'important ne réside-t'il pas de protéger le contenu de nos sites envers les "amateurs" (par opposition aux "pros")?
 
Discussions similaires
Haut