Pompage de mon site - Mirror and index made by HTTrack...

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par aurelien59, 10 Octobre 2008.

  1. aurelien59
    aurelien59 WRInaute impliqué
    Inscrit:
    25 Juillet 2006
    Messages:
    617
    J'aime reçus:
    1
    Bonjour,

    j'ai découvert un site qui récupère absolument tout ce qui est sur mon site avec la mise en forme, images, texte... Lorsque je fait site:sitequispam.com dans google il y a les titles, descriptions... de mon site !

    Lorsque je vais sur l'accueil du site il y a une page qui apparait pendant 1 secondes à peine et j'ai réussit à l'avoir C'est écrit "Mirror and index made by HTTrack Website Copier [XR&CO'2002]"

    Je souhaiterai bloquer totalement ce site en lui interdisant de récupérer les données.

    Je peut donner l'adresse du site en question par mp.


    merci.
     
  2. loran750
    loran750 WRInaute passionné
    Inscrit:
    15 Mars 2005
    Messages:
    2 009
    J'aime reçus:
    0
    c'est pas le site que tu dois blacklister. En tout cas pas uniquement. Il faut blacklister aussi l'IP du PC du proprio du site...

    Sinon il faut coder un truc dans le htaccess pour refuser les connexions de ce logiciel. Cherche sur le forum.

    lolo
     
  3. aurelien59
    aurelien59 WRInaute impliqué
    Inscrit:
    25 Juillet 2006
    Messages:
    617
    J'aime reçus:
    1
    Oui j'ai peur d'un duplicat content, et dans le whois du site il y a le numéro de téléphone de la proprio (en plus elle est du nord).
    J'ai cherché pour bloquer l'ip du site et j'ai trouvé un truc mais sa fonctionne pas.
     
  4. sr
    sr WRInaute passionné
    Inscrit:
    15 Mai 2003
    Messages:
    1 139
    J'aime reçus:
    0
    HTTrack est un aspirateur, une fois qu'il a aspiré, c'est fait.
    Simplement, ce logiciel ajoute sa signature dans le code des pages.

    A priori, quelqu'un a aspiré ton site et mis en ligne sous un autre nom de domaine.

    Le truc rigolo à faire, si tu avais certaines images avec des URL absolues, c'est de modifier le nom des tiennes, et pour lui, tu remplaces les images par d'autres du genre "Ce site est une copie frauduleuse de xxxx" ou autre idées de ton cru.

    Plus d'info sur les petites histoires du vol de contenu :
    -http://blog.axe-net.fr/plagiat-liste-voleurs-contenu/
    http://www.lejournaldublog.com/que-fair ... e-plagiat/
    -http://blog.axe-net.fr/duplicate-content-plagiat/
     
  5. anemone-clown
    anemone-clown WRInaute passionné
    Inscrit:
    11 Novembre 2007
    Messages:
    1 577
    J'aime reçus:
    20
    Si tu veux éviter que l'hémorragie se propage plus, interdit l'accès à HTTrack via htaccess; cela évitera au moins que le pompage intégral continue. ;-)
     
  6. aurelien59
    aurelien59 WRInaute impliqué
    Inscrit:
    25 Juillet 2006
    Messages:
    617
    J'aime reçus:
    1
    Merci SR je vais voir sa.

    J'ai mis ceci (source)
    Code:
    RewriteCond  %{HTTP_USER_AGENT}  wget [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  Gigabot [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  Xenu\ Link\ Sleuth [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  larbin [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  HTTrack [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  PhpDig [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  WebCopier [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  LWP::Simple [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  libwww [NC,OR]
    RewriteCond  %{HTTP_USER_AGENT}  lwp-trivial    [NC,OR]
    RewriteCond %{X-moz} prefetch
    RewriteRule  .*   -   [F]
    Mais le site qui aspire mon site fonctionne toujours.



    Il y a aussi un blog ifrance qui me vol aussi du contenu un simpel copié/collé de l'index du même site touché par cet aspirateur. Le blog ifrance fait sa avec plusieurs sites web; j'ai prévenu ifrance... Je n'ai décidément pas de chance !
     
  7. loran750
    loran750 WRInaute passionné
    Inscrit:
    15 Mars 2005
    Messages:
    2 009
    J'aime reçus:
    0
    !!!!!!!!!!!!!!!!!!!!!!!!!

    Rajoute des balises de type commentaire !!!

    Cela t'aidera en cas de problème. N'oublie pas d'en mettre plusieurs, avec des phrases différentes, et disséminées (de manière automatique, et pas au même endroit, cela permet d'éviter de les enlever facilement)

    Exemple :

    <!-- Cette page provient de ... -->

    ou

    <!-- Le contenu de cette page a été volé sur ... -->

    ou sinon ajoute des backlinks cachés :) :) :) via z-index ou sur un div bien positionné !

    Lolo
     
  8. Kounte
    Kounte WRInaute impliqué
    Inscrit:
    16 Septembre 2003
    Messages:
    626
    J'aime reçus:
    0
    il suffira de changer l'identification dans httrack pour mettre l'id d'un navigateur quelconque.

    il est pas malin, car c'est une option que l'on peut retirer et ne rien mettre au moment du back up !
     
  9. Kounte
    Kounte WRInaute impliqué
    Inscrit:
    16 Septembre 2003
    Messages:
    626
    J'aime reçus:
    0
    ce logiciel gére aussi les proxy !


    le seul truc serait d'éviter d'autoriser un trop grand nombre de pages dans un temps limité, mais faut voir à pas bloquer les spiders de google ! et ce log peut aussi faire de la temporisation !
     
  10. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 502
    J'aime reçus:
    0
    Tu peux aussi faire du cloaking et balancer de GROSSES images aléatoires, prises sur un autre serveur (genre google.com, flickr.com ...) comme ça le type va être "vénére" quand il découvrira que non seulement il n'a pas pompé le site, mais en plus qu'il a rempli son disque dur pour rien.
     
  11. aurelien59
    aurelien59 WRInaute impliqué
    Inscrit:
    25 Juillet 2006
    Messages:
    617
    J'aime reçus:
    1
    Franchement je comprend rien à se que vous dites :|

    si je change les images sur mon site tout les visiteurs le verront !!?

    Je souhaite juste que ce site qui pompe mes infos devienne HS , j'ai mis le code cité plus haut et sa change absolument rien !


    Ensuite tout sa me dépasse, pourquoi pomper un site si les pubs me rapporte à moi je vois pas l'intérêt de l'action du site qui pompe si se n'est d'emmerder son monde !
     
  12. mariea
    mariea WRInaute impliqué
    Inscrit:
    6 Mai 2005
    Messages:
    561
    J'aime reçus:
    0
    tu as contacté la personne qui a recopié ton site ? J'ai deja eu le cas. . un étudiant qui faisait un test .. Ca doit se regler rapidement ..
     
  13. aurelien59
    aurelien59 WRInaute impliqué
    Inscrit:
    25 Juillet 2006
    Messages:
    617
    J'aime reçus:
    1
    Je vais la contacter demain.
     
  14. TOMHTML
    TOMHTML WRInaute accro
    Inscrit:
    25 Août 2004
    Messages:
    2 502
    J'aime reçus:
    0
    C'est toujours un test... ou "de la faute d'un stagiaire"... :roll:
     
  15. anemone-clown
    anemone-clown WRInaute passionné
    Inscrit:
    11 Novembre 2007
    Messages:
    1 577
    J'aime reçus:
    20
    Il faut alors supposer que l'utilisateur est chevronné, auquel cas, pas grand chose ne peut arrêter un véritable "plagieur". En revanche, cela aura le mérite de stopper, ou pour le moins de limiter, les véléités des débutants!!!

    La preuve :
    Je ne suis pas persuadé que la majorité des utilisateurs de logiciels de ce type savent réellement exploiter la quintescence de ces outils.
     
  16. anemone-clown
    anemone-clown WRInaute passionné
    Inscrit:
    11 Novembre 2007
    Messages:
    1 577
    J'aime reçus:
    20
    Je suis tout à fait d'accord :wink: , c'est certainement la meilleure solution : il faut bannir les IP qui chargent des pages trop vite. Mais cela reste l'apanage des administrateurs de serveurs dédiés... Avec un hébergement mutualisé, il n'y a guère de salut. :?

    Et quand bien même de nombreuses solutions seraient mises en place, un "pro" passera au travers de toutes ces parades avec un nouvel outil, avec un nouvelle possibilité, etc.

    L'important ne réside-t'il pas de protéger le contenu de nos sites envers les "amateurs" (par opposition aux "pros")?
     
Chargement...
Similar Threads - Pompage Mirror made Forum Date
Marre du pompage de contenu, quel moyen pour bloquer les spamcrawler Administration d'un site Web 2 Avril 2010
Liaison de fichiers - Pompage de bande passante - comment le voir ? Administration d'un site Web 1 Octobre 2009
Pompage de site a grande échelle Référencement Google 13 Septembre 2005
"pompage de site" Administration d'un site Web 3 Août 2005
DNS mirroring Administration d'un site Web 14 Novembre 2010