Copie massive de sites ?

  • Auteur de la discussion Auteur de la discussion lou-ve
  • Date de début Date de début
WRInaute discret
Salut

Je sais pas si je poste au bon endroit, mais j'ai trouvé un site dont le proprietaire semble etre un russe vivant aux USA et hébergé en allemagne. Sur son site il y a 7520 pages copiées sur wikipedia france. Il a copié texto 2000 pages de mon site et bien d'autres. Quelqu'un sait ce que c'est ?
dans Google faites
site:www.ipzap.com

ou
site:www.ipzap.com wikipedia
 
WRInaute discret
Pas de réponse ? Etonnant

J'ai l'impression d'etre tombe sur truc assez exceptionnel.
Ou alors c'est un truc du genre waybackmachine, mais ce qui est bizarre c'est qu'il sort dans google et que certaines des ses pages copiées ont du PR

Il a 28 pages de webrankinfo
 
WRInaute discret
de ce que je sais c'est un service qui permet de surfer anonynement en " zappant " l'ip et en redirigeant vers une page. Comme par exemple pour tromper les services comme rapidshare etc.
peut etre est ce qu'il stocke des pages des sites dont les gens indiquent l'url dans le champs du formulaire.
 
WRInaute accro
Les images ne sont pas toutes stockées. Et comme ce sont 2 sites de photos qu' "ils" me pompent, c'est un peu con !
 
WRInaute discret
Incroyable

Depuis quand les pages de proxy sortent dans Google.

Il sort en 1ere page sur mes mots clé avec une copie de mes pages et en plus la copie a un meilleur PR que la mienne.

Je commence à me poser des questions sur le fameux algorithme de notre moteur prefere
 
WRInaute impliqué
Onthisplanet a dit:
Les images ne sont pas toutes stockées. Et comme ce sont 2 sites de photos qu' "ils" me pompent, c'est un peu con !

pareil pour mon site il est pompé sans les images ...
et comme mon site est un site basé sur le visuel ... :lol:
je ne vois pas trop l'utilité.
 
WRInaute discret
Il affiche pas mes pubs google dans les copies. Ca se comprend. et heureusement pour nous parce qu'il y en a qui se font virer d'adsense pour moins que ça.

Il a 147 000 pages indexées et ça doit donner à son site une certaine puissance qu'il doit exploiter dans une autre partie du site. Pour moi, c'est ça son intérêt
 
WRInaute discret
un autre truc marrant il a pas pris de mon site mais il a pris plein de mes partenaires, ca fait qu'il a doublé le nombre de backlincks de mon site avec sa connerie, moi qui me disait que ca montait assez vite sans que je fasse grand chose de plus, c'est un peu l'arnaque, en plus il a pas le PR, ni le trafic de mes partenaires ;)
 
WRInaute discret
Ha ! J'comprends pas pourquoi on trouve des pages de proxy dans les recherches google. Pourquoi il donne pas les originales.
Avec les photos c'est mieux :lol:
 
WRInaute discret
Ok c'est un proxy

Mais pour moi c'est pas normal qu'un proxy sorte dans Google et que ses pages elles aient du PR. La question que je me pose c'est au sujet du risque de duplicate content parce qu'il y a plein de proxies sur internet et ils se comportent pas de la même manière.

Autrement dit, si le proxy sort devant moi sur une requète et que la copie sort devant l'original, y a probleme quelque part.

Question : c'est normal que les pages d'un proxy sorte dans Google ?
 
WRInaute impliqué
e vois bien la copie de DMOZ anglais. Mais comment y retrouvez vous la copie de vos sites ou des images?
C'est quand même époustouflant!
:x
 
WRInaute discret
En fait en y regardant de plus près ça ne peut pas être un proxy. C'est bien un site qui copie.
 
WRInaute discret
Pour voir par exemple les pages copiées de wikipedia colle ou écris la ligne qui suit dans la barre Google :

site:www.ipzap.com wikipedia

Tu peux tester autre chose en collant ça :

site:www.ipzap.com chauffeurdebuzz

tu verras des pages du blog chauffeurdebuzz copiées et sans les photos
 
WRInaute impliqué
Merci Louve, ils ont bien mon site aussi. Pourquoi sont-ils intéressés, ça mystère. Ils ont recopié l'annuaire des artistes!! :) :)
 
WRInaute accro
Ce n'est rien de grave, réflexion faite.
C'est un moyen pour accéder à un site sans laisser son IP.
Pendant qu'il affiche les pages on voit ses accés dans les logs, donc dans les stats à cette adresse IP : u15186622.onlinehome-server.com

Il suffit de modifier un mot dans une page et de tester pour voir que c'est du direct, pas du stock.

Google lui attribue ces pages parce qu'il n'a pas pigé la manoeuvre.
C'est un GC, par moment.
 
WRInaute discret
Il laisse même, dans les logs, la signature du browser du demandeur :

"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322; .NET CLR 1.0.3705)"
"Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.4) Gecko/20061201 Firefox/2.0.0.4 (Ubuntu-feisty)"
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut