Une faille dans Google exploitée par des hackers pour voler le référencement : que faire ?

Nouveau WRInaute
Bonjour à tous,

Il y a une attaque massive sur Google qui fait perdre énormément de référencement à des sites comme le mien

http://www.sos-commentmaigrir.com/

mais aussi à des gros sites plus institutionnels tels que Forum Doctissimo, Wikihow ...

Cette attaque ne se produit pas sur Yahoo ou Bing par exemple.

Pour que ce soit rapidement compréhensible, tapez par exemple "regime rapide" sur google.

Le premier résultat était jusqu'à présent mon site http://www.sos-commentmaigrir.com/regime-rapide-pour-maigrir-tres-vite/

Mais depuis quelques jours, Google a référencé un site qui a été "hacké" en l'occurence (www.imekofoods.org/fr584/) sur lequel le hacker a copié mon contenu et a réussit à faire croire à Google que le contenu qu'il a copié était l'original.

Voir le cache suivant:

"http://webcache.googleusercontent.com/search?q=cache:tA4sOygt6A0J:www.imekofoods.org/fr584/+&cd=1&hl=en&ct=clnk&gl=fr"

Par conséquent, Google a donc déréférencé mon url et l'a remplacée par celle du hacker.

Ces sites hackés ont ensuite une redirection vers ce site http://2016.nutres-fr.com/testimonials.html#a1220 ou vers une page 404.

Ceci n'est qu'un exemple mais il y en a des centaines d'autres.

Voici une liste des sites hackés que j'ai repéré jusqu'à présent (il y'en a sans doute des tas d'autres):
www.imekofoods.org/
www.sweetsisterscakes.com/
www.mensafonds.nl
www.cisb.org.br
www.secnetedu.ro/
www.antiquity.fr/
www.aikido-eaubonne.fr

Ceci arrive à mon site et à beaucoup de mes confrères sur des sites concernant la diététique ou l'alimentation. Même des gros sites comme Wikihow en voici la preuve :

Tapez sur google "graisse abdominale" et au lieu d'obtenir Wikihow, on obtient ceci :

http://webcache.googleusercontent.com/search?q=cache:fBCZDb8gA3MJ:www.imekofoods.org/fr209/+&cd=1&hl=en&ct=clnk&gl=fr

Il y a des milliers d'exemple comme ceci.

Je précise que mon site est en état, je l'ai fait vérifié de fond en comble par 2 webmaster (pas de code douteux introduits), je ne me suis pas fait piraté ma Google Search Console, j'ai un rapport complet du site sucuri.net qui explique tout ceci et que je pourrais posté ultérieurement.

J'ai également lancé une discussion sur le forum webmaster tools et mon problème va apparemment être remonté auprès de l'équipe webscam de google.

Il faut en tout cas que Google rectifie le problème car ceci n'est pas à l'avantage des utilisateurs. J'ai perdu plus de 70% de mon traffic durement acquis au cours des dernières années.

Si vous êtes dans la même situation que moi ou si vous avez des pistes de solutions et bien je suis preneur mais il me semble que ceci va être très compliqué.

En tous cas merci d'avance de votre retour.
 
WRInaute accro
si vous avez des pistes de solutions et bien je suis preneur mais il me semble que ceci va être très compliqué.

Un mot : suroptimisation
Une multitude de liens brisés
balises title a revoir
Balisage HX a revoir
 
Nouveau WRInaute
Merci pour votre réponse.

Je concède votre analyse sur la suroptimisation, les balises title ... mais ceci n'est pas l'origine du problème car il ne s'agit pas que de mon site, de nombreux autres sites sont aussi concernés par ce problème.

Pour faire simple, le problème est qu'un hacker est capable de hacké un site A (www.imekofoods.org) et ensuite copier/coller le contenu d'un site B (mon site: http://www.sos-commentmaigrir.com/) sur le site A.

Puis le génie de ce hacker réside dans sa capacité à faire croire à Google que la copie est en fait l'original.

Du coup, le site B perd son référencement et même son indexation Google sur certaines pages au profit du site A.

Et ceci dans le but de rediriger ensuite l'internaute du site A vers un site C

Comment est ce possible que Google ne distingue pas l'original de la copie ? N'y a t'il pas un remède à cela ?
 
Nouveau WRInaute
Voici un article qui résume malheureusement ce qui m'arrive.

https://www.seroundtable.com/google-investigating-polish-hacker-who-is-stealing-webmaster-traffic-21601.html
 
WRInaute passionné
Slt,

2 choses.

1 - lors de duplicate GG donne toujours la valeur à celui qui à la meilleur "popularisation".
Ex : tonton à un site en P1 il se voit dupliquer sur "Le Monde"... Le monde passe en p1 sur la requête.
C'est ainsi depuis que le DC ets pris en compte pas GG.
2 - Ton site à un indice bien moins performant que le site hacké. Donc... voir point n°1.

Y a pas de génie là dedans.

Et y pas 36 solution.
Soit tu arrives à faire ferme l'hébergeur du site hacké, soit... je suis désolé pour toi.

En fait non, pas tant désolé que cela.

Sur la requête "régime rapide", GG devrait mettre sur les 10 première page des liens vers les médecions et psychologue locaux.
Mais c'est une autre histoire. :)
 
Nouveau WRInaute
Merci pour ton retour.

Je comprends ton point de vue.

Cependant, je suis surpris qu'il n'y ait pas de correctif à ça ou un plus grand contrôle de la part de Google au sujet du DC.

Car au final si ce phénomène se répand, tout le monde est alors menacé d'être copié et de voir le déclassement de son site. Peu importe la thématique ou le contenu du site que ce soit sur les régimes, la psychologie, les plantes, la mécanique ou autre....

Aussi, quand l'internaute tape une requête et qu'il décide de cliquer sur un lien mais qu'il n'arrive pas sur la page à laquelle il s'attendait arriver, on perd le coté "user friendly" de Google.

Tout le monde à part le hacker est ainsi trompé :
- L'internaute en premier
- Le webmaster qui voit son site déréférencé
- Google, qui perd en crédibilité quant aux résultats qu'il met en avant (à savoir les sites hackés avec redirection)

J'espère qu'il y aura de plus en plus de retours auprès de la webspam team de Google en espérant que les choses changent.
 
WRInaute accro
Car au final si ce phénomène se répand

Bah, ca fait déjà un moment..

je suis surpris qu'il n'y ait pas de correctif

Mais si, il y un correctif... il est gros comme ca :
mattcutts.jpg
 
WRInaute discret
pour faire simple, la seule solution technique est de bloquer (bannir) les proxy via ton fichier .htaccess
Pour obtenir l’IP du proxy, il suffit d’aller sur une page quelconque (par exemple: http://www.imekofoods.org/test12345) et de chercher dans tes logs la requête avec « test12345 ».
 
Nouveau WRInaute
Merci pour votre réponse.

Je vais tester ceci mais je crois que la solution ne sera que temporaire car le hacker peut très bien changer de proxy et donc on ne peut pas continuellement faire ce type de démarche.

Ceci est un problème de taille car Google met en avant des sites "hackés" sur des milliers de requêtes.

C'est un problème que je n'ai jamais rencontré auparavant et pourtant je passe énormément de temps à faire des recherches sur Google. Ce n'est pas qu'un simple Duplicate Content classique et il concerne de nombreux sites. Le problème est majeur et je ne suis pas un cas isolé.

Voici un autre exemple (parmi des milliers) avec un autre site sur la santé assez connu onmeda.fr (ce n'est pas mon site)

En tapant la requête maigrir des hanches

Voici les 2 premiers résultats de Google (aujourd'hui)

Maigrir des hanches - Perdre les poignées d'amour
entrainement-sportif.fr/maigrir-hanches.htm
3 astuces pour Maigrir des Hanches et perdre les poignées d'amour: faire un régime hypocalorique, ne muscler que les transverses, faire un sport pour brûler ...

Perdre des hanches : allez on y arrive ! - Onmeda.fr
http://www.imekofoods.org/images/maigrir185/
26 févr. 2016 - Perdre des hanches – c'est un rêve que partagent de nombreuses personnes, et particulièrement les femmes. Voici nos conseils pour maigrir ...

Quand on clic sur le 2ème résultat mis en avant par Google, l'internaute s'attend à arriver sur la la page du site Onmeda mais il en est tout autre et on arrive sur le site que souhaitait le hacker.

Pensez-vous que Google va se laisser pourrir des milliers de résultats de recherche qu'il met en avant auprès des internautes de la sorte ?

J'espère que non et qu'un correctif va être mis en place rapidement afin que les pages dupliquées sur des sites hackés soit déréférencées au profit des pages des sites originaux.
 
WRInaute accro
même soucis que toi, même si pour longtemps je croise les doigts car ils ne prennent pas le dessus sur mon NDD.

Mais j'ai également des :

-www.atesex.com/go/r/www.monndd.ext/
-bypassbc.appspot.com/www.monndd.ext <-- il est en https !

qui copie intégralement mon contenu a la volée.
J'ai réussi a bloquer en partie le 2eme. Mais pas encore le 1er
et c’est déjà le 3-4 eme site du genre

Et ça semble vraiment toucher beaucoup de sites, une véritable plaie.

Non seulement ils pompent à la volée le site (ce qui utilise surement nos ressources serveurs) mais en plus changent automatiquement les liens internes pour que la navigation se fasse sur leur ndd et pas la notre.

le premeir est beaucoup plus fourbe car il affiche uniquement le site pour google !
 
Nouveau WRInaute
Bonjour Noren,

Merci de ton retour. En effet, se faire copier intégralement son contenu c'est déjà pas top.

Mais en plus, qu'il soit complètement déréférencé car Google le considère comme la copie et pas l'original, c'est catastrophique.

Comment peut-on se protéger de ça ?

J'aurai pensé que Google prendrait en compte l'ancienneté d'un contenu pour l'identifier comme étant l'original.

J'ai l'impression que la bataille est perdue d'avance car même si Google apporte un rectificatif et vire de ses résultats les sites hackés, j'ai bien l'impression que je ne récupérerai jamais le bon référencement que j'avais durement acquis auparavant.

As tu contacté google via le forum webmaster tools ? Si oui, as tu eu un retour ?

Plus de personnes le feront et plus il y aura de chance que les choses s'améliorent.
 
WRInaute accro
Actuellement je viens de réussir de les bloquer, la question c’est jusqu’à quand !
Si je le signale a GG maintenant alors qu'ils sont bloqués ils ne verront et ne feront rien. Ça m'est déjà arrivé une fois.
 
Nouveau WRInaute
Merci de ta réactivité. J'ai 2 questions :

1/ Comment as tu fait pour les bloquer et empêcher qu'ils copient ton contenu?

2/ Tu penses vraiment que Google ne fera rien si sur des milliers de requêtes un bon nombre de résultats sont des sites hackés ?

Exemple :

3 résultats sur les 10 premiers résultats sont usurpés sur une requête à fort traffic comme maigrir des bras

VOIR CI-DESSOUS LES RESULTATS DE LA PREMIERE PAGE GOOGLE A AUJOURD'HUI

Environ 143 000 résultats (0,24 secondes)
Rappel concernant les règles de confidentialité de Google

Résultats de recherche

Exercice pour Maigrir des Bras Vite et Rapidement - YouTube
Vidéo pour "maigrir des bras"
▶ 3:19
https://www.youtube.com/watch?v=YppilFn1wT8
21 mai 2014 - Ajouté par raouf nounou
comment faire des Exercice pour perdre et maigrir des bras Vite et rapidement femme et homme comment ...

Maigrir des bras en quelques semaines | SOS Comment ...
http://www.sweetsisterscakes.com/fr1220/
Découvrez comment maigrir des bras et perdre la graisse et la peau qui pend en dessous, grâce à nos explications. Nous vous donnons les solutions pour ...


Maigrir des bras - Marie Claire
http://www.marieclaire.fr › Minceur › Morpho minceur
Des bras enrobés, mous, boudinés dans les manches de nos vêtements... C'est tout sauf sexy ! Pour maigrir des bras et afficher des membres musclés et ...

Fitness : 3 exercices pour maigrir des bras en vidéo ...
http://www.femmeactuelle.fr › Bien-être › Vidéo de gym
Avoir des bras fins et musclés mais pas trop peut paraître difficile et fastidieux. Mais avec ces exercices ultra-simples proposés par Isabelle Petit-Graff,...

Comment perdre la graisse sous les bras - Fourchette & Bikini
http://www.fourchette-et-bikini.fr › Maigrir par zone
29 juin 2015 - Quand on souhaite maigrir, on pense généralement aux cuisses, aux ... et en nutriments, éléments essentiels pour maigrir des bras entre autre.

Exercices physiques pour maigrir et perdre des bras
http://www.imekofoods.org › Comment maigrir › Comment maigrir des bras
4 sept. 2015 - Exercices physiques pour maigrir et perdre des bras. Les exercices faciles et les gestes du quotidien pour perdre du poids et de la graisse ...


Comment maigrir des bras ? - Magicmaman.com
http://www.magicmaman.com/,comment-maigrir-des-bras,3052,2278992.asp
Maigrir des bras : Choisissez un sport adapté. Pour mincir des bras efficacement, il est essentiel de faire du sport. Mais encore faut-il choisir un sport adapté, qui ...

Comment mincir des bras en 1 semaine : la solution
http://www.comment-maigrir-rapidement.info/comment-mincir-des-bras-en-1-...
23 juin 2013 - Aimeriez-vous mincir des bras et avoir des premiers résultats en une semaine ? Dans cet article retrouvez une solution pour maigrir des bras ...

Vidéos d'exercices pour maigrir des bras rapidement ! - Ateja
http://www.ateja.co.id › ... › Vidéos d’exercices ciblés pour les femmes
Quels sont les exercices pour maigrir des bras et muscler les biceps et les triceps ? Quels exercices ou quel sport pratiquer pour avoir des bras fermes et ...


Exercice 1 pour maigrir des bras - Regivia
http://www.regivia.com › ... › Exercices physiques pour maigrir des bras.
4 sept. 2015 - Pour tonifier vos bras, ce 1er exercice vous permettra de renforcer le biceps brachial, le muscle qui se trouve à l'avant du bras entre le coude et ...
 
WRInaute accro
dans le doute, ca me parait bien risqué de ne pas s'en préoccuper

pour les bloquer j'essaye de trouver leur plage IP, ca ne sera pas suffisant vu qu'ils doivent surement changer régulièrement. Mais ca peut calmer certains

mais effectivement c’est une véritable plaie et c’est hallucinant de voir les résultats que tu indiques. Car en effet en 1ere page voir en 1ere position également, pas mal de sites du même acabit.
 
WRInaute impliqué
Bonjour,

Nous avons eu le même problème sur notre site le plus populaire. l'URL pirate copiait à la volée via un proxy en prenant soin de changer tous nos URL par la leur.
Cela nous ait arrivé 2 fois, maintenant je fais une veille régulière, en recherchant sur le web pour voir si notre site n'a pas été copié, donc ce n'est pas rigolo. Voici mon protocole d'éradication de vermines :

* trouver l'IP du proxy à travers via la méthode de fosseene.
fosseene a dit:
pour faire simple, la seule solution technique est de bloquer (bannir) les proxy via ton fichier .htaccess
Pour obtenir l’IP du proxy, il suffit d’aller sur une page quelconque (par exemple: http://www.imekofoods.org/test12345) et de chercher dans tes logs la requête avec « test12345 ».

* dans un 1er temps ne pas bannir l'IP, simplement créer une règle apache qui redirige l'IP vers une "page d'erreur" (ou une image dégueulasse au choix) mais pas en 404. En effet une fois copiée, la page est en cache sur leur serveur. Le but c'est d'effacer le contenu de leur cache au moment de leur rafraichissement sans qu'il s'en aperçoive.

* Jouer collectif : cherchez les autres noms de domaines mutualisés avec un site comme http://www.ipneighbour.com/ à partir de leur IP. Vous trouverez les autres sites victimes de la même arnaque car en général reconnaissable par le logo image qui n'a pas été changé, et contacter les sites copiés pour leur avertir du piratage. Il nous font perdre du temps et de l'argent, faisant de même pour eux.

* après jours/semaines, bloquer le proxy par Iptables.
 
Nouveau WRInaute
Pour répondre à Drew, c'est impossible de ne pas s'en soucier.

En effet, mes pages ont été totalement désindexées du moteur de Google au profit de celles des hackers donc une baisse de traffic énorme.
 
WRInaute passionné
C'est pas vraiment nouveau comme problème. Comme l'a dit Koxin-L.fr ca se passe depuis que le management du DC est fait ainsi. (d'ailleurs il est arrivé que des gros sites en profitent)

Sinon tu pourrais changer le titre du post car voir "une faille dans google exploitée par des hackers pour voler référencement" ça m'a plus donné envie de cliquer pour voir quelle connerie allait être racontée plutôt que la gestion d'un problème qui est somme toute sérieux. (et auquel tu ne peux malheureusement pas faire grand chose sinon reporter)
 
WRInaute accro
honnêtement j'avais déjà eu ce soucis une fois il y a 2 ans environ. Mais la c’est de pire en pire.
Je ne sais pas si c’est nouveau ou non, mais ce problème est loin d'être anodin

Comment éviter l’intégration de nos sites, à la volée, sur un domaine pirate?
 
Nouveau WRInaute
Bonjour TopsiteMaker.

Merci pour ta réponse détaillée. Ce travail me semble titanesque.

Qu'un contenu soit copié c'est une chose. Mais que Google n'ait pas un meilleur moyen de contrôler quel est l'original de la copie me parait néfaste pour tout le monde : internaute, webmaster, Google lui même.

Bonjour Patapon87

Je suis d'accord avec toi, je n'ai aucun contrôle pour résoudre ce problème.

Là où je suis en désaccord avec ton analyse et celle de Koxin-L.fr,c'est que le problème me semble massif et relativement nouveau. Tu as déjà vu un détournement de 3 résultats sur 10 sur la première page de Google sur des requêtes à fort traffic? Moi pas. (voir mon post ci-dessus)

Ceci sur des "petits sites" comme le mien autant que sur des "gros sites" comme le forum "Doctissimo" ou par exemple "Magic Maman Forum".

Tape sur Google homeopathie pour maigrir et tu tomberas sur ce résultat hacké/usurpé aujourd'hui sur la première page Google (6ème position)

QUELS GRANULES D HOMEOPATHIE POUR MAIGRIR ...
http //www.secnetedu.ro/maigrir497
10 mars 2016 - Bonjour, je voudrais savoir ce qu'il faut prendre comme granules pour maigrir : le nom, la posologie, le prix et si on peut aller directement en ...

Si tu clic sur le cache, ça révèle en fait le site Magic Maman Forum
webcache.googleusercontent.com/search?q=cache:f3hmQQ9O6LMJ:www.secnetedu.ro/maigrir497/+&cd=6&hl=fr&ct=clnk&gl=fr

J'espère avoir un retour de la google spam team via le forum webmaster tools que je ne manquerai pas de vous communiquer si tel est le cas.
 
WRInaute impliqué
Dibang a dit:
Bonjour TopsiteMaker.
Merci pour ta réponse détaillée. Ce travail me semble titanesque.

Titanesque, non, mais c'est une chose à faire qui se rajoute à des centaines d'autres. Quand tu sais faire, ça demande une après-midi...
 
WRInaute occasionnel
RE: un webmaster qui se fait copier par un autre et accuse Google

Koxin-L.fr a dit:
Soit tu arrives à faire ferme l'hébergeur du site hacké, soit... je suis désolé pour toi.

Le site n'est pas hacké mais copié :wink: . Le fermer est une solution (couteuse en temps et en argent) qui va revenir quelques semaines ou mois suivants.
La seule solution est de détecter la méthode de copie et de l'interdire.
 
WRInaute accro
Le paradoxe c'est qu'on ne peut pas la détecter avant d'avoir été copié

a moins de faire circuler une liste noire des plages d'ip à bloquer et de tenir cette liste à jour
 
WRInaute accro
On peut également passer énormément de temps avant de trouver comment cette copie est faite et comment la bloquer. Pour le moment j'arrive a bloquer en trouvant l'ip, ou plage ip du site (serveur) en question. parfois c’est plus ou moins difficile a trouver.

mais l’idéal serait d'avoir un petit script léger (pas une machine de guerre) pour bloquer automatiquement ce type de copie à la volée, afin de se prémunir plutôt que d'avoir guérir

les techniques utilisées par les pirates sont surement de plus en plus difficiles à identifier et bloquer
 
Nouveau WRInaute
A priori, le problème va être remonté au service Ad Hoc de Google dès demain pour analyse. J'espère avoir un retour rapidement tout en étant conscient qu'il sera sans doute très difficile de rétablir la situation.
 
WRInaute passionné
Re: RE: un webmaster qui se fait copier par un autre et accuse Google

patrick_lejeune a dit:
Le site n'est pas hacké mais copié :wink:
Merci de corriger la coquille Patou.
Je parlais de faire fermer le site qui copie, en effet.

patrick_lejeune a dit:
Le fermer est une solution (couteuse en temps et en argent) qui va revenir quelques semaines ou mois suivants. La seule solution est de détecter la méthode de copie et de l'interdire.
Donc... faut vivre avec.

GG investiguera peut-être, mais je crois plutôt qu'il se retranchera derrière le droit.
Tu es plagié ?
A toi de faire le ménage via tes avocats.

C'est ainsi.
 
WRInaute accro
Le site légitime A est copié par le site B qui a été piraté et le site B redirige vers le site C, celui du hacker

Le site B a donc bien été hacké
 
WRInaute passionné
Il a peut-être pas été hacké le site plagiaire. C'est peut-être une vrai reprise de ndd.

Mais ça donne une direction de travail.
Si c'est un site hacké, il est certainement plus simple de contacter les proprio pour leur demander de faire le nécessaire.
 
Nouveau WRInaute
Impossible de contacter tous les proprios car les NDD de ces sites hackés changent de jour en jour.

Exemple:

1/

Il y a quelques jours quand on tapait la requête "maigrir des bras" on obtenait ce site hacké en 1er résultat de Google:

Maigrir des bras en quelques semaines | SOS Comment ...

sweetsisterscakes.com/fr1220/
Découvrez comment maigrir des bras et perdre la graisse et la peau qui pend en dessous, grâce à nos explications. Nous vous donnons les solutions pour ...

2/

Aujourd'hui j'ai obtenu un autre site hacké en 1er résultat de Google:

Maigrir des bras en quelques semaines | SOS Comment ...
zakazknig.com.ua/maigrir74/
Découvrez comment maigrir des bras et perdre la graisse et la peau qui pend en dessous, grâce à nos explications. Nous vous donnons les solutions pour ...

Il est donc impossible de contacter tous les jours des sites hackés, ne crois-tu pas?

Le problème de fond n'est pas vraiment le Duplicate Content. Qu'on te pique ton contenu, c'est une chose, mais ce qui est pire, c'est qu'on te pique ton référencement car là tu perds vraiment tout.
 
WRInaute accro
Koxin-L.fr a dit:
Si c'est un site hacké, il est certainement plus simple de contacter les proprio pour leur demander de faire le nécessaire.

Je doute que ca soit des sites hackés, Plus de chance que ça soit des NDD créés exprès. Et il est difficile voir impossible d'essayer de contacter l’hébergeur souvent à l'étranger.

Et passer par la voie juridique..... :roll:

C'est un véritable fléau, rien qu'hier j'en ai bloqué 3
 
WRInaute impliqué
Re: Une faille dans Google exploitée par des hackers

J'ai également lancé une discussion sur le forum webmaster tools et mon problème va apparemment être remonté auprès de l'équipe webscam de google.

Je ne ne comprends pas pourquoi les victimes cherchent la solution dans le forum Google Webmaster et dans des palabres diverses. Il y a plagiat donc, infraction au copyright, donc la victime remplit le formulaire DMCA.

Google est alors obligé d'y donner suite et, s'il y a copie, le site copieur est éjecté des SERPs grosso modo dans les 10/15jours.

La même solution DMCA est possible auprès de l'hébergeur et, dans ce cas, le site copieur est purement et simplement fermé (c'est mieux que sorti des seuls google SERPs). Mais évidemment, il faut que l'hébergeur soit dans un pays qui respecte les copyrights.
 
WRInaute accro
Alors dites moi si je me trompe, mais le problème avec les demandes DMCA c’est qu'on peut déclarer qu'une seule page malveillante, du moins le formulaire nous permet difficilement de porter plainte sur l'intégralité du site plagieur.
Hors lorsque tous notre site est copié intégralement à la volée ça devient compliqué.

Y a t-il un autre moyen pour signaler ces sites malveillants, qui en général utilisent le Cloaking et divers procédés interdits par GG ?
 
Nouveau WRInaute
Bonjour Kristel,

Merci pour ton post car tu apportes une info en plus dont je n'avais pas connaissance et je vais m'y intéresser.

Maintenant le hic qui se pose dans ma problématique c'est que mes pages ont totalement été désindexées de Google.

Exemple:

site:sos-commentmaigrir.com/maigrir-des-bras-en-quelques-semaines/

D'autres part, les URL des sites "copieurs" changent quasi tous les jours (voir mon post précédent sur la requête "maigrir des bras") mais leur référencement en première position sur Google ne change pas (jusqu'à aujourd'hui).

Comme Noren, il me semble compliqué d'allez tous les jours à la pêche aux nouvelles URL qui copient pour les signaler via le formulaire DMCA.

Je crois donc qu'il était urgent de signaler mon problème sur le forum webmaster tools de Google.
 
WRInaute accro
Ce serait pas plutôt ton WP qui est hacké et qui fait une 301 vers -zakazknig.com.ua/maigrir74/ lorsque le UA ou l'IP est Googlebot ?
-https://www.google.fr/#q=info:sos-commentmaigrir.com%2Fmaigrir-des-bras-en-quelques-semaines%2F
 
Nouveau WRInaute
spout a dit:
Ce serait pas plutôt ton WP qui est hacké et qui fait une 301 vers -zakazknig.com.ua/maigrir74/ lorsque le UA ou l'IP est Googlebot ?
-https://www.google.fr/#q=info:sos-commentmaigrir.com%2Fmaigrir-des-bras-en-quelques-semaines%2F


Non, pas de problème sur mon WP.


Dibang a dit:
Je précise que mon site est en état, je l'ai fait vérifié de fond en comble par 2 webmaster (pas de code douteux introduits), je ne me suis pas fait piraté ma Google Search Console, j'ai un rapport complet du site sucuri.net qui explique tout ceci et que je pourrais posté ultérieurement.
 
WRInaute impliqué
Re: Une faille dans Google exploitée par des hackers

Il est possible de faire un DMCA pour l'ensemble du site ou d'un répertoire; j'avoue ne plus me souvenir de la manière de le faire, mais, c'est possible.

Quant aux pages originales désindexées, ce n'est pas un problème tant qu'elles existent. DNCA n'est pas l'algorithme, c'est une question de droit d'auteur. Le DMCA n'a d'effet sur les SERPs que parce qu'il y a effraction du droit d'auteur.

NB
je réponds en théorie, car, je n'ai vérifié les cas cités dans la discussion: il faut évidemment que le plaignant soit clean.
 
WRInaute accro
En tout cas j'avais déjà du utiliser le formulaire DMCA et faut avouer que ça n'a rien d'intuitif lorsqu'il s'agit de se plaindre pour un vol de contenu d'un site entier. En tout cas je n'avais pas trouvé.
 
WRInaute accro
@Dibang : En tout cas on voit clairement que GG est un gros boulet. Quand on regarde le code source de la page en cache de zakazknig on voit pleins d'url vers ton site. L'algo de GG aurait dû faire le rapprochement et voir que c'ets ce site le plagieur et pas le tient

Le hic c’est que ton NDD date de 2013 et le sien de 2011, donc l'algo GG semble prendre uniquement en compte l'ancienneté du site plutôt que constater l'évidence même. :roll:

ca montre bien qu'il ne faut absolument pas se fier à l'algo de GG et que ce genre de problème peu arriver à n'importe qui. Et particulièrement les "petits sites" a faible notoriété
 
Nouveau WRInaute
En effet, que mon contenu soit copié, ce n'est pas ce qui m'embête le plus.

Mais que l'algo de Google me déréférence en ne me reconnaissant pas comme l'original, c'est là le coeur du problème.
 
WRInaute passionné
Les gars, la réponse à été donné par moi et Kristel.

C'est un problème relevant du droit.

Donc soit vos sites vous rapporte peau de balle et vous laissez tomber, soit ils vous font vivre et vous contactez un avocat. ;-)

C'est dur à accepter, mais y a pas trop de solutions alternative dans ces cas là.
 
WRInaute passionné
Dibang a dit:
spout a dit:
Ce serait pas plutôt ton WP qui est hacké et qui fait une 301 vers -zakazknig.com.ua/maigrir74/ lorsque le UA ou l'IP est Googlebot ?
-https://www.google.fr/#q=info:sos-commentmaigrir.com%2Fmaigrir-des-bras-en-quelques-semaines%2F


Non, pas de problème sur mon WP.
Tu en es certain ? Le lien de spout est plutôt évocateur
 
WRInaute accro
Koxin-L.fr a dit:
Donc soit vos sites vous rapporte peau de balle et vous laissez tomber, soit ils vous font vivre et vous contactez un avocat. ;-)

Et ça se trouve facilement des avocats spécialisés dans le web ?
Et Comment tu fais quand tu es face à de plus en plus de copies de ce genre ? crois tu que n'importe qui peut se permettre de payer un avocat à chaque fois ? Et je parle même pas du temps qu'on y perd !

la meilleur solution est surement d’empêcher ça en trouvant la parade dans les scripts de nos sites, ca éviterait bien des frais et de la perte de temps. Surtout que tous ces sites sont rarement facilement joignables, d'autant plus quand ils sont à l'étranger. Donc l'avocat je pense qu'ils en ont pas grand chose à carrer. Et au pire un site fermé, ils en ouvre un autre dans l'heure qui suit !
 
WRInaute impliqué
noren a dit:
Et ça se trouve facilement des avocats spécialisés dans le web ?
Et Comment tu fais quand tu es face à de plus en plus de copies de ce genre ? crois tu que n'importe qui peut se permettre de payer un avocat à chaque fois ? Et je parle même pas du temps qu'on y perd !

la meilleur solution est surement d’empêcher ça en trouvant la parade dans les scripts de nos sites, ca éviterait bien des frais et de la perte de temps. Surtout que tous ces sites sont rarement facilement joignables, d'autant plus quand ils sont à l'étranger. Donc l'avocat je pense qu'ils en ont pas grand chose à carrer. Et au pire un site fermé, ils en ouvre un autre dans l'heure qui suit !

+1,
la meilleure solution est technique, en combinant plusieurs méthodes : scripts se basant sur la géolocalisation IP de tes internautes (avec -https://www.maxmind.com/fr/home par exemple), scripts d'analyse de logs, scripts d'alertes ...
Si ce piratage est répandu dans ton secteur, et que tu arrives à te dégager de ces parasites, ça va devenir clairement être un avantage SEO par rapport à tes concurrents.

J'aimerais bien connaitre le terme utilisé en anglais, et en français également, pour désigner ce type de piratage qui relève plus de la concurrence déloyale ?
 
WRInaute accro
@Topsitemaker : le problème avec la solution technique, qui est évidemment l'idéal, c’est que les pirates utilisent beaucoup de solutions différentes. Se baser sur la géolocalisation parait bien difficile. Tu ne peux pas bloquer tout ce qui est US par exemple. Sans compter que parfois c’est l'IP de l'internaute qui à visité le site pirate qui apparaît dans tes logs et pas celui du serveur pirate.

Il y a en tout cas un point commun la plupart du temps avec ces sites c'est qu'ils utilisent le cloaking et la copie est visible uniquement par GG. Par conséquent suffit peut être de filtrer dans les logs tout ce qui contient l'user-agent googlebot et qui ne correspond pas a une IP GG. je ne sais pas si cette solution marcherait.

Mais dans tous les cas le mal serait déjà fait car le DC serait déjà visible de GG. A moins de balancer un code erreur 403 si on detecte un faux googlebot. ca peut peut être éviter quelques copies
 
WRInaute accro
spout a dit:
Ce serait pas plutôt ton WP qui est hacké et qui fait une 301 vers -zakazknig.com.ua/maigrir74/ lorsque le UA ou l'IP est Googlebot ?
-https://www.google.fr/#q=info:sos-commentmaigrir.com%2Fmaigrir-des-bras-en-quelques-semaines%2F

ca ne peut pas venir du simple fait que cette page étant désindexé, GG affiche une page qui lui semble correspondre?
 
WRInaute impliqué
noren a dit:
@Topsitemaker : le problème avec la solution technique, qui est évidemment l'idéal, c’est que les pirates utilisent beaucoup de solutions différentes. Se baser sur la géolocalisation parait bien difficile. Tu ne peux pas bloquer tout ce qui est US par exemple. Sans compter que parfois c’est l'IP de l'internaute qui à visité le site pirate qui apparaît dans tes logs et pas celui du serveur pirate.
Les pirates ont trouvé une manière industrielle de gagner de l'argent, et un site qui leur fait de la résistance sur 1000, ils s'en foutent. En même temps leur système va évoluer au fur et à mesure du temps et va devenir de plus en plus élaboré. Dans le cas de mon site root-top.com l'analyse IP est vitale. Je me suis fait une gestion fine des IPs pouvant voter sur le site, je valide ou pas à la mano les plages d'IP pouvant voter + d'autres scripts transversales + bots d'exploration. Après le système n'est pas parfait : je ne suis pas forcément là pour valider les nouvelles plages IP, j'ai des faux positifs, des internautes mécontents de ne pouvoir voter... mais au moins 98% des abus ont été éradiqués. Et au final c'est cela qui compte, car dans le secteur français on est plus que quelque-uns, alors qu'on était des centaines il y a 10 ans.

Pour revenir au problème, le site est en français, donc limiter les IPs aux bots de google et aux pays francophones peut me sembler pertinent Par exemple, quoi que un peu dangereux, donc à faire avec des variables d'ajustement dans le script. Faire une analyse fine de la provenance des internautes me semblerait judicieux. Bref ça ne se fait pas en claquant des doigts.

noren a dit:
Il y a en tout cas un point commun la plupart du temps avec ces sites c'est qu'ils utilisent le cloaking et la copie est visible uniquement par GG. Par conséquent suffit peut être de filtrer dans les logs tout ce qui contient l'user-agent googlebot et qui ne correspond pas a une IP GG. je ne sais pas si cette solution marcherait.

Mais dans tous les cas le mal serait déjà fait car le DC serait déjà visible de GG. A moins de balancer un code erreur 403 si on detecte un faux googlebot. ca peut peut être éviter quelques copies
 
Nouveau WRInaute
patapon87 a dit:
Dibang a dit:
spout a dit:
Ce serait pas plutôt ton WP qui est hacké et qui fait une 301 vers -zakazknig.com.ua/maigrir74/ lorsque le UA ou l'IP est Googlebot ?
-https://www.google.fr/#q=info:sos-commentmaigrir.com%2Fmaigrir-des-bras-en-quelques-semaines%2F


Non, pas de problème sur mon WP.
Tu en es certain ? Le lien de spout est plutôt évocateur

A priori le site n'a pas de problème mais je n'exclus pas une omission de ma part, de sucuri.net dans leur rapport ou des 2 webmasters supplémentaires qui ont déjà fait des vérifs.

Il est vrai que curieusement, lorsqu'on on tape ceci site:sos-commentmaigrir.com, Google indique 209 pages en tout (à aujourd'hui) alors que mon site n'en comporte pas plus de 80.

De plus, 209 pages sont indiquées, donc Google devrait présenter 21 "onglets" de 10 pages dans ces résultats, or, il n'en présente que 7.
 
Nouveau WRInaute
Salut Drew,

Merci ton post et tes explications claires.

Drew a dit:
Comme je l'ai déjà expliqué dans ce sujet, il est inutile de porter une attention à ce genre de site/problème.
Ce sont des sites temporaires qui ne reste bien entendu pas ouvert longtemps.
Il te suffit de consulter ta petite liste, dans le lot, tu en as déjà 3 qui sont mort... Il fallait s'y attendre !
Ton site, s'il est honnête, il sera tout simplement replacé à l'endroit où il doit l'être.

Je n'espère que ça.
 
WRInaute accro
Drew a dit:
Tu auras donc souvent plus de page indexées que ce que le site possède réellement.
....
Bing je n'ai pas ce problème, aucune page indexée avec le faux répertoire 't4cbible' ni 'pt' ni 'en', etc.

C'est marrant, j'ai exactement le problème inverse et c'est google qui est le plus juste
190 pages envoyées dans le sitemap et la commande site: de google m'indique 174
Pour bing, la même commande indique 244 :lol:
 
WRInaute accro
Drew a dit:
Sinon pour en revenir au mot clé 'regime rapide' dans ton exemple, il ne pointe absolument pas vers le site que tu cites, mais en première position il y a un site qui existe depuis plus de 2 ans.

Je vois bien de mon côté sweetsisterscakes en 3eme position.
Quoi qu'il en soit Dibang a suffisamment donné d’exemples vérifiables pour qu'il soit pris au sérieux. Et qu'importe les mots clés, que ca soit "régime rapide", ou "chaussettes en coton" ce type de sites qui copient à la volée d'autres sites ne devraient pas se trouver la et encore moins prendre la place du site plagié. Je constates aussi une recrudescence de problèmes de ce genre. les pirates ont peut être affiné leurs techniques.

Drew a dit:
Comme je l'ai déjà expliqué dans ce sujet, il est inutile de porter une attention à ce genre de site/problème.
Ce sont des sites temporaires qui ne reste bien entendu pas ouvert longtemps.

Ces sites peuvent rester des semaines, des mois ou bien plus longtemps avant de disparaître. En somme suffisamment longtemps pour foutre en l'air ou bien amocher les sites originaux. Notamment les plus fragiles (trop récents, peu de BL etc.)

Et a sa place, vu que ces sites pirates prennent ces positions et que lui disparaît je prendrais au contraire ce problème très au sérieux. Si tu laisse faire tu laisse la gangrène s'installer et s'accumuler des copies et des risques de problèmes de DC que GG ne gérera pas ! et comme ici pour Dibang, ça peut être catastrophique si tu es remplacé par la copie.

Et même si la copie est virée pas certain qu'il retrouve ces anciennes positions. Le mal aura été fait...


D'ailleurs je ne comprends pas l’intérêt ce ce type de sites plagieurs qui mettent des pages 404 pour les utilisateurs mais le site copiés pour GG (Cloaking), Qu'est-ce qu'ils y gagnent ?
 
WRInaute passionné
noren a dit:
Koxin-L.fr a dit:
Donc soit vos sites vous rapporte peau de balle et vous laissez tomber, soit ils vous font vivre et vous contactez un avocat. ;-)

Et ça se trouve facilement des avocats spécialisés dans le web ?
Et Comment tu fais quand tu es face à de plus en plus de copies de ce genre ? crois tu que n'importe qui peut se permettre de payer un avocat à chaque fois ?
D'ou ma phrase que tu cite mais que tu n'a visiblement pas compris. :mrgreen:

noren a dit:
Donc l'avocat je pense qu'ils en ont pas grand chose à carrer
Ton avocat ne va pas te servir à faire ferme ces sites, mais à apporter la preuve de plagiat à GG qui va lui dexindexer ces sites.
 
Nouveau WRInaute
Re: Une faille dans Google exploitée par des hackers pour

Je viens de m'inscrire pour pouvoir apporter mon grain de sel ;)
Juste un truc bizarre, les pb de ce type, ça tombe presque toujours sur les sites wp. C'est vraiment pas de chance ! (pour ceux qui n'auraient pas compris, oui, c'est ironique)
J'ai pris la liberté de tester la page suivante http://www.sos-commentmaigrir.com/menus-pour-maigrir-en-une-semaine-7-jours-de-repas-equilibres-et-dietetiques/
Quand je cherche sur Google, la page du site sos-commentmaigrir est déréférencée et on voit le site tiers.
Sur la page de sos-commentmaigrir rien d'anormal. Malheureusement on ne peut pas vérifier le cache de Google de cette page car il n'existe pas.
A mon avis, l'explication simple: le site sos-commentmaigrir est hacké et l'assaillant fait du cloaking quand gg parcourt le site. L'assaillant remplace alors dans la balise canonical sos-commentmaigrir par le site tiers.
 
WRInaute accro
@Akuri: c'est ce que j'ai dit, mais il a fait vérifier par 2 "webmasters" :p
Et ça peut être fait autrement que via le UA, il faudrait plutôt faire vérifier par 2 développeurs.
 
Nouveau WRInaute
Bonjour à tous et merci pour vos contributions.

Je peux en effet me tromper d'autant plus que je reconnais avoir des lacunes techniquement mais à priori mon site n'est pas hacké. S'il l'était, le phénomène devrait également se produire sur Bing ou Yahoo, vous ne croyez pas ?

Après, je ne suis sur de rien et j'explore toutes les infos qui sont données par vos contributions.

Il faut quand même souligner que c'est un problème plus important qui touche tous les sites sur le domaine de la nutrition/diététique/minceur.

Tapez "forum maigrir" et vous verrez aujourd'hui que le premier résultat est une usurpation du site Doctissimo (qui ne doit probablement pas être sous Wordpress)

Forum Maigrir - Doctissimo - Ateja
ww.ateja.co.id › Nutrition › FORUM Nutrition
Vous avez decide de perdre quelques kilos ? Venez en discuter sur notre forum consacre a la dietetique et aux regimes. Conseils, menus-minceurs.

Au final, je n'ai que le choix d'accepter la situation et d'espèrer que Google rétablira la situation rapidement.
 
WRInaute passionné
que faire ?

Je pense que c'est ton site ou ton PC qui sont hackés. Chez moi, la recherche que tu indiques ('grai.. abd...') retourne des résultats normaux y compris wikihow et doctissimo.
Et doctissimo n'est pas hacké, les liens google vont bien sur les pages doctissimo....

Toute cette discussion n'est-elle pas qu'un hoax?
 
Nouveau WRInaute
Re: Une faille dans Google exploitée par des hackers pour voler le référencement :

C'est grave quand même. Pour moi, on est devant ce qu'on appellerait en médecine un problème de santé publique dont même le ministère de l'économie numérique devrait se préoccuper.
Doctissimo c'est selon leur chiffre plus de 1 million de visiteurs uniques par mois. Par mesure de précaution on devrait leur imposer de mettre sur toutes les pages de leur site: "Doctissimo s'est probablement fait hacker. Merci de ne plus vous connecter aux pages tant que le problème n'est pas résolu". Et par la suite, il devrait y avoir un audit indépendant pour assurer aux utilisateurs du site que la faille est corrigée.
En informatique il y a un dicton que j'aime bien: "seuls les paranos survivent". Or on ne connaît pas les intentions du ou des hackers, hormis celle manifeste de tromper les utilisateurs. Mais en cliquant sur un lien depuis google qui redirige vers un site tiers mafieux (ce dont je me suis bien gardé de faire), l'utilisateur a un risque énorme de chopper un virus. Dernièrement on parlait du virus Petya qui s'atrappe en ouvrant un mail, imaginez sur quel virus on peut tomber en allant sur un site vérolé ou pire un site tiers mafieux. Dans 3/4 mois voire 1 an, on peut avoir potentiellement plus d'1 million de personnes qui auront leur pc ou smartphone bloqués par un virus et qui ne sauront pas d'où ça vient.
 
WRInaute accro
J'ai l'impression dans ce topic que bcp ne s'en prennent pas forcément à la bonne personne. Juste parce qu'il a un peu suroptimisé (que ceux qui n'ont jamais un peu suroptimisé ou utilisés de smethodes un peu BH me jettent la 1ere pierre) son site, ou que ca parle de régime ! et je trouve ça bien dommage, meme si moi aussi je ne suis pas friand des sites qui parlent de régime rapide etc.

@MikeR : sur la requête forum maigrir je vois bien en 1ère position obronca (un site spam qui pompe doctissimo, suffit de se mettre avec l'user agent de GG pour le voir), par contre je vois aussi doctissimo en 2eme position.

Il n'y a pas besoin d'avoir son site piraté pour se faire copier à la volée. Que ca soit par iframe ou autres méthodes (aspirateur via le serveur du spammeur etc.)....
Et quand je lis que ce topic est peut être un hoax m'hérisse un peu les poils

@Koxin-L.fr : je pense que c'est toi qui n'a pas compris ;) Faut-il être une énorme boite pour mériter d'être sur le web ?
Comme je l'ai dit plus haut tu vas payer l'avocat pour faire virer un site et quelques heures/jours plus tard un autre apparaît.
De plus si c'est pour le prouver à GG je trouve ca un peu abusé et chers. Il suffit que le site soit du Cloaking (c’est le cas dans 90% des cas) pour qu'ils puissent facilement le voir (après je suis pas certains que GG fassent bien toutes les verifs en cas de plainte). En plus ces spammeurs ne changent pas les bannières ou autres données images (charte graphique) qui indiquent le site d'origine. Je parle même pas d'archive.org qui prouve largement l’antériorité du site.
Le soucis c'est lorsque ce type de copie augmentent ou sont fréquentes, même si tu finis par les détecter pour les bloquer ou les virer de GG le mal a été fait. Pas certain que tu retrouves toutes tes positions ! Et ca restera dans ton historique.
Donc comme je disais précédemment, la voie juridique dans le cas présent me semble plus que bancale et insuffisante et seule la voie technique serait la plus efficace et préventive. Mais ça demande une certaine maîtrise que beaucoup n'ont pas forcément.
Mais surtout faudrait que l'algo de GG fasse correctement son boulot. Sachant que les spammeurs gagnent en expérience.
et le pire c’est que les plus sensibles sont les jeunes sites ou encore a faible notoriété, donc ceux qui n'ont pas les moyens de doctissimo et autre gros mastodontes pour se défendre.

Et de toute façon c’est également nuisible pour GG vu que ça touche directement a sa pertinence. Donc c’est bel et bien a GG de trouver les parades.
 
WRInaute occasionnel
C'est vraiment pitoyable que GG n'ait aucune parade pour ce type de problème. Vous parlez d'avocats, d'engager des frais, de perdre du temps, etc., mais où va-t-on là ? C'est à Google de faire son boulot, point barre. Il se prône être le meilleur et il n'est pas foutu de détecter une ou des pages publiées avant les autres, des hackers en l'occurrence ?

Au lieu de cela, il préfère optimiser à fond ses recettes fiscales pour frauder tous les fiscs européens. Lamentable les dirigeants de ce moteur...
 
WRInaute passionné
philyd a dit:
C'est à Google de faire son boulot, point barre.
Il le fait.

Son taf et d'indexer et de "classer" en fonction des attente.
Son taf et de proposer des résultats pertinents et cohérent.
Son taf et de désindexer tout contrevenant à ses règles et aux lois.

Son rôle n'est pas de faire la police entre plagieur et plagié.

Fournissez lui les preuves du vol ou de détournement de contenu et il fera son taf de désindexation du site fautif.

Lorsque tu croise une voiture volée, tu engueule la société de péage qui lui à permis de rouler sur la même route que toi ?

philyd a dit:
...il n'est pas foutu de détecter une ou des pages publiées avant les autres
Si il sais parfaitement le faire.
Mais l'antériorité dans l’édition de contenu n'a pas valeur de propriété. ;-)
 
Nouveau WRInaute
FortTrafic a dit:

Je n'ai pas regardé cette vidéo en entier car trop technique pour moi mais en tous cas elle illustre exactement ce que je subis, à priori le hijacking 302 (vers la 35ème minute de la vidéo) si je ne me trompes pas.

Même si on peut chacun de nos cotés essayer de trouver une parade ou limiter le piratage X, Y ou Z, je suis assez d'accord avec tous les points de vue qui soulignent le fait qu'en effet seul Google peut vraiment batailler contre ce fléau.

Koxin-L.fr a dit:
Son taf et de proposer des résultats pertinents et cohérent.

Je suis d'accord avec toi Koxin-L.fr mais en l'occurence ce n'est pas le cas. Si l'internaute demande la requête "doctissimo forum maigrir" mais que le premier résultat le redirige vers le site pirate XYZ qui n'est ni doctissimo, ni un forum, la pertinence est alors bien réduite.

PS: Je ne vais pas rajouter d'autres exemples pour ne pas noyer le fil de la discussion et surtout parce que les exemples que j'ai pu mettre jusqu'à présent étaient vrais où moment ou je les ai posté mais bien évidemment les résultats de google évoluent et ce qui était vrai il y a 2 ou 3 jours ne l'ai plus forcément aujourd'hui.
 
WRInaute accro


un petit screen qui montre le site spammeur en 1ere position sur "forum maigrir" et qui est en 1ere position en copiant le site Doctissimo. le pire c'est que ca tourne ce n’est pas forcément toujours le même site spammeur en 1er position.

Ce problème semble être pris au sérieux sur le forum de Google.

On touche ici directement à la pertinence de GG et c’est donc bel et bien à GG de trouver la parade. Les spammeurs utilisent du cloaking, copies des sites à la volée intégralement et arrivent a se positionner en 1ere pages voir même dans les 3 premières positions sur d'assez gros mots clés. Et ils créent des tonnes de sites de ce genre !

ces sites spammeurs ne copient pas juste les meta ou des bouts de textes, ils récupèrent bien tout le site victime, en direct live !

même la solution technique me parait en fin de compte peu envisageable de notre côté, et la solution judiciaire, j'ai déjà donné mon avis.
 
WRInaute occasionnel
Drew a dit:
Il est inutile de se soucier de ce genre de problème car les sites disparaissent quelques temps après.

Ce sont des sites temporaires.

Ben voyons :mrgreen: Quelques uns oui (s'ils sont pas rentables) et les autres ...

noren a dit:
Ce problème semble être pris au sérieux sur le forum de Google.
Sur le forum peut-être ... dans la pratique, GG gère le duplicate content partiel ou complet TRES MAL (même favorise les copieurs souvent) depuis au moins 2008: c'est pas nouveau et si Google avait décidé de s'occuper du problème, ça serait fait depuis au moins ... 8 ans. Aucune confiance dans Google.

noren a dit:
Les spammeurs utilisent du cloaking, copies des sites à la volée intégralement et arrivent a se positionner en 1ere pages voir même dans les 3 premières positions sur d'assez gros mots clés. Et ils créent des tonnes de sites de ce genre !
ces sites spammeurs ne copient pas juste les meta ou des bouts de textes, ils récupèrent bien tout le site victime, en direct live !

même la solution technique me parait en fin de compte peu envisageable de notre côté, et la solution judiciaire, j'ai déjà donné mon avis.
Je commence par la solution judiciaire: en Europe développée (donc pas forcément Pologne et autres anciens pays de l'Est), c'est possible quand on a les moyens. En pratique, ... c'est engagé beaucoup d'argent pour gagner ... peu. Pour le reste de l'Europe, engagé un avocat sur place + traducteurs + ... déplacements sur place ... même pas la peine.
EU: hébergé sur place = mise au tribunal aux EU ... Déjà le montant à débourser pour débuter la procédure est très importante, reste les avocats, .... quasiment impossible pour de petites structures.
Et le reste des pays ... essaye un peu une procédure en Russie ou en Ukraine (ou pire en Chine).

noren a dit:
... cloaking, copies des sites à la volée intégralement

Le cloaking n'intervient pas dans ces copies.
Pour copier un site, il y a plusieurs méthodes:
. un système de frame (c'est désuet mais ca fonctionne).
. un système de redirection ... à partir du site qui copie.

C'est deux méthodes permettent de copier à la volée.

. Envoyer des robots pour récupérer le contenu. Le robot peut-être global ... il passe sur le site régulièrement pour récupérer le contenu ou on page ... Le robot récupère à fait les pages visitées sur leur site.

D'abord bloquer les robots (par IP, user_agent ce qui est quasiment impossible ou par techniques de visites).
 
WRInaute occasionnel
Un Webmaster qui pense que les copies de pages et de sites ca n'existe pas

J'ai un peu changer le titre du post, c'est pas une faille de Google mais l'utilisation massive des CMS ou le "webmaster" comprend pas grand chose et dès qu'il y a un problème: c'est la panique.
indigene a dit:
Le paradoxe c'est qu'on ne peut pas la détecter avant d'avoir été copié
Mais non, faut juste développer un petit script en PHP lié à une base MySQL pour vérifier ce qui ce passe: en gros, c'est une espèce d'analyse du fichier log sur l'hébergement. Chez moi, c'est fait depuis quelques années: exit les visiteurs automatiques de Chine, Ukraine, Russie, ... (quasiment 3 X de pages vues par rapport aux réels visiteurs), exit les robots E-reputation, liens vers votre site, ... créés par des sociétés qui vendent le service et ... bouffent la bande passante.

Petits trucs de base à insérer avant le contenu:
1.

Code:
<?php
$adresse_reel="votre adresse de la page ";
$page=$_SERVER['REQUEST_URI'];
 if ($page<>$adresse_reel)
 {
   // on interdit l'accès
header("HTTP/1.1 403 Forbidden");
   exit();
 }
 ?>
Petit exemple: si "votre adresse de page" reprend /navigation.php. Un bricolage d'adresse avec comme URL /navigation?iframe=true&width=100%&height=1: le visiteur reçoit comme message une erreur 403.
Et honnêtement, je reçoit (recevait :roll: ) aussi des visites des robots de Google et MSN avec ces paramètres. En partie, ca bloque quand c'est bien paramétré les injections SQL. (c'est pas les techniques sophistiquées qui fonctionnent forcément le mieux).
2. dans l'en-tête en javascript
Code:
<script language="javascript" type="text/javascript">
if (top != self) {
top.location.href = location.href;
}
</script>
Tous les navigateurs ne l'acceptent pas mais une page en frame (d'un autre site) renvoie vers la page originale.
3. la copie d'images ... nécessite de mettre tous les liens vers les images en FQDN (exemple: https://www.webrankinfo.com/logo.jpg) et dans l'htaccess:

Code:
RewriteEngine On
RewriteCond %{HTTP_REFERER} !^$
RewriteCond %{HTTP_REFERER} !^http(s)?://(www\.)?webrankinfo.com [NC]
RewriteRule \.(jpg|jpeg|png|gif|pdf)$ https://www.webrankinfo.com/*logo-access.gif [NC,R,L]

Toute image directement reprise sur un autre site affiche l'image logo-access.gif s'il ne copie pas l'image sur son propre serveur. Personnellement, j'ai beaucoup hésiter à envoyer une image de remplacement plutôt qu'un virus :roll: .

Déjà trois petites pistes. Et ce n'est pas une faille de Google mais une faille des Webmasters.
Tapez l'adresse https://www.webrankinfo.com/*logo.jpg dans votre navigateur pour le plaisir(sans * dans l'adresse) ... :roll: et c'est la même chose pour les 3/4 des CMS. Des informations facilement récupérables (souvent inutiles) mais quand même: déjà une source de duplicate pour des "saloparts" qui essayent de couler un site (essayent, ca fonctionne pas réellement aussi facilement
 
WRInaute occasionnel
comment un tel post peut-il être repris en actualité?

Dibang a dit:
Tapez "forum maigrir" et vous verrez aujourd'hui que le premier résultat est une usurpation du site Doctissimo (qui ne doit probablement pas être sous Wordpress)
Pourquoi doctissomo serait pas sur WordPress (le couteau suisse des sites internet)? En deuxième, le premier résultat renvoie vers un fichier pdf qui n'est plus accessible. Je présume que le webmaster de ce site à bloqué la création de pdf en automatique.
Déjà interdire en htaccess le terme "pdf" dans l'user_agent ... c'est pas la panacée mais ca bloque beaucoup de petits problèmes.
 
WRInaute accro
Re: comment un tel post peut-il être repris en actualité?

patrick_lejeune a dit:
Pourquoi doctissomo serait pas sur WordPress (le couteau suisse des sites internet)?
Parce que WordPress n'est pas un script adapté pour un forum.
 
Nouveau WRInaute
Re: Une faille dans Google exploitée par des hackers pour voler le référencement

Patrick est gentil de donner quelques tuyaux mais à un moment donné, faut que les gens arrêtent le bricolage et suivent de vrais tutoriels en ligne ou de vraies formations plutôt que de bricoler des choses entendues à droite et à gauche sur les forums.
Quant à doctissimo, outre la technique pure des webmasters, il y a une question de fond qui se pose. Quand on cherche des discussions sur Google, on tombe très souvent sur le forum de doctissimo et des discussions qui datent de 2004, 2005. Pour le dire autrement des discussions qui datent d'il y a plus de 10 ans. Les gars de Doctissimo n'ont jamais fait l'effort de nettoyer leur forum. A vrai dire, ça les arrange bien car ça attire des visiteurs depuis Google. Mais aujourd'hui c'est sans doute aussi leur talon d'Achille (car il doit y avoir pas mal de liens morts dans ces discussions et on voit très souvent profil supprimé du côté des participants du forum).
Ce qui est limite malhonnête côté Doctissimo, c'est quand en 2016 vous rebondissez sur une discussion de 2004 après être tombée dessus via google, les modérateurs du site vous reprochent de déterrer une discussion vieille de 10 ans et suppriment votre post.
La discussion de fond, c'est de savoir à partir de quand une production web devrait être supprimée Ex: YouTube ne pourra pas éternellement stocker gratuitement toutes les vidéos datant des années 2000. Autre exemple: est-ce que ça encore un sens pour un forum informatique de garder une discussion qui parle des bugs d'internet explorer 6 ? Ne pas se poser la question, c'est risquer ce qui arrive aujourd'hui à Doctissimo.
On parle de Doctissimo mais les journaux web, je trouve que ce n'est pas beaucoup mieux. Internet a très souvent eu un gros problème avec les dates. En général on ne trouve pas les dates de parution des articles et encore moins les dates de mise à jour des articles, car ça génère des coûts de maintenance. C'est beaucoup plus facile de faire croire qu'un article référencé sur Google est toujours d'actualité si personne ne voit qu'il a été écrit en 2001.
 
WRInaute accro
Re: Une faille dans Google exploitée par des hackers pour voler le référencement

Akuri a dit:
En général on ne trouve pas les dates de parution des articles et encore moins les dates de mise à jour des articles, car ça génère des coûts de maintenance.

Des coûts de maintenance ??? :lol: :lol: :lol:

Sur mon site aucun article n'est daté car ce qui est écrit dans l'article reste intemporel
Dans le blog tous les billets possèdent une date de publication et une date de mise à jour car c'est un blog, donc un journal.

Pourquoi dater un article ? Ca sous-entendrait que ce qu'on a écrit est périssable. Une vérité écrite il y a 10 ans reste toujours une vérité. Si parfois on doit mettre à jour l'article alors on peut toujours préciser quelles mises à jour ont été effectuées et à quelle date mais supprimer ce qui était écrit il y a 10 ans n'a aucun sens. Ca revient à réécrire l'article aujourd'hui et ça ne serait plus le même article.

C'est une question de logique mais pas de coûts de maintenance !

Et je dirais même que dater un article c'est très néfaste. Perso si je tombe sur un article daté (avec une date bien visible tout en haut) ça me donne l'impression qu'il s'agit d'un blog et non d'un article de fond dans un site.
Si la date est en bas avec la liste de toutes les dates de modification (et pas seulement la dernière), ça donne alors bien plus de poids à l'article. A mon avis.
 
WRInaute passionné
Re: Une faille dans Google exploitée par des hackers pour voler le référencement

La datation à plusieurs aspect.
C'est pas ici le sujet, mais dater un article, même intemporel, et le versionaliser c'est important.
Et personne ne demande l'afficher en énorme tout en haut. ;-)
 
WRInaute accro
@patrick_lejeune : Je n'étais pas en train de dire qu'il faut passer par la voie juridique, voir mes posts précédents ;)
je n'ai pas dit non plus que le cloaking intervenait dans la technique de copie à la volée :wink:
je signifiais juste que les sites spammeurs en plus de la copie utilisaient également le claoking, entre autre, pour tromper GG et les utilisateurs.

Après je ne suis pas de ton avis sur :

Sur le forum peut-être ... dans la pratique, GG gère le duplicate content partiel ou complet TRES MAL (même favorise les copieurs souvent) depuis au moins 2008: c'est pas nouveau et si Google avait décidé de s'occuper du problème, ça serait fait depuis au moins ... 8 ans. Aucune confiance dans Google.

Certes GG gère toujours assez mal le DC, mais je doute qu'ils s'en foutent, vu que ca touche directement à la pertinence de leur résultat d'autant plus quand les copies sont des sites spammeurs qui utilisent toutes les techniques de spams connues. Mais je te rassure moi non plus je n'ai aucune confiance en GG. Le seul soucis c’est que dans le cas présent, vu que niveau judiciaire c’est impossible et qu'au niveau technique c’est compliqué et risqué, on ne peut compter que sur GG ou presque. Et d'ailleurs c’est de leur responsabilité.
Les solutions techniques que tu mentionnes demandent pas mal de compétences et tu le dis toi même comportent certains risques de filtrer de bons utilisateurs.

@Indigene : Tous les articles ou posts de forums ne sont pas intemporels. Si tu prend WRI il y a pleins de posts qui ne sont plus d'actualité. Ca n’empêchera pas GG de bien les positionner alors qu'en 2016 ils ne répondront pas au problème ou donneront une info plus valable à l'utilisateur. Donc heureusement que le post/article est daté.

Et pour en revenir au sujet quand on tape "forum maigrir", je vois maintenant 2 sites spammeurs en 1ere position et Doctissimo a tout simplement disparu.

Le 1er c'est imekofoods, site hébergé en italie et crée en 2015. Je ne comprend même pas comment GG peut considérer que ce site est l'original. :roll:

@Dibang : tiens nous au courant quand tu auras des réponses sur le forum de GG et quand les choses auront évolué :wink:
 
Nouveau WRInaute
Bonjour,

Merci à tous pour vos contributions à cette discussion, car pour moi, toutes les infos sont bonnes à explorer.

@Dibang : tiens nous au courant quand tu auras des réponses sur le forum de GG et quand les choses auront évolué :wink:

Je n'ai pas plus de retour que ça pour le moment à part le fait que ce soit remonté auprès des ingénieurs de l'équipe Search de Google et que ce cas concret (ainsi que d'autres) leur servira pour tenter d'améliorer l'algo de Google.

A priori lorsque les pages hackées seront supprimées, les pages des sites originaux seront apparemment reconnues comme les pages canoniques. Après dire, qu'elles seront à nouveau référencées, et bien référencées, rien n'est moins sur.

Je pense que ça va prendre du temps (des semaines, des mois) avant que le problème soit réglé avec une mise à jour de l'algo de Google et je ne suis pas certain de retrouver mon positionnement d'antan mais je ne peux pas y remédier donc il va falloir que je me fasse une raison et que je passe à autre chose.

Je vous tiendrai au courant dès que j'ai des news.
 
WRInaute accro
Ok merci.

Pour le moment tu peux toujours essayer de bloquer les IP des sites les plus gênants ou faire un spam report comme conseillé dans le forum de GG :

https://www.google.com/webmasters/tools/spamreportform?hl=fr

Ainsi tu pourras peut être virer quelques sites en attendant les MAJ de l'algo et gagner à nouveau et un peu plus rapidement quelques positions.
Même si ça ne réglera pas le fond du problème et que d'autres sites spammeurs prendront leurs places !
 
WRInaute occasionnel
Re: comment un tel post peut-il être repris en actualité?

Marie-Aude a dit:
patrick_lejeune a dit:
Pourquoi doctissomo serait pas sur WordPress (le couteau suisse des sites internet)?
Parce que WordPress n'est pas un script adapté pour un forum.
Oups, la bourde :oops: Quoique avec le nombre de sites sur WP :roll: (c'est réellement utilisé le CMS à tout faire: tout et (malheureusement) n'importe quoi).
Akuri a dit:
Patrick est gentil de donner quelques tuyaux mais à un moment donné, faut que les gens arrêtent le bricolage et suivent de vrais tutoriels en ligne ou de vraies formations plutôt que de bricoler des choses entendues à droite et à gauche sur les forums.
A peine une dizaine de membres de WRI savent que ca marche sur mes sites avec ... le développement suivant qui bloque un paquet de visiteurs. C'est juste quelques bases :wink:

Akuri a dit:
Quant à doctissimo, outre la technique pure des webmasters, il y a une question de fond qui se pose. Quand on cherche des discussions sur Google, on tombe très souvent sur le forum de doctissimo et des discussions qui datent de 2004, 2005.
Honnêtement pour mes problèmes de santé actuels, j'ai pas été voire ce site (forum) mais des toubib. Internet ne donne pas toutes les réponses (même si la majorité des utilisateurs de base de Google pensent que ce qui est dans les premières positions de Google est juste: met une page dans les trois premières position sur la recherche "soigner la grippe" en parlant de saignements (ou saignées) ... la vieille technique des médecins du 10 ième siècle quand ils savaient pas :mrgreen: et un paquet va s'ouvrir les veines pour soigner son rhum :roll: ).
Tous les sites fonctionnent comme ce forum: on laisse les vieilles pages parce qu'elles apportent toujours (peut-être) des visiteurs. Supprimer une vieille page = supprimer les liens internes qui vont dessus en interne et modifier l'htaccess pour rediriger les liens externes.
Ton post est correct (pour les visiteurs de ce forum) mais un peu hors sujet pour le sujet sur un problème de copie de pages (y compris pour ce forum qui s'est fait aussi copié). :wink:
 
WRInaute occasionnel
Les copieurs automatiques

noren a dit:
Ainsi tu pourras peut être virer quelques sites en attendant les MAJ de l'algo et gagner à nouveau et un peu plus rapidement quelques positions.
Pour accéder à un site, le visiteur envoie automatiquement plusieurs paramètres:
1. IP (personnellement, j'interdit quasiment toutes les plages d'amazoon : 52.0.0.0 -> 52.31.255.255 et 54.X (à vérifier)) entre autre directement sur le serveur.
2. user_agent: facilement modifiable mais quand même . Et là on passe par htaccess.

Il n'y aura pas de mise à jour dans ce cas, le duplicate est intégré dans l'algorythme.
 
WRInaute impliqué
Re: Une faille dans Google exploitée par des hackers pour voler le référencement

Akuri a dit:
Patrick est gentil de donner quelques tuyaux mais à un moment donné, faut que les gens arrêtent le bricolage et suivent de vrais tutoriels en ligne ou de vraies formations plutôt que de bricoler des choses entendues à droite et à gauche sur les forums.

Lol ! il t'a donné 3 techniques qui ne font même pas 10 lignes chacune. Tu peux tout d'abord apprécier l'efficacité de ses techniques, et en option lui remercier d'avoir délivrer sans contre-partie du code pour que d'autres survivent.
Ca reste un grand minimum... ou la sélection naturelle fera le reste.
 
WRInaute accro
ces problèmes non rien a voir avec Wordpress. N'importe quel site peut faire l'objet de ce genre de copie !
la preuve avec Doctissimo !
 
WRInaute accro
Pour que la copie prenne la place de l'originale il faut :
- soit que le site copieur ait une plus grosse réputation. Mais c'est étonnant pour un site qui change chaque semaine
- soit que la page copiée fasse une redirection 301 quand elle est visitée par un googlebot ou une ip google
bien sur, quand on visite le site copié normalement on voit les pages originales et il n'y a pas de redirection

Il faudrait peut-être creuser un peu plus l'idée du cloaking et admettre qu'on a pu se faire hacker

Je connais qu'un seul site copieur "légitime" qui peut prendre la place de l'original, c'est hellocoton. Mais ils ont un sacré PR et ce sont les webmasters eux-même qui leur donnent les articles à chaque fois qu'ils publient sur leur site.
 
Nouveau WRInaute
Bonjour à tous,

Indigène, tout comme toi j'essaie aussi de comprendre comment est il possible qu'autant de sites se fassent copier aussi facilement (des petits comme des gros) ?

De plus, ce qui est curieux c'est que la copie puisse bien se positionner, car en effet, la réputation des sites copieurs dans ma situation me laisse perplexe. Il ne semble pas que ce soit des sites avec une très forte réputation. (ex parmi d'autres: aikido-eaubonne.fr)

Tu as raison, je me suis peut être fait hacké aussi mais pour l'instant aucun de mes contacts ne le remarque (webmasters et développeurs), même une boite sérieuse comme sucuri.net
 
WRInaute passionné
Koxin-L.fr a dit:
Mais l'antériorité dans l’édition de contenu n'a pas valeur de propriété. ;-)
Oui mais en pratique, si un site copie le texte d'un autre site, celui qui peut revendiquer l'antériorité (via https://archive.org/web/ par exemple) du texte plagié aura gain de cause devant n'importe quel tribunal en France et pourra exiger du site plagieur d'enlever le texte copié. Les juges sont des humains et pas de robots :wink:
 
Nouveau WRInaute
Merci à Patrick-le jeune pour ces lignes de code. Je vais essayer d'explorer cette solution avec un développeur compétent.

Autre suggestion, pensez-vous que mettre en place un Cloud Proxy afin de contrôler les IP puisse aider à :

1/ ne pas se faire hacker ?
2/ ne pas se faire copier l'intégralité du contenu de son site ?

Enfin,

3/Est-il vraiment possible d'éviter que le contenu d'un site soit copié aussi facilement ?

4/ Une fois qu'un site est copié, est-ce déjà trop tard de vouloir protéger son contenu étant donné que les hackers ont déjà toutes les lignes de code?

Merci d'avance de vos retours
 
WRInaute passionné
poupilou a dit:
Oui mais en pratique, si un site copie le texte d'un autre site, celui qui peut revendiquer l'antériorité (via https://archive.org/web/ par exemple) du texte plagié aura gain de cause devant n'importe quel tribunal en France et pourra exiger du site plagieur d'enlever le texte copié. Les juges sont des humains et pas de robots :wink:

Faux.
Pour avoir gain de cause il faut apporter la preuve de la propriété du texte copié.

Ce n'est pas parce que tu es plagié que ton texte est obligatoirement TA propriété.
 
WRInaute accro
Koxin-L.fr a dit:
Faux.
Pour avoir gain de cause il faut apporter la preuve de la propriété du texte copié.

Pas totalement juste. L'insertion dans un site avec un timestamp archive.org (maintenant ENFIN reconnu par les tribunaux) est au moins une preuve de publication antérieure. En termes de droits d'auteurs, ça constitue un indice très fort. Si l'autre n'a rien de mieux (par exemple la preuve de l'achat du texte) et qu'en plus il copie un site entier, il est très mal.

Pour rappel, en ce qui concerne les droits d'auteurs, la création même de l'oeuvre génère la propriété. Si on crée soit même son texte, une telle preuve peut suffire. Si on l'achète, il y a un contrat et une facture.
 
WRInaute occasionnel
cloaking= pas Google

indigene a dit:
Il faudrait peut-être creuser un peu plus l'idée du cloaking et admettre qu'on a pu se faire hacker

... c'est hellocoton. Mais ils ont un sacré PR et ce sont les webmasters eux-même qui leur donnent les articles ...

1. :wink: te rappelle quand même la définition du cloaking ... c'est faire voire aux moteurs de recherche (robots) un contenu différent que celui vu par les visiteurs.
Petit exemple de code (très risqué):

Code:
 if ($host=="crawl-".$tableau['0']."-".$tableau['1']."-".$tableau['2']."-".$tableau['3'].".googlebot.com")
 {
  // Google
 echo "autre";
 }
J'ai juste copié le code sur un système de protection mais c'est basé sur les adresse IP (tableau[0 ...1,2,3] reprend l'adresse IP (la plage) en IPv4. "Autre" reprend le contenu pour Google (le robot). Seul problème, d'autres plages d'adresses sont utilisées par Google (référencées comme telles) et quelques adresses IP anonymes sont utilisées (surtout en cas de plaintes de webmasters).
Ces systèmes de copie n'utilisent pas le cloaking: le but est de récupérer du contenu "propre" pour le balancer aux robots de Google et autres. Essaye une copie en cache (généralement la page est en no cache, comme par hasard).
2. Pas besoin de se faire hacker pour être copié, il existe suffisamment d'outils sur Internet pour copier des sites à la volée (et pas forcément WordPress ou d'autres CMS). Un site hacké renvoie des liens (en interne) vers d'autres sites, renvoie un virus, une fenêtre publicitaire, une bestiole publicitaire, ... au visiteur (ou un beau message genre Ce site c'est fait hacké ou un redirection). Par expérience ... de m'être fait hacké quelques fois: c'est pire que d'être copié :roll: (généralement je réinstallais le serveur, les sites ... après nettoyage.
3. helloco-toon
C'est pas nouveau: les récupérateurs de fichiers RSS gonflent leur contenu et deviennent plus "pertinent" sur Google. Le PR n'existe plus depuis ... des années
Pas tout confondre et pas tout mélangé ... pour bloquer les copieurs
 
WRInaute passionné
Marie-Aude a dit:
Pas totalement juste.
Mais pas totalement faux.

Je trouve un livre du XVe que je numérise et met sur le web.
Un type me plagie.

Je peut demander au tribunal d'ordonner la suppression du plagiaire.
Mais si le boulot du coté de la justice est fait correctement, je l'ai dans l'os, puisque le texte n'est pas de moi, même si j'en ai l'antériorité.

Moi, c'est simplement ce que je veux faire comprendre antériorité n'est pas obligatoirement propriété.
 
WRInaute accro
La on parle tout de même de copie intégrale de sites et pas uniquement un texte ou un bout de texte. Généralement dans le cas présent il y a également copie de la charte graphique, du logo, de la marque (ou ndd) dans la bannière etc. des copies de sites français sur des hébergement russes etc.
Inutile de tourner autour du pot, dans le cas présent un archive.org démontre largement qui est le propriétaire. Et encore il n'y a même pas besoin de ça.

@indigene : ça a déjà été précisé plusieurs fois, pas besoin d'être piraté pour subir des copies à la volée, et patrick_lejeune l'a expliqué un peu plus en détail :wink:

Ce qui reste hallucinant c’est également de voir qu'une copie via iframe peut fonctionner !

Quand on tape forum maigrir c’est encore un nouveau site spammeur en 1ere position a la place de doctissimo.Il y en a vraiment beaucoup et GG est toujours à l'ouest! Une chose est sur c’est que la technique semble suffisamment bien rodée pour arriver à prendre le dessus sur doctissmo sur certaine bonnes requêtes...
 
WRInaute occasionnel
Une faille des sites internet exploitée par des copieurs: ALERTE

noren a dit:
Ce qui reste hallucinant c’est également de voir qu'une copie via iframe peut fonctionner !

Quand on tape forum maigrir c’est encore un nouveau site spammeur en 1ere position
Pour simplement que la page "copieur" soit connue, il faut déjà des liens dessus. Du coup, pour démarrer la procédure, il faut d'abord des sites connus par Google (y compris en en piratant au passage). Ca doit faire un paquet de redirection 301 au départ et un gros travail de programmation et d'intelligence au départ. Du coup le "hallucinant" ... :wink:
C'est aux Webmaster à ce défendre, pas à Google de comprendre au cas par cas.
PS: j'adore modifier à chaque fois le titre du post. Ca va paniquer sec dans les chaumières :mrgreen:
 
WRInaute accro
noren a dit:
@indigene : ça a déjà été précisé plusieurs fois, pas besoin d'être piraté pour subir des copies à la volée, et patrick_lejeune l'a expliqué un peu plus en détail :wink:

Ce qui était important dans ce que j'ai écrit c'est ceci :
Pour que la copie prenne la place de l'originale il faut :
soit...
soit...

Bien sur que c'est très facile de copier. Il suffit de faire enregistrer sous... et on a une copie
Mais pour placer cette copie à la place de l'original dans les résultats des moteurs de recherche c'est une autre paire de manche.

C'est pourquoi je pense que les sites usurpés ont subit ce type d'actions :
1) piratage du site. Le pirate possède la faculté de modifier toutes les pages du site ou de modifier le contenu de la base de données
2) copie d'une page par simple "enregistré sous"
3) mise en ligne de la copie après avoir modifié les liens pour mener vers le site des hackers. Le site sur lequel la copie est mise en ligne peut lui-même être un autre site hacké
4) mise en place d'un cloaking sur la page d'origine pour faire une redirection 301 vers la copie. Seul google voit et suit cette redirection 301, le visiteur affiche la page d'origine et ne s'aperçoit de rien.
5) Google remplace tout simplement dans les serp la page d'origine par la copie car il suit les instructions de la redirection 301 qu'il pense être légitime.
6) ça va fonctionner quelques semaines jusqu'à ce que google s'aperçoive du cloaking. Il supprime alors de ses résultats la copie installée sur le site des hackers. Mais il pénalise le site d'origine qui, pour lui, est un site qui pratique le cloaking. Il n'y a donc pas de retour de la page d'origine a ses anciennes positions sauf si on corrige le cloaking pour rendre le site propre à nouveau. Je pense même que l'intégralité du site copié peut être pénalisé par google pour infraction aux guidelines.

Que pensez-vous de mon raisonnement ? Pour moi il tient la route sur le plan logique
 
WRInaute accro
Non plus, pour que le site spammeur prenne la place dans les serps du site d'origine pas besoinde hacker le site d'origine. il suffit de faire confiance en partie a la mauvaise gestion du DC de la part de GG. Et les spammeurs savent y faire. Ensuite il y a surement d'autres paramètres qui nous échappent mais qui n'ont rien a voir avec un hack du site d'origine.
En tout cas, pas pour les exemples de ce topic

Donc oublie cette histoire de hack, de cloaking sur le site d'origine etc. :wink:
 
Nouveau WRInaute
Koxin-L.fr a dit:
Faites comme moi...
Utilisez Qwant.
Y aura plus tout ces problème. :)

Pourquoi pas, sauf que plus de 90% des Internautes utilisent Google pour leurs recherches donc le problème n'est pas vraiment résolu.
 
Nouveau WRInaute
Koxin-L.fr a dit:
Slt,

2 choses.

1 - lors de duplicate GG donne toujours la valeur à celui qui à la meilleur "popularisation".
Ex : tonton à un site en P1 il se voit dupliquer sur "Le Monde"... Le monde passe en p1 sur la requête.
C'est ainsi depuis que le DC ets pris en compte pas GG.
2 - Ton site à un indice bien moins performant que le site hacké. Donc... voir point n°1.

Google ne tient pas compte de celui qui a l’antériorité? Parce que donner raison au plus populaire revient à ne pas tenir compte du DC.
 
Discussions similaires
Haut