Le Duplicate-Content en question : un cas de duplicate content important non-pénalisé

Discussion dans 'Google : l'entreprise, les sites web, les services' créé par hibou57, 13 Juillet 2010.

  1. hibou57

    hibou57 WRInaute passionné

    Inscrit:
    1 Novembre 2006
    Messages:
    1 309
    J'aime reçus:
    0
    Hillou les gens,

    J’ai reçu et reçois encore de temps en temps des visites de ce site, et les première fois, je me suis demandé : « mais comment se fait-il que je reçoive des visites d’un site Russe ? ». j’ai donc suivi les liens référents, pour découvrir qu’il s’agissait de visites en provenance de la copie d’une page de Wikipédia faisant un lien vers mon principal site.

    Ce fut le premier contact pour moi avec ce site, mais pas le dernier.

    Dans Google, et seulement dans Google, ce site, academic.ru (du moins certains de ces sous-domaines, comme fr.) ressort régulièrement dans les résultats de Google depuis quelques temps (enfin, sur mes requêtes à moi au moins), pour des pages qui sont elles aussi des copies de Wikipédia.

    Comment expliquer à la fois ce phénomène et la théorie selon laquelle Google pénaliserait la duplication de contenu (duplicate-content) ?

    Les autres phénomènes supposés être la démonstration de l’existence de cette pénalité de Google, n’avaient-ils pas éventuellement d’autres causes possibles ? (corrélation n’est pas nécessairement cause) Ou alors cette « règle » souffrirait-elle d’exceptions flagrantes ?
     
  2. rudddy

    rudddy WRInaute accro

    Inscrit:
    1 Août 2007
    Messages:
    2 562
    J'aime reçus:
    0
    on en a déjà parlé hier sur le forum avec voila
     
  3. hibou57

    hibou57 WRInaute passionné

    Inscrit:
    1 Novembre 2006
    Messages:
    1 309
    J'aime reçus:
    0
    Tu veux dire le moteur de recherche Voila ?
     
  4. lecouti

    lecouti WRInaute passionné

    Inscrit:
    3 Janvier 2009
    Messages:
    1 561
    J'aime reçus:
    0
    J'ai d'autres cas plus simples encore, qui me font penser que le DC chez Google c'est interdit mais pas grave tant qu'on ne se fait pas attraper. En attendant mes deux exemples caracolent en première page.
    Mais c'est vrai que c'est à se demander pourquoi parfois GG le détecte et parfois non
     
  5. Rod la Kox

    Rod la Kox WRInaute accro

    Inscrit:
    24 Juin 2008
    Messages:
    3 255
    J'aime reçus:
    0
    Je ne le dirais jamais assez, le DC et Google, ça me fait bien rire...

    cherchez des fonction php et les premiers résultats retournés seront tous des copies du manuel en ligne...
     
  6. aladdin

    aladdin WRInaute passionné

    Inscrit:
    29 Avril 2005
    Messages:
    1 453
    J'aime reçus:
    0
    même expériance vécue, un plagieur a copié des contenus de ma page, avec mes méta tags (j'avais même mis un meta tag <meta generator="VIM (^_^)" /> pour m'amuser il l 'a copié tel quel) ... et sur certaines requêtes il s'est retrouvé mieux positionné que moi et il l'es toujours ...

    Les pénalité dont Google parle il y a que lui qui sait comment ca fonctionne vraiment, un peu de transparence serait la bienvenue de sa part ... c'est également le cas de milliers de sites qui enfreignent toutes les TOS de google adsense et qui continuent à faire de l'argent avec ...
     
  7. rudddy

    rudddy WRInaute accro

    Inscrit:
    1 Août 2007
    Messages:
    2 562
    J'aime reçus:
    0
  8. Argonaute

    Argonaute WRInaute impliqué

    Inscrit:
    31 Juillet 2008
    Messages:
    600
    J'aime reçus:
    0
    Il existe plusieurs domaines où le dc n'est pas sanctionné, parce que Google ne peut pas faire autrement : cinéma, théâtre, communication d'entreprise, etc... En bref tous les sites reprenant le contenu fourni par les attachés de presse.
    L'exemple le plus frappant est le cinéma où quasiment tous les sites (et pas des petits) ont le même contenu de base et ressortent sans problème dans les résultats.

    Il y a beaucoup d'annuairistes et d'agrégateurs sur WRI, ce qui explique la tournure dramatique des conversations liées au DC.
     
  9. anemone-clown

    anemone-clown WRInaute passionné

    Inscrit:
    11 Novembre 2007
    Messages:
    1 708
    J'aime reçus:
    0
    Surtout quand ça peut rapporter un max de pub adsense lorsque le copieur affiche des pubs et que l'original n'en affiche pas (academic.ru vs. wikipedia).

    Concernant academic, ça fait longtemps que j'en avais déjà fait l'écho et il truste de nombreuses premières places sur GG images dans le domaine animalier-botanique.
     
  10. Firewave

    Firewave WRInaute passionné

    Inscrit:
    26 Juillet 2009
    Messages:
    2 298
    J'aime reçus:
    0
    De toute façon là depuis May Day ça tourne au grand n'importe quoi. Je vois de ces grands écarts et des sites sans aucun contenu, mais vraiment aucun viennent sur la première page des résultats avec même pas masse de BLs. Tu te dis qu'il y a un souci dans leur algo à google. Le plus drôle de ce que j'ai vu c'était un site sous forme de:
    -http://www.mot-clé-mot-clé2.com/clé/mot-clé-mot-clé2.php -
    Venir en première page sur une grosse requête sans rien avoir de probant niveau opti site si ce n'est cette url à rallonge avec du kw stuffing et c'est la même chose sur quasiment toutes les requêtes que j'observe actuellement. Tu as le mot clé dans le ndd t'es propulsé...
     
  11. milkiway

    milkiway WRInaute accro

    Inscrit:
    3 Février 2004
    Messages:
    4 968
    J'aime reçus:
    0
    Google est pertinent sur le DC. Il le sanctionne (ou plutôt le filtre à mon sens) lorsque la duplication n'est pas logique.
    Certains secteurs acceptent de très forts taux de DC.
     
  12. hibou57

    hibou57 WRInaute passionné

    Inscrit:
    1 Novembre 2006
    Messages:
    1 309
    J'aime reçus:
    0
    Celle là il faut que quelqu’un la mette dans le sujet des citations Best-Of des grandes pensées éclairées

    Ça c’est un autre sujet, mais sinon oui, on est au moins trois à avoir remarqué. À quand les sites qui se réduisent à une URL ? Merci Google....

    Ce n’était pas la peine de mettre fin au bourrage des balises meta qu’on avait en 1995-2000, pour encourager la même chose avec les NdD.

    Tu veux ouvrir un topic sur la question ?

    Wikipédia.... c’est un secteur en particulier ? 8O
     
  13. zeb

    zeb WRInaute accro

    Inscrit:
    5 Décembre 2004
    Messages:
    13 577
    J'aime reçus:
    0
    Celui là et d'autres en effet si tu prend le cas particulier de la presse et si google blacklistait le DC l'AFP irait a la trappe direct sans passer par la cas départ et sans toucher 20 000 (du moins peut être pas l'AFp mais toutes les grandes maisons de presse)

    Cinéma idem etc ...
     
  14. Rod la Kox

    Rod la Kox WRInaute accro

    Inscrit:
    24 Juin 2008
    Messages:
    3 255
    J'aime reçus:
    0
    Tiens, je t'en file une autre...
    Le SEO ? Depuis le May Day, ça tourne au SOS.
     
  15. zeb

    zeb WRInaute accro

    Inscrit:
    5 Décembre 2004
    Messages:
    13 577
    J'aime reçus:
    0
    Elle est vraiment excellente celle là Reco pour toi Rod :lol:
     
  16. hibou57

    hibou57 WRInaute passionné

    Inscrit:
    1 Novembre 2006
    Messages:
    1 309
    J'aime reçus:
    0
    May Day, bloody May Day (pardon pour la parodie, sans vouloir offenser cette chanson qui dit des choses fortes)


    May Day, May Day, nous allons nous écraser ! (l’histoire ne dit pas si c’est la voie du pilote du site ou celle du pilote de Google qui parle.... suspens)
     
  17. IT-Renew

    IT-Renew WRInaute discret

    Inscrit:
    20 Décembre 2012
    Messages:
    89
    J'aime reçus:
    0
    Désolé de déterré un sujet, mais du coup je voulais donner mon opinion, en 2014 =)

    Bon déjà GG ayant énormément renforcé la lute du DC, les sites sont plus facilement reperés.

    Après, en pratique comment on imagine que ça peut se passer? Tout simplement de la même méthode que lors d'une inscription dans un annuaire (sérieux) demandant justement une description unique (pour éviter ce célèbre DC).

    C'est simple, on prend les 3 ou 4 premières lignes et on fais copier coller dans les résultats de recherche : si on voit deux (voir plus des fois tellement certains webmaster sont doués) sites qui ont les mêmes lignes, bas là sanction est immédiate...

    Si rien n'est trouvé, je pense qu'ils check les BL, qu'ils vérifient le code source pour voir si une source externe est citée et vérifie cette source si le texte est identique ou fortement similaire...

    Bref, il est facile (en tout cas désormais) de détecter le DC.

    Après, si on a un site qui fait du DC, mais qui se situe déjà dans la sandbox ou qui est dans les choux (15ème page), GG n'a même pas à faire la sanction, puisque le site n'est déjà pas référencé...

    Et comme on dit "pas vu, pas prit", mais perso je ne tenterais pas vu la rapidité des sanctions actuelles...
     
  18. axelsoc

    axelsoc Nouveau WRInaute

    Inscrit:
    7 Mars 2014
    Messages:
    1
    J'aime reçus:
    0
    Une question qui me taraude :
    dans le cas où un autre site fait du plagiat et copie mon contenu, suis-je aussi pénalisé ? Ou bien Google est assez intelligent pour savoir qui a commis la faute ?
     
  19. zeb

    zeb WRInaute accro

    Inscrit:
    5 Décembre 2004
    Messages:
    13 577
    J'aime reçus:
    0
    non :D malheureusement il ne peut le savoir ni personne d’ailleurs. Et c'est le site le plus trusranké qui gagne.