Comment Google détecte-t-il le duplicate content ?

Discussion dans 'Débuter en référencement' créé par schwipps, 3 Février 2010.

  1. schwipps
    schwipps Nouveau WRInaute
    Inscrit:
    23 Juin 2009
    Messages:
    37
    J'aime reçus:
    0
    Bonjour tout le monde,

    Une question me taraude aujourd'hui ! Je voudrais en effet en savoir un peu plus sur le duplicate content "hostile" (un site B pompe du contenu d'un site A), et surtout sur la manière dont les moteurs (et notamment Google) s'y prennent pour statuer sur le publieur originel.

    Car s'il existe un certain nombre de solutions pour indiquer aux moteurs quel contenu prendre en compte quand, pour une raison ou pour une autre, on est à l'origine du duplicate content (attribut canonical notamment), dans le cas contraire, le moteur doit pénaliser le fautif (ce qui est normal).

    A ce titre, j'ai récemment lu que Google se contenterait souvent de pénaliser la page au PR le plus faible, comme si la popularité d'un site permettait d'affirmer qu'il ne pompe pas. J'avoue que ça me surprend un peu de la part de Google, qui nous a habitué à plus malin que ça 8O.

    Ne serait-il pas plus judicieux de donner la priorité à celui qui a amené le premier ce contenu à la connaissance du moteur ?

    Qu'en pensez-vous ?
     
  2. Sébastien Billard
    Sébastien Billard WRInaute passionné
    Inscrit:
    7 Mai 2003
    Messages:
    1 695
    J'aime reçus:
    1
    Plusieurs éléments seraient pris en compte, comme la date de première indexation, les dates des liens, le fait que la source soit mentionnée etc. mais ce n'est pas parfait. Dans certains cas les sites à gros PR vont cependant ressortir à la place du site source à faible PR. C'est typique de certains gros agrégateurs par exemple. Ce n'est pas voulu par le moteur, c'est juste que le petit site n'a pas réussi à prouver son antériorité. Aucune pénalité là dedans, Google doit choisir une page parmi plusieurs versions. Il essaie de chosir la bonne, mais se plante parfois :)
     
  3. ybet
    ybet WRInaute accro
    Inscrit:
    22 Novembre 2003
    Messages:
    7 419
    J'aime reçus:
    1
    te rassure (plutôt pas) ce n'est pas le PR qui joue. (et il est bien moins malin que ça). Pour le premier non plus, GG n'a aucune coonfiance dans ses robots.
    La date de première indexation non plus (il y a plus d'un an, j'ai fait des tests dans le café de WRI avec des pages datant de plus de 6 mois et ce sont les pages originales qui sont passées à la trappe mais le site n'était déjà pas trop bien vu de GG).
    Les dates de liens peut-être (mais rien n'est prouvé) et ca ne joue que sur des vielles pages (mais GG garde en mémoire les versions des vieilles pages). Ce n'est pas le PR qui fait ressortir les pages mais une sorte de "niveau de confiance" complètement débile (sauf que L'jee s'est fait copier des descriptifs de son annuaire par un débutant et s'est fait aussi cassé)


    . Pénalité pour celui qui copie non. Pour celui qui est copié oui (je suis un peu moraliste dans ma réponse :wink: ).

    C'est justement le problème depuis prêt de deux ans, c'est que Google ne gère (sais pas) gérer le duplicate.
    > French Dread: désolé :wink: mais ce problème n'a pour l'instant pas de réelles réponses pour les webmasters: il n'y a aucune logique (AUCUNE)
     
  4. schwipps
    schwipps Nouveau WRInaute
    Inscrit:
    23 Juin 2009
    Messages:
    37
    J'aime reçus:
    0
    Donc qu'est ce qu'on peut faire, selon vous, pour s'en prémunir ? Y a-t-il des éléments qu'on puisse soumettre à Google, ou insérer dans nos pages, pour l'aider à mieux trancher ?
     
Chargement...
Similar Threads - Google détecte duplicate Forum Date
Détecteur de duplicate content (sans API Google) ? Référencement Google 13 Août 2011
Script pour détecter le duplicate sur Google Développement d'un site Web ou d'une appli mobile 11 Avril 2011
Balise "noindex" détectée par Google mais introuvable Crawl et indexation Google, sitemaps 28 Août 2018
Pages 410 toujours détectées comme erreurs dans Google Search Console Netlinking, backlinks, liens et redirections 11 Septembre 2017
Page compatible mobile détectée en erreur par Google Débuter en référencement 28 Juillet 2016
Les réseaux de sites (satellites) toujours aussi mal détectés par Google ? Référencement Google 23 Mai 2016
impact de la langue détectée par google Rédaction web et référencement 4 Août 2015
Données structurées non détectées et pourtant extraites par l'outil Google Problèmes de référencement spécifiques à vos sites 23 Juin 2014
Comment corriger des erreurs d'url détectées par le robot de google Problèmes de référencement spécifiques à vos sites 25 Avril 2014
Google detecte il tout le spam? Référencement Google 10 Mars 2014
détecter la position sur Google Débuter en référencement 28 Février 2013
Achat de lien ? Partenariat croisé ? Comment Google peut le détecter ? Netlinking, backlinks, liens et redirections 16 Avril 2012
Erreurs 303 détectées par Google Webmaster Tools Crawl et indexation Google, sitemaps 22 Mars 2012
Google détecte vidéo ? Crawl et indexation Google, sitemaps 7 Septembre 2011
Javascript : détecter mot clés Google et exécuter un script Développement d'un site Web ou d'une appli mobile 16 Juillet 2011
Google Analytics détecte-t-il correctement les primo-visiteurs ? Google : l'entreprise, les sites web, les services 21 Avril 2011
langue détecté par google anglais.. Référencement Google 24 Janvier 2011
Détecter les pages no indexées sur google ? Débuter en référencement 23 Juin 2010
Soft 404 : Google détecte les erreurs 404 qui n'en sont pas Crawl et indexation Google, sitemaps 7 Juin 2010
Combien de mots clés google detecte-t-il dans un site??? Problèmes de référencement spécifiques à vos sites 16 Janvier 2010