Duplicate content ou non ?

WRInaute discret
Bonjour,

j'ai crée, il y a de ça plusieurs années, un site listant des cartes d'un jeu de cartes à collectionner.
Il s'agit d'une grosse base de données de toutes les cartes du jeu.
La page de visualisation d'une carte présente les différentes infos (nom, édition, numéro, illustration de la carte, etc)

Il peut arriver que certaines cartes aient été éditées plusieurs fois (dans des éditions différentes, la plupart du temps avec des illustrations différentes). Du coup, plusieurs pages du site peuvent présenter un content similaire (pas totalement identique mais très proche).
Est-ce que Google peut considérer ça comme du duplicate content ou est-il capable de distinguer qu'une partie des infos est différente ? Je ne pense pas qu'il analyse l'illustration...

Voici un exemple de carte éditée plusieurs fois : http://www.tcg-seigneurdesanneaux.net/carte/32 et http://www.tcg-seigneurdesanneaux.net/carte/1246

Merci d'avance

NB : si les 2 pages ont le même titre (balise <title>) ou la même description (balise meta description), Google me le signale dans "outils pour les webmasters", c'est pour ça que je me pose des questions à ce sujet
 
WRInaute impliqué
Le problème, c'est que la notion de DC reste vague.

Des pages avec 20% de texte en DC se sont vu plonger alors que d'autre avec plus de 80% sont resté en place.
Tout dépend de la popularité du site, de la quantité de contenu unique du site, de la quantité de contenu de la page incriminée, etc...

Dans ton cas, je dirais que c'est en effet risqué.
 
WRInaute accro
De toute façon, un DC entre page d'un même site avec une seule url n'est pas (trop) (si) problématique: Google en choisira une qu'il mettra en avant.. pour la requête retenue.
Donc, en individualisant au maximuml ce qui peut l'être et en faisant bien le travail de linking entre les pages pour permettre aux visiteurs de tout visiter, cela devrait rester jouable, non ?
 
WRInaute discret
Bonjour Elianora,
le duplicate content interne n'est pas idéal mais ça reste effectivement moins grave que si c'était un autre site.
Plusieurs solutions s'offrent à vous : soit vous faites des redirections, soit vous utilisez une URL canonique.

Webmaster tools détecte et signale en effet les pages dont le title est identique, mais il existe également des outils qui permettent de le faire. Florian Karmen a rédigé un article cette semaine sur un de ces outils : Screaming Frog

En gros, le logiciel crawle les liens sur vos pages et classe ensuite les pages dans un tableau avec des infos capitales pour le référencement : title, titraille, etc.

Grâce à ça, vous pouvez très facilement trouver les pages en 'doublon' sur votre site. Par contre, l'outil est payant au delà de 500 pages et SeoQuake m'indique qu'il y a plus de 1.700 pages de votre site dans l'index, il faudrait donc trouver un outil similaire ou payer...
 
WRInaute accro
Pour le coup, voyant très bien le genre de problématique (ancien joueur de Magic, ça aide), je serais plutôt de l'avis de JanoLapin : laisser les url s'indexer, tout en essayant au maximum de les différencier (mention de l'illustrateur, de l'année, de la série / édition si elle a changée, des cotes, etc).
 
WRInaute discret
Mais il n'y a que des lapins sur ce forum !! :lol: cf. les avatars de UsagiYojimbo & JanoLapin

Plus sérieusement, j'avoue je n'ai jamais joué aux cartes Magic, on a peut-être une vision différente de la chose.
J'ai regardé les 2 pages et les descriptions varient un peu, je ne sais pas si c'est lié à la carte (si elles sont différentes, etc.) mais si c'est le cas, vous pouvez laisser en état.

S'il n'y a strictement aucune différence, tu peux utiliser une URL canonique ou une redirection mais il faudra bien choisir quelle page tu souhaites valoriser. Sinon, j'ai trouvé un autre outil sur le même blog : UN.CO.VER qui permet de détecter le duplicate content 'interne' & 'externe'.
 
WRInaute discret
ces 2 cartes sont bien différentes, il n'y aucune raison que que j'en "supprime" une des 2 au profit de l'autre (url canonique, redirection 301)
donc je laisse tel quel
de toute façon, je ne pense pas que ça change sensiblement mon référencement (qui n'est pas phénoménal ^^)

merci, j'y vois un peu plus clair

PS : 1700 liens ?
il en manque, il y a déjà un peu plus de 3000 cartes, les pages des éditions, de recherche et les pages diverses, ça fait sûrement le double ;)
 
WRInaute impliqué
L'url canonique ne supprime pas la page, elle dit juste à GG que le contenu vient d'une autre, afin d'éviter le DC.
Evidement, seul celle canoniquée ressortira dans les SERPs, mais l'autre sera accessible via ton site.

Tu n'as pas vraiment le choix sur des pages avec si peu de contenu et autant de DC. :-(
 
WRInaute discret
Dolph a bien raison, l'URL canonique ne va pas supprimer ta page, en revanche elle va permettre à Google de savoir quelle page privilégier en cas de contenu dupliqué. Le risque avec ton site c'est qu'il n'est pas très riche en contenu textuel, tu risques donc d'être plus fragile qu'un site bien rempli.

Concernant les pages indexées, il n'en ressort pas 3000 pages. Je viens de rééssayer et Google m'affiche 1.880 pages indexées.

281329567-22f9c30144f5d8f8a86771692c3a4d26.4dafe400-full.png
 
WRInaute discret
Du contenu dupliqué est du contenu dupliqué peu importe la raison et on ne sait jamais exactement ce que Google en fera.

Tu peux peut-être empêcher l'indexation de certaines pages.
 
Discussions similaires
Haut