Gérer (honnêtement) du duplicate content

Nouveau WRInaute
Salut les WRIstes,

Ca fait un moment que je vous lis, et voici mon premier sujet auquel je n'ai pas encore trouvé de réponse:

Je suis en train de refondre un blog d'une centaine d'articles, dont une bonne moitié est composé de contenu unique, donc pour cette partie aucun souci.
Environ 40% de mes articles est du copier-coller bête et méchant de parutions et d'interviews sur des journaux en ligne (Figaro, BFM, Le Monde, etc...). Ces articles parlent de mon blog, le copier-coller est donc justifié: je souhaite garder une copie de toutes ces parutions dans la mesure ou certaines, à terme, deviennent indisponibles sur les sites copiés.

Bien entendu, je ne cherche pas à me positionner dans les SERP sur ces résultats, et autant dire que d'essayer de se positionner devant Le Monde avec du copier-coller relève de l'utopie.
Ma question est : Comment gérer ces pages? Est-ce que je dois interdire les robots sur ces pages? Lier vers les originaux? Disons que j'ai un peu peur que l'ensemble du site soit affecté par cette grosse part de duplicate!

Merci pour vos réponses :)
 
WRInaute passionné
Bonjour,

il y a deux possibilités, sachant que ces articles parlent de toi, tu as donc en partie une légitimité "morale".

Est-ce que ces articles sont tous rassemblés dans une page ou chacun a sa propre page?

Si ils sont rassemblés dans une même page (ou quelques unes), tu peux utiliser un noindex, mais autoriser de suivre les liens (follow) ... ou pas ...

Si ce sont des pages uniques, tu peux aussi indiquer le liens original avec la balise canonical .

personnellement, je ferais un sous domaine dédié a ces articles et je laisserais Google se débrouiller avec ce contenu ...
Ainsi, le domaine principal n'est pas touché, et les quelques articles disparus chez les autres aurons un petit impact ... peut-etre même que leur auteur seront content de les retrouver à l'avenir ... ?
 
Nouveau WRInaute
Bonjour et merci pour vos réponses!

Ce sont des pages uniques, les articles des journalistes étant de 1000 à 3000 mots, c'est compliqué ergonomiquement parlant de faire une page avec la quarantaine d'articles.

Vu que je fais la refonte sur une plateforme Wordpress, je pense que la solution du sous-domaine est un peu complexe à mettre en oeuvre (je vais me renseigner). Pour les détails superflus, mon index est une timeline faisant une retrospective des publications et écrits dans le temps (aussi bien mes écrits que ceux des journalistes).

Etant assez pointilleux sur la sémantique, je trouve que ta solution du canonical vers le site source est séduisante : je ne savais pas qu'on pouvait la lier à un site externe!

Merci en tout cas, je vais suivre tes conseils, je ferai un petit compte-rendu ici quand j'aurais un peu de matière du côté des stats.
 
Discussions similaires
Haut