HTML + PDF = duplicate content ?

WRInaute discret
hello :)

Tout est dans le titre, avec cette belle équation dont je suis très fier (moi qui suis nul en maths) :mrgreen:

J'ai un petit site d'initiation à l'astronomie, qui est en partie visité par des jeunes scolarisés.
Nul doute que ces visiteurs viennent chercher sur mes pages des infos pour leurs exposés et divers travaux scolaires ... Donc je m'étais posé la question de proposer un téléchargement pdf de toutes mes pages, pour qu'ils puissent aisément les imprimer et les stabiloter (aaaah c'est loin tout ça).

J'ai tenté de me renseigner sur WRI et je suis tombé sur cette page qui date de 4 ans, et qui ne me renseigne pas vraiment (puisqu'on y lit des avis contradictoires)
https://www.webrankinfo.com/forum/t/pdf-et-html-duplicate-content.65827/

Aujourd'hui, quels sont les avis sur cette question ?
Y a-t-il parmi vous des feedbacks ?
 
WRInaute accro
entre temps, il a été évoqué un certain nombre d'outils pour éviter ce duplicate content, comme par exemple proposer le pdf depuis une page en noindex, et doter ton site de balises canoniques
 
WRInaute discret
merci JanoLapin

c'est vrai que je n'ai pas mis la balise canonical sur mes page, je vais m'y atteler !

Avec cette balise, est-ce suffisant ?
Car je compte rendre accessible le fichier pdf directement depuis la page html source via un bouton, donc pas question de mettre noindex sur ma page html ...
 
Discussions similaires
Haut