PDf et html duplicate content ?

WRInaute discret
Bonjour,

Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
 
WRInaute accro
mauvais ça ! Une solution serait peut-être d'interdire l'indexation des pdf par le robot alors... Ceci laisserait donc quand même la possibilité au visiteur de le télécharger sans devoir l'enlever.
 
WRInaute discret
YoyoS a dit:
mauvais ça ! Une solution serait peut-être d'interdire l'indexation des pdf par le robot alors... Ceci laisserait donc quand même la possibilité au visiteur de le télécharger sans devoir l'enlever.

Rien n'est prouvé encore !

Quand on ne connait pas le problème, inutile de chercher des solutions.
 
WRInaute accro
GG lit les .pdf, il les indexe et il n'est pas idiot au point de considérer leur contenu comme duplicate par rapport à des pages html.
Dit autrement : le duplicate content, c'est entre documents de même type que ça se joue.
 
WRInaute passionné
Szarah a dit:
GG lit les .pdf, il les indexe et il n'est pas idiot au point de considérer leur contenu comme duplicate par rapport à des pages html.
Dit autrement : le duplicate content, c'est entre documents de même type que ça se joue.

Je ne serais pas aussi affirmatif, mais cela semble logique effectivement.

Il est tout à fait légitime d'avoir du contenu sous plusieurs formats, et ce ne serait pas très intelligent de la part de Google de pénaliser cela.
 
WRInaute discret
c'est aussi la réflexion que j'avais : format différent => traitements différents. D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?? En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
 
WRInaute passionné
Hartas a dit:
Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
Je pense que oui.
Hartas a dit:
D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?
Je pense que oui.
Hartas a dit:
En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
Je pense que oui.


Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.
 
WRInaute discret
Bonjour !
Question que je me suis posé il y a environ 1 an et apparemment google ne pénalise pas, je n'ai pas doublé l'ensemble du site en pdf mais quand même quelques pages et à ce jour je n'ai pas de problème.
J'ai simplement pris la précaution de ne pas mettre les pdf à la racine mais dans un répertoire.
Paul
 
WRInaute discret
Serious a dit:
Hartas a dit:
Petite question qui me travail : le fait d'avoir de l'info dans une page en html et de proposer le téléchargement d'un pdf contenant à peu près les mêmes infos peut-il être interprété comme un duplicate content par google ?
Je pense que oui.
Hartas a dit:
D'un autre coté GG fait-il une analyse aussi poussé avec les PDF qu'avec les pages html?
Je pense que oui.
Hartas a dit:
En allant jusqu'au bout de la réflexion, on pourrait tres bien avoir du duplicate content entre fichier PDF. Qu'en pensez-vous?
Je pense que oui.


Mais je ne pense pas qu'il existe de penalite pour le contenu duplique.

Tu penses trop.
 
Nouveau WRInaute
Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables :roll:
 
WRInaute passionné
aljaber a dit:
Il nous est peut être tous arriver de tomber sur un site qui présente un documentation sous différents formats. C'est du bon sens que de penser que cela ne peut être considéré comme du duplicate content. Pour affirmer le contraire, faut des preuvres, des preuves irréfutables
https://www.google.com/search?hl=en&lr=& ... tnG=Search
Google detecte clairement le contenu duplique et cache un des resultats.

PS: page pris au hasard
 
Discussions similaires
Haut