Menace de "Duplicate content" ?

WRInaute discret
J'ai lu que le "Duplicate content" posait problème dans le cas des sites multidomaines.

Je souhaiterais savoir si pour un seul et unique domaine, la présence de plusieurs pages identiques posaient le même problème ?

A savoir si je créer une page http://www.lesite.com/voiture.html et une autre page http://www.lesite.com/vehicule.html qui sont exactement identique, est ce que ca rentre dans le cadre du "duplicate content" ?

Autre question : le "duplicate content" peut être détourné en insérant une toute petite différence dans la page, par exemple, le nom du chemin lui même (qui est la seule chose différente) ou l'heure ?

Je précise que ce n'est pas une tentative de "spamming" mais il est possible que certaines pages soit identiques en même temps, et j'ai peur que ca entraine dans la Black List...
 
WRInaute accro
Salut,

si tu veux mettre 1000 pages identiques sur TON site, je ne pense pas que cela pose probleme..

google en choisira une, tout simplement....a mon avis, ce sera celle qui aura le plus de liens vers elle.
 
WRInaute accro
tout le monde fait volontairement (ou involontairement) du duplicate content (meme WRI :mrgreen:)
Par contre le degré de pénalité n'est pas le meme :
si tu le fais sur TON site, la "pénalité" sera la non prise en compte des doublons... on va appeller ca le benefice du doute ?
si tu le fais le meme contenu pour PLUSIEURS sites, la c'est pan pan! :)
 
WRInaute impliqué
bah non, ce que décrit mahé c'est le Duplicate Content.
avoir des pages identiques avec des urls différentes, c'est normalement impossible, ça doit venir d'un problème d'ergo de ton site.
 
WRInaute impliqué
d'une part ça, et d'autre part (mais là c'est pas mon cas), faire un url-rewriting "croisé", en quelque sorte, qui fait que les liens sont différents pour une même page car correspondant à diférentes méthodes d'URL rewriting.
Ca veut dire moins de BL internes pour une même page, donc technique foireuse.
 
WRInaute passionné
yanhl a dit:
d'une part ça, et d'autre part (mais là c'est pas mon cas), faire un url-rewriting "croisé", en quelque sorte, qui fait que les liens sont différents pour une même page car correspondant à diférentes méthodes d'URL rewriting.
Ca veut dire moins de BL internes pour une même page, donc technique foireuse.

C'est à dire que de la page
article.php?id_article=12

on a ecrit article-12.html
et aussi joli-titre-12.html
en gardant article.php?id_article=12 quelque part dans les liens

Il me semble que dans les trois cas Google ne conserve dans son index qu'une seule page, et il choisira la bonne c'est à dire celle qui a le plus de Back Link.

On peut aussi rajouter la page imprimer-12.php qui n'est que le contenu de cette article 12, mais avec une présentation pour l'imprimante, là aussi d'après mon expérience, google choisit.
 
WRInaute impliqué
Le mieux pour contrer cela, c'est de tester si l'url dans le navigateur est celle attendue, et sinon faire une redirection 301 vers la bonne adresse. Comme ça, on se prémunit contre l'accès à la page via l'adresse non url-rewritée, et également contre l'accès via une url rewritée mauvaise type joli-titre-12.html au lieu de article-12.html :)
J'ai fait ça pour les urls des catégories et des annonces du site de mon profil.
 
WRInaute occasionnel
Dans quelques mois je pourrai vous dire ce qu'il en est de cette histoire de rewriting GG crawle mes anciennes pages en index.php?cat=12 et les nouvelles blabla-12.html. Donc il a les 2 dans se base. J'ai l'impression qui comprend pas que c'est la meme page !!
 
WRInaute accro
j'ai le cas chez moi aussi.. mais j'ai remarqué que c'est parce que les 2 pages ne sont pas tout a fait les memes (une pub qui a changé par ci, une url qui s'est rajouté par la), ce qui est un peu normal vu qu'il ne crawle surement pas les 2 pages au meme moment.
 
Discussions similaires
Haut