Est-ce du duplicate content ?

WRInaute occasionnel
Bonjour,

J'ai une BD de produit football sur mon site web.
J'ai la possibilité de lister ces produits selon plusieurs "filtres".

Par exemple : h**p://www.footcenter.fr/liste.php?categorie=Bordeaux+Maillots+Enfant
pour afficher les maillots de bordeaux enfants.

Mais je peux aussi les faire afficher comme ça : h**p://www.footcenter.fr/liste.php?categorie=Enfant+Bordeaux+Maillots

Le contenu est presque le même (le chemin de fer change un peu ainsi que le title).
C'est du duplicate content ça ? Ou bien est-ce que la page doit être exactement pareil pour que GG considère qu'il y a duplicate content ?


Merci bcp. :wink:
 
WRInaute discret
Bonjour,

Je ne sais pas de manière certaine comment procède google, donc je ne te livre que mon impression...
A mon avis, google doit surement détecter du duplicate content à partir d'un certain seuil de ressemblance entre deux pages (ressemblance du code source HTML, on ne parle pas du design qui peut être totalement différent si géré par des CSS externes).
Et en regardant ces deux pages qui sont vraiment très proches, le pourcentage de ressemblance est surement supérieur au seuil fixé (genre 90% ?) ; je pense donc que ggogle va considérer ces deux pages comme duplicate content effectivement.
 
WRInaute discret
Ce que je ne comprends pas trop c'est à quel moment l'internaute ( et donc le moteur de recherche ) tombe sur ce genre de lien sur ton site ... Je n'ai trouvé que des liens avec catégorie unique ( = enfant ou = bordeaux etc ... ) :?: :?:
 
WRInaute occasionnel
Céo Kay a dit:
Ce que je ne comprends pas trop c'est à quel moment l'internaute ( et donc le moteur de recherche ) tombe sur ce genre de lien sur ton site ... Je n'ai trouvé que des liens avec catégorie unique ( = enfant ou = bordeaux etc ... ) :?: :?:

A aucun moment, mais je voulais juste savoir histoire de mieux connaitre GG :) Pis je me suis dit que si j'arrivais a créer une page contenant des liens vers toutes les combinaisons possibles (des milliers ...) ca pourrait me faire bcp de pages d'indexées :wink:

Donc c'est bien ce que je pensais, il y a un certain seuil de ressemblance à ne pas dépasser.

Merci
 
WRInaute discret
Pas vraiment... D'après ce que j'ai pu lire, il me semble que google n'indexera que l'une des N pages en duplicate content et ignorera les autres (enfin, ne les indexera pas), donc rien de bien catastrophique...
 
WRInaute accro
Oui c'est ça : elle sont indexées en "pages ingorées" Ce n'est pas pénalisant ( a condition que ce soit pas des duplicate content d'autres sites ) Vous en avez une certitude avec les sites qui utilisent phpmyannu par ex : la page de soumission est indéxée sous X entrées (autant que de catégories ) en pages ignorées car toutes identiques mais ça ne pénalise pas les sites utilisateurs pour leurs refrencements
 
WRInaute occasionnel
Les pages ignorées c'est ça :

"Pour limiter les résultats aux pages les plus pertinentes (total : 642), Google a ignoré certaines pages à contenu similaire.
Si vous le souhaitez, vous pouvez relancer la recherche en incluant les pages ignorées." :?: :?:


Merci
 
WRInaute impliqué
PeeWee a dit:
Bonjour,

J'ai une BD de produit football sur mon site web.
J'ai la possibilité de lister ces produits selon plusieurs "filtres".

Par exemple : h**p://www.footcenter.fr/liste.php?categorie=Bordeaux+Maillots+Enfant
pour afficher les maillots de bordeaux enfants.

Mais je peux aussi les faire afficher comme ça : h**p://www.footcenter.fr/liste.php?categorie=Enfant+Bordeaux+Maillots

Le contenu est presque le même (le chemin de fer change un peu ainsi que le title).
C'est du duplicate content ça ? Ou bien est-ce que la page doit être exactement pareil pour que GG considère qu'il y a duplicate content ?


Merci bcp. :wink:

Il suffit de classer tes arguments par ordre alphabetique et hop plus de probleme :p
 
Nouveau WRInaute
Encore plus simple... :lol:

Pour eviter les doublons et en plus éviter que GG zap ce genre d'URL dynamique "http://www.site.com/index.php?var=1..."
>> URL Rewriting << en plus, avec un bon .htaccess tu pourras envoyer tes arguments par 1, par 2, 3... sans te prendre la tête..

J'ai bon ? :roll:
 
WRInaute occasionnel
Je veux bien que Google ait des critères (genre 90% de contenu identique) pour qu'il considère qu'une page soit du Duplicat Content.

Mais alors, pour un site comme le mien qui est une gallerie de photos et dont certaines pages ont un contenu textuel absolument identique (il n'y a que la photo qui change, donc la balise <img> ) que fait-il? Le contenu est en fait visuel.

Jusqu'ici, je n'ai pas été blacklisté.

Arnaud
 
WRInaute impliqué
ça va venir... :wink:
en fait, pas blacklisté, mais désindexé.
Mon site de photos vient de subir une désindexation massive....
c'est en train de revenir tout doucement, mais bon j'ai perdu quasiment tous les visiteurs en provenance de google
 
WRInaute occasionnel
Ah :?
J'ai l'exemple d'un autre site de photos un peu à l'image du mien, et dont le webmaster se reconnaîtra si il parcours ce message, qui a des pages pratiquement identiques sauf l'image. Il n'a jamais eu de problème de désindexation.
Est-ce que le simple fait d'afficher le nombre de fois que la photo a été vue (nombre différent pour chaque photo) fait dire à GG que ce n'est pas du DC? Ca me paraît léger comme différence...

Arnaud
 
WRInaute occasionnel
h**p://www.footcenter.fr/liste.php?categorie=Bordeaux+Enfant+Maillots is 98.720877112837% percentage similar to h**p://www.footcenter.fr/liste.php?categorie=Bordeaux+Maillots+Enfant


humhum :D
 
WRInaute occasionnel
Merci pour le lien, je viens d'essayer... J'ai pris deux pages qui sont identiques à 99,6%...
Tu sais comment marche l'outil? Il compare le code de la page ou le texte affiché?

Arnaud
 
WRInaute discret
Juste pour info la premiere fois que google a indéxé mes pages elles étaient toutes différents mais avaient toutes le meme titre. Il a considérées que toutes les pages etaient duplicate content!!
voili voilou :)
 
WRInaute occasionnel
WhiteSpi a dit:
Juste pour info la premiere fois que google a indéxé mes pages elles étaient toutes différents mais avaient toutes le meme titre. Il a considérées que toutes les pages etaient duplicate content!!
voili voilou :)

Oui le title est vraiment treeeeeeeeeesss important pour GG :D
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut