Deux pages jugées identiques à partir de quel % ?

WRInaute passionné
Salut à tous,

J'ai un catalogue de plus de 200 000 produits et il arrive très fréquemment que mes pages soient très similaires les unes par rapport aux autres.

Google ne les indéxe pas toutes et il me met beaucoup de pages en "Erreur de type soft 404" dans GSC.

D'où ma question : à partir de quel % du texte présent sur 2 pages, Google considère qu'une page est identique à une autre : 70, 80, 90%, plus... ?

Existe-t-il un outil online qui compare le texte de 2 pages afin de voir en % la comparaison du texte de ces 2 pages ?
 
WRInaute passionné
S'agit-il de produits totalement différentes ou bien c'est en comptant les variantes qu'on arrive à 200.000 ?
Il s'agit de 200 000 produits en comptant les variantes.

Je m'aperçois que Google n'indéxe plus les pages de nos produits, ni pour moi, ni pour mes concurrents, il doit estimer que ça lui prend trop de ressources pour crawler toutes ces pages ou quelles sont trop similaires les unes des autres.
 
Olivier Duffez (admin)
Membre du personnel
sans doute qu'il ne faut pas faire indexer les variantes, mais seulement une URL par produit, toutes variantes confondues
 
WRInaute passionné
sans doute qu'il ne faut pas faire indexer les variantes, mais seulement une URL par produit, toutes variantes confondues
Le problème c'est que chacun de mes produits est unique et lorsque ce produit est vendu il est définitivement supprimé parce qu'il est unique, on ne peut pas le re-stocker.

On peut avoir 300 produits très similaires les uns par rapport aux autres mais chacun de ses produits à une durée de "vie" très différente qui varie d'un produit à l'autre, certains sont listés sur mon site depuis des années et d'autres ne resteront que quelques semaines/jours. Malheureusement je ne peux pas savoir quels produits sont listés depuis des années car je ne garde pas en mémoire la date de première insertion. Ma base de données de mes produits est mise à jour tous les jours, des milliers d'articles rentrent chaque jour et d'autres en sortent. Dans ce cas là, comment choisir le produit/l'url qui sera indéxé ?
 
Olivier Duffez (admin)
Membre du personnel
est-ce que les pages produits ont vraiment besoin d'être indexées ? n'est-ce pas possible de ne travailler que les catégories ?
 
Discussions similaires
Haut