Page similaire, le retour eternel

WRInaute impliqué
Bonjour,

Apres avoir rewrité mes pages fin decembre, j'ai contenu l'effet des pages similaires, j'ai donc gagné regagné du trafic suite a une grosse claque vers la mi decembre 2004.

Depuis j'ai l'impression qu je reperds le terrain gagné grace au rewriting, petit a petit voila que deux mois apres avoir refait mes pages, je crains que la contagion des pages similaires ne se repropage !

Je me rappelle avoir lu un truc " aprendre avec des pincettes ?" qui incriminait adsense, vos avis?


https://www.google.com/search?q=allinurl ... N&filter=0


Florent
 
WRInaute impliqué
merci pour l'info

3 mots ou combien de caracteres, des sources sur ce point;

ps: le lien ci-dessus semble deja indiquer un autre resultat que tout a l'heure ! ( ca donnait que des pages similaires)
 
WRInaute occasionnel
Lentreprenaute a dit:
Depuis j'ai l'impression qu je reperds le terrain gagné grace au rewriting

Bonsoir Florent,

Classique problème de désindexation due à la similitude des pages, plusieurs fois abordé sur ce forum.

Pour résumer, Google se méfie des milliers de pages dynamiques générées par base de données. Je vois que 7750 pages de ton site sont connues de Google, mais seulement 388 pages sont indexées.

Je pense que l'url-rewriting a masqué quelque temps la similarité de tes pages (puisque la ré-écriture d'Url les fait paraître différent). Mais les moteurs ne sont plus guère dupes de ça... Malgré l'url-rewriting ils voient de plus en plus que les pages sont quasi-identiques. Ca me semble confirmé par le fait que la désindexation recommence, malgré l'UR (ce que tu expliques dans ton post).

Evidemment vu ton site, son objectif etc, c'est pas très évident de contourner le problème.
 
WRInaute accro
je comprend ton problème, j'y ai moi même été confrontée il y a qq temps ... c'est malheureusement assez courant lorsque l'on déploie une base de données de produits sur une page de description ayant une structure intinsèque déjà conséquente (c'est malheureusement souvent le cas) ...

si cela peut t'aider j'ai constaté qu'en dessous de 70% de similitude la désindexation cesse et les pages commencent à être réindéxées ... :wink:
 
WRInaute occasionnel
Cendrillon a dit:
si cela peut t'aider j'ai constaté qu'en dessous de 70% de similitude la désindexation cesse et les pages commencent à être réindéxées ... :wink:

Voilà une info que vaut de l'or et va intéresser tous les sites de e-commerce qui déclinent leur gamme en milliers de références-produits (nombre de produits X couleurs X taille X etc = on arrive vite à des dizaines de milliers de pages Html). C'est le cas aussi des sites qui proposent des dizaines de milliers de fonds d'écran etc...

Il faut qu'on arrive d'une façon ou d'une autre à contourner ce problème de désindexation pour similarité de pages, pour moi c'est la grande question du moment.
 
WRInaute accro
je comprend ton problème, j'y ai moi même été confrontée il y a qq temps ... c'est malheureusement assez courant lorsque l'on déploie une base de données de produits sur une page de description ayant une structure intinsèque déjà conséquente (c'est malheureusement souvent le cas) ...

si cela peut t'aider j'ai constaté qu'en dessous de 70% de similitude la désindexation cesse et les pages commencent à être réindéxées ... Wink

Je confirme, je suis passé à 60% de similarité (pas mon profil qui en l'état l'exemple de ce qu'il faut pas faire :D) et google a reindexé les pages... par contre c'est assez lourd de trouver des ruses.... genre en faisant des menus "aléatoires" ou des trucs dans le style :wink:
 
WRInaute passionné
Cendrillon a dit:
si cela peut t'aider j'ai constaté qu'en dessous de 70% de similitude la désindexation cesse et les pages commencent à être réindéxées ... :wink:

Mesurée avec quel outil ?
 
WRInaute impliqué
Megachercheur a dit:
Lentreprenaute a dit:
Depuis j'ai l'impression qu je reperds le terrain gagné grace au rewriting

Bonsoir Florent,

Classique problème de désindexation due à la similitude des pages, plusieurs fois abordé sur ce forum.

Pour résumer, Google se méfie des milliers de pages dynamiques générées par base de données. Je vois que 7750 pages de ton site sont connues de Google, mais seulement 388 pages sont indexées.

Je pense que l'url-rewriting a masqué quelque temps la similarité de tes pages (puisque la ré-écriture d'Url les fait paraître différent). Mais les moteurs ne sont plus guère dupes de ça... Malgré l'url-rewriting ils voient de plus en plus que les pages sont quasi-identiques. Ca me semble confirmé par le fait que la désindexation recommence, malgré l'UR (ce que tu expliques dans ton post).

Evidemment vu ton site, son objectif etc, c'est pas très évident de contourner le problème.


Si seulement GG faisait son boulot, j'ai des veilles pages (+ d'un an)qui ne sortent pas de l'index !!! de plus j'ai fais une redirection 301 de toute mes pages php vers les nouvelles rewrité.

Je en devrais pas avoir autant de pages trouvé par GG! + de 7000 , je devrai tourner autour de 2500!

Florent
 
WRInaute occasionnel
Lentreprenaute a dit:
Je en devrais pas avoir autant de pages trouvé par GG! + de 7000 , je devrai tourner autour de 2500!

Moi je vois des choses comme ça :

index.php?catid=9&order=datestamp
index.php?catid=9&order=sitetitle&way=1
index.php?catid=9&order=catname&way=1
index.php?catid=9&order=picture&way=0


Avec ta base de données, tu ajoutes des arguments en fonction des choix des visiteurs. Très bien ! Le problème c'est que chaque argument ajouté rajoute une page pour Google. C'est le meme principe que sur mon annuaire par exemple :

http://www.megachercheur.com/annuaire/index.php?c=3 est une page
http://www.megachercheur.com/annuaire/i ... p?c=3&s=91 est une autre page (du simple fait de l'ajout de l'argument &s=91)

Ton problème maintenant va être de faire en sorte que tes pages à arguments multiples (par exemple générées lorsque le visiteur demande un tri dans les résultats) ne soient plus indexées. Sans doute à l'aide de l'url-rewriting puis avec un Disallow etc

Ton nombre de pages indexées va tomber de 7700 à 2500 (les vrais pages, selon toi). Avec un peu de chance, ces pages-là seront moins sujettes à désindexation pour similarité.

Amicalement,
 
WRInaute impliqué
Megachercheur a dit:
Lentreprenaute a dit:
Je en devrais pas avoir autant de pages trouvé par GG! + de 7000 , je devrai tourner autour de 2500!

Moi je vois des choses comme ça :

index.php?catid=9&order=datestamp
index.php?catid=9&order=sitetitle&way=1
index.php?catid=9&order=catname&way=1
index.php?catid=9&order=picture&way=0


Avec ta base de données, tu ajoutes des arguments en fonction des choix des visiteurs. Très bien ! Le problème c'est que chaque argument ajouté rajoute une page pour Google. C'est le meme principe que sur mon annuaire par exemple :

http://www.megachercheur.com/annuaire/index.php?c=3 est une page
http://www.megachercheur.com/annuaire/i ... p?c=3&s=91 est une autre page (du simple fait de l'ajout de l'argument &s=91)

Ton problème maintenant va être de faire en sorte que tes pages à arguments multiples (par exemple générées lorsque le visiteur demande un tri dans les résultats) ne soient plus indexées. Sans doute à l'aide de l'url-rewriting puis avec un Disallow etc

Ton nombre de pages indexées va tomber de 7700 à 2500 (les vrais pages, selon toi). Avec un peu de chance, ces pages-là seront moins sujettes à désindexation pour similarité.

Amicalement,

comme tu dis, le truc c'est qu'aucunes de ces pages, de ces liens ne sont present sur mon site, tout est rewrité (exception partie petites annonces qui n'est pas rewrité, ni optimisé d'ailleurs) avec redirection 301 depuis decembre 2004 de ces anciennes url, de plus, j'ai des pages qui ne sont plus sur le site depuis un an facile et toujours dans la cache de GG, j'ai fin par faire des 301 egalement, je peux pas dire que gg se presse de les supprimer.

j'ai meme procede a des liens en javascript pour les ASC etc.. pour justement eviter d'indexer des pages identiques.

F
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut