Google ajoute à l'index des anciennes urls ?

Nouveau WRInaute
Bonjour :D

NB / je reposte ici car pas de réponses dans rubrique "google/indexation"

Mon site a commencé à être indexé en février 2007.
J'en suis à environ 150 pages sur 4500.
Début juin, j'ai du changer les 4000 urls d'articles suite à une réimportation de catalogue (l'url change car le n° d'article change).
J'ai lu sur ce forum que l'idéal était d'écrire une ligne de redirection 301 pour chaque url modifiée avec renvoi permanent vers la nouvelle.
Pour des raisons techniques, je n'ai pas pu faire cela de facon aussi précise mais j'ai au moins pu rediriger chaque ancienne url vers la page de catégorie correspondante. J'ai donc 4000 lignes de redirections 301 dans mon htaccess pointants toutes vers une cinquantaine de catégorie.
Cependant, je vois que Google continue a ajouter dans son index des anciennes urls en majorité. J'en déduis qu'il y a une certaine "inertie" et que le robot a du garder "en réserve" lors de ses précédents passages des urls qu'il "rebalance".
Q1/ Me confirmez vous ce point et si oui : quand va t'il s'arrêter et continuer avec les bonnes urls ?
Q2/ Vu que mes anciennes urls pointent toutes vers des pages de catégorie, google ne va t'il pas considérer cela comme une pratique douteuse ?
Q3/ N'y aura t'il pas une sorte de "duplicate content" involontaire entre les anciennes et nouvelles urls ?

Précisions : Mon sitemap est mis à jour et google passe tous les 5/7 jours environ.

Désolé de ce long message mais il faut bien expliquer

et merci d'avance :wink:
 
WRInaute accro
J'avais vu ton post, mais personnellement je ne sais pas trop quoi te répondre en fait ^^.

Pourquoi tu ne peux pas faire toutes les redirections 301 ?

Si tu ne peux vraiment pas, si c'était pour moi je ne ferais aucune redirection, et essaierais de voir quels sont les liens qui pointaient vers des pages profondes pour les "récupérer" (l'outil Google Webmaster Central permet de faire ça plus facilement).

Les 301 sur les cat je ne trouve pas ça logique, mais je ne pense pas que ça soit mauvais non plus.
 
Nouveau WRInaute
Merci Wullon

Oui j'avoue que c'est un peu tordu

Pourquoi tu ne peux pas faire toutes les redirections 301 ?
Parce que ce serait très long pour des raisons techniques de retrouver chaque ancienne url pour la faire pointer vers la nouvelle (4500 urls) enfin dans mon cas

Les 301 sur les cat je ne trouve pas ça logique, mais je ne pense pas que ça soit mauvais non plus.
Disons que c'est en tout cas mieux de cliquer sur un article et d'arriver dans la bonne catégorie que d'arriver sur une page d'erreur !
(j'ai oublié de préciser que je ne peux pas personnaliser ma page 404, je suis en train de résoudre ce problème, je cumule :wink: )

Si tu ne peux vraiment pas, si c'était pour moi je ne ferais aucune redirection, et essaierais de voir quels sont les liens qui pointaient vers des pages profondes pour les "récupérer"
Oui dans l'idéal mais il commence à en avoir beaucoup et je voulais justement savoir si le robot avait une inertie telle qu'il risque de me "recracher" progressivement toutes les anciennes urls (au détriment des nouvelles, ce qui serait encore pire)

Merci à toi : au fait c'est normal que ton site soit dans les choux à cet instant 8O
 
WRInaute accro
Non, mais il n'y a rien de toute façon ;).

C'est vrai que 4500 URLs, ça commence à faire beaucoup, c'est dommage que tu ne puisses pas faire de translation automatique.

Moi en tant qu'internaute je préfère une 404 qui explique que la structure du site a changé récemment, avec un champ de recherche (éventuellement pré-rempli), plutôt que de tomber sur un truc qui ne correspond pas mais qui n'apparait pas comme une erreur (après il y a des cas particuliers mais bon ^^), c'est perso hein.

Et justement, en mettant une 404, GoogleBot va comprendre que ces URLs n'existent plus, donc ne plus les indexer normalement (c'est pas forcément rapide ;D) ; et il faut espérer que les nouveaux liens (structure interne notamment) vers les nouvelles URLs soient assez forts pour que le tout soit réindexé rapidement.

J'avoue que je ne connais pas trop le problème, mais pour moi, ancienne url <> 301 vers la nouvelle ou 404.
 
Discussions similaires
Haut