Comment désindexer des URL proprement ?

WRInaute discret
Bonjour,

Je vous explique un peu mon problème, j'ai un vieux site web que je suis en train de reprendre, et il a des URL que j'aimerais désindexer et d'autres que je dois rediriger pour avoir une indexation "propre".

Pour les URL à désindexé sur ces pages j'ai placé un noindex,follow
Pour les URL à rediriger, ce code :
Code:
header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.monsite.fr/xxx");
die();
exit();

Le soucis c'est que l'impact de la désindexation semble casi inexistante après 2 mois. Mon site comporte environ 2000 pages réels et la commande site: m'affiche encore 9000 URL, donc problème de duplicate content.
N'ayant pas encore de sitemap, je me demande si la création d'un sitemap avec les pages existantes que je veux indexer ferait que les autres pages absente de celui ci seraient supprimés de l'index ?
Sinon y'aurait il un moyen de spécifier proprement à Google les pages à supprimer de l'index et celles à déplacer ?

Merci d'avances pour vos éventuels lumières :)
 
WRInaute discret
Bonjour,

Pourquoi ne pas utiliser une balise canonical pour éviter le duplicate content ?

Tu peux également utiliser Google Webmaster tools pour supprimer certaines pages indéxées.

Ensuite un sitemap xml est une bonne solution également.

Ensuite les redirection 301 propres à faire via un fichier htaccess.

J'espère t'avoir aidé ;)
 
WRInaute discret
Pour desindexer proprement, renvoie lui le status HTTP 410, qui correspond à une ressource qui n'existera plus.
 
WRInaute discret
Merci de vos conseils,

J'ai fais un petit sitemap que j'ai soumis sous Webmaster Tools + désindexation via robots.txt + statut en 410.
Pour les autres pages dont l'URL a été modifié j'ai gardé mon instruction
Code:
header("Status: 301 Moved Permanently", false, 301);
header("Location: http://www.monsite.fr/xxx");
die();
exit();

Car j'ai besoin de les regénérer dynamiquement avec la BDD, je pense pas que ca sois possible via le fichier htaccess.
J'espère que l'impact sera notable.

Sinon je me demandait quelque chose : en tapant la commande site:www.monsite.com j'ai "Résultats 1 à 10 sur un total d'environ 9000", le chiffre 9000 désigne bien 9000 pages à l'URL différente qui ont été indexés ?
Autre chose: En parcourant les pages, et en incluant les résultats ignorés je ne peux que aller jusqu'au 77 pages, donc je suis limité à 760 résultats, où sont les 8000 autres résultats ?
 
WRInaute discret
L'ecart que tu observes est "normal". Google ne donne pas des résultats fiable sur le nombre de pages indexés et sur les liens pointant sur ton site. Donc il ne faut pas se fier à ces commandes dans Google.
 
Discussions similaires
Haut