Comment désindexer des URL proprement ?

Discussion dans 'Débuter en référencement' créé par Dark_Shark, 26 Février 2010.

  1. Dark_Shark
    Dark_Shark WRInaute discret
    Inscrit:
    9 Mars 2006
    Messages:
    119
    J'aime reçus:
    0
    Bonjour,

    Je vous explique un peu mon problème, j'ai un vieux site web que je suis en train de reprendre, et il a des URL que j'aimerais désindexer et d'autres que je dois rediriger pour avoir une indexation "propre".

    Pour les URL à désindexé sur ces pages j'ai placé un noindex,follow
    Pour les URL à rediriger, ce code :
    Code:
    header("Status: 301 Moved Permanently", false, 301);
    header("Location: http://www.monsite.fr/xxx");
    die();
    exit();
    
    Le soucis c'est que l'impact de la désindexation semble casi inexistante après 2 mois. Mon site comporte environ 2000 pages réels et la commande site: m'affiche encore 9000 URL, donc problème de duplicate content.
    N'ayant pas encore de sitemap, je me demande si la création d'un sitemap avec les pages existantes que je veux indexer ferait que les autres pages absente de celui ci seraient supprimés de l'index ?
    Sinon y'aurait il un moyen de spécifier proprement à Google les pages à supprimer de l'index et celles à déplacer ?

    Merci d'avances pour vos éventuels lumières :)
     
  2. daerf59
    daerf59 WRInaute discret
    Inscrit:
    26 Février 2010
    Messages:
    66
    J'aime reçus:
    0
    Bonjour,

    Pourquoi ne pas utiliser une balise canonical pour éviter le duplicate content ?

    Tu peux également utiliser Google Webmaster tools pour supprimer certaines pages indéxées.

    Ensuite un sitemap XML est une bonne solution également.

    Ensuite les redirection 301 propres à faire via un fichier htaccess.

    J'espère t'avoir aidé ;)
     
  3. Nic'O
    Nic'O WRInaute discret
    Inscrit:
    13 Mai 2009
    Messages:
    180
    J'aime reçus:
    0
    Pour desindexer proprement, renvoie lui le status HTTP 410, qui correspond à une ressource qui n'existera plus.
     
  4. Dark_Shark
    Dark_Shark WRInaute discret
    Inscrit:
    9 Mars 2006
    Messages:
    119
    J'aime reçus:
    0
    Merci de vos conseils,

    J'ai fais un petit sitemap que j'ai soumis sous Webmaster Tools + désindexation via robots.txt + statut en 410.
    Pour les autres pages dont l'URL a été modifié j'ai gardé mon instruction
    Code:
    header("Status: 301 Moved Permanently", false, 301);
    header("Location: http://www.monsite.fr/xxx");
    die();
    exit();
    Car j'ai besoin de les regénérer dynamiquement avec la BDD, je pense pas que ca sois possible via le fichier htaccess.
    J'espère que l'impact sera notable.

    Sinon je me demandait quelque chose : en tapant la commande site:www.monsite.com j'ai "Résultats 1 à 10 sur un total d'environ 9000", le chiffre 9000 désigne bien 9000 pages à l'URL différente qui ont été indexés ?
    Autre chose: En parcourant les pages, et en incluant les résultats ignorés je ne peux que aller jusqu'au 77 pages, donc je suis limité à 760 résultats, où sont les 8000 autres résultats ?
     
  5. daerf59
    daerf59 WRInaute discret
    Inscrit:
    26 Février 2010
    Messages:
    66
    J'aime reçus:
    0
    L'ecart que tu observes est "normal". Google ne donne pas des résultats fiable sur le nombre de pages indexés et sur les liens pointant sur ton site. Donc il ne faut pas se fier à ces commandes dans Google.
     
Chargement...
Similar Threads - désindexer proprement Forum Date
Se désindexer proprement Crawl et indexation Google, sitemaps 20 Mars 2013
WordPress Faut-il désindexer les page/2/ page/3/ ... ? Débuter en référencement 20 Octobre 2022
Desindexer le staging Débuter en référencement 16 Mars 2022
Désindexer des pages auteur avec Yoast sur Wordpress Référencement Google 15 Septembre 2021
Désindexer une page via Google Search Débuter en référencement 14 Juin 2021
Désindexer ou supprimer ? Débuter en référencement 25 Mai 2021
Désindexer une page non indexée Crawl et indexation Google, sitemaps 12 Août 2020
Désindexer les pages http (sans certificat SSL) après piratage japonais Crawl et indexation Google, sitemaps 1 Juillet 2020
WordPress désindexer les pages feed Crawl et indexation Google, sitemaps 8 Juin 2020
Désindexer liste d'URL en générant un sitemap Crawl et indexation Google, sitemaps 2 Mai 2020
Crédits et mentions légales : pages à désindexer ou pas ? Référencement Google 22 Janvier 2020
Désindéxer pages sans en-têtes, ni balises meta Crawl et indexation Google, sitemaps 6 Décembre 2019
Désindexer page du moteur de recherche interne Crawl et indexation Google, sitemaps 30 Octobre 2019
Pages zombies : faut-il désindexer les pages catégories ? Référencement Google 26 Août 2019
Pages Avis clients : à désindexer ou pas ? e-commerce 19 Août 2019
pages zombies à désindexer Techniques avancées de référencement 29 Juin 2019
Comment desindexer ces pages (AMP Media WP) Débuter en référencement 19 Juin 2019
désindexer et/ou empêcher crawl ? Crawl et indexation Google, sitemaps 4 Janvier 2019
Doit-on désindexer avant un 410 ? Débuter en référencement 11 Décembre 2018
Dilemme : désindexer ou pas les pages de faible qualité Crawl et indexation Google, sitemaps 6 Novembre 2018