Faire un sitemap pour désindexer des URL

Discussion dans 'Débuter en référencement' créé par Icipierrot, 24 Juin 2018.

  1. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    341
    J'aime reçus:
    14
    Bonjour,

    J'ai mis en noindex un paquet de pages dont le contenu ne pouvait pas être mis à jour, car obsolète.

    À partir de là j'ai vu qu'il est possible de créer un sitemap https://www.webrankinfo.com/dossiers/indexation/comment-desindexer, afin d'amener les bot de Google à les crawler et donc à les désindexer plus vite.

    Si j'ai bien compris le principe, ça se passe comme ça :

    1- Créer un fichier sous le format .txt et y lister les URL à crawler (et donc à désindexer), à raison d'une par ligne.

    2- Mettre ce fichier .txt en ligne, via l'outil d'ajout de sitemap de la console Google.

    Toutefois un point me chagrine : cette liste d'URL se trouve déjà sur le sitemap des articles. Si je rajoute un 2e sitemap avec ces mêmes URL, elles vont se trouver en double dans l'ensemble de mon index.

    N'y a-t-il pas un danger de créer de la masse noire, et donc d'affecter mon référencement ?

    Merci d'avance.
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 878
    J'aime reçus:
    73
    Google n'indexe pas des url identiques en double, même si tu les incorpores dans plusieurs sitemap.

    Pour autant, par souci de lisibilité, je séparerais les url en noindex de celles qui ne le sont pas.
     
    Icipierrot apprécie ceci.
  3. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    341
    J'aime reçus:
    14
  4. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    341
    J'aime reçus:
    14
    Dans le même ordre d’idée, je lis sur mon dernier rapport MR Tech que j'ai 61 % de pages indéxables.

    Or je lis aussi : "il n'est pas efficace de laisser de nombreuses pages se faire crawler alors que vous exigez qu'elles ne soient pas indexées."

    J'en déduit donc que je dois aussi les regrouper dans une catégorie, et bloquer le crawl de cette catégorie via mon ficher robots.txt.

    Oui mais voila, ces pages sont en cours de désindexation, du coup dois-je attendre que ces pages soient toutes désindexées avant d'en empêcher le crawl ?

    Existe-t-il une astuce pour bloquer le crawl tout en demandant aux bots de Google de les désindexer ?

    Merci d'avance.
     
Chargement...
Similar Threads - sitemap désindexer Forum Date
Besoin d'un sitemap.xml pour web app en REACT? Débuter en référencement Jeudi à 10:00
WordPress Yoast - Attachment-sitemap.xml à faire indexer ? Débuter en référencement 1 Février 2020
Search Console Sitemap envoyé de manière automatique Crawl et indexation Google, sitemaps 27 Janvier 2020
Lien image vers le sitemap Crawl et indexation Google, sitemaps 27 Décembre 2019
Search Console Sitemap déplacée : besoin de redirection ? Crawl et indexation Google, sitemaps 14 Décembre 2019
Problème de référencement et ajout sitemaps Problèmes de référencement spécifiques à vos sites 26 Novembre 2019
Search Console Sitemap ou pas pour page unique ? Crawl et indexation Google, sitemaps 4 Novembre 2019
sitemap de groupe Crawl et indexation Google, sitemaps 29 Octobre 2019
Sitemap envoyé mais pages non indexées Crawl et indexation Google, sitemaps 26 Octobre 2019
Sitemap : que faire des URL expirées ? Crawl et indexation Google, sitemaps 25 Octobre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice