Faire un sitemap pour désindexer des URL

Discussion dans 'Débuter en référencement' créé par Icipierrot, 24 Juin 2018.

  1. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    363
    J'aime reçus:
    14
    Bonjour,

    J'ai mis en noindex un paquet de pages dont le contenu ne pouvait pas être mis à jour, car obsolète.

    À partir de là j'ai vu qu'il est possible de créer un sitemap https://www.webrankinfo.com/dossiers/indexation/comment-desindexer, afin d'amener les bot de Google à les crawler et donc à les désindexer plus vite.

    Si j'ai bien compris le principe, ça se passe comme ça :

    1- Créer un fichier sous le format .txt et y lister les URL à crawler (et donc à désindexer), à raison d'une par ligne.

    2- Mettre ce fichier .txt en ligne, via l'outil d'ajout de sitemap de la console Google.

    Toutefois un point me chagrine : cette liste d'URL se trouve déjà sur le sitemap des articles. Si je rajoute un 2e sitemap avec ces mêmes URL, elles vont se trouver en double dans l'ensemble de mon index.

    N'y a-t-il pas un danger de créer de la masse noire, et donc d'affecter mon référencement ?

    Merci d'avance.
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 885
    J'aime reçus:
    74
    Google n'indexe pas des url identiques en double, même si tu les incorpores dans plusieurs sitemap.

    Pour autant, par souci de lisibilité, je séparerais les url en noindex de celles qui ne le sont pas.
     
    Icipierrot apprécie ceci.
  3. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    363
    J'aime reçus:
    14
  4. Icipierrot
    Icipierrot WRInaute occasionnel
    Inscrit:
    30 Octobre 2013
    Messages:
    363
    J'aime reçus:
    14
    Dans le même ordre d’idée, je lis sur mon dernier rapport MR Tech que j'ai 61 % de pages indéxables.

    Or je lis aussi : "il n'est pas efficace de laisser de nombreuses pages se faire crawler alors que vous exigez qu'elles ne soient pas indexées."

    J'en déduit donc que je dois aussi les regrouper dans une catégorie, et bloquer le crawl de cette catégorie via mon ficher robots.txt.

    Oui mais voila, ces pages sont en cours de désindexation, du coup dois-je attendre que ces pages soient toutes désindexées avant d'en empêcher le crawl ?

    Existe-t-il une astuce pour bloquer le crawl tout en demandant aux bots de Google de les désindexer ?

    Merci d'avance.
     
Chargement...
Similar Threads - sitemap désindexer Forum Date
Désindexer liste d'URL en générant un sitemap Crawl et indexation Google, sitemaps 2 Mai 2020
Faut-il déclarer le sitemap dans le robots.txt ou search console ? Crawl et indexation Google, sitemaps Samedi à 14:26
Faut-il créer un sitemap mobile ? Crawl et indexation Google, sitemaps 6 Octobre 2020
Gestion sitemap.xml sur un site multilingue Crawl et indexation Google, sitemaps 5 Octobre 2020
Sitemap et site multilangue Crawl et indexation Google, sitemaps 21 Août 2020
WordPress Sitemap site multilangue / yoast / polylangue Référencement international (langues, pays) 7 Août 2020
Search Console Sitemaps non indéxés ""Impossible de recuperer le sitemap" Crawl et indexation Google, sitemaps 23 Juillet 2020
Mise à jour simultanée sitemap/canonical/hreflang Crawl et indexation Google, sitemaps 16 Juillet 2020
Search Console Google n'explore pas les liens du sitemap (de desindexation) Crawl et indexation Google, sitemaps 6 Juillet 2020
Si hreflang implémentés par HTML (<head>), inutile dans sitemaps ? Référencement international (langues, pays) 18 Mai 2020