Suppression d'url demandées, mais toujours dans GWT des semaines après

Discussion dans 'Crawl et indexation Google, sitemaps' créé par LaMarmotte, 16 Octobre 2014.

  1. LaMarmotte
    LaMarmotte Nouveau WRInaute
    Inscrit:
    12 Mars 2008
    Messages:
    7
    J'aime reçus:
    0
    Bonjour à tous,

    Suite à une refonte structurelle totale de mon site, j'ai :
    - resoumis un sitemap.xml à jour avec uniquement les nouveaux liens valides -> OK, pas d'erreur, tous ces liens ont été rapidement indexés
    - resoumis mon robots.txt -> OK pas d'erreur
    - via GWT,dans la rubrique Index Google>URL à supprimer, j'ai explicitement demandé la suppression (URL + cache) de toutes mes anciennes URL qui n'existent plus (et qui, via le .htaccess renvoient toutes vers une page d'erreur 404 personnalisée) -> OK, Google les a bien marquées comme supprimées qq jours plus tard.

    Cela fait à peu près 3 semaines que j'ai effectué ces actions dans GWT, et maintenant, je me retrouve avec tout un tas d'erreurs d'exploration (soft 404), qui correspondent en gros à toutes les URL dont j'avais explicitement demandé la suppression à Google (suppressions confirmées par Google). Dans cette liste d'erreurs soft 404, Google m'indique qu'il a "détecté" (donc crawlé, je suppose) ces pages à une date bien postérieure à la date à laquelle il m'a confirmé la suppression des URL, comme si ces pages existaient toujours pour lui...
    Donc je me rends à la rubrique "Supprimer le contenu obsolète", et là s'affiche bien l'intégralité de ces URL dont j'avais demandé la suppression, et qui possèdent toutes la mention "Etat : page supprimée" et "Type de suppression : suppression d'une page obsolète".
    Je ne vois donc pas quoi faire pour dire à Google qu'il arrête de m'afficher ces pages obsolètes dans mes GWT, alors qu'il a lui même confirmé qu'elles avaient été supprimées suite à ma demande !
    En plus et du coup, ces URL obsolètes/supprimées apparaissent aussi dans d'autres rubriques de GWT comme dans Améliorations HTML>Balises META en double : toutes les erreurs de balisage HTML affichées ne concernent que des vieux liens censés avoir été supprimés (alors que toutes les pages de mon nouveau site - donc celles qui EXISTENT - ne renvoient aucun message d'erreur de conception HTML)
    Ces URL obsolètes apparaissent aussi dans Traffic de recherche>Liens internes (noyées au milieu de mes vraies URL), mais aussi dans Index Google>Etat de l'indexation (à ce jour j'ai le double de pages indexées, forcément puisqu'il y a aussi les anciennes URLS censées être supprimées !)

    Donc en gros, si Google avait réellement supprimé ces vieilles URL comme je lui ai demandé, et s'il ne tenait compte que des nouveaux liens que je lui ai soumis via mon sitemap.xml, je n'aurais absolument aucune erreur d'aucune sorte !
    C'est dingue, je ne vois pas pourquoi il persiste à vouloir prendre en compte des URL obsolètes dont j'ai demandé la suppression. J'ai vérifié tous mes liens canonical, ils sont conformes, et dans les nouvelles pages de mon site il n'y a plus aucune trace d'éventuels liens vers des pages obsolètes.

    Avez-vous une idée ? est-ce juste un pb de cache dans GWT donc dois-je être patiente ? Ou est-ce mon .htaccess qui renvoie des soft 404 qui met le bazar ? Je pige pas...
    Merci beaucoup pour votre aide @+
     
  2. LaMarmotte
    LaMarmotte Nouveau WRInaute
    Inscrit:
    12 Mars 2008
    Messages:
    7
    J'aime reçus:
    0
    Petite précision : quand je fais site:www.adressemonsite.com dans Google recherche web, mes vieilles URL (dont j'ai demandé la suppression) n'apparaissent plus : il n'y a donc bien que dans GWT que ces URL obsolètes semblent toujours exister...
     
  3. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 361
    J'aime reçus:
    2
    Il suffit de marquer dans GWT que l'erreur a été corrigée. Tu as sur la droite la date de détection... ça peut être assez ancien.
     
  4. LaMarmotte
    LaMarmotte Nouveau WRInaute
    Inscrit:
    12 Mars 2008
    Messages:
    7
    J'aime reçus:
    0
    Bonjour Marie-Aude,

    Justement, ces dates de détection sont postérieures à celle de la suppression confirmée par Google, comme si ces pages étaient encore détectables/crawlable par Google à ce jour, et alors que dans le moteur de recherche lui-même ces vieilles URL ont bien disparu des résultats de la requête "site:www.monbeausite.com" !!!
    J'ai bien vu que l'on pouvait marquer ces URL comme "corrigées", mais il n'y a aucune info/aide sur les conséquences de cette action, alors j'hésitais...

    Merci @+
     
  5. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 361
    J'aime reçus:
    2
    ça tend à indiquer que la source de ces urls existe toujours. GWT te la donne, regarde ce qu'il en est.
     
Chargement...
Similar Threads - Suppression demandées GWT Forum Date
Suppression répertoire complet. Redirection 301 ou Erreur404 ? URL Rewriting et .htaccess 7 Janvier 2021
WordPress Suppression de la pagination et des pages zombies Tests et études de cas 4 Décembre 2020
Desindexation et suppression URL Crawl et indexation Google, sitemaps 6 Novembre 2020
Suppression de la pagination Techniques avancées de référencement 4 Novembre 2020
WordPress Suppression élément avec Css Demandes d'avis et de conseils sur vos sites 16 Août 2020
Search Console Suppression de sous domaines + stop crawl ? Crawl et indexation Google, sitemaps 27 Juillet 2020
Suppression de page et Référencement Référencement Google 16 Juillet 2020
Outil suppression GSC Crawl et indexation Google, sitemaps 20 Avril 2020
suppression de page noindex Crawl et indexation Google, sitemaps 12 Mars 2020
Suppression des étiquettes Wordpress (tags) ? Rédaction web et référencement 21 Novembre 2019