Traiter les 404 (par centaines de milliers) dans GWT

Discussion dans 'Crawl et indexation Google, sitemaps' créé par raljx, 27 Janvier 2009.

  1. raljx

    raljx WRInaute accro

    Inscrit:
    10 Juillet 2006
    Messages:
    2 812
    J'aime reçus:
    0
    Bonjour,

    Un lien cassé dans un site de plusieurs centaines de milliers de page et c'est une monstrueuse liste de 404 qui apparait dans les GWT !!! Voila ce qui m'est arrivé, un moment d'inattention, quelques jours de crawl de GoogleBot et je me retrouve avec +56000 404 :?

    Donc ca a été corrigé de suite mais maintenant (même si le chiffre a baissé, du principalement a la vitesse d'indexation de mon site) je me retrouve toujours avec ~25 000 pages mises en cause.

    Je me pose donc la question sur la procédure suivante :

    1 - Je telecharge en csv ces pages où (avant) il y avait le lien cassé.
    2 - Je creer un Sitemap spécifique
    3 - Je balance ce sitemap dans les GWT

    Pensez-vous que cela est sans risque ? A mon humble avis oui... je pense meme que cette procedure permet de refaire passer le bot sur des pages qu'ils n'a pas visité depuis longtemps. Mais je suis cependant ouvert à vos avis ...
     
  2. YoyoS

    YoyoS WRInaute accro

    Inscrit:
    14 Septembre 2006
    Messages:
    4 026
    J'aime reçus:
    0
    Tu attends et c'est tout ;)
     
  3. cthierry

    cthierry WRInaute accro

    Inscrit:
    15 Janvier 2005
    Messages:
    2 742
    J'aime reçus:
    0
    +1

    J'ai viré il y a quelques semaines un sous domaine en demandant la désindexation dans GWT mais par contre je n'avais pas mis le sous domaine en disallow dans robot.txt.

    Résultat, des centaines de pages en 404. Cela commence à se résorber depuis quelques jours.

    Donc mettre au carré et patienter :-D