1. ⭐⭐⭐ Grosse PROMO en cours sur ma plateforme SEO My Ranking Metrics
    Rejeter la notice

Pages existantes que Google classe en 404

Discussion dans 'Crawl et indexation Google, sitemaps' créé par landry, 13 Avril 2014.

  1. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Bonjour,

    Je me demande pourquoi Google classe certaines URL existantes en 404.

    Par exemple cette page existe :

    -http://www.micro-astuce.com/Forum/topic946.html
    il s'agit après 301 de :
    -http://www.micro-astuce.com/Forum/dadvsi-le-collectif-stopdrm-passe-aux-actes-t946.html

    De plus il trouve un sitemap qui lui n'existe pas, en revanche.
    Forum/sitemapindex.xml ok, mais Forum/sitemapsindex.xml n'xiste pas, Google me renvoie une erreur 404 pour ce sitemap fantôme.

    Pour info si toutefois il y aurait un effet de dommages collatéraux :
    Il y a quelques semaines j'ai activé la réécriture avancée mais j'ai oublié d'activer le zéro dup afin que les anciennes url soient redirigées, le site est resté 1 mois comme ça.
    Du coup je n'ai plus aucune page du forum indexées à cause du duplicate content (là j'ai vraiment pas assuré, site bien référencé avant et existant depuis 2006).
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 873
    J'aime reçus:
    71
    A quel niveau ? L'onglet Introuvable de GWT ? Pour info, il y a une latence au niveau de la mise à jour de cet outil. Du coup, si tu as corrigé et appliqué des 301, il se peut que Google mette un certain temps à les faire disparaître de GWT.

    Perso, je me base sur le fichier d'export de cet interface (qui liste bien au-delà des 1000 url listées de base par l'interface) et je vérifie quelle est l'entête renvoyée, de manière à me concentrer uniquement sur les erreurs effectives.
     
  3. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Oui, sur GWT.
    Pourtant il m'affiche des erreurs au 11 avril 2014

    -Forum/probleme-sata-nvrd64-t6701.html
    11/04/14

    -Forum/lenteur-au-demarage-t6696.html
    11/04/14

    Ces pages existent, j'ai lu que cela pouvait aussi être un signe de lenteur au niveau du serveur, je ne sais pas si c'est exact.

    Là effectivement il y a un peu plus d'url, google va même chercher des url que j'ai supprimé depuis plusieurs années et qui ne sont dans aucun sitemap bien sûr.

    Par exemple cette page partenaire n'existe plus depuis 5 ans minimum :
    -http://www.micro-astuce.com/partenaire.php

    ici le sitemap :
    -http://www.micro-astuce.com/micromap.xml

    De même que ces vieux tutos obsolètes que j'ai supprimé il y a quelques mois:
    -http://www.micro-astuce.com/optimisation/defragmenter-prefetch.php

    De plus il va chercher :
    -http://www.micro-astuce.com/Forum/post50347.html ou
    -http://www.micro-astuce.com/Forum/membre2030.html

    Pourtant mon robots.txt est clair :

    Disallow: /Forum/membre
    Disallow: /Forum/post

    Bon, j'ai effectué pas mal de modif ces derniers mois, je vais attendre un peu avant de me fier aux Outils pour Webmaster.
    Cela dit comment google fait-il pour aller me déterrer des url supprimées il y a plus de 5 ans ?
     
  4. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Il y a parfois des bizarreries innomable chez google, entre Aout et Décembre 2013, je me suis pris le bec avec les googlers en raison d'un nombre très important de pages inexistantes indexées dans les résultats, par dizaine de milliers, suite a un mélange de Google des sous domaines (page de marseilles dans le dept 75, pages paris dans le dept 24, etc etc).
    En fait, les pages existaient bien, mais Google les "déplaçants" dans le mauvais répertoire et mauvais département (sous domaine), tous les liens relatifs croisés internes devenaient des liens en erreur 404.

    Il en a résulté une lente baisse progressive du trafic, alors que j'étais en constante progression.

    Il a fallu que je restructure totalement mon site, une lourde opération sur 5 millions de pages, avec les redirections 301 qui vont bien. Après 3 mois, le trafic est remonté et dépasse le meilleur trafic 2013, avec toujours une constante progression.

    Ton problème est un peu différent. Si tu n'a pas de baisse de trafic, les infos devraient peu a peu se remettre a jour dans webmastertools. Sinon, il faut agir et corriger le maximum d'erreurs.
    Apparemment, Google ne sanctionne pas des pages disparues, mais si elle trouve des pages avec des liens ROMPUS, il peut rapidement déclasser le site.

    Le problème étant que Google peut ressortir des pages anciennes qui n'existent plus avec des liens qui n'existent plus non plus, et sanctionner ces liens morts …
    Si le nombre de ces pages "fantômes" n'est pas très important, peut-être que l'outil de suppression d'url peu suffire a corriger le probleme.
     
  5. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    En parlant de bizarrerie voilà aussi une chose qui me laisse perplexe.

    Dans la partie Sitemap :

    Dans la partie "Etat de l'indexation"

    Faut savoir, quel chiffre est le bon ?
     
  6. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 873
    J'aime reçus:
    71
    J'imagine que dans la partie sitemap, c'est par rapport aux URL que tu envoies...
     
  7. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Oui d'accord, dans ce cas à quoi correspondent les 4541 autres ?
    Des pages que je n'envoie pas et que Google m'indexerait, quelles pages ?
    J'avoue que j'ai du mal à suivre sa logique...
     
  8. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 873
    J'aime reçus:
    71
    Parce que tu crois sérieusement que Google ne se base que sur ton sitemap pour indexer ? Ce dernier n'a jamais été conçu et penser en ce sens. Tant que tu n'en interdis pas le crawl ou l'indexation, si Google peut accéder à une page de ton site, il peut l'indexer.
     
  9. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Ce que je veux dire c'est quelles sont ces autres pages, car selon moi tout est dans le sitemap.

    J'ai aussi des soucis de lenteurs, Google me renvoie des erreurs serveurs à cause d'un délai d'attente trop long. J'en fais part à OVH.


    Sans commentaire.
     
  10. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Bonjour,

    J'ai refait mon robots.txt, je n'ai plus de duplicate et pour autant le nombre de pages indexées continue à diminuer.
    Au 16 avril Google affiche des avertissements rencontrées au mois de décembre.

    Code:
    Forum/post
    étant bloqué par le robots.txt il ne peut indexer ces trois sujets dont je viens de modifier le titre pour éviter l'erreur.

    Cela dit pourquoi 50 avertissements:



    D'un côté il signale 3 avertissements et de l'autre il en indique 50. :?:

    C'est pas ça qui me pénalise mais c'est juste pour comprendre.
     
  11. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    Code:
    Forum/post
    Valeur : -http://www.micro-astuce.com/Forum/poster-pj-sur-ce-forum-t6994.html
    Valeur : -http://www.micro-astuce.com/Forum/poster-pj-sur-ce-forum-t6994.html
    Valeur : -http://www.micro-astuce.com/Forum/post-rapport-t1992.html
     
  12. landry
    landry WRInaute discret
    Inscrit:
    3 Mai 2006
    Messages:
    208
    J'aime reçus:
    0
    Ca j'ai compris et j'ai rectifié mais pourquoi 50 avertissements, il n'y a que 3 URL impactées ?
     
Chargement...
Similar Threads - existantes Google classe Forum Date
googlebot crawle des pages inexistantes Crawl et indexation Google, sitemaps 16 Août 2019
Google crawle des url inexistantes "mobile" Crawl et indexation Google, sitemaps 8 Janvier 2017
Le robot Google se connecte t-il sur toutes les aborescences mêmes inexistantes ? Débuter en référencement 10 Octobre 2015
Dégringolade dans google et référencement de pages inexistantes Problèmes de référencement spécifiques à vos sites 13 Novembre 2013
Probleme balise Meta? et indexaction google de pages inexistantes. Problèmes de référencement spécifiques à vos sites 11 Juin 2012
GoogleBot crawle des pages partenaires inexistantes Crawl et indexation Google, sitemaps 30 Avril 2011
Pages sans extension "inexistantes" mais indexées par Google Problèmes de référencement spécifiques à vos sites 4 Juillet 2010
google indexe des pages inexistantes ! Crawl et indexation Google, sitemaps 13 Mars 2010
WordPress Trouver toutes les R301 existantes URL Rewriting et .htaccess 25 Octobre 2019
Pourquoi avoir des adresses vers des pages inexistantes ...? Crawl et indexation Google, sitemaps 31 Janvier 2017
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice