Erreurs 404 imaginaires d'exploration dans GWT ?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par JeRetiens, 19 Juin 2014.

  1. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Salut à tous !

    Depuis quelques semaines maintenant, GG me trouve X erreurs d'explo par jour/deux jours. Je sais bien qu'elles ne sont pas imaginaires et qu'elles doivent provenir d'un endroit mais je ne trouve pas.

    Elles ciblent les tags, et plus particulièrement certains tags qui semblent générés à mon insu:

    Voici l'exemple du jour:

    • tag/vertebre/besoin-dun-truc
      tag/animal/besoin-dun-truc
      tag/chameau/besoin-dun-truc
      tag/homo-sapiens-sapiens/besoin-dun-truc

    C'est TOUJOURS la même structure: ça part d'un tag aléatoire, auquel est rajouté l'adresse de ma page /besoin-dun-truc.

    Premier réflex, me dire que j'avais oublié dans mon menu, par exemple, un / avant /besoin-dun-truc ce qui aurait pu avoir pour conséquence étrange de bugger les tags. Mais ce n'est pas le cas :/
    D'ailleurs, je n'utilise plus ces tags depuis un bout de temps et ils ont été supprimés...

    Dois-je simplement "supprimer" les 5-10 url chaque jour via GWT ou quelque chose peut être entrepris dans le code pour éviter ce bug quotidien ? De plus, y aurait-il quelque chose de particulier à faire pour éviter que la page /besoin-dun-truc se retrouve collée aux tags inexistants ?

    Un énorme merci !
     
  2. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Bonjour,

    j'ai connu cela aussi, et d'autres. Dans mon cas sur des millions d'urls, j'ai du au final changer la structure de mon site.
    Il y avait bien une erreur de Google, mais cela pouvait être aussi du NSEO, je n'ai pas trouvé la cause. Je pense qu'il s'agit d'un algo un peu foireux de Google qui tente de déceler des urls dans du texte sur des pages ...

    Il faut déjà examiner en profondeur les LOGS, et voir ce qu'il se passe dans le crawl de Google.
    Ensuite, le mieux est de faire une synthese et mettre en place une stratégie de redirection 301, si c'est possible.
     
  3. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Merci pour ta réponse !

    Wow ça a l'air plus complexe que je n'imaginais... comment puis-je accéder à ces logs ?

    Si je demande à google de supprimer les url /tag/ de mon site, cela résoudra-t-il le souci lorsqu'il réindexera les tags ?
     
  4. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    il faut aller voir dans l'administration de ton hébergement. Tous ne permettent pas cette option de récupérer les logs.
    Non, supprimer les erreurs dans webmastertools n'empeche pas leur réapparition, hélas.
    Il faut en trouver la source, peut etre des séparateurs / qui trainent sur les pages?

    Sinon, il faut lister ces erreurs 404 et faire les redirections appropriées.
     
  5. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 934
    J'aime reçus:
    4
    Si c'est toujours la même structure, tu peux probablement aisément créer une règle de redirection (en 301 de préférence) vers la bonne page ;)
     
  6. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Le souci c'est qu'il n'y a pas réellement de bonne page...

    Je suis allé voir les logs, je n'ai pas compris grand chose :/

    Est-ce que ces erreurs peuvent nuire à mon référencement (en admettant que je m'amuse à les supprimer manuellement tous les jours/semaines) ?
     
  7. HawkEye
    HawkEye WRInaute accro
    Inscrit:
    23 Février 2004
    Messages:
    13 934
    J'aime reçus:
    4
    Il y a toujours une "bonne page" ;)

    :arrow: soit c'est la page du tag (tag/vertebre/besoin-dun-truc --301--> tag/vertebre/) si /vertebre/ existe
    :arrow: soit c'est la page "tags" (tag/vertebre/besoin-dun-truc --301--> tag/) si /vertebre n'existe pas et que /tag/ est une page valide
    :arrow: soit c'est la home
     
  8. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    Dans les logs, avec un editeur de texte, tu peut extraire les lignes qui t'intéresse.
    Les erreurs sont noté 404 dans les lignes. Tu peux ensuite extraire des 404 celles de google (googlebot dans la ligne).
    Tu verra ainsi les fausses pages que google tente de crawler et que tu retrouvera dans webmasterstools, plus tard, et créer les redirections.

    Ca semble ardu au début, mais peu a peu, tu t'y retrouvera.
     
  9. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 996
    J'aime reçus:
    294
    c'est sur quel site ?

    tu devrais t'assurer qu'il n'y a sur ton site pas le moindre lien vers des URL de ce genre (à ta place c'est ce que je vérifierais en faisant un audit technique avec mon outil)

    Google ne t'indique aucune source (lien externe) ? regarde aussi dans tes backlinks

    si les tags ont été supprimés de ton site, tu peux simplement bloquer le crawl de /tag/, tu n'auras plus d'erreurs indiquées dans GWT( mais le nb d'URL bloquées augmentera)
     
  10. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Merci pour vos différentes réponses, je commence doucement à mieux comprendre !

    Le site est mon site perso, indiqué dans mon profil, jeretiens.net mais je n'ai pas les moyens financiers de me payer un audit :cry:

    Je songe à complètement bloquer l'indexation de mes tags à GG, genre bloquer le crawl et les passer en no index.
    Je n'ai franchement pas l'impression qu'ils agissent positivement pour mon référencement (je crois que j'ai du avoir 1 ou 2 clics grâce à ça...) et j'ai l'impression que ça créé du DC (?)

    C'est peut-être un peu radical comme solution mais pensez-vous que ça puisse nuire à mes positions dument acquises auprès de GG ?
     
  11. longo600
    longo600 WRInaute passionné
    Inscrit:
    24 Février 2005
    Messages:
    2 208
    J'aime reçus:
    5
    La seule chose qui puisse etre négative aux yeux de google, c'est qu'il considère que tu as des liens morts interne.
    Pour ma part, j'ai eut une baisse légère, mais régulière, sans pouvoir contrer et stopper le phénomène assez fou. J'ai réagit assez vite en changeant ma structure, mais ce n'est pas obligé d'en arriver là.

    Avec de bonnes et propres redirections, tu ne devrais pas perdre de trafic ni de position. Le DC interne n'est pas sanctionné par Google, une seule des deux pages est sélectionné, c'est tout, il me semble en tout cas.

    Je le répete, les liens morts sont sanctionné. Si des pages sont supprimées et que les liens internes aussi, il n'y a pas de sanction. Si les mauvais liens interne restent, là il y aura une sanction.
     
  12. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Je pense savoir comment sont apparus ces liens bizarres... c'est depuis que j'ai tout simplement supprimé des tags inutiles quand j'en mettais le plus possible par article. Depuis, j'ai réédité une grosse partie du site pour enrichir le contenu et j'en ai profité pour virer quelques tags et c'est à partir de là que GG en repassant sur le site chaque jour bug les résultats...
    Le truc c'est que ces liens n'ont jamais existé (les liens complets) donc ils ne sont pas présents matériellement ou réellement dans le site quand GG passe pour indexer !
     
  13. loubet
    loubet WRInaute impliqué
    Inscrit:
    19 Février 2003
    Messages:
    793
    J'aime reçus:
    0
    sur -http://jeretiens.net/tag/vertebre/
    il y a bien un lien vers
    -http://jeretiens.net/tag/vertebre/besoin-dun-truc
    pareil sur -http://jeretiens.net/tag/animal/
    donc sur tous les tags supprimés.
     
  14. Marie-Aude
    Marie-Aude WRInaute accro
    Inscrit:
    5 Juin 2006
    Messages:
    16 372
    J'aime reçus:
    2
    C'est effectivement dans le texte de ta 404 bien vu... tu as mis une url relative (sans / au début)
     
  15. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    Wow effectivement bien vu et merci à vous deux !

    Il ne me reste plus qu'à trouver le fichier fourbe dans lequel j'ai glissé ce lien parce que bien évidemment ce n'est pas 404.php ... ! :lol: C'eut été trop facile !
     
  16. JeRetiens
    JeRetiens WRInaute discret
    Inscrit:
    16 Mai 2013
    Messages:
    87
    J'aime reçus:
    0
    C'était dans content-none.php !

    Merci pour votre aide ! :p :p :p
     
Chargement...
Similar Threads - Erreurs 404 imaginaires Forum Date
[htaccess] Rediriger toutes les erreurs 404 vers ma home Crawl et indexation Google, sitemaps 30 Janvier 2019
erreurs 404 pour produits supprimés restent dans search console Problèmes de référencement spécifiques à vos sites 2 Octobre 2018
Milliers d'erreurs 404 sur site de petites annonces Débuter en référencement 25 Septembre 2018
Erreurs 404 sur des urls de type /fr/fr/, /en/en/ ou /de/de/ Crawl et indexation Google, sitemaps 8 Juin 2018
Urls tronqués dans Search Console - Erreurs 404 Crawl et indexation Google, sitemaps 17 Janvier 2018
Corriger ou rediriger les erreurs 404 ? Débuter en référencement 19 Juillet 2017
Changement de forum et erreurs 404 : bonne pratique? URL Rewriting et .htaccess 26 Novembre 2016
Erreurs 404 dont la provenance est inconnue Problèmes de référencement spécifiques à vos sites 21 Octobre 2016
Nombreuses erreurs d'exploitations 404 Netlinking, backlinks, liens et redirections 15 Septembre 2016
GWT : Erreurs 404 signalées incompréhensibles Crawl et indexation Google, sitemaps 24 Août 2016
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice