Version en cache de Google différente : piratage ?

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par Digitude, 1 Mars 2018.

  1. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Bonjour à toute la communauté WRI,

    Votre avis et/ou retours d'expérience m'intéressent par rapport à un phénomène que je rencontre depuis maintenant 1 an. Ni agences SEO ni consultants senior n'ont pu trouver une explication à ce problème (et dieu sait que j'ai demandé à des pointures de renom).

    Bref, je m'explique. La version en cache Google de plusieurs pages de mon site est différente de la page visitée.
    Exemple fictif : je me trouve sur la page : www.ndd.com/vetement-homme.php. Si j'utilise la commande "cache:www.ndd.com/vetement-homme.php", Google m'annonce une url différente de celle-ci, mais bien interne à mon site comme "cache:www.ndd.com/chaussure-femme.php.

    Conséquence de l'histoire : sur la requête "vêtement homme" sur laquelle mon site était 1ère page, je me retrouve totalement sortie de l'index primaire, du jour au lendemain, sans déclassement progressif ni rien.
    Imaginez que cette requête vous apporte 20% de votre trafic et que vous perdez cet avantage concurrentiel du jour au lendemain...

    J'ai fait analyser ma page. Tout est OK niveau SEO et le champ sémantique tourne bien autour des vêtements pour homme (et non des chaussures pour femme, on sait jamais, que ça puisse influencer Google).

    Suite à ce constat, j'ai pris l'initiative d'envoyer une erreur 410 sur les pages concernées et de recréer ces dernières (en changeant l'url bien sûr). Tout est rentré dans l'ordre pendant 5 mois où j'ai atteint de nouveau la 1ère page sur mes requêtes perdues et où la version en cache était de nouveau bien interprétée par Google.
    Sauf que depuis ce matin, rebelote. Les pages concernées par les problèmes sont les mêmes qu'il y a 5 mois et devinez quoi, les pages en cache sont également les mêmes (chaussure femme à la place de vêtement homme si je reprends mon exemple).

    Ma question : est-ce que l'un d'entre vous a déjà rencontré ce type de problème ou a une idée des points de vérification à faire ?

    De mon côté, j'ai vérifié :
    - La qualité de la page (contenu, technique)
    - Les canoniques
    - Les logs
    - Le HTaccess (redirections, boucles de redirection etc.)
    - Cloaking
    - Le test en User Agent Google Bot (qui m'affichait bien la page voulue et non celle en cache)

    Je n'ai pas vérifié la partie technique (intrusion php par ex). J'attends avant tout vos retours, ça m'intéresse.

    Merci et n'hésitez pas si vous voulez que je vous communique les vraies pages concernées.

    Excellente soirée @ vous,
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 873
    J'aime reçus:
    71
    Difficile de vous aider sans boule de cristal...
     
  3. elas
    elas WRInaute impliqué
    Inscrit:
    26 Février 2008
    Messages:
    759
    J'aime reçus:
    31
    oui il faut le site pour savoir
    Et après a priori tu n'es pas google, donc quand tu verifies le cloacking, une embrouille dans tes redirections, dns, serveur web ou toute la chaine du web qui est difficilement traçable, comment fais-tu pour par exemple questionner ton site depuis l'endroit ou le bot est passé (peut etre californie, ou ireland ou n'importe ou)
    On peut questionner un site web depuis le monde entier facilement et voir comment il répond, il ya même des outils dédiés (exemple pingdom.com) mais, mais !!!!! c'est impossible de savoir depuis ou le robot de google s'est embrouillé. Mais je te parle de gros site mondiaux, souvent c'est simplement un imbroglio dans des redirections . Et au risque de te décevoir, il faut plutot t'adresser un un spécialiste du web, pas forcément un SEO
     
  4. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Merci pour ta réponse. Pourquoi serai-je déçu de passer par un spécialiste du web ? Je suis partie du principe qu'il fallait d'abord écarter tous risques de pénalités SEO avant d'interroger un spécialiste du web. J'ai à titre perso utilisé des outils brevetés à plusieurs milliers d'euros par mois pour écarter les problèmes que j'ai cité plus haut (notamment la simulation en mode Google bot).
    Bref, compliqué cette affaire. Certains consultants ont vu des problèmes quasi similaires et la conclusion qu'ils ont tiré : bug Google... mais vu que le problème revient une 2ème fois, ça m'étonnerait...

    Voici un exemple d'URL concernée : https://goo.gl/zHNkNd
    Si vous vous rendez sur la version en cache, c'est cette page que Google affiche : https://goo.gl/k9E3Bq

    Merci :)
     
    #4 Digitude, 2 Mars 2018
    Dernière édition: 2 Mars 2018
  5. cthierry
    cthierry WRInaute passionné
    Inscrit:
    15 Janvier 2005
    Messages:
    2 192
    J'aime reçus:
    39
    Ben (regard dubitatif :)) quand tu fais un pagespeed avec Google, ce dernier voit bien un lit superposable pour une de tes URL. Donc à priori cela semble bon. Reste à savoir ce qu’envoi vraiment le site quand il voit un bot au lieu d'un utilisateur (cloaking ou pas cloaking) mais là ce n'est pas gagné sauf à mettre les mains dans le code.

    D'ailleurs en parlant code, il semble que tes outils brevetés à plusieurs milliers d'euros par mois ont eu un bug aussi :)
    Impasse sur la page 404 ?
    Pages qui passent pas mais vraiment pas le mobile friendly de notre ami GG : L'outil PSI estime que cette page nécessite 5 allers-retours supplémentaires pour charger les ressources qui bloquent l'affichage et 3.9 Mo pour être entièrement affichée. La page médiane nécessite 4 allers-retours et 2.7 Mo. Les pages qui demandent une quantité réduite d'allers-retours et d'octets sont plus rapides. Et tu scores à 43 sur mobile et 33 sur ordinateur => https://developers.google.com/speed/pagespeed/insights/

    Et aussi pas mal d'erreur dans la console quand tu affiches une page...

    Bref, je ne dis pas que c'est tout cela qui impacte ton site (il y a peut être un bug) mais là, il est clairement hors course pour les optimisations.

    Un peu de lecture, tout en cherchant sur ton site si il y a un bug ou pas :) :
    https://www.webrankinfo.com/dossiers/referencement-mobile/mobile-first-indexing
     
  6. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Merci pour ton retour. On ne convainc pas un convaincu ;) Je suis conscient des problèmes techniques et comme dit plus haut, c'est pour l'instant la seule chose que je n'ai pas expérimentée. J'ai déjà une roadmap à ce sujet, roadmap que j'ai conçu à l'aide de GPSI, Lighthouse, Dareboost & co.
    Dans tous les cas, le problème ne vient pas de là car toutes mes pages ont ces soucis de ralentissements et elles ne sont pas toutes impactées.
    Je vais devoir malheureusement remettre une 410 sur ces pages, les recréer et attendre 4 mois avant d'atteindre de nouveau la 1ère page (en //, je m'occuperai des optimisations techniques).

    En tout cas, merci pour tes retours, c'est sympa :)
     
    #6 Digitude, 2 Mars 2018
    Dernière édition: 2 Mars 2018
  7. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Si quelqu'un d'autre a une idée, je reste preneur bien entendu :p
     
  8. fran6
    fran6 WRInaute passionné
    Inscrit:
    21 Septembre 2004
    Messages:
    1 165
    J'aime reçus:
    6
    Salut, ta page filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html n'est pas indexée, google doit sûrement te montrer le cache d'une page similaire

    la page indexée est filedanstachambre.com/lit/lit-superpose-enfant/12.html donc problème de contenu dupliqué interne
     
    Digitude apprécie ceci.
  9. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Salut Fran6,

    Merci d'avoir pris le temps d'étudier mon cas, c'est sympa.
    Effectivement, tu as raison. Cette URL n'a pas lieu d'être indexée. Le problème, c'est qu'en scrapant mon site, je ne retrouve pas cette URL dans la liste (donc impossible de mettre la main sur la page source qui contient cette URL).

    Voici un autre exemple d'une page concernée "Armoire" qui renvoi vers les "Tapis" (catégorie qui n'a rien à voir) : https://goo.gl/Gpzuna
     
  10. fran6
    fran6 WRInaute passionné
    Inscrit:
    21 Septembre 2004
    Messages:
    1 165
    J'aime reçus:
    6
  11. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Oui je sais. Les pages concernées par le problème de cache sont toutes désindexées.
    Je ne pense pas qu'il y ait une corrélation entre le fait que la page soit désindexée et le fait qu'il affiche en cache une page proche. Regarde cet exemple. La page n'est pas indexée et la version en cache est bien la bonne : https://goo.gl/DcXzJ2
     
  12. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Et j'ose espérer que, si j'avais un problème de duplicate interne sur une page aussi stratégique que le lit superposé et classée entre la 1ère et 2ème page, Google m'envoie un message sur la search... Car de mémoire, une pénalité algorithmique aurait déclassée ma page progressivement. Là, ça ressemble plus à une pénalité manuelle... :oops:
     
  13. fran6
    fran6 WRInaute passionné
    Inscrit:
    21 Septembre 2004
    Messages:
    1 165
    J'aime reçus:
    6
    "Et j'ose espérer que, si j'avais un problème de duplicate interne sur une page aussi stratégique que le lit superposé et classée entre la 1ère et 2ème page, Google m'envoie un message sur la search"
    tu peux toujours rêver :)


    Dans ton menu, ton lien "lit superposé" arrive sur -filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html cette page n'est pas indexée (rendue non indexable donc apparemment)

    ta page réellement indexée -filedanstachambre.com/lit/lit-superpose-enfant/12.html ne reçoit donc plus de liens internes, il ne faut pas s'étonner qu'elle chute lourdement.
     
  14. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    La page réellement indexée n'a pas lieu d'être indexée justement. Ce lien n'est présent ni crawlable sur aucune page... Et pourtant, la version en cache de la page -filedanstachambre.com/lit/lit-superpose-enfant/12.html affiche une date de passage au 1er février 2018... Google l'a trouvée quelque part mais où...

    Bref, la page que je veux indexer et qui était classée sur la 1ère page, c'est : filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html

    Une redirection 301 de la page .com/lit vers .com/enfant/lit s'impose donc, qu'en penses-tu ?
     
  15. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 136
    J'aime reçus:
    273
    Bonjour,

    Concernant les réponses #8 #9 :
    Pourtant avec un crawl la page apparaît bien dans la liste.
    #5 : @cthierry problèmes de code source et même serveur (599, 404, 405, 408, etc.).
    #11 : Il faudrait faire la liste des pages à problèmes pour l'étude du problème
    #12 : Si pénalité manuelle, vous devriez avoir un message via Search Console

    Il faudrait corriger le site, plus facile pour trouver une aiguille dans une botte de foin.

    N'hésitez pas à vous présenter au forum : ici et entre deux messages présenter vos avis aussi sur les sujets : ici, pour aider les autres personnes de la communauté d'entraide.

    Temps de réponse : 10 minutes.
    Cordialement.
     
  16. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Je ne pense pas avoir saisi le sens de ta phrase ?

    Tout site internet a des failles à corriger. Les travaux sont en cours. Mais je ne pense pas qu'on puisse dire que le phénomène que je rencontre vienne de ces problèmes techniques sinon, d'autres pages auraient été impactées (ce n'est que mon humble avis).

    Les voilà, les pages concernées :

    -https://www.filedanstachambre.com/bebe/mobilier/commode-bebe/12.html
    -https://www.filedanstachambre.com/bebe/mobilier/armoire-bebe/12.html
    -https://www.filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html
    -https://www.filedanstachambre.com/enfant/armoire/armoire-2-portes-et-3-portes/12.html

    Merci de ton retour :D
     
  17. fran6
    fran6 WRInaute passionné
    Inscrit:
    21 Septembre 2004
    Messages:
    1 165
    J'aime reçus:
    6
    "affiche une date de passage au 1er février 2018... Google l'a trouvée quelque part mais où"
    peut-être indexée via chrome

    oui 301 ça devrait rouler, tu peux essayer "explorer comme google" dans gwt pour accélérer le processus
     
  18. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 136
    J'aime reçus:
    273
    Bonjour,
    Le site a de nombreuses erreurs de base, ce qui peut créer d'autres erreurs (dont certaines en SEO, cf. d'anciens sujets du forum avec des problèmes aussi d'indexation).
    Il y en a d'autres, il faudra faire une vérification plus complète du site Internet.
    Pour vérifier le problème, il vous faudra utiliser l'analytique, le site et le serveur.
    Courage sachant qu'il faudra du temps pour corriger et vérifier les erreurs d'indexation.

    Temps de réponse : 5 minutes.
    Cordialement.
     
  19. cthierry
    cthierry WRInaute passionné
    Inscrit:
    15 Janvier 2005
    Messages:
    2 192
    J'aime reçus:
    39
    Déjà, je vois que le problème "404" est résolu :-D
     
  20. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Oui. Ma requête tombait mal dans la mesure où dans la journée de jeudi à vendredi, nous avions quelques problèmes techniques en cours de résolution :)

    Je viens de trouver une piste mais j'aimerai avoir votre avis.

    Si je prends toujours comme exemple le lit superposé, et que je tape la requête suivante sur Google : info:https://www.filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html, la page qu'affiche Google est la même que celle en cache. Cela voudrait donc dire que j'ai un problème de canonique sur ces pages (enfin, logiquement...). Si je regarde bien le code source de ma page, la canonique est bonne.
    D'autres pistes où regarder ?

    Côté Bing, la page est bien indexée -_-

    Merci @ vous o_O
     
  21. GBB N12
    GBB N12 Nouveau WRInaute
    Inscrit:
    9 Mars 2017
    Messages:
    17
    J'aime reçus:
    0
    Hello,

    Ton site à vraiment du mal à répondre lorsqu'on le crawl (j'ai des temps de réponse à plus 10 sec), tu devrais regarder la config de ton serveur pour voir si il n'y a quelque chose qui bloque.

    Si GoogleBot se casse les dents en crawlant tes pages, normal qu'il ne les indexe pas.

    Pour aller encore encore plus loin, tu peux essayer d'analyser tes logs serveurs et notamment le comportement de ton site lors du passage de GoogleBot (Code réponse et Temps de réponse), si tu n'as pas les moyens de passer par un outil payant il existe https://seolyzer.io/ qui est gratuit et qui suffira largement pour écarter cette hypothèse de problème serveur.

    Bon courage
     
  22. Digitude
    Digitude Nouveau WRInaute
    Inscrit:
    23 Mars 2017
    Messages:
    24
    J'aime reçus:
    0
    Salut GBB N12,

    Merci pour ton retour, très qualitatif. Je me suis inscrits sur Seolyzer. J'attends les instructions pour implémenter le script afin d'obtenir les 1ères remontées.

    Là où je te rejoins, c'est sur le temps de réponse qui est affreusement élevé. Par contre, ce temps de réponse est approximativement le même sur toutes les pages du site. Pourquoi alors impacter seulement 5 urls de mon site plutôt que la totalité ?

    A ce niveau, est-ce que tu penses à un point bloquant en particulier que les admins system doivent vérifier ?

    Merci pour ton retour en tout cas, c'est sympa
     
Chargement...
Similar Threads - cache Google différente Forum Date
Problème cache Google : 404. That’s an error Crawl et indexation Google, sitemaps 22 Mai 2018
La background image du site et la vue en cache de google Débuter en référencement 26 Mars 2018
Taille max cache Google ? Référencement Google 19 Septembre 2017
Optimisation mise en cache avec google PageSpeed Insights Google Analytics 21 Août 2017
[URGENT] Un site remplace mes liens dans le cache Google Problèmes de référencement spécifiques à vos sites 3 Février 2017
Comment supprimer un document en version html du cache de Google? Référencement Google 27 Décembre 2016
Contenu caché pénalisé par Google ? Référencement Google 15 Juin 2016
Forcer rapidement la mise à jour de la cache de nos pages sur google ? Crawl et indexation Google, sitemaps 19 Mars 2016
Iframe youtube remplacée par <!--@ inlined-iframe . --> dans cache Google ? Crawl et indexation Google, sitemaps 15 Mars 2016
CSS en cache : un problème pour Google ? Problèmes de référencement spécifiques à vos sites 23 Octobre 2015
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice