Nouveau WRInaute
Bonjour à toute la communauté WRI,

Votre avis et/ou retours d'expérience m'intéressent par rapport à un phénomène que je rencontre depuis maintenant 1 an. Ni agences SEO ni consultants senior n'ont pu trouver une explication à ce problème (et dieu sait que j'ai demandé à des pointures de renom).

Bref, je m'explique. La version en cache Google de plusieurs pages de mon site est différente de la page visitée.
Exemple fictif : je me trouve sur la page : www.ndd.com/vetement-homme.php. Si j'utilise la commande "cache:www.ndd.com/vetement-homme.php", Google m'annonce une url différente de celle-ci, mais bien interne à mon site comme "cache:www.ndd.com/chaussure-femme.php.

Conséquence de l'histoire : sur la requête "vêtement homme" sur laquelle mon site était 1ère page, je me retrouve totalement sortie de l'index primaire, du jour au lendemain, sans déclassement progressif ni rien.
Imaginez que cette requête vous apporte 20% de votre trafic et que vous perdez cet avantage concurrentiel du jour au lendemain...

J'ai fait analyser ma page. Tout est OK niveau SEO et le champ sémantique tourne bien autour des vêtements pour homme (et non des chaussures pour femme, on sait jamais, que ça puisse influencer Google).

Suite à ce constat, j'ai pris l'initiative d'envoyer une erreur 410 sur les pages concernées et de recréer ces dernières (en changeant l'url bien sûr). Tout est rentré dans l'ordre pendant 5 mois où j'ai atteint de nouveau la 1ère page sur mes requêtes perdues et où la version en cache était de nouveau bien interprétée par Google.
Sauf que depuis ce matin, rebelote. Les pages concernées par les problèmes sont les mêmes qu'il y a 5 mois et devinez quoi, les pages en cache sont également les mêmes (chaussure femme à la place de vêtement homme si je reprends mon exemple).

Ma question : est-ce que l'un d'entre vous a déjà rencontré ce type de problème ou a une idée des points de vérification à faire ?

De mon côté, j'ai vérifié :
- La qualité de la page (contenu, technique)
- Les canoniques
- Les logs
- Le HTaccess (redirections, boucles de redirection etc.)
- Cloaking
- Le test en User Agent Google Bot (qui m'affichait bien la page voulue et non celle en cache)

Je n'ai pas vérifié la partie technique (intrusion php par ex). J'attends avant tout vos retours, ça m'intéresse.

Merci et n'hésitez pas si vous voulez que je vous communique les vraies pages concernées.

Excellente soirée @ vous,
 
WRInaute impliqué
oui il faut le site pour savoir
Et après a priori tu n'es pas google, donc quand tu verifies le cloacking, une embrouille dans tes redirections, dns, serveur web ou toute la chaine du web qui est difficilement traçable, comment fais-tu pour par exemple questionner ton site depuis l'endroit ou le bot est passé (peut etre californie, ou ireland ou n'importe ou)
On peut questionner un site web depuis le monde entier facilement et voir comment il répond, il ya même des outils dédiés (exemple pingdom.com) mais, mais !!!!! c'est impossible de savoir depuis ou le robot de google s'est embrouillé. Mais je te parle de gros site mondiaux, souvent c'est simplement un imbroglio dans des redirections . Et au risque de te décevoir, il faut plutot t'adresser un un spécialiste du web, pas forcément un SEO
 
Nouveau WRInaute
oui il faut le site pour savoir
Et après a priori tu n'es pas google, donc quand tu verifies le cloacking, une embrouille dans tes redirections, dns, serveur web ou toute la chaine du web qui est difficilement traçable, comment fais-tu pour par exemple questionner ton site depuis l'endroit ou le bot est passé (peut etre californie, ou ireland ou n'importe ou)
On peut questionner un site web depuis le monde entier facilement et voir comment il répond, il ya même des outils dédiés (exemple pingdom.com) mais, mais !!!!! c'est impossible de savoir depuis ou le robot de google s'est embrouillé. Mais je te parle de gros site mondiaux, souvent c'est simplement un imbroglio dans des redirections . Et au risque de te décevoir, il faut plutot t'adresser un un spécialiste du web, pas forcément un SEO

Merci pour ta réponse. Pourquoi serai-je déçu de passer par un spécialiste du web ? Je suis partie du principe qu'il fallait d'abord écarter tous risques de pénalités SEO avant d'interroger un spécialiste du web. J'ai à titre perso utilisé des outils brevetés à plusieurs milliers d'euros par mois pour écarter les problèmes que j'ai cité plus haut (notamment la simulation en mode Google bot).
Bref, compliqué cette affaire. Certains consultants ont vu des problèmes quasi similaires et la conclusion qu'ils ont tiré : bug Google... mais vu que le problème revient une 2ème fois, ça m'étonnerait...

Voici un exemple d'URL concernée : https://goo.gl/zHNkNd
Si vous vous rendez sur la version en cache, c'est cette page que Google affiche : https://goo.gl/k9E3Bq

Merci :)
 
Dernière édition:
WRInaute accro
Bref, compliqué cette affaire. Certains consultants ont vu des problèmes quasi similaires et la conclusion qu'ils ont tiré : bug Google... mais vu que le problème revient une 2ème fois, ça m'étonnerait...

Ben (regard dubitatif :)) quand tu fais un pagespeed avec Google, ce dernier voit bien un lit superposable pour une de tes URL. Donc à priori cela semble bon. Reste à savoir ce qu’envoi vraiment le site quand il voit un bot au lieu d'un utilisateur (cloaking ou pas cloaking) mais là ce n'est pas gagné sauf à mettre les mains dans le code.

D'ailleurs en parlant code, il semble que tes outils brevetés à plusieurs milliers d'euros par mois ont eu un bug aussi :)
Impasse sur la page 404 ?
Pages qui passent pas mais vraiment pas le mobile friendly de notre ami GG : L'outil PSI estime que cette page nécessite 5 allers-retours supplémentaires pour charger les ressources qui bloquent l'affichage et 3.9 Mo pour être entièrement affichée. La page médiane nécessite 4 allers-retours et 2.7 Mo. Les pages qui demandent une quantité réduite d'allers-retours et d'octets sont plus rapides. Et tu scores à 43 sur mobile et 33 sur ordinateur => https://developers.google.com/speed/pagespeed/insights/

Et aussi pas mal d'erreur dans la console quand tu affiches une page...

Bref, je ne dis pas que c'est tout cela qui impacte ton site (il y a peut être un bug) mais là, il est clairement hors course pour les optimisations.

Un peu de lecture, tout en cherchant sur ton site si il y a un bug ou pas :) :
https://www.webrankinfo.com/dossiers/referencement-mobile/mobile-first-indexing
 
Nouveau WRInaute
Ben (regard dubitatif :)) quand tu fais un pagespeed avec Google, ce dernier voit bien un lit superposable pour une de tes URL. Donc à priori cela semble bon. Reste à savoir ce qu’envoi vraiment le site quand il voit un bot au lieu d'un utilisateur (cloaking ou pas cloaking) mais là ce n'est pas gagné sauf à mettre les mains dans le code.

D'ailleurs en parlant code, il semble que tes outils brevetés à plusieurs milliers d'euros par mois ont eu un bug aussi :)
Impasse sur la page 404 ?
Pages qui passent pas mais vraiment pas le mobile friendly de notre ami GG : L'outil PSI estime que cette page nécessite 5 allers-retours supplémentaires pour charger les ressources qui bloquent l'affichage et 3.9 Mo pour être entièrement affichée. La page médiane nécessite 4 allers-retours et 2.7 Mo. Les pages qui demandent une quantité réduite d'allers-retours et d'octets sont plus rapides. Et tu scores à 43 sur mobile et 33 sur ordinateur => https://developers.google.com/speed/pagespeed/insights/

Et aussi pas mal d'erreur dans la console quand tu affiches une page...

Bref, je ne dis pas que c'est tout cela qui impacte ton site (il y a peut être un bug) mais là, il est clairement hors course pour les optimisations.

Un peu de lecture, tout en cherchant sur ton site si il y a un bug ou pas :) :
https://www.webrankinfo.com/dossiers/referencement-mobile/mobile-first-indexing

Merci pour ton retour. On ne convainc pas un convaincu ;) Je suis conscient des problèmes techniques et comme dit plus haut, c'est pour l'instant la seule chose que je n'ai pas expérimentée. J'ai déjà une roadmap à ce sujet, roadmap que j'ai conçu à l'aide de GPSI, Lighthouse, Dareboost & co.
Dans tous les cas, le problème ne vient pas de là car toutes mes pages ont ces soucis de ralentissements et elles ne sont pas toutes impactées.
Je vais devoir malheureusement remettre une 410 sur ces pages, les recréer et attendre 4 mois avant d'atteindre de nouveau la 1ère page (en //, je m'occuperai des optimisations techniques).

En tout cas, merci pour tes retours, c'est sympa :)
 
Dernière édition:
WRInaute passionné
Salut, ta page filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html n'est pas indexée, google doit sûrement te montrer le cache d'une page similaire

la page indexée est filedanstachambre.com/lit/lit-superpose-enfant/12.html donc problème de contenu dupliqué interne
 
Nouveau WRInaute
Salut Fran6,

Merci d'avoir pris le temps d'étudier mon cas, c'est sympa.
Effectivement, tu as raison. Cette URL n'a pas lieu d'être indexée. Le problème, c'est qu'en scrapant mon site, je ne retrouve pas cette URL dans la liste (donc impossible de mettre la main sur la page source qui contient cette URL).

Voici un autre exemple d'une page concernée "Armoire" qui renvoi vers les "Tapis" (catégorie qui n'a rien à voir) : https://goo.gl/Gpzuna
 
Nouveau WRInaute

Oui je sais. Les pages concernées par le problème de cache sont toutes désindexées.
Je ne pense pas qu'il y ait une corrélation entre le fait que la page soit désindexée et le fait qu'il affiche en cache une page proche. Regarde cet exemple. La page n'est pas indexée et la version en cache est bien la bonne : https://goo.gl/DcXzJ2
 
Nouveau WRInaute
Et j'ose espérer que, si j'avais un problème de duplicate interne sur une page aussi stratégique que le lit superposé et classée entre la 1ère et 2ème page, Google m'envoie un message sur la search... Car de mémoire, une pénalité algorithmique aurait déclassée ma page progressivement. Là, ça ressemble plus à une pénalité manuelle... :oops:
 
WRInaute passionné
"Et j'ose espérer que, si j'avais un problème de duplicate interne sur une page aussi stratégique que le lit superposé et classée entre la 1ère et 2ème page, Google m'envoie un message sur la search"
tu peux toujours rêver :)


Dans ton menu, ton lien "lit superposé" arrive sur -filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html cette page n'est pas indexée (rendue non indexable donc apparemment)

ta page réellement indexée -filedanstachambre.com/lit/lit-superpose-enfant/12.html ne reçoit donc plus de liens internes, il ne faut pas s'étonner qu'elle chute lourdement.
 
Nouveau WRInaute
ta page réellement indexée -filedanstachambre.com/lit/lit-superpose-enfant/12.html ne reçoit donc plus de liens internes, il ne faut pas s'étonner qu'elle chute lourdement.

La page réellement indexée n'a pas lieu d'être indexée justement. Ce lien n'est présent ni crawlable sur aucune page... Et pourtant, la version en cache de la page -filedanstachambre.com/lit/lit-superpose-enfant/12.html affiche une date de passage au 1er février 2018... Google l'a trouvée quelque part mais où...

Bref, la page que je veux indexer et qui était classée sur la 1ère page, c'est : filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html

Une redirection 301 de la page .com/lit vers .com/enfant/lit s'impose donc, qu'en penses-tu ?
 
Membre Honoré
Bonjour,

Concernant les réponses #8 #9 :
Cette URL n'a pas lieu d'être indexée. Le problème, c'est qu'en scrapant mon site, je ne retrouve pas cette URL dans la liste (donc impossible de mettre la main sur la page source qui contient cette URL).
Pourtant avec un crawl la page apparaît bien dans la liste.
#5 : @cthierry problèmes de code source et même serveur (599, 404, 405, 408, etc.).
#11 : Il faudrait faire la liste des pages à problèmes pour l'étude du problème
#12 : Si pénalité manuelle, vous devriez avoir un message via Search Console

Il faudrait corriger le site, plus facile pour trouver une aiguille dans une botte de foin.

N'hésitez pas à vous présenter au forum : ici et entre deux messages présenter vos avis aussi sur les sujets : ici, pour aider les autres personnes de la communauté d'entraide.

Temps de réponse : 10 minutes.
Cordialement.
 
Nouveau WRInaute
Il faudrait corriger le site, plus facile pour trouver une aiguille dans une botte de foin.

Je ne pense pas avoir saisi le sens de ta phrase ?

Tout site internet a des failles à corriger. Les travaux sont en cours. Mais je ne pense pas qu'on puisse dire que le phénomène que je rencontre vienne de ces problèmes techniques sinon, d'autres pages auraient été impactées (ce n'est que mon humble avis).

#11 : Il faudrait faire la liste des pages à problèmes pour l'étude du problème

Les voilà, les pages concernées :

-https://www.filedanstachambre.com/bebe/mobilier/commode-bebe/12.html
-https://www.filedanstachambre.com/bebe/mobilier/armoire-bebe/12.html
-https://www.filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html
-https://www.filedanstachambre.com/enfant/armoire/armoire-2-portes-et-3-portes/12.html

Merci de ton retour :D
 
WRInaute passionné
"affiche une date de passage au 1er février 2018... Google l'a trouvée quelque part mais où"
peut-être indexée via chrome

oui 301 ça devrait rouler, tu peux essayer "explorer comme google" dans gwt pour accélérer le processus
 
Membre Honoré
Bonjour,
Je ne pense pas avoir saisi le sens de ta phrase ?
Le site a de nombreuses erreurs de base, ce qui peut créer d'autres erreurs (dont certaines en SEO, cf. d'anciens sujets du forum avec des problèmes aussi d'indexation).
Mais je ne pense pas qu'on puisse dire que le phénomène que je rencontre vienne de ces problèmes techniques sinon, d'autres pages auraient été impactées (ce n'est que mon humble avis).
Il y en a d'autres, il faudra faire une vérification plus complète du site Internet.
Pour vérifier le problème, il vous faudra utiliser l'analytique, le site et le serveur.
Courage sachant qu'il faudra du temps pour corriger et vérifier les erreurs d'indexation.

Temps de réponse : 5 minutes.
Cordialement.
 
Nouveau WRInaute
Déjà, je vois que le problème "404" est résolu :-D

Oui. Ma requête tombait mal dans la mesure où dans la journée de jeudi à vendredi, nous avions quelques problèmes techniques en cours de résolution :)

Je viens de trouver une piste mais j'aimerai avoir votre avis.

Si je prends toujours comme exemple le lit superposé, et que je tape la requête suivante sur Google : info:https://www.filedanstachambre.com/enfant/lit/lit-superpose-enfant/12.html, la page qu'affiche Google est la même que celle en cache. Cela voudrait donc dire que j'ai un problème de canonique sur ces pages (enfin, logiquement...). Si je regarde bien le code source de ma page, la canonique est bonne.
D'autres pistes où regarder ?

Côté Bing, la page est bien indexée -_-

Merci @ vous o_O
 
Nouveau WRInaute
Hello,

Ton site à vraiment du mal à répondre lorsqu'on le crawl (j'ai des temps de réponse à plus 10 sec), tu devrais regarder la config de ton serveur pour voir si il n'y a quelque chose qui bloque.

Si GoogleBot se casse les dents en crawlant tes pages, normal qu'il ne les indexe pas.

Pour aller encore encore plus loin, tu peux essayer d'analyser tes logs serveurs et notamment le comportement de ton site lors du passage de GoogleBot (Code réponse et Temps de réponse), si tu n'as pas les moyens de passer par un outil payant il existe https://seolyzer.io/ qui est gratuit et qui suffira largement pour écarter cette hypothèse de problème serveur.

Bon courage
 
Nouveau WRInaute
Salut GBB N12,

Merci pour ton retour, très qualitatif. Je me suis inscrits sur Seolyzer. J'attends les instructions pour implémenter le script afin d'obtenir les 1ères remontées.

Là où je te rejoins, c'est sur le temps de réponse qui est affreusement élevé. Par contre, ce temps de réponse est approximativement le même sur toutes les pages du site. Pourquoi alors impacter seulement 5 urls de mon site plutôt que la totalité ?

tu devrais regarder la config de ton serveur pour voir si il n'y a quelque chose qui bloque.

A ce niveau, est-ce que tu penses à un point bloquant en particulier que les admins system doivent vérifier ?

Merci pour ton retour en tout cas, c'est sympa
 
Discussions similaires
Haut