Version en cache de google pas toujours disponible

WRInaute discret
Bonjour,

Je souhaiterais avoir une info. je me suis "amusé" récemment à faire quelques recherches sur Google en utilisant les commandes usuelles. J'en ai profité pour vérifier les dates de mise en cache par Google d'un certain nombre d'urls et j'ai commencé à me poser des questions sur quelque chose que j'avais déjà constaté sans vraiment y prêter attention.

En fait, ma question est la suivante : comment se fait-il que pour un meme domaine, on puisse afficher la date de mise en cache google pour certaines urls et pas pour d'autres ?


NB: les urls en question n'ont pas de méta "noarchive"
 
WRInaute discret
Ben oui mais non :D
Je sais bien que toutes les pages d'un site ne sont pas visitées en même temps. Ce que je ne comprends pas c'est la raison pour laquelle il est possible de consulter la date de mise en cache de certaines pages mais pas d'autres.
 
WRInaute impliqué
Avec un exemple concert peut-etre, ca pourrait aider à trouver des pistes :)
Pour ma part, les peut de fois ou j'ai regardé, la date de mise en cache était affichée
 
WRInaute discret
Alors l'exemple précis que j'évoquais n'apparait plus. Après réflexion, je pense avoir compris pourquoi.
Il me semble que les pages concernées étaient celles contenant la meta "noindex, follow".
Etrangement, Google semble faire apparaitre dans des commandes type "site:domaine.com" des urls qu'ils n'indexent pas et qui ont peu voire aucune chance d'apparaitre dans des résultats de recherche "classiques".

Quelqu'un pourrait confirmer cette hypothese ?
 
WRInaute discret
Concernant le fonctionnement du cache de Google j'ai constaté que lorsque Google mets une page en cache pour la première fois (donc découvre la page) là le cache met du temps à être disponible. Au départ il indexe et mets le lien "en cache" et environ 24h plus tard l(plus ou moins) à le lien amène sur la page en cache donc si le lien n'amène sur rien c'est qu'il vient de l'indexer
 
WRInaute discret
Merci pour cette info complémentaire. Mais, dans le cas que j'avais observé, il s'agissait de pages qui avaient déjà pas mal d'ancienneté.
 
WRInaute discret
Dans le cas de page "très anciennes" qui reviennent des oubliettes... c'est pareil. Si une page cesse d'être indexée pour des raison x ou y, le jour où il décide de la faire ressortir, là le fonctionnement du cache revient... Exemple des vielles pages qui n'ont pas été mis à jour depuis des années et qui d'un coup réapparaîssent, là il s'agit d'une réindexation même si Google connais ces pages... C'est le cas par exemple des pages utilisant des frames et autre javascript que Google ne voyait pas, maintenant le moteur évolue et indexe du javascript ou des frames... et ces "nouveau" contenus suffisent pour que Google les réactualise... Je pense que pour le cas des commandes site: etc... Google fait et affiche ce qu'il veut d'autant que la commande n'est plus très fiable même si elle continue de fonctionner (il affiche les nouvelles pages indexées), mais là on entre dans des interrogations dont seul google a la réponse :), je parle par exemple d'une 301 permanante avec un .htaccess qui perdure et que Google continue de "surveiller" :)
 
Discussions similaires
Haut