MAJ du cache de Google dépend du tx de modifs d'une page ?

Nouveau WRInaute
Bonjour,

Je constate que lorsque je réalise une modification assez minime sur une page, Google met bien plus de temps à prendre cette nouvelle version dans son cache que lorsque les modifications sont plus "flagrantes".

Vous aussi ?

Comment faire pour accélérer la mise à jour du cache dans ce cas :?: Ressoumettre le fichier SiteMap ?
 
WRInaute occasionnel
Re: MAJ du cache de Google dépend du tx de modifs d'une page

Bobi La Pointe a dit:
lorsque je réalise une modification assez minime sur une page, Google met bien plus de temps à prendre cette nouvelle version dans son cache que lorsque les modifications sont plus "flagrantes".
Oui. Plus exactement ce n'est pas l'ampleur de la modification qui me parait provoquer les nouvelles mises en cache, mais le rythme où tu les s'effectues.

Autrement dit, entre tout bouleverser une fois par mois, ou faire des modifs significatives une fois par semaine, je choisirais la n°2. Tu évoques dans ton post les modifications "assez minimes", disons qu'en dessous d'un minimum cela n'entraîne pas (en soit) de mise-à-jour du cache par Google.

Bien sûr, toutes choses égales par ailleurs... (ce n'est pas comme appuyer sur un bouton, personne ne "provoque" vraiment les MàJ, cela sert plutôt à inciter les robots à repasser souvent car ils ont de la matière à se mettre sous la dent).
 
Nouveau WRInaute
Merci pour ta réponse Megachercheur,
Par expérience je te rejoins dans ta remarque sur la fréquence des mises à jour d'une page qui est en relation avec la fréquence des mises à jour du cache Google.

en dessous d'un minimum cela n'entraîne pas (en soit) de mise-à-jour du cache par Google.

Mouai, dommage, une mise à jour minime peut parfois être importante pour le référencement (modification d'un titre), alors patience...
 
WRInaute occasionnel
nickargall a dit:
Qu'est ce qui te fait penser ça ? As tu déjà effectué des tests ou lus des docs dans ce sens ?
Je pense que ça saute aux yeux de tous ceux qui mettent à jour leur site très régulièrement (par exemple les blogueurs qui ajoutent un billet quasiment chaque jour).

Un petit exercice intéressant est d'attendre que Google ait fait une mise en cache de ta page d'accueil, ensuite tu ajoutes tout de suite dessus un contenu neuf. Autrement dit, tu fais en sorte que Google soit toujours avec un cache de retard (dés qu'il a pris ta nouvelle page, hop tu la réecris). J'ai constaté plusieurs fois que Google devient complètement fou, il revient faire des mises en cache tous les jours comme s'il voulait gagner la course de vitesse contre toi :wink:

Rappelle-toi au début des blogs, quand ils se sont mis à grimper de façon vertigineuse dans les requêtes. Google adore lorsque les contenus sont souvent actualisés (même si ça marche moins bien qu'il y a un an ou deux).
 
WRInaute accro
CAD que Google jetterait un oeil sur le contenu d'une page, il le compare au contenu en cache, si le taux de modifs dépasse x% de la page il relit tout mais 'pour de vrai' ??
 
Nouveau WRInaute
si le taux de modifs dépasse x% de la page il relit tout mais 'pour de vrai' ??
Disons qu'il ne la re-relit pas mais l'enregistre dans sa base de données et écrase l'ancienne version.
C'est une opération qu'il ne juge pas nécessaire si tu as modifié une virgule dans ta page, une manière d'économiser des processus serveurs.

Remarque, pendant que j'écris ces lignes, je me demande bien quand il mettra en cache cette "nouvelle virgule", puisqu'il le mettra bien à jour à un moment ou à un autre ce cache...

8O
 
WRInaute accro
Moi j'ai du mal à me dire qu'il va inspecter le code "de loin" pour voir les changements, il met des jumelles et déguise son IP derrière des branchages pour pas être détecté par les robots tracker quand il le fait ? ;) Et il tombe le masque si ses jumelles ont détecté des changements significatifs ? j'ai vraiment du mal avec cette notion de changement de contenu pour appâter Google bot. A moins qu'il y ait un Google spy qui reste tapi dans l'ombre, les yeux rivés sur le site, et il appelle son grand frere quand il ya du mouvement ???
 
WRInaute impliqué
lol

nickargall a dit:
[...] déguise son IP derrière des branchages pour pas être détecté par les robots tracker quand il le fait ? ;)
je ne pense pas :wink:
c'est le même r0b0t tout aussi banal que d'habitude qui relève le code source, ensuite qui fait le boulot, je pense que c'est les DC.
 
WRInaute accro
MAis c'est bien le Google bot qui envoie les infos aux DC, non ? Ce qui me pose pb, c'est qu'on parle de refaire venir le robot avec du changement; mais comment voit il ce changement sans revenir ? Hein ? c'est la question à $1.000 du jour
 
WRInaute impliqué
Mme Irma

nickargall a dit:
mais comment voit il ce changement sans revenir ?
le b0t ne voit pas le changement sans revenir :wink:
il voit le changement lors de son exploration "naturelle"
ou il est aidé par un s1tem4p qui lui signale le changement.

le r0b0t qui verrait le changement sans crawler, il s'appelle Irma, mais comme il voit les changements à distance, il est très diffcile de le logger :lol:
 
WRInaute occasionnel
nickargall a dit:
on parle de refaire venir le robot avec du changement
Ce n'est pas ce que je dis. Le robot, il vient ou il ne vient pas. Par contre ce qu'il est possible de faire, c'est d'accélérer la fréquence des mises en cache. Si le robot vient et qu'il n'y a rien de nouveau, il se casse. S'il y a du nouveau, il va reprendre ton nouveau contenu en cache (pas toujours mais disons qu'on cherche à l'y inciter). Par exemple ça peut te faire ressortir sur les requêtes secondaires grâce aux nouveaux mots-clé que tu as inséré en ajoutant/modifiant du contenu.

Il ne s'agit pas d'appâter le robot (petit-petit-petiiiit !!!! viens-y-ci gentil petit robot !!!) mais plutôt de faire que quand il se pointe, il ne reparte pas les mains vides.

Capisci ? :wink:
 
WRInaute passionné
Effectivement, à mon avis, le robot "apprend", ou plutôt "note" :

Si à chacun de ses passages il constate que des changements ont été effectués, un "tag" est sans doute mis sur l'adresse pour signifier que les mises à jour sont régulières et cela entraine une fréquence de crawl plus élevée.
 
Nouveau WRInaute
Bon allez, c'est décidé, je change une virgule, une seule virgule dans le corps d'une page qui est maj toutes les 2-3 semaines, dont la version du cache GG date du 14 sep 2006.

Et je Post dans cette discussion la prochaine fois que Google prend cette fameuse virgule dans son cache.

(waou, on s'éclate!)
 
WRInaute occasionnel
Monty973 a dit:
un "tag" est sans doute mis sur l'adresse pour signifier que les mises à jour sont régulières
Hypothèse extrêmement intéressante. Je n'y avais pas pensé, et j'aimerai bien creuser cette question. C'est peut-être un truc évident qui m'a échappé, cet histoire de tag. Monty973, qu'est-ce qui te fait dire ça ? Tu as lu des articles là-dessus, fais des tests ? Ce sont tes propres observations ? Contact en MP si nécessaire, sinon dans ce fil bien sûr.
 
WRInaute occasionnel
Bobi La Pointe a dit:
je change une virgule
Je pense que cela ne donnera rien, c'est une modif non visible. Ce qui serait vraiment intéressant, c'est de compter le nombre de mots non vides (donc sans tenir compte de le du en sur par etc) dans ta page, d'attendre la mise en cache (début de l'expérience), puis de rajouter 5% de mots non-vides. Puis essayer avec 10% etc. Voir où est le seuil (puisqu'il me parait acquis qu'il y en a un).
 
WRInaute occasionnel
Je pense que plus le site va être mis à jour et plus google va passer sur cette page. C'est cler qu'un site vitrine de présentation d'une entreprise provoquera moins de passage qu'un site d'actualité qui créee tous les jours du nouveau contenu.
 
WRInaute occasionnel
Neoxy a dit:
C'est clair qu'un site vitrine de présentation d'une entreprise provoquera moins de passage qu'un site d'actualité qui créee tous les jours du nouveau contenu.
Oui, cela résume bien ce qui a été dit dans ce post. Pour ma part, j'essaie de combiner les deux : une partie inaltérable avec des infos de fond qui doivent être présente, et plutôt vers le haut de page une partie avec les titres d'actualité, les flux RSS s'il y a lieu etc... renvoyant à la vraie page d'actu. Au début je ne mettais l'actu que sur une page dédiée, mais je pense qu'il faut appâter le moteur en lui faisant miroiter ce qui est neuf (peeetit petit petit.... viens-t ici zoli petit moteur....peeetit petit ...) donc maintenant je lui mets l'eau à la bouche avec quelques bribes d'actu.

J'espère que ça met aussi l'eau à la bouche des visiteurs (purée faut que je me souvienne de penser à eux, des fois...) :wink:
 
Nouveau WRInaute
Bon allez, c'est décidé, je change une virgule, une seule virgule dans le corps d'une page qui est maj toutes les 2-3 semaines, dont la version du cache GG date du 14 sep 2006.

Alors voilà, Google a mis à jour son cache pour cette page le 30 Septembre, et a bien pris en compte cette virgule supplémentaire...

On peut conclure que peu importe l'importance d'une modif, si la page n'est pas exactement celle de son cache, Google semble mettre à jour son cache.

Voilà une info qui est maintenant vérifiée.
 
Nouveau WRInaute
Dépend aussi de la fréquence de fréquentation des backlinks

Dans un sens, vous avez raison mais il n'y pas que ce paramètre qui entre en jeu.

Pour chaque site il existe un certain nombre de backlinks... A chaque fois que Google passe dessus, je pense qu'il effectue une espèce de Ping et que c'est à ce moment-là qu'il vérifie et compare son cache avec la page qu'il ping.

Dans le cas où la page vérifiée diffère de celle inscrite dans son cache, il procède à une visite... et enregistre les modifs effectuées en remplaçant son cache actuel par le nouveau etc.

C'est pourquoi certains sites internet sont plus visités que d'autres etc... Tout dépend du nombre de pages qui y font référence.

Voilà ma vision des faits, à vous... Eking!
 
Discussions similaires
Haut