Crawl : pourquoi Google re-indexe t-il plus que nécessaire ?

WRInaute passionné
Good morning, Ohayo gosaïmasu, Sba7 nnour, Guten tag,

Une petite colle, une question que je me pose : pourquoi le robot Google crawl t-il bien plus qu’il ne le serait nécessaire, des pages qui changent bien moins souvent qu’il ne les re-indexe ?

Exemple : une ou des pages sont mises à jours 2 ou 3 fois par an, voir une fois par an, le SiteMap n’est pas erroné et donne des date de mise à jour correct, et pourtant Google les re-indexe parfois tous les jours, et même quelque fois plusieurs fois dans la journée.

Pourquoi ? :?:

Est-ce que la fréquence de mise à jour suggéré par le SiteMap et qui est souvent mal évaluée quand ça change trop peu souvent peut avoir son importance ici ? Mais je pensais que le robot Google n’en tenait pas trop compte et se fiait plutôt à la fréquence de mise à jour effective.

Je me demande quand-même pourquoi il re-crawl si fréquemment des pages dont il doit bien avoir logué quelque-part qu’elles ne changent pas si fréquemment.

Any idea ? How does it work ?
 
WRInaute accro
Peut être que des liens sont régulièrement créés vers ces pages, ce qui expliquerait que le robot retrouve régulièrement le chemin vers celles-ci.
 
WRInaute passionné
UsagiYojimbo a dit:
Peut être que des liens sont régulièrement créés vers ces pages, ce qui expliquerait que le robot retrouve régulièrement le chemin vers celles-ci.
Il y en a de temps en temps, mais pas tant que ça.

finstreet a dit:
pour savoir qu'elles ne changent pas, il faut bien les visiter non ?
Mais ensuite quand « on » sait, pourquoi faire comme si « on » ne savait pas ?
 
WRInaute accro
Si une page ne change pas durant un certain temps, rien ne dit qu'elle ne va pas changer plus tard.

Il suffit d'un nouveau lien vers cette page pour initier un nouveau crawl j'imagine.
 
WRInaute accro
hibou57 a dit:
finstreet a dit:
pour savoir qu'elles ne changent pas, il faut bien les visiter non ?
Mais ensuite quand « on » sait, pourquoi faire comme si « on » ne savait pas ?

Quand on sait quoi ? Parce que tu sais que la valeur Alcatel a gagné 0% en un an, tu sais quoi d'autres ? Qu'elle ne va pas gagner 20% l'année prochaine ? Tu n'en sais rien. Là c'est pareil.
 
WRInaute passionné
Sait-on s’il honore les éléments “changefreq” d’un Sitemap ? Me semble évident qu’il ignore les éléments “priority”, je me demande s’il n’ignore pas tout autant ces “changefreq”.

Quelqu’un qui se pose la même question : Does Google use the Sitemap "Changefreq" attribute ?

doughayman (webmasterworld.com) a dit:
Is this attribute just a placebo ?

Quelqu’un plus loin dit que ce n’est qu’un facteur parmi d’autres et que Google en donne le poids qu’il veut, mais cela équivaut à « pas de réponse » si on ne donne pas la moindre idée du poids qu’il donne (parce que si le poids est 0.1%, on peut simplifier en disant qu’il l’ignore).

Vais faire un test plus tard…
 
WRInaute accro
finstreet a dit:
Non mais faut arrêter avec le sitemap :) Ca sert à rien sauf à voir si les pages sont indexées.

+1. Un bon site bien structure au niveau du linking internet n'a pas besoin de sitemap. Et le cas échéant, c'est bien plus efficace de travailler son site plutôt que de se reposer sur le sitemap pour en faire indexer les pages.
 
WRInaute passionné
finstreet a dit:
Non mais faut arrêter avec le sitemap :) Ca sert à rien sauf à voir si les pages sont indexées.
Oops, je ne savais pas que ça ne sert à rien. Au moins ça explique pourquoi ça a toujours eu l’air de ne servir à rien.

Merci pour cette réponse.

Sinon, quelles sont les sources qui confirment que ça ne sert à rien ? C’est l’observation collective ou est-ce qu’un article est paru à ce sujet chez Google ou autres moteurs ?
 
WRInaute accro
Google va même t'expliquer que la barre verte ca sert à quelque chose. Le sitemap est un outil parmi tant d'autres. Qui a surement des avantages en terme techniques pour Google et quelques avantages pour le webmaster, mais s'il suffisait d'écrire "modif quotidienne" pour voir le robot passer tous les jours, ca se saurait.
 
Discussions similaires
Haut