Cet article fait partie des archives de WebRankInfo : certes, il est ancien, mais complet et détaillé pour son époque. Si vous cherchez d'autres informations, faites une recherche sur le site ou participez au forum. Contactez-moi si besoin.
Qu'est-ce que Caffeine ?
Un nouvel outil pour l'indexation Google
Cafeine est une réorganisation complète de la plateforme de Google utilisée pour le crawl et l'indexation, mieux adaptée à l'évolution actuelle du web. Google garantit être capable d'afficher dans ses pages de résultats des documents très peu de temps après qu'ils ont été publiés. Matt Cutts parle même de "quelques secondes" ! A priori ce serait donc plutôt une bonne nouvelle pour les éditeurs de sites web.
Mais attention, ce n'est pas un changement d'algo comme Panda, Pingouin ou Colibri.
Depuis aujourd'hui, Caffeine est en place sur tous les datacenters de Google, dans tous les pays et pour toutes les langues. Google l'a en effet annoncé sur son blog officiel.
Comment Google a fait pour gagner 50% de rapidité ?
Jusqu'à présent, Google traitait les pages par groupes : ses robots allaient crawler les pages puis elles étaient analysées, décortiquées dans tous les sens, pour finalement être ajoutées à l'index. Les pages de ce groupe n'étaient disponibles pour les résultats de recherche qu'une fois que tout le groupe avait été traité.
Désormais, chaque page est gérée individuellement. Dès qu'elle a été crawlée et indexée, elle est accessible via les recherches. Est-ce un hasard ou bien faut-il y voir un Matt Cutts avec la mise à jour May Day pour laquelle j'ai l'impression que Google analyse les pages de façon plus individuelle qu'avant ?
L'index de Google est-il plus gros ?
Non pas pour l'instant semble-t-il, mais Google s'est donné les moyens pour le faire grossir bien plus efficacement qu'avant (source). D'après Carrie Grimes (ingénieur Google), l'index de Google occupe 100 millions de Go en espace de stockage, qui grossit de plusieurs centaines de milliers de Go chaque jour.
Caffeine en vidéo
Voici une discussion entre Matt Cutts et Danny Dullivan à propos de Caffeine :
Caffeine et le référencement naturel Google
Comme dit précédemment, Caffeine n'est pas un changement d'algorithme. Comme Matt Cutts l'avait annoncé, il ne faut donc pas s'attendre à voir des impacts en termes de positionnement.
Par contre, avec Caffeine, Google se donne les moyens de mieux analyser les documents indexés (c'est-à-dire les pages web, les images, les vidéos, etc.). Pour chaque document indexé, Google stocke des informations qui lui servent à évaluer sa pertinence : backlinks, textes des backlinks, historique, critères internes à la page, etc. Caffeine permettrait une plus grande flexibilité pour l'association de "signaux" à chaque document, permettant aux ingénieurs de Google de développer d'autres algorithmes plus sophistiqués.
Lors de la conférence SMX qui se tient ces jours-ci, Matt Cutts a donné un exemple d'amélioration qui pourrait être apportée aux informations associées aux documents. Aujourd'hui Google associe chaque page avec un seul pays ; avec Caffeine plusieurs pays pourraient être rattachés. Il ne s'agit que d'un exemple pas forcément déjà exploité : il montre simplement comment Google va pouvoir mieux analyser chaque document individuellement.
Attendez-vous donc à des changements de positionnement dans les mois à venir...
On discute de Caffeine sur le forum référencement WebRankInfo.
J'ai de nombreux blogs wordpress et il est clair que pour l'indexation, pubsubhubub est un outil incroyable qui permet, même à un blog récent et peu populaire, de bénéficier de l'indexation en temps réel.
Caffeine n'a à mon sens rien à voir avec ce phénomène d'indexation temps réel...
Quelques mois après caffeine, l'effet est confirmé. Google affiche de façon prépondérante des pages qui ont été crawlées récemment. Google veut être sur de pouvoir afficher dans ses résultats, des pages qui n'ont pas changées.
Ca fait déjà 2 mois que lorsque j'ajoute un article à mon blog sous wordpress cet article est affiché dans la seconde qui suit sur google en tapant les mots clés du titre par ex.
C'est peut-être grâce au flux RSS et au ping automatique de WordPress. Ou peut-être grâce à PubSubHubub
D'un point de vue purement SEO, à quoi faudra-t-il penser dans l'avenir ? J'imagine par exemple que la structure des sites multilingues va certainement être revue dans les prochains mois...
"Comme dit précédemment, Caffeine n'est pas un changement d'algorithme. Comme Matt Cutts l'avait annoncé, il ne faut donc pas s'attendre à voir des impacts en termes de positionnement."
Je pensais que Caffeine prendrait en compte les temps de réponse d'un site dans son algo. Je me trompe ?
Oui tu te trompes, la prise en compte des temps de réponse ne concerne pas Caffeine. Ca n'empêche pas que c'est déjà en place...