Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google officialise son infrastructure Caffeine

Connue sous le nom de code Caffeine, la nouvelle infrastructure technique de Google est officiellement en place. Comme je l’ai déjà répété à plusieurs reprises, il s’agit surtout de changements internes chez Google qui concernent majoritairement le crawl et l’indexation (la fraîcheur de l’index serait améliorée de 50%). C’est donc seulement de façon indirecte que nous sommes concernés, pas en tant que changement d’algorithme (comme récemment avec May Day).

Qu’est-ce que Caffeine ?

Un nouvel outil pour l’indexation Google

Cafeine est une réorganisation complète de la plateforme de Google utilisée pour le crawl et l’indexation, mieux adaptée à l’évolution actuelle du web. Google garantit être capable d’afficher dans ses pages de résultats des documents très peu de temps après qu’ils ont été publiés. Matt Cutts parle même de « quelques secondes » ! A priori ce serait donc plutôt une bonne nouvelle pour les éditeurs de sites web.

Mais attention, ce n’est pas un changement d’algo comme Panda, Pingouin ou Colibri.

Caféine de Google

Caffeine, le nouvel index de Google

Depuis aujourd’hui, Caffeine est en place sur tous les datacenters de Google, dans tous les pays et pour toutes les langues. Google l’a en effet annoncé sur son blog officiel.

Comment Google a fait pour gagner 50% de rapidité ?

Jusqu’à présent, Google traitait les pages par groupes : ses robots allaient crawler les pages puis elles étaient analysées, décortiquées dans tous les sens, pour finalement être ajoutées à l’index. Les pages de ce groupe n’étaient disponibles pour les résultats de recherche qu’une fois que tout le groupe avait été traité.

Désormais, chaque page est gérée individuellement. Dès qu’elle a été crawlée et indexée, elle est accessible via les recherches. Est-ce un hasard ou bien faut-il y voir un lien avec la mise à jour May Day pour laquelle j’ai l’impression que Google analyse les pages de façon plus individuelle qu’avant ?

L’index de Google est-il plus gros ?

Non pas pour l’instant semble-t-il, mais Google s’est donné les moyens pour le faire grossir bien plus efficacement qu’avant (source). D’après Carrie Grimes (ingénieur Google), l’index de Google occupe 100 millions de Go en espace de stockage, qui grossit de plusieurs centaines de milliers de Go chaque jour.

Caffeine en vidéo

Voici une discussion entre Matt Cutts et Danny Dullivan à propos de Caffeine :

Caffeine et le référencement naturel Google

Comme dit précédemment, Caffeine n’est pas un changement d’algorithme. Comme Matt Cutts l’avait annoncé, il ne faut donc pas s’attendre à voir des impacts en termes de positionnement.

Par contre, avec Caffeine, Google se donne les moyens de mieux analyser les documents indexés (c’est-à-dire les pages web, les images, les vidéos, etc.). Pour chaque document indexé, Google stocke des informations qui lui servent à évaluer sa pertinence : backlinks, textes des backlinks, historique, critères internes à la page, etc. Caffeine permettrait une plus grande flexibilité pour l’association de « signaux » à chaque document, permettant aux ingénieurs de Google de développer d’autres algorithmes plus sophistiqués.

Lors de la conférence SMX qui se tient ces jours-ci, Matt Cutts a donné un exemple d’amélioration qui pourrait être apportée aux informations associées aux documents. Aujourd’hui Google associe chaque page avec un seul pays ; avec Caffeine plusieurs pays pourraient être rattachés. Il ne s’agit que d’un exemple pas forcément déjà exploité : il montre simplement comment Google va pouvoir mieux analyser chaque document individuellement.

Attendez-vous donc à des changements de positionnement dans les mois à venir…

On discute de Caffeine sur le forum référencement WebRankInfo.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

7 commentaires

Cédric

« Comme dit précédemment, Caffeine n’est pas un changement d’algorithme. Comme Matt Cutts l’avait annoncé, il ne faut donc pas s’attendre à voir des impacts en termes de positionnement. »

Je pensais que Caffeine prendrait en compte les temps de réponse d’un site dans son algo. Je me trompe ?

Répondre
moterc

D’un point de vue purement SEO, à quoi faudra-t-il penser dans l’avenir ? J’imagine par exemple que la structure des sites multilingues va certainement être revue dans les prochains mois…

Répondre
Marc

Ca fait déjà 2 mois que lorsque j’ajoute un article à mon blog sous wordpress cet article est affiché dans la seconde qui suit sur google en tapant les mots clés du titre par ex.

Répondre
kristoguy

Quelques mois après caffeine, l’effet est confirmé. Google affiche de façon prépondérante des pages qui ont été crawlées récemment. Google veut être sur de pouvoir afficher dans ses résultats, des pages qui n’ont pas changées.

Répondre
Guillaume

J’ai de nombreux blogs wordpress et il est clair que pour l’indexation, pubsubhubub est un outil incroyable qui permet, même à un blog récent et peu populaire, de bénéficier de l’indexation en temps réel.

Caffeine n’a à mon sens rien à voir avec ce phénomène d’indexation temps réel…

Répondre