Vous êtes ici : Dossiers référencement > Indexation Google

Membre WebRankInfo ?

S'inscrire Aide

Fresh Crawl, Deep Crawl, Google Dance…

Olivier Duffez, Vendredi 22 novembre 2002

Mise à jour : cet article date de plusieurs années, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé : Google est mis à jour en permanence (crawl, indexation, algorithme, etc.) et les techniques décrites ici ne sont plus forcément applicables à 100% (par exemple il n'existe plus vraiment de Deep Crawl, Fresh Crawl et autres Full Crawl ou Google Dance)…

La vie d'une page sur le web est ponctuée en général de nombreuses visites, que ce soit de visiteurs (humains), de robots de moteurs de recherche voire de logiciel (aspirateurs de sites). Si la dernière catégorie n'intéresse pas vraiment le webmaster, il souhaite en général augmenter la fréquence des deux autres… Intéressons-nous aux visites des robots, par exemple celles de GoogleBot, le robot de Google.

Référencer des nouvelles pages

Après des heures de travail acharné, le webmaster publie enfin sa page sur son site. Il aura beau attendre des jours entiers, personne ne viendra la voir tant qu'il ne communiquera pas son adresse (URL). Pour la signaler à GoogleBot, il est possible d'aller remplir le formulaire de soumission d'URL, mais il vaut mieux tout simplement ajouter des liens vers cette page à partir de pages déjà indexées.

En fonction du nombre de liens et de l'importance des pages sur lesquelles figurent les liens (leur PageRank), GoogleBot va mettre entre 12h et 1 mois à venir voir cette nouvelle page. Il est facile de détecter son passage, soit en analysant les fichiers log, soit en utilisant RobotStats, un outil d'analyse temps réel des visites de GoogleBot.

En prenant le cas d'une page visitée dans les 12h qui suivent sa mise en ligne, il faut attendre en général encore quelques heures pour la trouver dans Google à partir d'une recherche par mots-clés. Ainsi, une nouvelle page liée par quelques pages à PageRank 5 ou 6 est détectée par Google en 12h, et ajoutée dans l'index en 24h !

La « prime de fraîcheur »

Vient ensuite une période faste pour cette nouvelle page : dans les premiers jours qui suivent son apparition sur Google, la page bénéficie d'une « prime de fraîcheur ». A cet instant précis, cette page n'est passée que dans la première moitié de l'algorithme de Google, à savoir son indexation. Tous les mots ont été épluchés, les balises HTML décortiquées. Par contre Google n'a pas encore analysé la structure de liens vers et à partir de cette page. Cette page n'a donc pas encore de PageRank, même si la barre d'outils Google peut en indiquer un (à ce moment-là ce n'est qu'une estimation). Notez que dans le cas d'un nouveau site, la Toolbar reste bien grise et indique « La page affichée n'est pas indexée dans Google ».
Grâce à cette « prime de fraîcheur », cette page a des chances de sortir en meilleure position que d'autres pages présentes dans Google depuis longtemps (et ayant un PageRank). Même si cette idée peut paraître étonnante, elle présente l'avantage de mettre en avant rapidement des pages d'actualité, puis de les retirer pour revenir à l'algorithme classique.

Les meilleures choses ayant malheureusement toujours une fin, il est fréquent de voir disparaître cette page de Google, surtout si elle ne bénéficiait pas de nombreux liens (ou de liens issus de pages à faible PageRank). Il ne faut pas s'inquiéter, elle reviendra !

Google Dance

Quelques jours (ou semaines) après, la Google Dance commence et le monde des webmasters tremble… Tous les webmasters soucieux de leur référencement se sont inscrits à l'alerte Google Dance. Google a terminé les analyses de liens et surtout les calculs de PageRank, et entame la diffusion de son nouvel index sur ces serveurs. Notre nouvelle page qui avait disparu est maintenant visible sur www2.google.com : il y a encore de l'espoir.

La Google Dance est maintenant terminée, et la nouvelle page apparait de nouveau dans Google au cours d'une recherche par mots-clés. Malheureusement elle a perdu quelques places… et son PageRank n'est pas fameux. En plus cette fois il s'agit d'un véritable PageRank calculé : il va donc falloir optimiser cette page pour augmenter son PageRank.

Full Crawl

Dès la fin de la Google Dance, pendant que le webmaster se débrouille pour optimiser son site, GoogleBot passe en régime d'indexation massive (full crawl). Il faut s'attendre à recevoir de nombreuses visites de GoogleBot pendant quelques jours (en provenance de plusieurs adresses IP, puisqu'il s'agit d'un programme distribué sur de nombreuses machines). C'est une bonne période pour ajouter des pages sur son site, en prévision de la prochaine Google Dance…

La machine Google semble désormais bien rodée pour gérer l'indexation régulière de 3 milliards de pages. En plus de l'analyse des nouvelles pages, il ne faut pas oublier que Google doit aussi déterminer les millions de pages qu'il doit supprimer, suite à leur disparition ou leur déplacement.

Note : après réflexion, il serait plus juste de commencer par le Full Crawl, car c'est l'étape la plus importante pour qu'un site soit indexé. Tant que votre site n'a pas « subi » de Full Crawl, il ne peut pas être complètement indexé dans Google.


Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

  • Analyse de positionnement sur les data centers de Google
    Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données).
  • Calculer le ratio de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • La classe C de l'adresse IP
    Cet outil vous permet de vérifier si plusieurs sites sont hébergés sur la même classe C (adresse IP du serveur).
  • Ancienneté d'un site dans Google
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Logiciel d'analyse du positionnement
    AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.


Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking