Fresh Crawl, Deep Crawl, Google Dance...
Par Olivier Duffez, Vendredi 22 novembre 2002
class="encadre">Mise à jour : cet article date de plusieurs années, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé : Google est mis à jour en permanence (crawl, indexation, algorithme, etc.) et les techniques décrites ici ne sont plus forcément applicables à 100% (par exemple il n'existe plus vraiment de Deep Crawl, Fresh Crawl et autres Full Crawl ou Google Dance)...
La vie d'une page sur le web est ponctuée en général de nombreuses visites, que ce soit de visiteurs (humains), de robots de moteurs de recherche voire de logiciel (aspirateurs de sites). Si la dernière catégorie n'intéresse pas vraiment le webmaster, il souhaite en général augmenter la fréquence des deux autres... Intéressons-nous aux visites des robots, par exemple celles de GoogleBot, le robot de Google.
Référencer des nouvelles pages
Après des heures de travail acharné, le webmaster publie enfin sa page sur son site. Il aura beau attendre des jours entiers, personne ne viendra la voir tant qu'il ne communiquera pas son adresse (URL). Pour la signaler à GoogleBot, il est possible d'aller remplir le formulaire de soumission d'URL, mais il vaut mieux tout simplement ajouter des liens vers cette page à partir de pages déjà indexées.
En fonction du nombre de liens et de l'importance des pages sur lesquelles figurent les liens (leur PageRank), GoogleBot va mettre entre 12h et 1 mois à venir voir cette nouvelle page. Il est facile de détecter son passage, soit en analysant les fichiers log, soit en utilisant RobotStats, un outil d'analyse temps réel des visites de GoogleBot.
En prenant le cas d'une page visitée dans les 12h qui suivent sa mise en ligne, il faut attendre en général encore quelques heures pour la trouver dans Google à partir d'une recherche par mots-clés. Ainsi, une nouvelle page liée par quelques pages à PageRank 5 ou 6 est détectée par Google en 12h, et ajoutée dans l'index en 24h !
La "prime de fraîcheur"
Vient ensuite une période faste pour cette nouvelle page : dans les premiers jours qui suivent son apparition sur Google, la page bénéficie d'une "prime de fraîcheur". A cet instant précis, cette page n'est passée que dans la première moitié de l'algorithme de Google, à savoir son indexation. Tous les mots ont été épluchés, les balises HTML décortiquées. Par contre Google n'a pas encore analysé la structure de liens vers et à partir de cette page. Cette page n'a donc pas encore de PageRank, même si la barre d'outils Google peut en indiquer un (à ce moment-là ce n'est qu'une estimation). Notez que dans le cas d'un nouveau site, la Toolbar reste bien grise et indique "La page affichée n'est pas indexée dans Google".
Grâce à cette "prime de fraîcheur", cette page a des chances de sortir en meilleure position que d'autres pages présentes dans Google depuis longtemps (et ayant un PageRank). Même si cette idée peut paraître étonnante, elle présente l'avantage de mettre en avant rapidement des pages d'actualité, puis de les retirer pour revenir à l'algorithme classique.
Les meilleures choses ayant malheureusement toujours une fin, il est fréquent de voir disparaître cette page de Google, surtout si elle ne bénéficiait pas de nombreux liens (ou de liens issus de pages à faible PageRank). Il ne faut pas s'inquiéter, elle reviendra !
Google Dance
Quelques jours (ou semaines) après, la Google Dance commence et le monde des webmasters tremble... Tous les webmasters soucieux de leur référencement se sont inscrits à l'alerte Google Dance. Google a terminé les analyses de liens et surtout les calculs de PageRank, et entame la diffusion de son nouvel index sur ces serveurs. Notre nouvelle page qui avait disparu est maintenant visible sur www2.google.com : il y a encore de l'espoir.
La Google Dance est maintenant terminée, et la nouvelle page apparait de nouveau dans Google au cours d'une recherche par mots-clés. Malheureusement elle a perdu quelques places... et son PageRank n'est pas fameux. En plus cette fois il s'agit d'un véritable PageRank calculé : il va donc falloir optimiser cette page pour augmenter son PageRank.
Full Crawl
Dès la fin de la Google Dance, pendant que le webmaster se débrouille pour optimiser son site, GoogleBot passe en régime d'indexation massive (full crawl). Il faut s'attendre à recevoir de nombreuses visites de GoogleBot pendant quelques jours (en provenance de plusieurs adresses IP, puisqu'il s'agit d'un programme distribué sur de nombreuses machines). C'est une bonne période pour ajouter des pages sur son site, en prévision de la prochaine Google Dance...
La machine Google semble désormais bien rodée pour gérer l'indexation régulière de 3 milliards de pages. En plus de l'analyse des nouvelles pages, il ne faut pas oublier que Google doit aussi déterminer les millions de pages qu'il doit supprimer, suite à leur disparition ou leur déplacement.
Note : après réflexion, il serait plus juste de commencer par le Full Crawl, car c'est l'étape la plus importante pour qu'un site soit indexé. Tant que votre site n'a pas "subi" de Full Crawl, il ne peut pas être complètement indexé dans Google.
A propos de l'auteur : Olivier Duffez
![]()
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Vous avez aimé cet article ? Partagez-le ! | Vous aimez WebRankInfo ? Suivez-nous ! |
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Sites de l'annuaire
- La Ludwave : une nouvelle nage ondulatoire hélicoïdale
- Annuaire web gratuit et référencement Google
- Cours et vidéos pour progresser en natation
- Cabinet de recrutement Google et Gmail
- Google PR
- Rodsbot, un Google Earth très insolite
- Livre sur le référencement Google (référencement naturel)
- My Google Maps sur votre site
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
Catégories des dossiers
- Actualité
- Android
- Autres produits Google
- Brèves
- Conseils référencement
- Débuter en référencement
- Droit et Internet
- e-marketing
- Ecrire pour le web et le référencement
- Gmail
- Google AdSense
- Google AdWords
- Google Analytics
- Google Chrome
- Google Images
- Google Labs
- Google Maps
- Google Mobile
- Google News
- Google Search
- Google Toolbar
- Google Webmaster Tools
- Google+
- Indexation Google
- L'entreprise Google
- Les API de Google
- Livres sur le référencement et les moteurs de recherche
- Outils
- PageRank
- R&D référencement
- Ranking Metrics
- Référencement Bing
- Référencement des images
- Référencement et PHP
- Référencement local
- Référencement Yahoo
- Référencement Yandex
- Réseaux sociaux
- Sitemaps
- Stratégies de liens
- Stratégies de mots-clés
- Techniques de référencement
- Webmastering
- WebRankInfo
- YouTube

