Etude de Googlebot : le FreshBot et le DeepBot
Olivier Duffez, Vendredi 5 septembre 2008
Petite étude réalisée en 2002 et 2003 sur les différentes formes de Googlebot, le robot de crawl de Google.
Mise à jour : cet article date de plusieurs années, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé : Google est mis à jour en permanence (crawl, indexation, algorithme, etc.) et les techniques décrites ici ne sont plus forcément applicables à 100%…
Pour commencer une petite étude sur Googlebot, le robot d'indexation de Google, voici un graphique donnant (pour 2 sites tests) :
- l'évolution du nombre de visites quotidiennes de Googlebot
- l'évolution du nombre de pages vues quotidiennes par Googlebot
- le rappel des dates des débuts de Google Dance (updates)
Cette étude sera complétée au fur et à mesure des mises à jour de Google…


Analyses
Googlebot en Juillet 2002
Googlebot vient indexer largement les sites pendant la Google Dance (ou quelques jours après).
Googlebot en Août 2002
Les deux sites utilisés pour ces statistiques ayant optimisé leur référencement dans Google, le nombre de visites de Googlebot a augmenté (tout comme le nombre de pages vues). Il n'est plus si évident que ça de faire un lien entre les dates des mises à jour et les pics de visites de Googlebot.
Il reste encore à analyser l'écart entre la date de visite d'une page donnée par Googlebot et sa date de disponibilité dans les résultats sur Google…. Suite au prochain épisode !
Googlebot en Septembre 2002
Comme nous en avions discuté sur le forum Google, Google a semble-t-il changé un peu sa façon d'indexer les sites. GoogleBot vient en effet plus souvent pour essayer d'avoir du contenu « frais », c'est-à-dire le plus à jour possible. Conséquence : il y a bien plus de visites de Googlebot sur nos sites ! Autre conséquence : la Google Dance apporte moins de changements qu'avant.
Googlebot en Mars 2003
Depuis septembre 2002 dernier les habitudes de Googlebot ont pu être beaucoup plus cernées, comme je l'explique dans l'article La vie d'une page sur le web. Il existe deux sortes de robots Googlebot:
- le Fresh bot (Freshbot) : ce robot Googlebot passe tous les jours (sur les sites bien référencés) pour mettre à jour les pages dans son index. Seul le texte est analysé, pas la structure entre pages.
- le Deep bot (Deepbot) : ce robot Googlebot passe pendant environ une semaine juste après la fin de la Google Dance. Il effectue une indexation intensive des sites (full crawl).
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Etude de Googlebot, le robot d'indexation de Google
- La danse de Googlebot :-) La Google Dance
- Googlebot, le robot d'indexation de Google
- Le Full Crawl a enfin commencé
- Mise à jour de Google Images (Juillet 2006)
- Mise à jour de Google Images (16/04/2006)
- Google crawle les fichiers CSS
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Comment créer une page web en PHP
- Le référencement de pages PHP
- Etude de Googlebot, le robot d'indexation de Google
- Mediapartners-Google/2.1 (+http://www.googlebot.com/bot.html
- Le bot d'Adsense à la rescousse de GoogleBot ?
- Nouveau bot (Googlebot/Test) ???
- différence entre crawl.googlebot et crawler.googlebot ?
- fresh bot
- Visites quotidiennes du Fresh bot en ce moment ?
- Nouveau site est pas de Googlebot officiel, mais la visite d'un bot noname ...
- Grosse activité du bot (pas deep)?
- Google Wireless Transcoder : vieux Bot ou nouveau Bot ?
- Grosse activité de GoogleBot cette semaine (Fresh Crawl)
- [Robotstats] un bot nommé Crawler
- bot ou crawler open source çà existe ?
- Le deep crawl de GoogleBot sur WebRankInfo
- Bot spécifique pour crawler les pages contenant des ADSENSES
Consultez la description détaillée des produits ou services de Google suivants : Googlebot, Google Feed Fetcher
- Calcul du taux de backlinks vers pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Hotel restaurant Le Pont Neuf à Florac Lozère dans les Gorges du Tarn
- Organisation coordination de tout type d'évènement en Haute Savoie
- Agence immobilière Somacimmo - Somain
- Hôtel de Bordeaux à La rochelle
- Vente en ligne de cactus plantes grasses et tillandsia
- TETRADIS, Distributeur spécialisé solutions interconnexion très haut débit
- Cartes, faire-parts et articles de papeterie à imprimer soi-même
- 17WebStore - Achetez aujourd'hui la technologie de demain
- Location de musique DJ pour trouver chaque soirée
- Santé des chiens et des chats : des vétérinaires répondent à vos questions
- Outils interactifs pour un développement durable facile en entreprises
- Must Animation : Dj animateur, organisation et l'animation évènementielle
- Location de villa et appartement à koh Samui en Thailande
- Le club des amateurs et passionnés des jeux de grille
- Colat Clés le Serrurier - Professionnel de la serrurerie en Guadeloupe


