Googlebot a changé…
Olivier Duffez, Jeudi 2 octobre 2003
Mise à jour : cet article date de plusieurs années, attention à le lire avec le recul nécessaire, pour votre culture web personnelle !
Depuis environ 6 mois, Google a davantage changé ses méthodes que par le passé. Nous allons tenter de faire le point sur les modifications apportées à son fonctionnement ou son algorithme, en commençant par les techniques d'indexation utilisées par GoogleBot, le robot de Google. Pour rendre ceci plus concret, je suis parti d'un exemple…
Le système de diffusion d'actualités sur WebRankInfo a été récemment modifié. Avant, on affichait sur la page d'accueil les 4 dernières actualités, en entier ; chaque message comportait un titre, un texte, la mention de la source et un lien. Ces actualités étaient également disponibles dans les archives, avec une page par mois.
Maintenant, sont affichées sur la page d'accueil seulement des introductions de ces actualités, la suite étant accessible (via un lien depuis la page d'accueil) sur une autre page dont l'URL ne change jamais (même dans les archives). Il y a toujours une page d'archives par mois.
Ce système a également perturbé les URL des anciennes archives, mais j'ai mis une redirection serveur dans mon fichier .htaccess.
Expérimentation
Voici comment Google a réagi :
- d'un seul coup, plus d'une centaine de nouvelles pages étaient créées sur WebRankInfo vendredi 19/09/2003 vers 23h. Le logiciel RobotStats permet d'analyser rapidement quel robot est venu, quand, sur quelles pages.
- Le lendemain, samedi 20/09/2003, 5 versions du robot GoogleBot découvrent ces pages et commencent l'indexation. Les 5 dernières actualités, liées directement depuis la page d'accueil, sont indexées. Ensuite seront indexées la page d'accueil des archives, et quelques pages d'archives mensuelles.
- Ce qui est plus intéressant à remarquer, c'est que ces 5 robots se sont répartis uniformément les 14 pages indexées (3 chacun sauf le dernier 2 pages).
- Dimanche 21/09/2003, on constate que la totalité des nouvelles pages ajoutées 30 heures auparavant (environ 140 pages) ont été visitées par 28 versions différentes (au sens des adresses IP) de GoogleBot. Cependant, les seules pages présentes dans Google restent les 14 premières indexées samedi.
- Lundi 22/09/2003, toutes les pages visitées par le robot sont présentes dans l'index, avec l'indication de la date d'indexation (cette date n'est indiquée que pendant 2 jours environ).
Toutes ces pages ont été indexées par la nouvelle forme de robots de Google, ceux qui indexent toutes les pages tous les jours… Il n'existe plus les 2 familles de robots (Fresh crawler et Full crawler) comme avant.
Changement avec le PageRank
L'affichage du PageRank dans la barre d'outils de Google, ne se fait plus exactement comme avant. En effet, il fallait auparavant attendre la prochaine Google Dance pour que la barre affiche un PageRank (calculé). Avant cette Google Dance, la barre affichait souvent une estimation du PageRank basée sur celui du répertoire parent, en retirant 1 point sur 10.
- Aujourd'hui, quand une page est inconnue de Google, la barre n'affiche rien (elle est grise).
- Quand Google est venu l'indexer, mais qu'il n'y a pas encore eu de Google Dance, la barre affiche un PageRank 0 (elle est toute blanche)
- Quand Google a calculé son véritable PageRank, et que la Google Dance est arrivée, la barre affiche son PageRank réel (entre 0 et 10).
Par exemple, les 140 pages que Google vient d'indexer sur WebRankInfo ont toutes un PageRank de 0, mais ne sont pas « pénalisées », elles bénéficient au contraire d'une prime de fraîcheur pendant quelques jours.
Attention : il existe des exceptions… ceci est le fonctionnement le plus classique.
Conclusion : ce qui a changé :
- GoogleBot passe plus fréquemment indexer les pages.
- Il n'existe plus 2 catégories de robots (Fresh crawler et Full crawler) mais un seul qui remplit les deux rôles. Il n'est plus nécessaire d'attendre 1 mois que le robot du Full Crawl vienne indexer un site en profondeur.
- L'affichage du PageRank sur la barre d'outils est plus standard, puisqu'il n'y a plus d'affichage de PageRank estimé.
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- Googlebot, le robot d'indexation de Google
- Le début du full crawl
- Début du Full Crawl
- Encore une Google Dance spéciale
- Présentation de l'indexation Google - Googlebot, le robot de Google
- La danse de Googlebot :-) La Google Dance
- L'algorithme de Google en résumé (mars 2003)
- Grosse activité de GoogleBot cette semaine (Fresh Crawl)
- Le deep crawl de GoogleBot sur WebRankInfo
- Frequence des full crawl de googlebot
- Le fresh-deep crawl c'est partiiiii !
- Googlebot et changement d'adresse IP pendant le full crawl
- "Deep Crawl" ou "Fresh Crawl"
- différence entre crawl.googlebot et crawler.googlebot ?
- Fin du full crawl, debut de la popularité
- Deep crawl de google aux USA
- Google dance / full crawl
- crawl et crawler googlebot ?
- On dirait que le deep crawl c'est commencer chez les amerlok
- Full Crawl : tous les combien de temps ?
- Full Crawl de Décembre : Par ici les discussions
- google crawl indexation nouveaux domaines
Consultez la description détaillée des produits ou services de Google suivants : Googlebot, Google Webmaster Tools, Google Sitemaps, Google PageRank, Google Toolbar
- Déterminer l'âge d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Liste de sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site. - Calcul du taux de liens profonds
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Hotel restaurant Le Pont Neuf à Florac Lozère dans les Gorges du Tarn
- Organisation coordination de tout type d'évènement en Haute Savoie
- Agence immobilière Somacimmo - Somain
- Hôtel de Bordeaux à La rochelle
- Vente en ligne de cactus plantes grasses et tillandsia
- TETRADIS, Distributeur spécialisé solutions interconnexion très haut débit
- Cartes, faire-parts et articles de papeterie à imprimer soi-même
- 17WebStore - Achetez aujourd'hui la technologie de demain
- Location de musique DJ pour trouver chaque soirée
- Santé des chiens et des chats : des vétérinaires répondent à vos questions
- Outils interactifs pour un développement durable facile en entreprises
- Must Animation : Dj animateur, organisation et l'animation évènementielle
- Location de villa et appartement à koh Samui en Thailande
- Le club des amateurs et passionnés des jeux de grille
- Colat Clés le Serrurier - Professionnel de la serrurerie en Guadeloupe


