Vous êtes ici : Dossiers référencement > Indexation Google

Membre WebRankInfo ?

S'inscrire Aide

Googlebot a changé…

Olivier Duffez, Jeudi 2 octobre 2003

Mise à jour : cet article date de plusieurs années, attention à le lire avec le recul nécessaire, pour votre culture web personnelle !

Depuis environ 6 mois, Google a davantage changé ses méthodes que par le passé. Nous allons tenter de faire le point sur les modifications apportées à son fonctionnement ou son algorithme, en commençant par les techniques d'indexation utilisées par GoogleBot, le robot de Google. Pour rendre ceci plus concret, je suis parti d'un exemple…

Le système de diffusion d'actualités sur WebRankInfo a été récemment modifié. Avant, on affichait sur la page d'accueil les 4 dernières actualités, en entier ; chaque message comportait un titre, un texte, la mention de la source et un lien. Ces actualités étaient également disponibles dans les archives, avec une page par mois.

Maintenant, sont affichées sur la page d'accueil seulement des introductions de ces actualités, la suite étant accessible (via un lien depuis la page d'accueil) sur une autre page dont l'URL ne change jamais (même dans les archives). Il y a toujours une page d'archives par mois.
Ce système a également perturbé les URL des anciennes archives, mais j'ai mis une redirection serveur dans mon fichier .htaccess.

Expérimentation

Voici comment Google a réagi :

  • d'un seul coup, plus d'une centaine de nouvelles pages étaient créées sur WebRankInfo vendredi 19/09/2003 vers 23h. Le logiciel RobotStats permet d'analyser rapidement quel robot est venu, quand, sur quelles pages.
  • Le lendemain, samedi 20/09/2003, 5 versions du robot GoogleBot découvrent ces pages et commencent l'indexation. Les 5 dernières actualités, liées directement depuis la page d'accueil, sont indexées. Ensuite seront indexées la page d'accueil des archives, et quelques pages d'archives mensuelles.
  • Ce qui est plus intéressant à remarquer, c'est que ces 5 robots se sont répartis uniformément les 14 pages indexées (3 chacun sauf le dernier 2 pages).
  • Dimanche 21/09/2003, on constate que la totalité des nouvelles pages ajoutées 30 heures auparavant (environ 140 pages) ont été visitées par 28 versions différentes (au sens des adresses IP) de GoogleBot. Cependant, les seules pages présentes dans Google restent les 14 premières indexées samedi.
  • Lundi 22/09/2003, toutes les pages visitées par le robot sont présentes dans l'index, avec l'indication de la date d'indexation (cette date n'est indiquée que pendant 2 jours environ).

Toutes ces pages ont été indexées par la nouvelle forme de robots de Google, ceux qui indexent toutes les pages tous les jours… Il n'existe plus les 2 familles de robots (Fresh crawler et Full crawler) comme avant.

Changement avec le PageRank

L'affichage du PageRank dans la barre d'outils de Google, ne se fait plus exactement comme avant. En effet, il fallait auparavant attendre la prochaine Google Dance pour que la barre affiche un PageRank (calculé). Avant cette Google Dance, la barre affichait souvent une estimation du PageRank basée sur celui du répertoire parent, en retirant 1 point sur 10.

  • Aujourd'hui, quand une page est inconnue de Google, la barre n'affiche rien (elle est grise).
  • Quand Google est venu l'indexer, mais qu'il n'y a pas encore eu de Google Dance, la barre affiche un PageRank 0 (elle est toute blanche)
  • Quand Google a calculé son véritable PageRank, et que la Google Dance est arrivée, la barre affiche son PageRank réel (entre 0 et 10).

Par exemple, les 140 pages que Google vient d'indexer sur WebRankInfo ont toutes un PageRank de 0, mais ne sont pas « pénalisées », elles bénéficient au contraire d'une prime de fraîcheur pendant quelques jours.
Attention : il existe des exceptions… ceci est le fonctionnement le plus classique.

Conclusion : ce qui a changé :

  • GoogleBot passe plus fréquemment indexer les pages.
  • Il n'existe plus 2 catégories de robots (Fresh crawler et Full crawler) mais un seul qui remplit les deux rôles. Il n'est plus nécessaire d'attendre 1 mois que le robot du Full Crawl vienne indexer un site en profondeur.
  • L'affichage du PageRank sur la barre d'outils est plus standard, puisqu'il n'y a plus d'affichage de PageRank estimé.

Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

  • Déterminer l'âge d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).
  • Liste de sous-domaines
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
  • Calcul du taux de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking