Google en résumé
Un article de Eservice (Sécurité Internet), publié en mars 2003
Mise à jour : cet article date de 2003, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé : Google est mis à jour en permanence (crawl, indexation, algorithme, etc.).
Une recherche, deux fichiers cache, trois traitements
Cet article est une synthèse du fonctionnement du moteur de recherche Google. Vous trouverez à la suite, des liens pour approfondir le sujet.
Tout le monde connaît le moteur de recherche Google ( www.google.fr ). Mais comment fait-il pour trouver les nombreux résultats ( parfois plusieurs millions ) en une fraction de seconde ?
Il recherche les mots que vous avez saisis dans son fichier de pages Web qu'il a soigneusement enregistré au fur et à mesure du temps. Il s'agit plutôt d'une base de données, vu le volume très élevé qu'il a en mémoire ( plus de 3 milliards de pages ).
Cette base, appelée aussi « cache« , est alimentée par un robot, le « Googlebot« , qui parcourt le Web tous les jours. Ce phénomène s'appelle « fresh crawl » ou indexation. Il suit les hyperliens de page en page, et de site Web en site Web pour enrichir sa base de données (ajouter les nouvelles pages et mettre à jour les anciennes).
On peut voir le cache dans la liste des résultats en cliquant sur le lien du même nom : Google affiche la version de la page qu'il a en mémoire.
La page enregistrée peut être la version mise à jour par le webmaster pendant un ou deux jours, pour revenir ensuite à la version précédente : lorsqu'une page est mise à jour ou créée, sa nouvelle version apparaît momentanément dans le cache de Google, avec un classement plus favorable dans la liste des résultats de recherche. Google favorise ainsi les pages mises à jour régulièrement, a priori plus intéressantes pour les internautes. Passé ce délai, la version en cache et son positionnement reviennent à l'état antérieur.
Cette mise à jour sera enregistrée durablement dans le cache, ainsi que son positionnement réel dans les résultats de recherche, lors du traitement mensuel appelé « Google Dance« , qui dure quelques jours.
A la suite de la Google Dance, il opère un examen plus profond du Web pendant plusieurs jours, appelé « deep crawl« , au cours duquel il va décortiquer chaque page une par une, en particulier les liens entrants. Cette analyse mensuelle lui servira de base de calcul du positionnement des pages lors de la Google dance suivante, un mois plus tard environ.
En résumé
Une page aura son vrai positionnement au maximum deux mois suivant sa publication ( publication —> Google Dance 1 -> Full Crawl 1 —> Google Dance 2 ).
Ainsi d'un mois sur l'autre, en fonction des modifications et créations ( et suppressions ) de pages Web, le classement des résultats de recherche varie.
La base de données énorme de Google et son classement particulier des résultats en font l'outil de recherche le plus utilisé au monde à ce jour, et de loin (plus de 50 % des requêtes pour Google, entre 15 et 20 % seulement pour le deuxième outil de recherche).
A lire absolument :
- le moteur de recherche Google
- la vie d'une page sur le Web
- critères de positionnement sur Google
- 10 règles pour optimiser son référencement sur Google
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Le Full Crawl a enfin commencé
- La vie d'une page sur le web : Fresh Crawl, Deep Crawl, Google Dance
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Début du Full Crawl
- Les changements de Googlebot fin 2003
- Googlebot, le robot d'indexation de Google
- Le début du full crawl
- La danse de Googlebot :-) La Google Dance
- Explications sur le Crawl Caching Proxy de Google
- Présentation de l'indexation Google - Googlebot, le robot de Google
- Google dance / full crawl
- Grosse activité de GoogleBot cette semaine (Fresh Crawl)
- Frequence des full crawl de googlebot
- Googlebot et changement d'adresse IP pendant le full crawl
- Le crawl qui suit la Google Dance
- Le fresh-deep crawl c'est partiiiii !
- "Deep Crawl" ou "Fresh Crawl"
- Ca alors: le nouvel algorithme est + sympa niveau crawl
- But du full crawl?
- Full Crawl
- Prochain full crawl
- Un full crawl... chinois :)
- Forcer un full crawl ...?
- Full crawl démarré !
- Inktomi full crawl ??
Consultez la description détaillée des produits ou services de Google suivants : Googlebot, Google Feed Fetcher, Google Webmaster Tools, Google Sitemaps
- Test data centers Google
Cet outil vous permet d'afficher sur une seule page les résultats Google effectués sur de nombreux data centers (centres de données).
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Le portail de la gratuité
- Décoration artisanale pour chambre d'enfants : A la lune à la deux à la trois
- La revue du marketing alternatif
- At Dolls web agency crée et référence votre site Internet
- Pousada Habitat - Caraiva, Bahia, Brésil
- Résidence Hotel Sparvati - Bahia, Brésil
- Epuren: Garden and Home staging - Décoration et architecture d'intérieur
- Arbria : offrir un arbre cadeau
- Acca Larentina prêt à porter d'allaitement
- DZactu: Le quotidien algérien et kabyle- L'actualité d'Algérie et de Kabylie
- Site radin pour économiser avec trucs et astuces maison
- EBO events : créateur d'événements pour particuliers et entreprises
- CanaillouGoth pour les enfants d'une autre mode
- Martakech Immobilier : agence immobilière à Marrakech
- Poteries marocaines de Salé - Rabat - Maroc


