Voir aussi
Études
Articles de WRI
- Redirections 302
- Google Toolbar 3
- Rel="NoFollow"...
- L'effet sandbox
- Foire aux backlinks
- Redirections sauvages
- Détournement de page
- Afficher un flux RSS
- Intégrer un flux RSS
- Le PR est-il mort ?
- Analyse référencement
- Google Data Centers
- L'algo de janvier 2004
- Google Deskbar
- Google Dance oct 2003
- GoogleBot change
- Calculatrice Google
- J'ai de la chance
- Google.fr, Google.com
- GoogleBot détaillé
- Bilan 2002
- Chanson au PR Noel
- Viewer, WebQuotes
- La vie d'une page
- Les labos de Google
- Google API
- Phénomène de société
- L'algorithme parfait
- La Google danse...
Autres articles
- Pénalités de Google
- Ma théorie sandbox
- Le secret des doubles-résultats
- Marketing viral
- Le projet Opquast
- Forum phpBB
- Sessions et langues
- Référencement multilingue
- Google en résumé
- Réécriture d'URL
- URL Rewriting
- URL Rewriting : intro
- Fichier .htaccess
PHP
Google en résumé
Un article de Eservice (Sécurité Internet)
Une recherche, deux fichiers cache, trois traitements
Cet article est une synthèse du fonctionnement du moteur de recherche Google. Vous trouverez à la suite, des liens pour approfondir le sujet.
Tout le monde connaît le moteur de recherche Google ( www.Google.fr ). Mais comment fait-il pour trouver les nombreux résultats ( parfois plusieurs millions ) en une fraction de seconde ?
Il recherche les mots que vous avez saisis dans son fichier de pages Web qu'il a soigneusement enregistré au fur et à mesure du temps. Il s'agit plutôt d'une base de données, vu le volume très élevé qu'il a en mémoire ( plus de 3 milliards de pages ).
Cette base, appelée aussi "cache", est alimentée par un robot, le "Googlebot", qui parcourt le Web tous les jours. Ce phénomène s'appelle "fresh crawl" ou indexation. Il suit les hyperliens de page en page, et de site Web en site Web pour enrichir sa base de données (ajouter les nouvelles pages et mettre à jour les anciennes).
On peut voir le cache dans la liste des résultats
en cliquant sur le lien du même nom : Google affiche
la version de la page qu'il a en mémoire.
La page enregistrée peut être la version mise
à jour par le webmaster pendant un ou deux jours, pour
revenir ensuite à la version précédente
: lorqu'une page est mise à jour ou créée,
sa nouvelle version apparaît momentanément dans
le cache de Google, avec un classement plus favorable dans
la liste des résultats de recherche. Google favorise
ainsi les pages mises à jour régulièrement,
a priori plus intéressantes pour les internautes. Passé
ce délai, la version en cache et son positionnement
reviennent à l'état antérieur.
Cette mise à jour sera enregistrée durablement dans le cache, ainsi que son positionnement réel dans les résultats de recherche, lors du traitement mensuel appelé "Google Dance", qui dure quelques jours.
A la suite de la Google Dance, il opère un examen plus profond du Web pendant plusieurs jours, appelé "deep crawl", au cours duquel il va décortiquer chaque page une par une, en particulier les liens entrants. Cette analyse mensuelle lui servira de base de calcul du positionnement des pages lors de la Google dance suivante, un mois plus tard environ.
En résumé une page aura son vrai positionnement au maximum deux mois suivant sa publication ( publication ---> Google Dance 1 -> Full Crawl 1 ---> Google Dance 2 ).
Ainsi d'un mois sur l'autre, en fonction des modifications et créations ( et suppressions ) de pages Web, le classement des résultats de recherche varie.
La base de données énorme de Google et son classement particulier des résultats en font l'outil de recherche le plus utilisé au monde à ce jour, et de loin (plus de 50 % des requêtes pour Google, entre 15 et 20 % seulement pour le deuxième outil de recherche).
A lire absolument :
- le moteur de recherche Google
- la vie d'une page sur le Web
- critères de positionnement sur Google
- 10 règles pour optimiser son référencement sur Google
Publicités
- Hébergement web pro

- Pour un bon référencement, il faut un bon hébergeur.
- Testez Sivit, l'hébergeur choisi par WRI (garantie 30 jours satisfait ou remboursé) à partir de 1,90 EUR HT/mois
- Best seller
