Date de mise a jour d'un site

WRInaute discret
Bonjour,
j'aimerais premièrement savoir sur google . pour la date de mise a jour d'un site, est-ce que google fait la mise a jour quand il voit qu'un fichier a été modifié ou lit-il tout le contenu de la page et si il y a des changement la il l'indexera?

Deuxiemement, dans alltheweb ou va t'il chercher la date de mise a jour d'un site?
 
WRInaute occasionnel
Melyndra a dit:
Bonjour,
j'aimerais premièrement savoir sur google . pour la date de mise a jour d'un site, est-ce que google fait la mise a jour quand il voit qu'un fichier a été modifié ou lit-il tout le contenu de la page et si il y a des changement la il l'indexera?

Deuxiemement, dans alltheweb ou va t'il chercher la date de mise a jour d'un site?

Bonjour,
le fonctionnement simplifié d'un robot indexeur est comme suit :
Le robot reçoit l'ordre de mettre à jour ou indexer une page.
* S'il ne l'a jamais visitée :arrow: Il va l'indexer.
* S'il la connaît déjà :
il exécute une requête HTTP de type HEAD pour recevoir les informations de la page sans son contenu (peu de trafic).
Si la page comporte une date de dernière modification :
-il compare la date de la page avec la date de la version dans le cache. Si la page en cache est plus ancienne, le robot visite la page pour mettre à jour.
Si la page ne nomporte pas de date de modification :
- la page est visitée, puis comparée avec la version en cache pour déterminer si elle a été mise à jour.

Les mises à jour de l'index de Google se font tous les jours grâce aux robots du fresh crawl (qui visitent un nombre réduit de pages) et environ une fois par mois mise à jour complète (c'est le fullcrawl, d'ailleurs ça va commencer dans pas longtemps).
es dates de mises à jour indiquées par Google et Alltheweb (et d'autres moteurs) correspondent aux dates auxquelles ces pages ont été visitées pour la dernière fois par les robots indexeurs.

J'espère que j'ai clarifié certains points.

Note : dans la pratique c'est plus compliqué que ça, j'ai volontairement simplifié les explications (je ne veux pas écrire d'encyclopédie non plus :? )

Explications supplémentaires disponibles dans les articles, la FAQ...voir menus tout en haut de cette page.

Jocelyn
 
WRInaute discret
Tres intéressant :)

J'ai d'autres questions ;)

que signifie exactement une requête Head?
Y a t-il d'autres types de requêtes?
Si la page comporte une date de dernière modification :
Ou doit-on mettre cette date?
Un tag particulier?
Quelle est la fréquence des visites du Robots qui exécute une requête de type Head?

Merci!
 
Nouveau WRInaute
Une requète HEAD, c'est une requète qui va juste envoyer certains entêtes, comme les dates de modif, le type de fichier, la taille, etc. Seul certains serveurs supportent cette requète (apache le gère très bien).
Pour la date de modif c'est basé sur la date de modif en hard, sur le disque dur donc rien à modifier.

pour les pages en dynamique ce sera l'heure qu'il est à ce moment la.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut