l'affichage de la date et le passage de google

Discussion dans 'Crawl et indexation Google, sitemaps' créé par zombui, 24 Juillet 2003.

  1. zombui
    zombui Nouveau WRInaute
    Inscrit:
    21 Juillet 2003
    Messages:
    5
    J'aime reçus:
    0
    le fait d'afficher tout le jour la date sur son site joue -t il sur le passage de Google.

    Google prend -t -il en compte le changement comme une mise à jour régulière?
    Cela permet-il de faire passer plus souvent google sur les pages(en dehors de la google dance bien sur)

    merci
    zombui :?
     
  2. Mirgolth
    Mirgolth WRInaute occasionnel
    Inscrit:
    14 Octobre 2002
    Messages:
    419
    J'aime reçus:
    0
    Quel est l'interêt de vouloir plein de passage de Bots s'il n'y aucune modification sur tes pages (en dehors de la date) ?

    Des passage fréquents sont intèressant pour que du contenu frais soit indexé rapidement. Si ce contenu est frais c'est qu'il y a eut des changement sur la page et il n'est donc pas nécessaire d'y ajouter des pseudo-modifications.

    Ta question est paradoxale...

    Mirgolth
     
  3. Qaghan
    Qaghan WRInaute discret
    Inscrit:
    11 Juin 2003
    Messages:
    245
    J'aime reçus:
    0
    Pas si paradoxal que ca a mon avis, une telle technique (encore faut-il qu'elle soit suivie par google) permettrait au contenu frais d'etre rapidement pris en compte par google independament de la frequece reelle de mise a jour du site...

    Je m'explique:

    - Google adapte la frequence de ses passages a la frequence des mises a jour constatees des pages
    - Supposons (uniquement pour l'exemple) que la frequence de passage de google est egale a celle qu'il constate au niveau du contenu...

    - Ainsi, si le contenu est mis a jour tous les mois, google passera une fois par mois...

    - Ce qui fait un delai moyen pour l'indexation des nouveaux contenus de 2 semaines (a priori aucune synchronisation)

    - En augmentant articificiellement la frequence de passage de Google a 1 fois par jour, le delai moyen d'indexation des nouveaux contenus passe a 12h bien que ceux-ci ne soient toujours mis a jour qu'une fois par mois...

    J'espere avoir ete suffisament explicite concernant l'interet d'une telle methode... Je ne pense pas que Google se fasse avoir aussi facilement, en ce cas, si tout le monde faisait ca je ne pense pas qu'il pourrait tenir la cadence... Et ce sont les sites aux mises a jour quotidiennes qui en patiraient :-(

    Olivier,

    Autre discussion qui a derivee vers ce sujet: https://www.webrankinfo.com/forum/t/comportement-de-google-vis-a-vis-des-pages-imprimables.3965/
     
  4. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    D'accord avec toi Qaghan sur l'intérêt de pouvoir augmenter la fréquence de visite de Googlebot...

    Mais un simple changement de date sur les pages ne suffit pas.

    La fréquence de passage des bots dépend de plusieurs facteurs, les "mises à jour" ne constituant que l'un de ces facteurs.

    D'ailleurs il faut s'entendre sur ce que l'on entend par mise à jour : les changements dans l'arborescence (ajout de nouvelles pages, suppression de pages) sont peut-être aussi importants que le changement du contenu dans les pages.
     
  5. mixmax06
    mixmax06 WRInaute occasionnel
    Inscrit:
    7 Mars 2003
    Messages:
    374
    J'aime reçus:
    0
    je confirme, la date ne change rien . J'utilise une include pour mon script et cela ne change absolument rien à la frequence de passage de googlebot, mais me permet de savoir les dates de maj après le crawl en regardant le cache.

    André
     
  6. dauzac
    dauzac WRInaute discret
    Inscrit:
    8 Avril 2003
    Messages:
    116
    J'aime reçus:
    0
    Et alors : quel genre d'algo Google utilise-t-il pour voir les évolutions sur le contenu ?
    Le checksum joue-t-il un rôle pour voir si "quelque chose" a bougé sur le site ?
    Existe-t-il un sous-checksum par page du site ?
    Le texte que l'on peut mettre dans un "calque" est-il analysé au même titre que du texte basic ?

    Merci d'éclairer nos lanternes.
     
  7. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 060
    J'aime reçus:
    329
    si tu parles du checksum de la toolbar, il est défini pour chaque URL (page)
     
  8. dauzac
    dauzac WRInaute discret
    Inscrit:
    8 Avril 2003
    Messages:
    116
    J'aime reçus:
    0
    Je pense au checksum dont on parle souvent dans WRI, et qui est donné par exemple par ABC-PR.exe
    Quel algorithme utilise Google pour savoir si un site évolue ou non ?
     
  9. Mies Van der Rohe
    Mies Van der Rohe WRInaute passionné
    Inscrit:
    7 Décembre 2002
    Messages:
    1 178
    J'aime reçus:
    0
    D'après mon expérience je pense que Google se fie au changement d'une page. J'ai deux pages au même rank, l'une est toujours la même, l'autre évolue quasiment tous les jours. La page qui évolue est crawlée tous les jours alors que l'autre toutes les semaines environ. A mon vais puisque Google enregistre ces pages en cache, il doit simplement comparer les pages nouvelles avec celle qui sont dans son cache.
     
  10. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 060
    J'aime reçus:
    329
    il n'y a pas de rapport entre le checksum et les fréquences de mise à jour.
    à ma connaissance le checksum ne change pas pour une URL donnée (en tout cas il n'a pas bougé depuis des mois)
     
  11. HISTOMOBILE
    HISTOMOBILE WRInaute discret
    Inscrit:
    8 Mai 2003
    Messages:
    188
    J'aime reçus:
    0
    Depuis la Dominique, je constate ceci.

    Pendant le mois, je perds toute les semaine des pages (1300 en un mois) puis comme d'habitude, entre le 25 et le 6, je regagne tout ce que j'ai perdu pendant le mois.

    De plus, avant GG réactualisait ma première page une fois par mois, maintenant (faudrait que je vérifie) mais ca à l'air d'être 2-3 fois par semaine, si pas tous les jours.

    Ca bouge bien avec GG depuis cette dominique, je trouve.
     
  12. Mies Van der Rohe
    Mies Van der Rohe WRInaute passionné
    Inscrit:
    7 Décembre 2002
    Messages:
    1 178
    J'aime reçus:
    0
    D'ailleurs a vorte avis elle s'appellera comment la prochaine Google dance? Je propose Enigma, car on on sait pas si elle sera ou quand elle sera
     
  13. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 060
    J'aime reçus:
    329
  14. Mies Van der Rohe
    Mies Van der Rohe WRInaute passionné
    Inscrit:
    7 Décembre 2002
    Messages:
    1 178
    J'aime reçus:
    0
  15. Mirgolth
    Mirgolth WRInaute occasionnel
    Inscrit:
    14 Octobre 2002
    Messages:
    419
    J'aime reçus:
    0
    .. et un garçon pour respecter l'alternance.

    Alors je propose FRanky ;)

    Mirgolth
     
  16. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    En fait, Google fait une utilisation intensive du champ IMS (is modified since) du header http. Googleguy avait déjà signalé en oct/nov 2002 (je ne suis pas sûr de la date) que les serveurs dont l'IMS était down ou désactivé étaient lourdement pénalisés.

    Dans ses dernières recommandations, Googleguy a à nouveau rappelé l'importance de l'IMS. En fait, le champ IMS a certainement pris encore plus d'importance depuis Esmeralda, puisque le crawling est permanent, et n'a plus ni début ni fin comme avec les deepcrawls. Donc, seules les pages "modifiées" d'après l'IMS sont "aspirées".

    Le robot envoie une requete GET avec la date du dernier fichier connu. Si l'IMS indique que le fichier a été modifié depuis, le serveur renvoie un code 200 et le nouveau contenu. Si le fichier n'a pas été modifié, le serveur renvoie un code 304, et pas de contenu.

    Le système est simple, économise la bande passante et raccourcit le temps de crawl.

    Pour évaluer la fréquence de mise à jour, mon petit doigt me dit que seul les changements indiqués par l'IMS sont évalués. Inutile de faire plus compliqué, car les changements dans les pages ne sont que l'un des facteurs pris en compte, et la fréquence optimum de mise à jour de l'index, selon de savantes études, doit être supérieure à la fréquence de changement de pages.
     
  17. Mirgolth
    Mirgolth WRInaute occasionnel
    Inscrit:
    14 Octobre 2002
    Messages:
    419
    J'aime reçus:
    0
    Ca se déguise facilement, toutes mes pages ont la ligne PHP suivante:
    Code:
    header("Last-Modified: " . gmdate("D, d M Y H:i:s") . " GMT"); // Always modified
    Elles sont donc constament modifiée au sens de l'IMS.

    Mirgolth
     
  18. Suede
    Suede WRInaute passionné
    Inscrit:
    4 Octobre 2002
    Messages:
    2 474
    J'aime reçus:
    0
    Je suis dubitatif :)

    Je ne pense pas que ce soit le seul critere. C'est un critere trop facile à modifier.
    A mon avis, c'est combiné à une analyse de la taille du fichier par exemple.
    Si on regarde plus loin, qu'elle est la date de modif d'un fichier php ?

    Cela devrait être facile à vérifier pour ceux qui ont accès à leur serveur : quelles sont les requetes effectuées et quelles sont les fichiers effectivement DL.

    François
     
  19. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    C'est la date de dernière modif du source ... Sauf si le script de Mirgolth ou un équivalent
    est employé, ce qui est conseillé... Par contre, déclarer que la page est modifiée à chaque requête, alors que ce n'est pas vrai, je ne trouve pas cela sympa ! :lol: :lol:

    Justement, je ne balance que rarement les trucs sans savoir, donc cette remarque se base aussi sur l'observation de mes logs, après que Googleguy eut insisté de manière suspecte sur cette histoire d'IMS la semaine dernière :

     
  20. Mirgolth
    Mirgolth WRInaute occasionnel
    Inscrit:
    14 Octobre 2002
    Messages:
    419
    J'aime reçus:
    0
    Je précise que le but est que les pages dynamiques ne soient pas misent en cache comme conseillé sur http://www.php.net/header
    Etant chez AOl, j'avais beaucoup de mal à tester les modifs de mes pages avant de mettre ça en place car les proxies AOL me renvoyant des vielles pages misent en cache :evil:

    Mirgolth
     
  21. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    Je m'en doutais un peu, donc ma remarque était vraiment "gratuite" : je le fais aussi sur des pages dynamiques dont la vitesse de modification est supérieure aux délais d'expiration par défaut des browsers.

    D'ailleurs, j'ai eu récemment un gag avec un de mes serveurs, dont l'horloge est en retard : la réponse de l'IMS est fausse, et dans ce cas là, la page reste en cache malgré tout...
    Beuh...

    Y'a toujours quelque chose pour vous pourrir la vie...
     
Chargement...
Similar Threads - affichage date passage Forum Date
affichage date et heure en francais Développement d'un site Web ou d'une appli mobile 25 Mars 2015
affichage de xx dates en fonction du jour Développement d'un site Web ou d'une appli mobile 24 Juin 2010
Affichage Google : Principales activités à découvrir Référencement Google 16 Octobre 2019
Affichage des urls dans google : url de la home et urls des autres pages d'un site Problèmes de référencement spécifiques à vos sites 1 Octobre 2019
Avis disparu de l'affichage Adwords ? AdWords 9 Août 2019
WordPress Affichage de l'auteur au lieu de la meta description Référencement Google 19 Juillet 2019
Modification des règles d'affichage des bannières AdSense AdSense 2 Juillet 2019
Mauvais affichage menu en https (https imposé par google) Développement d'un site Web ou d'une appli mobile 15 Juin 2019
Problème d'affichage meta titre Débuter en référencement 3 Juin 2019
Affichage sur Google avec notations utilisateurs (étoiles) Débuter en référencement 9 Février 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice