🧟‍♂️️ Vérifiez vos pages zombies SEO sur votre site !!! 🧟‍♀️️

Elles plombent votre référencement et ne vous rapportent rien...

Je le détaille dans mon tuto Pages Zombies

Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

La vie d’une page sur le web : Fresh Crawl, Deep Crawl, Google Dance…

Mise à jour : cet article date de plusieurs années, attention à le lire pour votre culture web personnelle ! En effet bien des choses ont changé : Google est mis à jour en permanence (crawl, indexation, algorithme, etc.) et les techniques décrites ici ne sont plus forcément applicables à 100% (par exemple il n’existe plus vraiment de Deep Crawl, Fresh Crawl et autres Full Crawl ou Google Dance)…

La vie d’une page sur le web est ponctuée en général de nombreuses visites, que ce soit de visiteurs (humains), de robots de moteurs de recherche voire de logiciel (aspirateurs de sites). Si la dernière catégorie n’intéresse pas vraiment le webmaster, il souhaite en général augmenter la fréquence des deux autres… Intéressons-nous aux visites des robots, par exemple celles de GoogleBot, le robot de Google.

Référencer des nouvelles pages

Après des heures de travail acharné, le webmaster publie enfin sa page sur son site. Il aura beau attendre des jours entiers, personne ne viendra la voir tant qu’il ne communiquera pas son adresse (URL). Pour la signaler à GoogleBot, il est possible d’aller remplir le formulaire de soumission d’URL, mais il vaut mieux tout simplement ajouter des liens vers cette page à partir de pages déjà indexées.

En fonction du nombre de liens et de l’importance des pages sur lesquelles figurent les liens (leur PageRank), GoogleBot va mettre entre 12h et 1 mois à venir voir cette nouvelle page. Il est facile de détecter son passage, soit en analysant les fichiers log, soit en utilisant RobotStats, un outil d’analyse temps réel des visites de GoogleBot.

En prenant le cas d’une page visitée dans les 12h qui suivent sa mise en ligne, il faut attendre en général encore quelques heures pour la trouver dans Google à partir d’une recherche par mots-clés. Ainsi, une nouvelle page liée par quelques pages à PageRank 5 ou 6 est détectée par Google en 12h, et ajoutée dans l’index en 24h !

La « prime de fraîcheur »

Vient ensuite une période faste pour cette nouvelle page : dans les premiers jours qui suivent son apparition sur Google, la page bénéficie d’une « prime de fraîcheur ». A cet instant précis, cette page n’est passée que dans la première moitié de l’algorithme de Google, à savoir son indexation. Tous les mots ont été épluchés, les balises HTML décortiquées. Par contre Google n’a pas encore analysé la structure de liens vers et à partir de cette page. Cette page n’a donc pas encore de PageRank, même si la barre d’outils Google peut en indiquer un (à ce moment-là ce n’est qu’une estimation). Notez que dans le cas d’un nouveau site, la Toolbar reste bien grise et indique « La page affichée n’est pas indexée dans Google ».
Grâce à cette « prime de fraîcheur », cette page a des chances de sortir en meilleure position que d’autres pages présentes dans Google depuis longtemps (et ayant un PageRank). Même si cette idée peut paraître étonnante, elle présente l’avantage de mettre en avant rapidement des pages d’actualité, puis de les retirer pour revenir à l’algorithme classique.

Les meilleures choses ayant malheureusement toujours une fin, il est fréquent de voir disparaître cette page de Google, surtout si elle ne bénéficiait pas de nombreux liens (ou de liens issus de pages à faible PageRank). Il ne faut pas s’inquiéter, elle reviendra !

Google Dance

Quelques jours (ou semaines) après, la Google Dance commence et le monde des webmasters tremble… Tous les webmasters soucieux de leur référencement se sont inscrits à l’alerte Google Dance. Google a terminé les analyses de liens et surtout les calculs de PageRank, et entame la diffusion de son nouvel index sur ces serveurs. Notre nouvelle page qui avait disparu est maintenant visible sur www2.google.com : il y a encore de l’espoir.

La Google Dance est maintenant terminée, et la nouvelle page apparait de nouveau dans Google au cours d’une recherche par mots-clés. Malheureusement elle a perdu quelques places… et son PageRank n’est pas fameux. En plus cette fois il s’agit d’un véritable PageRank calculé : il va donc falloir optimiser cette page pour augmenter son PageRank.

Full Crawl

Dès la fin de la Google Dance, pendant que le webmaster se débrouille pour optimiser son site, GoogleBot passe en régime d’indexation massive (full crawl). Il faut s’attendre à recevoir de nombreuses visites de GoogleBot pendant quelques jours (en provenance de plusieurs adresses IP, puisqu’il s’agit d’un programme distribué sur de nombreuses machines). C’est une bonne période pour ajouter des pages sur son site, en prévision de la prochaine Google Dance…

La machine Google semble désormais bien rodée pour gérer l’indexation régulière de 3 milliards de pages. En plus de l’analyse des nouvelles pages, il ne faut pas oublier que Google doit aussi déterminer les millions de pages qu’il doit supprimer, suite à leur disparition ou leur déplacement.

Note : après réflexion, il serait plus juste de commencer par le Full Crawl, car c’est l’étape la plus importante pour qu’un site soit indexé. Tant que votre site n’a pas « subi » de Full Crawl, il ne peut pas être complètement indexé dans Google.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

Un Commentaire

ROKHAYA FAYE

Bonjour

C’est très instructifs comme dossier, j’ai trouvé pas mal de réponse à des questions que je me posais, j’ai tiré beaucoup de leçon de votre dossier.
Merci tout simplement

Répondre