Théorie sur la sandbox

Un article de B. Tolman, le 15/01/2005

Benjamin Tolman nous donne son avis personnel sur l’effet sandbox

De plus en plus de monde évoque la sandbox, un terme employé sur les forums américains et désormais mis à toutes les sauces, ce qui commence naturellement à m’agacer car il est au référencement ce que l’asthme est à la médecine, c’est-à-dire un fourre-tout magique qu’on donne en réponse à des problèmes qu’on ne sait pas diagnostiquer.

Bref, une fois de plus je vous propose une théorie, je rappelle que je ne suis pas influencé par qui que ce soit et que ces raisonnements sont à prendre avec de la distance, mais pas pour autant à écarter, lisez plutôt…

Introduction

Je ne crois pas à la sandbox comme étant un phénomène d’évincement systématique de nouveaux sites dans les classements de Google, je crois tout simplement à une courbe d’évolution avec un degré de tolérance, un peu comme une courbe de croissance d’un enfant.

Elle doit certainement prendre plusieurs paramètres, ceux auxquels j’ai pensé sont l’âge et la popularité. Il est tout naturel que Google ne puisse pas vous propulser directement dans les 3 premières pages d’une recherche très concurrentielle après quelques semaines d’existence sinon les « sites de référence » seraient rapidement chassés et la pertinence du moteur serait remise en question.

Détails sur le phénomène

Revenons maintenant à cette courbe. Pour moi, tout comme un enfant, un site doit évoluer de manière constante jusqu’à atteindre un stade dit de maturité qui le rendra crédible pour l’outil de recherche Google. Un site, tout comme un enfant, a le droit dès la naissance d’avoir des proportions anormales, sa croissance elle aussi a le droit d’être fracassante, et tant qu’elle est constante tout va bien.

Seulement, un site qui part avec une quantité faramineuse de backlinks (« BL ») quelques jours après sa première indexation, et qui n’évolue plus jamais, autrement dit qui acquiert son stade de maturité en terme de popularité dès sa naissance est suspect.

En revanche, un site qui part de manière relativement correcte et qui entretient sa croissance de manière constante et normale, est lui considéré comme conforme.

Autrement dit, si l’on place la barre assez haut dès la naissance d’un site, il faut savoir assumer ce départ et entretenir cette croissance pendant quelques mois.

Ce raisonnement est naturel il n’y a rien de magique là-dedans : un site est un produit, et comme tout produit commercialisé il traverse forcément différents stade de vie, je vous propose d’ailleurs de consulter la rubrique PLC – Analyse du cycle de vie des produits pour voir où je veux en venir.

Les aspects techniques de la SandBox

Pour terminer ma théorie, je voudrais souligner les aspects techniques de la sandbox, à savoir comment Google pourrait-il mettre en place un système détectant un lancement de site non naturel.

Comme je l’ai expliqué précédemment, je pense que Google ne tient pas compte d’une quantité de liens pointant vers un site, mais bien d’un coefficient de progression calculé à des intervalles cruciaux de la vie d’un site pour vérifier s’il entre bien dans une courbe de normalité, encore une fois comme un pédiatre le ferait pour un enfant.

Comment donc peut-il juger qu’un coefficient entre dans la normalité alors que chaque site part avec un capital BL différent ?

C’est très simple, il a établi une courbe de normalité comme ont pu le faire les médecins avec l’échelle de croissance pour les être humains, à savoir établir des mesures sur une quantité énorme d’échantillons afin que l’on puisse trouver un repère en terme de normalité ou d’anormalité.

Cependant la différence entre les prémices d’un site et d’un être humain est de taille : en effet un site peut partir avec un nombre de backlinks des milliers de fois supérieur à un autre, cela ne l’empêchera pas d’être viable. A la naissance, l’être humain ne peux être viable en deçà d’un certain poids et ne peux physiologiquement pas peser plus d’un certain poids, autrement dit l’écart de viabilité se résume à quelques kilos.

Pour le référencement nous avons donc une plage de possibilité infinie, nous nous retrouvons donc dans l’impossibilité d’avoir une notion de normalité ou d’anormalité … Sauf si on établit une courbe de référence pour les sites démarrant dans un intervalle de BL compris entre X et Y, une autre courbe pour les sites démarrant entre Q et P, etc.

Pour illustrer cela je vous propose un petit schéma, notez bien qu’il n’y a pas d’échelles, en effet je ne peux pas les deviner, et personne d’autre ne peut le faire à moins de procéder à des milliers de tests, d’où la puissance de cet algorithme, si c’est bel et bien lui qui a été mis en place.

Schéma explicatif sur la théorie de la sandbox
© Benjamin Tolman

Comme vous pouvez le constater ce schéma est composé de deux courbes, elles représentent une catégorie de sites dont le nombre de BL de départ est compris dans l’intervalle [X,Y].

Comme vous le savez, le sandbox n’intervient pas à intervalles réguliers ou lors de perturbations visibles de Google (mise à jours des BL, Google Dance, …), il tombe sur le nez soit peu après la naissance d’un site, soit subitement sans que l’on comprenne pourquoi.

Pour essayer de répondre à cette question j’ai parsemé le schéma de différentes valeurs X (X1 et X2) et Y (Y1 et Y2) qui représentent des moments cruciaux de la vie de ce type de site en terme de popularité, ces derniers étant encore une fois calculés sur des millions de sites. Notez bien que pour plus de précision Google a peut-être utilisé des intervalles de temps et non des points précis, en d’autre termes utilise-t-il simplement des points pour se réferencer sur la courbe, ou calcule-t-il la pente de la courbe sur plusieurs intervalles de dates pour établir ses comparaisons ?

Il est également difficile de savoir comment Google peut réagir s’il juge un site anormal, le met-il automatiquement en sandbox ? Ajoute-il ce critère à d’autres pour décider du sort du site ?

Autant de questions auxquelles je n’ai pas la prétention de répondre car je n’en ai tout simplement pas la moindre idée.

Après avoir lu cet article, une question vous viendra peut être à l’esprit : si un site est mis en sandbox, comment peut-il en ressortir si son nombre de BL est largement supérieur au maximal autorisé par la courbe ? Devra-t-il attendre plusieurs mois, voire plusieurs années avant de réapparaître dans les résultats ?

Bien qu’on m’ait reporté des cas extrêmement longs de mise à l’écart de sites par Google, je doute qu’il faille attendre que la courbe atteigne le seuil de BL du site avant que celui-ci puisse réintégrer le classement, en effet cela signifierait qu’une centaine de backlinks le replongerait dans la sandbox… Mais rappelez-vous tout-à-l’heure nous avons évoqué le fait qu’il devait forcément exister plusieurs courbes selon le nombre de backlinks à la naissance. Pour pallier notre problème, il suffirait donc qu’après une mise en bac à sable, Google transfère le site dans un référentiel supérieur qui correspond davantage au cycle de vie que ce dernier a pris.

C’est ainsi que cet article s’achève, j’espère qu’il vous aura plu, notez bien une dernière fois que c’est une simple théorie et qu’il faut prendre de la distance avec cette dernière sans toutefois l’ignorer car elle reste plausible et pourrait, si elle s’avérait exacte, expliquer beaucoup de choses…

Discussion dans le forum Discutez de l’article Théorie sur la sandbox dans le forum

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.