Vous êtes ici : Dossiers référencement > Stratégies de liens

Membre WebRankInfo ?

S'inscrire Aide

Théorie sur la sandbox

Un article de Benjamin Tolman (Fleurs livraison), le 15/01/2005

Benjamin Tolman nous donne son avis personnel sur l'effet sandbox

De plus en plus de monde évoque la sandbox, un terme employé sur les forums américains et désormais mis à toutes les sauces, ce qui commence naturellement à m'agacer car il est au référencement ce que l'asthme est à la médecine, c'est-à-dire un fourre-tout magique qu'on donne en réponse à des problèmes qu'on ne sait pas diagnostiquer.

Bref, une fois de plus je vous propose une théorie, je rappelle que je ne suis pas influencé par qui que ce soit et que ces raisonnements sont à prendre avec de la distance, mais pas pour autant à écarter, lisez plutôt…

Introduction

Je ne crois pas à la sandbox comme étant un phénomène d'évincement systématique de nouveaux sites dans les classements de Google, je crois tout simplement à une courbe d'évolution avec un degré de tolérance, un peu comme une courbe de croissance d'un enfant.

Elle doit certainement prendre plusieurs paramètres, ceux auxquels j'ai pensé sont l'âge et la popularité. Il est tout naturel que Google ne puisse pas vous propulser directement dans les 3 premières pages d'une recherche très concurrentielle après quelques semaines d'existence sinon les « sites de référence » seraient rapidement chassés et la pertinence du moteur serait remise en question.

Détails sur le phénomène

Revenons maintenant à cette courbe. Pour moi, tout comme un enfant, un site doit évoluer de manière constante jusqu'à atteindre un stade dit de maturité qui le rendra crédible pour l'outil de recherche Google. Un site, tout comme un enfant, a le droit dès la naissance d'avoir des proportions anormales, sa croissance elle aussi a le droit d'être fracassante, et tant qu'elle est constante tout va bien.

Seulement, un site qui part avec une quantité faramineuse de backlinks ( »BL ») quelques jours après sa première indexation, et qui n'évolue plus jamais, autrement dit qui acquiert son stade de maturité en terme de popularité dès sa naissance est suspect.

En revanche, un site qui part de manière relativement correcte et qui entretient sa croissance de manière constante et normale, est lui considéré comme conforme.

Autrement dit, si l'on place la barre assez haut dès la naissance d'un site, il faut savoir assumer ce départ et entretenir cette croissance pendant quelques mois.

Ce raisonnement est naturel il n'y a rien de magique là-dedans : un site est un produit, et comme tout produit commercialisé il traverse forcément différents stade de vie, je vous propose d'ailleurs de consulter la rubrique PLC – Analyse du cycle de vie des produits pour voir où je veux en venir.

Les aspects techniques de la SandBox

Pour terminer ma théorie, je voudrais souligner les aspects techniques de la sandbox, à savoir comment Google pourrait-il mettre en place un système détectant un lancement de site non naturel.

Comme je l'ai expliqué précédemment, je pense que Google ne tient pas compte d'une quantité de liens pointant vers un site, mais bien d'un coefficient de progression calculé à des intervalles cruciaux de la vie d'un site pour vérifier s'il entre bien dans une courbe de normalité, encore une fois comme un pédiatre le ferait pour un enfant.

Comment donc peut-il juger qu'un coefficient entre dans la normalité alors que chaque site part avec un capital BL différent ?

C'est très simple, il a établi une courbe de normalité comme ont pu le faire les médecins avec l'échelle de croissance pour les être humains, à savoir établir des mesures sur une quantité énorme d'échantillons afin que l'on puisse trouver un repère en terme de normalité ou d'anormalité.

Cependant la différence entre les prémices d'un site et d'un être humain est de taille : en effet un site peut partir avec un nombre de backlinks des milliers de fois supérieur à un autre, cela ne l'empêchera pas d'être viable. A la naissance, l'être humain ne peux être viable en deçà d'un certain poids et ne peux physiologiquement pas peser plus d'un certain poids, autrement dit l'écart de viabilité se résume à quelques kilos.

Pour le référencement nous avons donc une plage de possibilité infinie, nous nous retrouvons donc dans l'impossibilité d'avoir une notion de normalité ou d'anormalité … Sauf si on établit une courbe de référence pour les sites démarrant dans un intervalle de BL compris entre X et Y, une autre courbe pour les sites démarrant entre Q et P, etc.

Pour illustrer cela je vous propose un petit schéma, notez bien qu'il n'y a pas d'échelles, en effet je ne peux pas les deviner, et personne d'autre ne peut le faire à moins de procéder à des milliers de tests, d'où la puissance de cet algorithme, si c'est bel et bien lui qui a été mis en place.

Schéma explicatif sur la théorie de la sandbox
© Benjamin Tolman

Comme vous pouvez le constater ce schéma est composé de deux courbes, elles représentent une catégorie de sites dont le nombre de BL de départ est compris dans l'intervalle [X,Y].

Comme vous le savez, le sandbox n'intervient pas à intervalles réguliers ou lors de perturbations visibles de Google (mise à jours des BL, Google Dance, …), il tombe sur le nez soit peu après la naissance d'un site, soit subitement sans que l'on comprenne pourquoi.

Pour essayer de répondre à cette question j'ai parsemé le schéma de différentes valeurs X (X1 et X2) et Y (Y1 et Y2) qui représentent des moments cruciaux de la vie de ce type de site en terme de popularité, ces derniers étant encore une fois calculés sur des millions de sites. Notez bien que pour plus de précision Google a peut-être utilisé des intervalles de temps et non des points précis, en d'autre termes utilise-t-il simplement des points pour se réferencer sur la courbe, ou calcule-t-il la pente de la courbe sur plusieurs intervalles de dates pour établir ses comparaisons ?

Il est également difficile de savoir comment Google peut réagir s'il juge un site anormal, le met-il automatiquement en sandbox ? Ajoute-il ce critère à d'autres pour décider du sort du site ?

Autant de questions auxquelles je n'ai pas la prétention de répondre car je n'en ai tout simplement pas la moindre idée.

Après avoir lu cet article, une question vous viendra peut être à l'esprit : si un site est mis en sandbox, comment peut-il en ressortir si son nombre de BL est largement supérieur au maximal autorisé par la courbe ? Devra-t-il attendre plusieurs mois, voire plusieurs années avant de réapparaître dans les résultats ?

Bien qu'on m'ait reporté des cas extrêmement longs de mise à l'écart de sites par Google, je doute qu'il faille attendre que la courbe atteigne le seuil de BL du site avant que celui-ci puisse réintégrer le classement, en effet cela signifierait qu'une centaine de backlinks le replongerait dans la sandbox… Mais rappelez-vous tout-à-l'heure nous avons évoqué le fait qu'il devait forcément exister plusieurs courbes selon le nombre de backlinks à la naissance. Pour pallier notre problème, il suffirait donc qu'après une mise en bac à sable, Google transfère le site dans un référentiel supérieur qui correspond davantage au cycle de vie que ce dernier a pris.

C'est ainsi que cet article s'achève, j'espère qu'il vous aura plu, notez bien une dernière fois que c'est une simple théorie et qu'il faut prendre de la distance avec cette dernière sans toutefois l'ignorer car elle reste plausible et pourrait, si elle s'avérait exacte, expliquer beaucoup de choses…

Discussion dans le forum Discutez de l'article Théorie sur la sandbox dans le forum


Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Sandbox, Google TrustRank

  • Calcul du nombre de backlinks
    Cet outil vous permet d'analyser en détails la "popularité" de votre site sur Google. En plus du nombre de liens pris en compte par Google, il calcule le pourcentage de liens internes parmi tous les liens, et il affiche les premières URL trouvées.
  • Détection de pages dupliquées
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Synthèse du référencement Google
    Cet outil vous donne un petit résumé de l'état de référencement de votre site dans Google.
  • Calcul du taux de backlinks vers pages internes
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
  • Partenaires pour échanger des liens
    Cet outil vous liste quelques sites qui font des liens vers des sites similaires au vôtre, pour vous aider à trouver des partenaires pour des échanges de liens.


Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking