Les nouveautés de l'algorithme de Google
Olivier Duffez, Mardi 13 janvier 2004
Mise à jour : cet article date de plusieurs années, attention à le lire avec le recul nécessaire, pour votre culture web personnelle !
Depuis la Google Dance baptisée Florida en novembre dernier, les changements dans l'algorithme de Google ont été nombreux. Mais sont-ils pour autant évidents à identifier ? Je vous indique quelques pistes de réflexion.
Tout ce qui a circulé sur le web à ce sujet n'est pas à prendre à la lettre, c'est le moins que l'on puisse dire. Voici néanmoins ce dont il a été question :
- le filtre basé sur une liste de mots ( »commerciaux »)
- le filtre de « sur-optimisation »
- mise en place de la lemmatisation (stemming)
- l'algorithme Hilltop
- et bien d'autres théories…
Le filtre basé sur une liste de mots ( »commerciaux »)
Une des premières rumeurs qui a circulé est celle de la création par Google d'un filtre qui modifierait les résultats dits « classiques ». Ce filtre serait appliqué seulement pour certaines requêtes contenant un des mots figurant sur une liste de mots-clés caractérisant des requêtes commerciales, et qui pourrait facilement être défini à partir des mots achetés par les clients des AdWords. L'idée sous-jacente était de penser que Google défavorise spécialement les sites commerciaux afin qu'ils achètent des AdWords. D'une part Google a toujours indiqué que les services Moteur et Publicité sont bien distincts, d'autre part il me semble bien dangereux pour Google de se lancer dans ce genre d'opération…
Le filtre de « sur-optimisation »
Une autre idée a été de penser que Google avait mis en place un filtre détectant les pages sur-optimisées. Cela pourrait par exemple toucher les pages dont l'indice de densité d'un des mots-clés de la requête est trop important (le seuil a pu être abaissé). Cela peut concerner également les pages dont tous les liens entrants (backlinks) contiennent les mêmes termes (et encore plus si ces termes se retrouvent dans le titre, la balise H1 et le reste du texte de la page). Néanmoins, de nombreux contre-exemples ont montré que ceci ne s'appliquait pas toujours, ce qui semble indiquer que ce n'est pas la bonne explication.
Mise en place de la lemmatisation (stemming)
Google a récemment annoncé avoir commencer à introduire la lemmatisation. Cette technique consiste à tronquer automatiquement un mot pour retrouver le mot racine, ce qui permet de fournir à une requête donnée des résultats comprenant des mots de la même racine. Cependant d'une part l'influence du stemming est secondaire par rapport aux autres changements introduits par Google, et d'autre part mes essais n'ont pas été concluants, même avec l'exemple donné par Google. Cette fonctionnalité n'est donc peut-être pas encore en place…
L'algorithme Hilltop
Cet algorithme modifie la façon de mesurer la popularité d'une page sur le web par rapport à l'algorithme désormais classique du PageRank. Les deux changements majeurs sont que la popularité d'une page est mesurée pour une thématique donnée, et que cette mesure dépend du nombre et de l'importance des sites experts qui font un lien vers elle. Cette notion de sites experts rejoint l'analyse déjà ancienne de la répartition du web en « hubs » et en « authorities ». L'algorithme Hilltop est en général efficace si des sites experts peuvent être correctement trouvés pour la requête donnée ; sinon, aucun résultat n'est fourni. Il pourrait donc être utilisé pour des requêtes générales. Cela dit, il semble aujourd'hui trop coûteux pour être utilisé en temps réel.
Autres théories
On pourrait également citer les idées suivantes, avancées sans toujours un fondement solide :
- Google avantage les sites affichant des publicités AdSense,
- Google avantage les sites ayant acheté des publicités AdWords,
- Google désavantage les sites commerciaux, repérés par leur inscription dans Yahoo,
- Google avantage les sites présents dans Froogle, le moteur shopping de Google,
- Google désavantage les sites ayant de mauvais voisinages en termes de liens sortants (mais aussi entrants !) vers des sites ne respectant pas les règles de Google,
- Google trace désormais les clics dans les pages de résultats et a intégré ces statistiques dans les classements,
- Google cherche à diversifier les types de pages dans les résultats, pour ne pas toujours afficher en premier les gros sites commerciaux,
Attention à ne pas croire une de ces théories seulement parce que vous l'avez lue dans un article ou un forum : il vaut mieux la vérifier prudemment plutôt que de commencer à détruire les optimisations actuelles de votre site !
Conclusion
Finalement, nous voyons qu'il est bien plus difficile que prévu d'analyser réellement en quoi consiste ce nouvel algorithme. Certains articles nous laissent penser que les choses sont maintenant évidentes, mais sans jamais aucune preuve à l'appui, sans exemples en nombre… Ce qui est certain, c'est que Google ajuste souvent son algorithme (l'accélération des mises à jour du PageRank en est une preuve), parfois en introduisant des changements majeurs, d'autres fois en corrigeant seulement les erreurs générées par ces modifications. Il ne fait pas de doute également que l'algorithme actuel ne repose pas essentiellement sur le PageRank, et que certaines idées décrites dans la littérature doivent refléter une partie de la réalité. Il faut donc s'attacher à les analyser pour évaluer la probabilité qu'elles soient déjà appliquées par Google.
Il reste donc nécessaire, encore plus que jamais, d'analyser finement le comportement de l'algorithme de Google. D'une part, étudier les résultats affichés pour différents types de requêtes (très générales, très spécifiques, dand un domaine commercial, de l'information, etc.). D'autre part, il faut comprendre les spécificités de chaque site, ses contraintes, ses atouts et ses facteurs bloquants, tâche en générale d'autant plus complexe que le site est important.
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Rumeurs nouvel algorithme Google
- Algorithme de classement de google modifié ?
- Algorithme de calcul du checksum Google a jour ?
- [Google Images] VisualRank - Algorithme - Evolutions
- Nouvel algorithme du checksum de la Google Toolbar
- Indices sur le nouvel algorithme de google
- Google PageRank : Liens payants ou nouvel algorithme ?
- Aligner un span à droite
- <strong> ou <span style bold>
- [Reglé] [CSS] <SPAN> dans <A>
- Pb saut de ligne dans balise <SPAN>
- Les dangers d'un algorithme trop serré
- Nouvelle Algorithme...
- Algorithme Moteur de Réservation!!
- algorithme des moteurs de recherche
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
- Similarité et duplicate content
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Escale Détente : Spa Hammam Massages à Bordeaux
- Vente de spa, jacuzzi et cabines de sauna infrarouge en ligne JFC
- Logiciels de gestion commerciale
- Location de gite à Vagnas en Ardèche méridionale avec piscine
- Enchère inversées Kazoom : gagnez de nombreux lots
- Syllatech : dépannage informatique à Colombes dans les Hauts-de-Seine
- Tibet Village Projet Association de soutien aux tibétains
- Anne Gianni, créatrice d'oeuvres en céramique. Vente à Paris
- Anora Kanesiri créatrice de mode et styliste modéliste
- Communauté de graphisme automobile
- Sophrologie et relation d'aide
- Chatterie de sphynx, élevage familial, chats nus canadiens
- S.o.S Plantes - Conseils en jardinage
- Planet Vélo, votre magasin de vélos dans les Yvelines
- Cap Web Informatique à Flers


