La densité de mots-clés et le référencement
Olivier Duffez, Lundi 14 septembre 2009
Cet article a pour objectif de tordre définitivement le cou à la croyance de l'existence d'un indice de densité de mots-clés idéal pour le référencement… Je donne de nombreux arguments qui me semblent convaincants ! Utilisez plutôt des techniques sérieuses d'optimisation éditoriale du référencement !
Le meilleur indice de densité de mots-clés pour Google

Le meilleur indice de densité pour le référencement enfin révélé en exclusivité par WebRankInfo !
Alors, c'est combien la meilleure densité ? Je lis ou entend en formation que l'indice idéal tourne entre 2% et 8% selon les « experts »… Certains avancent même des nombres supérieurs, entre 10% et 20%. Essayez de lire un texte avec 1 mot qui revient une fois sur 10 et demandez-vous s'il vous semble vraiment naturel…
En guise d'introduction, j'ai listé quelques exemples d'indices de densité mesurés par alyze.info (un bon outil d'un membre de WebRankInfo au passage). J'ai choisi uniquement des « mots-clés » constitués d'un seul mot sans accent (vous comprendrez pourquoi en lisant la suite de cet article), pour lesquels le site analysé arrive en 1er dans Google. Je n'ai donc analysé que des pages qui sortent en 1er dans Google : elles sont censées être bien optimisées pour le référencement ;-)
J'ai pris des exemples de toutes sortes pour montrer qu'on peut réussir avec des indices de densité très variés… Parfois la page sort 1ère en raison du netlinking mais d'autres fois c'est pour des raisons purement linguistiques.
- pour « 2006″ : 0,7% (Wikipédia) tandis que pour « 2008″ : 6,7% (Wikipédia) : alors, c'est quoi l'idéal ?
- pour « shareware » : 0,5% (Wikipédia) : la page parle de « partagiciel »…
- pour « google » : 9% (Google.fr) et pour « yahoo » : 2,7% (Yahoo FR) : page dépouillée ou très chargée…
- pour « subprimes » : 0,3% (Wikipédia) : le mot est utilisé surtout au singulier…
- pour « allo » : 0% (Allociné.fr) car le site reçoit de nombreux liens avec dans le texte de lien les mots « allo » et « ciné » séparés…
- pour « manipuler » : 0% (Wikipédia) car la page utilise d'autres formes du mot (manipulation, manipulations, etc.)…
Attention ! Ces exemples ne cherchent pas à prouver quoi que ce soit, ils ne sont là que pour provoquer des réflexions. Par contre les arguments qui suivent démontrent qu'il est impossible de déterminer la densité de mots-clés idéale pour le référencement.
Quand bien même il existerait un indice idéal…
Avec quel outil faut-il le calculer ?
Ceux qui donnent des valeurs ne disent pas avec quel outil les mesurer ! J'ai testé plusieurs outils pour le même cas, je n'ai pas obtenu une seule fois la même valeur précise ! D'ailleurs ces outils ne détaillent généralement pas leur méthode de calcul exacte.
Quelle est la véritable formule pour calculer l'indice de densité ?
Ceux qui parlent d'indice de densité donnent en général une formule très basique comme « nombre d'occurrences du mot-clé divisé par le nombre de mots dans la page ». Comment faut-il faire pour calculer l'indice d'une expression de 3 mots ? Faut-il diviser par le nombre d'expressions constituées de 3 mots ? Ou bien par le nombre de mots ? Ou bien le calcul est-il plus complexe dans le cas d'expressions de plus d'un mot ? Ca non plus pas grand monde n'en parle…
Faut-il tenir compte des balises meta ? de la balise Title ?
Là aussi, ceux qui donnent des valeurs ne disent généralement pas précisément quelle partie de la page HTML doit être analysée…
Faut-il tenir compte du contenu utile de la page uniquement ?
On sait bien que les moteurs évaluent les différentes zones des pages (la zone de contenu réel, spécifique à chaque page, est identifiée et séparée de l'entête, du pied de page, des marges, de la zone de navigation, etc.). Ceux qui donnent des valeurs de densité de mots-clés ne précisent généralement pas si elles concernent la page entière ou l'article uniquement. De toute façon comment pourrait-on calculer de la même façon que l'algorithme du moteur, si on ne connait pas le découpage de la page effectué par le moteur ?
Faut-il tenir compte des stop words ?
Si oui, lesquels ? Ceux qui donnent des valeurs n'en parlent que rarement et personne ne se risque à donner la liste des mots vides utilisés par Google ou les autres moteurs…
Faut-il tenir compte du contenu dans le Flash ?
On sait que Google peut récupérer le texte des animations Flash, alors quand on calcule la densité de mots-clés, faut-il tenir compte à la fois du texte alternatif et du texte inclus dans le Flash ?
Faut-il tenir compte des accents ?
On sait bien que les moteurs savent gérer les accents, donc faut-il considérer comme différents ou identiques 2 mots avec et sans accent ? Sachant que le sens du mot dépend parfois des accents (par exemple marche et marché).
Faut-il différencier singulier et pluriel ?
On sait bien que les moteurs savent identifier les versions singulier et pluriel d'un même mot, alors faut-il considérer comme différents ou identiques un mot au singulier et le même au pluriel ? Ceux qui parlent d'indice de densité ne s'embarrassent pas avec ce genre de considération…
Faut-il différencier les formes conjuguées ?
On sait bien que les moteurs savent identifier les différentes formes conjuguées d'un même mot, alors faut-il considérer comme différents ou identiques un verbe sous différentes formes conjuguées ? Ceux qui assurent qu'il existe un indice de densité optimal n'abordent pas ce genre de problème…
Faut-il tenir compte du nombre d'occurrences sur le web ?
Ceux qui calculent la densité de mots-clés d'une page font abstraction du reste du web. Pourtant le plus élémentaire serait de tenir compte à la fois de la fréquence des mots dans une page ET de la fréquence de ces mots sur l'ensemble du corpus (c'est l'idée du fameux TF IDF). En gros, si on imaginait qu'il existe un indice idéal, il serait différent pour chaque requête étudiée et changerait au cours du temps en fonction des publications sur le web…
Y a-t-il une densité idéale de mots-clés différente pour un site éditorial et un site marchand ?
Je ne sais pas… demandez à ceux qui pensent que ça existe ! En réalité ce n'est pas un sujet qu'ils abordent, pourtant il est évident qu'on n'applique pas les mêmes optimisations pour un site éditorial et pour un site marchand… Ca peut dépendre aussi des mots, par exemple si la densité idéale existait, elle serait sans doute différente pour des noms communs et pour des noms propres, non ?
L'indice de densité optimal n'existe pas !
Si après tout ça vous croyez encore tout ce qu'on vous raconte sur l'indice de densité idéal… alors je n'essaierai plus de vous convaincre :-) J'ai d'autres arguments mais ce serait trop long de les détailler ici.
Vous l'avez donc bien compris, il n'existe pas d'indice de densité idéal pour le référencement. D'ailleurs l'indice de densité n'est même pas pris en compte par les principaux moteurs.
Si vous souhaitez savoir ce qu'il faut faire pour écrire de façon efficace à la fois pour les internautes et le référencement, venez participer à ma formation sur le référencement éditorial ! En attendant, lisez au moins mes conseils sur la rédaction web optimisée pour le référencement…
On discute de la densité de mots-clés idéale pour le référencement naturel dans le forum Référencement éditorial de WebRankInfo.
PS: au fait c'est quoi l'indice de densité de cette page pour la requête « indice de densité » ? :-)
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- WebRankInfo lance un forum rédaction et référencement
- Les bonnes stratégies de mots-clés pour le référencement
- Traitement des mots par Google et notions linguistiques
- Outil de référencement SEO Playground Tool
- Nouvel outil : calculez la visibilité de votre site
- Nouvelle étude de WebRankInfo : les mots-clés et le référencement
- Search Engine Strategies - Londres
- Calculer l'indice de co-occurrence et le ratio E/F
- Comment bien écrire pour le référencement : conseils d'Olivier Duffez
- Interview de Véronique Martin, spécialiste web rédaction et référencement
- indice de densité des mots clés
- Indice de popu dans google ???
- indice-de-popularite....
- indice de densite.
- indice de densité
- outils indice-densite hs?
- A propos de lindice de popularité
- Pertinence Indice Y00VI
- diminution indice de popularité ?
- un indice de popularité de -1...lol
- Votre meilleur indice YooVi
- indice globale 0 classement 0 lien 0...
- indice de popularité et adresse IP commune
- Indice Yoovi : la mouture de novembre est sortie ...
- Quality Index de Yahoo - Panama (Indice de Qualité)
Consultez la description détaillée des produits ou services de Google suivants : Google Insights for Search, Google Sets, Google Suggest, Google Search-based Keyword Tool (sktool), Google Image Labeler
- Indice de co-occurrence et ratio E/F
Cet outil vous permet de calculer l'indice de co-occurrence de 2 ou 3 termes, ainsi que le ratio E/F. L'indice de co-occurrence mesure le relation entre les termes : plus cet indice est élevé, plus les termes sont reliés. Concrètement, plus l'indice est élevé, plus il est fréquent de trouver des documents qui contiennent les différents termes. - Indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
19 commentaires sur “L’indice de densité idéal pour le référencement”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- Guillaume Jan, Wildlife and Nature Photographer
- Blog mariage : informations et idées - Chalama
- Art'mail CONSEIL, Agence Conseil en Communication Digitale, Paris
- Pizza Pam - Pizzas à emporter ou à livrer à Pont-à-Mousson
- ADF Pneus à Jarny, vente de pneumatiques
- Moldes Barcelona fabrication de moules pour l'injection
- Isolation thermique, peinture en bâtiment (92)
- Permis de construire, administratif photovoltaïque, déclaration préalable
- Folie Cosmetic : maquillage et produits de beauté pas cher
- Beauté maquillage manucure à Nangeville
- Application de peinture industrielle, revêtements de murs Rhône-Alpes
- Entreprise d'électricité générale à Clary (59)
- Festival Arts Martiaux Perpignan 15 Mai 2010
- MGL, vente et location de mini grues
- Les caniches de la Garrigue des Eaux Vives



« au fait c’est quoi l’indice de densité de cette page pour la requête « indice de densité » ? :-) »
Et bien, pour un sujet qui veut prouver que ce n’est pas un critère !!!
Sinon, selon Alyze, la densité est de 3,4% pour 25 occurences du terme. Et ce, sous la forme de Title, de Alt, de gras (strong), de liens et de textes standards…
Cependant, sur ce terme là, WRI est second … … … … … Est-ce dû à la puissance SEOienne intrinsèque de WRI ou bien est-ce dû à la densité des mots-clef ?
ps : pas taper !
pps : à cause de ce commentaire, les statistiques sont différentes.
@loran : chez moi le 1er résultat est ma vieille page http://www.webrankinfo.com/outils/indice-densite.php
il n’y a bien sûr pas d’indice de densité idéal, en revanche il me semble qu’un excès (à tous les niveaux) est quand même pénalisant. il me semble important de le souligner.
Comme le signal loran, les commentaires cassent l’indice de départ.
Une seule chose est sure l’indice doit être supérieure à 0, par contre il peut aller jusqu’à 100 % … s’il n’ y a qu’un seul mot sur la page !! :)
Plus sérieusement sur certaines des SERP que je monitor on voit des densités de 30 % sur des pages certes courtes et des 2 % moins sur des longues, mais toutes bien positionnées, donc les ratio ideaux du style 3 à 8 % c’est de fait une légende !
@olivier : je me suis mal exprimé. Cette page arrive en second, alors que comme tu le soulignes, l’ancienne arrive toujours en premier.
Note pour plus tard (ou pour celui qui veut faire un test) : Effectuer un comparatif entre une page qui a de l’ancienneté (et donc du trust) et une nouvelle page, qui a la prime de fraicheur… Chacune des 2 pages mériterait d’être présente en 1er, l’une pour la confiance, l’autre pour la nouveauté car cela apporte quelque chose de plus valide (?).
En effet c’est bien des tests que vous faites: ce sont surement des choses qui cherchent à éclaircir le sombre qui règne sur l’argument, mais ceux-ci restent cependant des tests.
Comme dit Olivier les expressions au singulier et au pluriel sont deux choses complètement différentes, soit parce qu’ils donnent totalement un autre sens à la signification de la phrase et du contexte, soit parce qu’ils sont considérés comme non repris dans le comptage de mots pour le calcul de la densité.
Exemple: Rome tour et Rome tours, quand le mot tour va etre compté il ne va pas etre compté deux fois car le singulier ne va pas etre compté comme le meme mot inclus dans le pluriel.
Ce qui se note d’ailleurs dans les positions des SERP où ils ont carrément deux requetes bien distinctes.
@loran: une page qui a de l’ancienneté n’a pas forcément du trust, ce n’est pas une équation forcée…
Bon article, mais je trouve que les exemples sont mal pris. Les requêtes allo, Yahoo, Google ou autres ne sont pas les plus généralistes et ne sont pas des requêtes sur lesquelles chercheraient à se référencer des sites. Surtout quand le site qui sort premier a le mot-clé dans son Ndd, et est déjà très bien référencé.
J’aurais aimé qu’on regarde deux pages qui parlent par exemple du même thème sur un deux sites de notoriété équivalentes (comment la mesurer ?) et là, regarder ce qui se passe.
Les contre-exemples donnés ici seraient qualifiables de triviaux.
D’ailleurs, ils me font poser une question : les moteurs de recherche, au delà du référencement, n’attribuent pas des « noms » à un site ? JE veux dire, Yahoo, yaho, yah, yahooooo, yahou… renvoient tous sur la page Yahoo! Serait-il possible qu’au delà d’un référencement automatique, certains mots-clés sont attribués à un site comme une sorte de marque déposée ?
@Jip : les exemples ne cherchent absolument pas à démontrer quoi que ce soit, simplement à montrer qu’on peut arriver en 1er dans Google avec toutes sortes de valeurs de densité de mots-clés. Ils sont là pour « provoquer la réflexion » si je peux dire.
C’est inutile de chercher à démontrer quoi que ce soit sur la densité de mots-clés en se basant uniquement sur des exemples, car Google utilise trop de critères dans son algo.
Article intéressant !
Mais je ne comprends pas l’intérêt des exemples en début d’article…
Si l’indice de densité est un critère pertinent, il n’est certainement pas le seul (et tout le monde peut en convenir).
La page avec un indice de densité de 0% a sans doute un bien meilleur trust et backlinking que ses suivantes dans le classement…
Une page avec un indice de densité de 2-3% a peut-être moins besoin de travailler ses critères off-page…
Le seul moyen d’en être certain et est de réaliser des tests sur des pages iso pour une même requête…
Des volontaires ?
@shoplifter : comme je viens de l’expliquer en commentaires, les exemples en début d’article servent à faire prendre conscience qu’il y a toutes sortes d’indices de densité qui permettent d’arriver en 1er. Parfois c’est en effet grâce aux critères off-page, mais parfois c’est pour d’autres raisons, notamment linguistiques (pluriel, synonymes, etc.).
Et naturellement la tache difficile, quand on va faire interagir le travail off-page au résultat-hypothèse de cette fantomatique densité (qui n’est d’ailleurs pas près d’etre objectivement prouvée), c’est le bon réglage des efforts combinés (chose très ardue puisque nous ne pouvons pas nous baser sur des données certaines).
Donc un algo qui opère en sachant ce qu’il fait qui joue contre des webmasters qui s’efforcent de trouver la route dans le noir à la lumière d’une chandelle, il n’y aura pas de « no contest » selon moi…
C’est vrai que c’est du flan l’indice de densité, comme les metas description,
Pour bien être référencé l’unique chose à faire c’est le netlinking et un bon titre…
Qu’en est-il de l’indice de densité des mots des anchor des liens !?
Je crois qu’ils prennent une place importante dans le positionnement d’une page pour une requète définie.
Es-ce considéré comme une sur-optimisation que de créer un menu contenant par exemple « Mot clé » Ville
Certes, cela fait grimper l’indice de densité d’une page, mais aussi le positionnement de la page pour une requete « Mot clé » Ville…
Je pense que c’est surveillé de près par Google, + qu’avant en effet. C’est avantageux pour les pages liées mais je pense que ça fait partie de la suroptimisation.
Tu as des retours d’expérience sur le sujet ?
PS: attention aussi au bourrage de mots-clés dans les anchor text des liens des commentaires sur les blogs ;-)
Olivier, je comprends bien, mais provoquer la réflexion avec des requêtes du style « yahoo », « google »… Ce n’est pas ça qui va aider à penser que l’indice de densité n’est pas déterminant. Comme de la même façon, pour démontrer que le PR n’est pas (plus) important, on ne va pas dire que sur la requête « Yahoo », Yahoo.fr sort devant d’autres sites mieux pagerankés. Enfin je ne trouve pas que ce sont de bons contre-exemples…
OK pour yahoo et google. Mais pour les autres ? Au passage, il ne s’agit pas de contre-exemples…
Le Naturel est riche en enseignements. L’indice de densité nous fait tomber dans un travail de référencement mécanique qui n’est pas forcément bon. Il faut être un artisan et travailler les sites au cas par cas, penser toujours à leur apporter une valeur ajoutée (de contenu)…
http://twitter.com/yagraphic/statuses/4348842554
Si on tient compte du diagramme de Salton en plus, où les expressions répétées dans un texte font perdre du poids au contenu de la page entière, on ne sait plus où se placer pour chercher à obtenir un résultat équilibré….