Vous êtes ici : Dossiers référencement > Actualité

Membre WebRankInfo ?

S'inscrire Aide

Prise en compte du singulier et du pluriel par les moteurs de recherche

Comment les moteurs de recherche tiennent-ils compte des différentes formes d'un mot (singulier/pluriel) ? Nous savons bien que les moteurs repèrent la racine commune du mot (stemming), si bien qu'en utilisant le singulier sur une page, on peut bien sortir dans les résultats pour une requête au pluriel (et réciproquement). L'attribution d'un brevet sur la question à Yahoo est l'occasion de revenir sur ce sujet d'étude du référencement...

Le brevet sur la transformation entre singulier et pluriel

Pour résumer le brevet (Word pluralization handling in query for web search, attribué à Yahoo le 7 août 2008 et décrit dans l'article How a Search Engine Might Handle Singular and Plural Queries), je dirais que pour choisir les résultats, le moteur ne tient pas strictement compte de la forme utilisée par l'internaute dans sa requête. C'est-à-dire qu'on a beau utiliser le singulier dans la requête, si le moteur estime que cela vaut le coup d'afficher des résultats qui auraient été sélectionnés si on avait utilisé le pluriel, alors il fait un savant mélange des 2 groupes de résultats et c'est ce que l'utilisateur voit au final.

Tout d'abord, le système construit une sorte de dictionnaire des mots concernés (ceux qui prennent une forme différente au singulier et au pluriel, et qui valent la peine d'être étudiés). Les mots retenus pour cette analyse sont déterminés en cherchant dans la requête le dernier mot qui ne soit pas un stop-word (ou mot vide, c'est-à-dire un mot non porteur de sens, qui n'apporte rien ou presque à la requête, comme par exemple "la" dans la requête "la Tour Eiffel").

Ensuite, le système analyse les résultats obtenus pour les 2 requêtes (la requête initiale et celle obtenue en inversant singulier et pluriel sur le mot sélectionné).

D'après les auteurs du brevet, environ la moitié des requêtes des internautes comportent au moins un mot qui peut ainsi être transformé entre le singulier et le pluriel. Cela ne veut pas dire pour autant que cette transformation soit bénéfique dans tous les cas...

Vous pouvez en savoir plus en lisant l'article (PDF) des mêmes auteurs Context Sensitive Stemming for Web Search.

Comment faut-il donc rédiger son contenu de manière efficace ?

A vrai dire, j'ai beau tourner et retourner le problème dans tous les sens, je ne vois pas réellement ce qu'on peut tirer de ces descriptions algorithmiques en vue d'une optimisation du référencement. En effet, comme dans la plupart des cas étudiés en référencement, de nombreux paramètres entrent en jeu :

  • du côté des algorithmes :
    • les moteurs savent très bien reconnaître les différentes formes d'un mot, donc on pourrait dire : à quoi bon mettre les 2 formes (singulier et pluriel) si le moteur ramène tout à la même racine ?
    • les moteurs utilisent des algorithmes similaires à celui décrit dans ce brevet, consistant à fournir des résultats "mixtes" (mélange singulier et pluriel) quelle que soit la forme utilisée dans la requête (je schématise un peu trop sans doute...).
  • du côté des humains :
    • les internautes font souvent leurs requêtes majoritairement avec une certaine forme (le singulier d'après ce que je constate) ; autant donc privilégier dans les pages web à optimiser la forme utilisée par ceux qui vous cherchent
    • ceux qui produisent du contenu (sans chercher à écrire pour optimiser le référencement) utilisent la forme qui leur semble adéquate selon les cas. Là aussi on peut calculer quelques statistiques basées sur les occurrences ou les co-occurrences, mais il faut reconnaître que seuls les moteurs disposant d'un index représentatif du web peuvent faire des analyses fiables.

En conclusion, quand vous rédigez vos contenus, je vous conseille tout simplement :

  • de vous renseigner sur la forme majoritairement utilisée par les internautes (singulier ou pluriel), en utilisant des outils comme Google Trends, les suggestions de Google Insights for Search ou le générateur de mots-clés de Google AdWords
  • d'utiliser cette forme prépondérante aux endroits les plus stratégiques de votre site comme le titre des pages (balises title et h1), le nom d'une catégorie de produits, d'une rubrique du site, etc.
  • d'utiliser la forme secondaire à d'autres endroits de la page
  • de procéder de la même manière pour l'optimisation du netlinking : utiliser la forme prépondérante dans les textes de lien des backlinks de meilleure qualité, et la forme secondaire dans les backlinks de moindre qualité.

N'oubliez pas de consulter également mon petit guide de la rédaction web orientée référencement.

Et vous ?

Et vous, avez-vous une stratégie particulière pour optimiser le référencement au pluriel et au singulier ? On discute de l'impact singulier / pluriel pour le référencement dans le forum WebRankInfo.

Par Olivier Duffez , Mardi 9 septembre 2008

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur LinkedIn

Olivier DuffezConsultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).

Vous avez aimé cet article ? Partagez-le !

Vous aimez WebRankInfo ? Suivez-nous !

Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

6 commentaires

  1. gif dit :

    Peut être les internautes tapent au singulier mais lorsque nous mettons au pluriel, l'internaute a plus de chance de trouver le site parce que dans le mot au pluriel il a le singulier. Exemple tatas lorsque l'internaute tape tatas il trouve le site et lorsque qu'il tape tata il le trouve aussi. Tandis si nous ajoutons tata, quand l'internaute tape tatas il ne trouve pas le site donc une perte de visiteurs. Moins de chances.

  2. Olivier Duffez dit :

    Tu es sûr d'avoir bien lu et fait quelques tests ? Google sait très bien reconnaître que différentes formes d'un mot ont la même racine, notamment en ce qui concerne le singulier et le pluriel. Donc pour prendre ton exemple (pas super choisi), Google sait que tatas est le pluriel de tata, et inversement. D'ailleurs le pluriel ne se résume pas à ajouter un S... Tape la requête [cheval] et tu verras que Google te met en gras "chevaux" en plus de "cheval".

  3. Bruno dit :

    Bonjour à tous et Merci Olivier pour cet article

    Mais moi-aussi, j'ai pas tout compris.
    D'un côté, Olivier affirme "le moteur ne tient pas strictement compte de la forme utilisée par l'internaute dans sa requête". De l'autre, il conseille d'en tenir compte dans la rédaction du contenu.

    De plus, j'ai fait qq essais avec Google et Yahoo en utilisant les deux formes singulier/pluriel, sur plusieurs requêtes (notamme celle avec tata/tatas) et le résultat est différent dans les deux formes.

    Des éclaircissements ?

  4. Olivier Duffez dit :

    Pour résumer, je dirais que même quand une des versions domine largement (c'est souvent le singulier), c'est une erreur de tout miser sur celle-ci, et comme souvent dans la rédaction web pour le référencement il faut jouer sur toutes les possibilités. J'indique ma méthode (mais je suis curieux de connaître les vôtres) : d'abord déterminer quelle version prédomine (tests utilisateurs ou outils style Google Insights), puis utiliser la version qui domine aux endroits clés et l'autre aux endroits secondaires.

    je reconnais que globalement mon article n'est pas clair ! désolé...

  5. MQC dit :

    Votre commentaire en tout cas résume à mon sens très bien le comportement qu'il faut probablement suivre :-) (C'est ma technique en tout cas !)

    Il faut évidemment déjà avoir un certain nombre de pages annexes pour que ce soit viable.

  6. Phil dit :

    Bonjour

    Pour mon cas personnel, j'ai du mettre dans la description, les mots clé au pluriel puis au singulier. Voir pour la recherche "musique francophone" et "musiques francophones" sur Google (qui d'ailleurs sort des résultats différents). Sur Yahoo mon site (francomix) ne sort pas sur la requête au singulier.

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).

WebRankInfo sur Twitter

Suivez-moi sur Twitter !
WebRankInfo Twitter

Hébergement web

Hebergement web mutualise, dedie

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.