Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Gestion singulier/pluriel dans le référencement (algo Google)

Comment les moteurs de recherche tiennent-ils compte des différentes formes d'un mot (singulier/pluriel) ? Nous savons bien que les moteurs repèrent la racine commune du mot (stemming), si bien qu'en utilisant le singulier sur une page, on peut bien sortir dans les résultats pour une requête au pluriel (et réciproquement). L'attribution d'un brevet sur la question à Yahoo est l'occasion de revenir sur ce sujet d'étude du référencement...

Le brevet sur la transformation entre singulier et pluriel

Pour résumer le brevet (Word pluralization handling in query for web search, attribué à Yahoo le 7 août 2008 et décrit dans l'article How a Search Engine Might Handle Singular and Plural Queries), je dirais que pour choisir les résultats, le moteur ne tient pas strictement compte de la forme utilisée par l'internaute dans sa requête. C'est-à-dire qu'on a beau utiliser le singulier dans la requête, si le moteur estime que cela vaut le coup d'afficher des résultats qui auraient été sélectionnés si on avait utilisé le pluriel, alors il fait un savant mélange des 2 groupes de résultats et c'est ce que l'utilisateur voit au final.

Tout d'abord, le système construit une sorte de dictionnaire des mots concernés (ceux qui prennent une forme différente au singulier et au pluriel, et qui valent la peine d'être étudiés). Les mots retenus pour cette analyse sont déterminés en cherchant dans la requête le dernier mot qui ne soit pas un stop-word (ou mot vide, c'est-à-dire un mot non porteur de sens, qui n'apporte rien ou presque à la requête, comme par exemple "la" dans la requête "la Tour Eiffel").

Ensuite, le système analyse les résultats obtenus pour les 2 requêtes (la requête initiale et celle obtenue en inversant singulier et pluriel sur le mot sélectionné).

D'après les auteurs du brevet, environ la moitié des requêtes des internautes comportent au moins un mot qui peut ainsi être transformé entre le singulier et le pluriel. Cela ne veut pas dire pour autant que cette transformation soit bénéfique dans tous les cas...

Comment faut-il donc rédiger son contenu de manière efficace ?

A vrai dire, j'ai beau tourner et retourner le problème dans tous les sens, je ne vois pas réellement ce qu'on peut tirer de ces descriptions algorithmiques en vue d'une optimisation du référencement. En effet, comme dans la plupart des cas étudiés en référencement, de nombreux paramètres entrent en jeu :

  • du côté des algorithmes :
    • les moteurs savent très bien reconnaître les différentes formes d'un mot, donc on pourrait dire : à quoi bon mettre les 2 formes (singulier et pluriel) si le moteur ramène tout à la même racine ?
    • les moteurs utilisent des algorithmes similaires à celui décrit dans ce brevet, consistant à fournir des résultats "mixtes" (mélange singulier et pluriel) quelle que soit la forme utilisée dans la requête (je schématise un peu trop sans doute...).
  • du côté des humains :
    • les internautes font souvent leurs requêtes majoritairement avec une certaine forme (le singulier d'après ce que je constate) ; autant donc privilégier dans les pages web à optimiser la forme utilisée par ceux qui vous cherchent
    • ceux qui produisent du contenu (sans chercher à écrire pour optimiser le référencement) utilisent la forme qui leur semble adéquate selon les cas. Là aussi on peut calculer quelques statistiques basées sur les occurrences ou les co-occurrences, mais il faut reconnaître que seuls les moteurs disposant d'un index représentatif du web peuvent faire des analyses fiables.

En conclusion, quand vous rédigez vos contenus, je vous conseille tout simplement :

  • de vous renseigner sur la forme majoritairement utilisée par les internautes (singulier ou pluriel), en utilisant des outils comme Google Trends, les suggestions de Google Insights for Search ou le générateur de mots-clés de Google AdWords
  • d'utiliser cette forme prépondérante aux endroits les plus stratégiques de votre site comme le titre des pages (balises title et h1), le nom d'une catégorie de produits, d'une rubrique du site, etc.
  • d'utiliser la forme secondaire à d'autres endroits de la page
  • de procéder de la même manière pour l'optimisation du netlinking : utiliser la forme prépondérante dans les textes de lien des backlinks de meilleure qualité, et la forme secondaire dans les backlinks de moindre qualité.

N'oubliez pas de consulter également mon petit guide de la rédaction web orientée référencement.

Et vous ?

Et vous, avez-vous une stratégie particulière pour optimiser le référencement au pluriel et au singulier ? On discute de l'impact singulier / pluriel pour le référencement dans le forum WebRankInfo.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

6 commentaires

Phil

Bonjour

Pour mon cas personnel, j'ai du mettre dans la description, les mots clé au pluriel puis au singulier. Voir pour la recherche "musique francophone" et "musiques francophones" sur Google (qui d'ailleurs sort des résultats différents). Sur Yahoo mon site (francomix) ne sort pas sur la requête au singulier.

Répondre
MQC

Votre commentaire en tout cas résume à mon sens très bien le comportement qu'il faut probablement suivre :-) (C'est ma technique en tout cas !)

Il faut évidemment déjà avoir un certain nombre de pages annexes pour que ce soit viable.

Répondre
Olivier Duffez

Pour résumer, je dirais que même quand une des versions domine largement (c'est souvent le singulier), c'est une erreur de tout miser sur celle-ci, et comme souvent dans la rédaction web pour le référencement il faut jouer sur toutes les possibilités. J'indique ma méthode (mais je suis curieux de connaître les vôtres) : d'abord déterminer quelle version prédomine (tests utilisateurs ou outils style Google Insights), puis utiliser la version qui domine aux endroits clés et l'autre aux endroits secondaires.

je reconnais que globalement mon article n'est pas clair ! désolé...

Répondre
Bruno

Bonjour à tous et Merci Olivier pour cet article

Mais moi-aussi, j'ai pas tout compris.
D'un côté, Olivier affirme "le moteur ne tient pas strictement compte de la forme utilisée par l'internaute dans sa requête". De l'autre, il conseille d'en tenir compte dans la rédaction du contenu.

De plus, j'ai fait qq essais avec Google et Yahoo en utilisant les deux formes singulier/pluriel, sur plusieurs requêtes (notamme celle avec tata/tatas) et le résultat est différent dans les deux formes.

Des éclaircissements ?

Répondre
Olivier Duffez

Tu es sûr d'avoir bien lu et fait quelques tests ? Google sait très bien reconnaître que différentes formes d'un mot ont la même racine, notamment en ce qui concerne le singulier et le pluriel. Donc pour prendre ton exemple (pas super choisi), Google sait que tatas est le pluriel de tata, et inversement. D'ailleurs le pluriel ne se résume pas à ajouter un S... Tape la requête [cheval] et tu verras que Google te met en gras "chevaux" en plus de "cheval".

Répondre
gif

Peut être les internautes tapent au singulier mais lorsque nous mettons au pluriel, l'internaute a plus de chance de trouver le site parce que dans le mot au pluriel il a le singulier. Exemple tatas lorsque l'internaute tape tatas il trouve le site et lorsque qu'il tape tata il le trouve aussi. Tandis si nous ajoutons tata, quand l'internaute tape tatas il ne trouve pas le site donc une perte de visiteurs. Moins de chances.

Répondre