Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Google identifie les formes des mots (singulier/pluriel notamment)

Depuis longtemps, pour Google, les mots « patinoire » et « patinoires » sont différents, si bien que si on veut être positionné sur les 2 formes, il faut prévoir les 2 cas (par exemple créer 2 pages). Il est possible que ceci soit en train de changer, voici donc quelques pistes de réflexion.

En anglais, Google sait assez bien reconnaître la relation entre des mots « sémantiquement proches » (*), même s’ils n’ont pas la même racine. En utilisant l’opérateur tilde devant un mot, Google peut fournir des résultats ne portant pas uniquement sur les mots de la requête, mais aussi sur des mots associés. Il semble que ce soit le cas maintenant en français (peut-être ai-je des mois de retard et que le support du français date déjà…).

Une recherche de ~musique montre que Google sait que le mot « chanson » est « sémantiquement proche » du mot « musique ». Résultats de la recherche ~musique

Edit : attention, depuis, Google a supprimé son opérateur ~ de recherche spéciale…

Mais attention ! Il faut bien distinguer la phase d’analyse de la pertinence des pages web pour une requête donnée (application de l’algorithme de Google) de celle de l’affichage des résultats. La mise en gras de certains mots dans l’affichage des résultats n’indique pas (forcément) que le même processus a été utilisé lors de la première phase.

Aujourd’hui, d’après l’affichage des résultats dans Google, il est indéniable que Google sait reconnaître (en français) :

  • le singulier et le pluriel
  • d’autres formes du même mot
  • d’autres mots « sémantiquement proches »

Toutes les formes ne sont pas encore reconnues. Je vous invite à en discuter dans le forum (voir les liens en fin d’article).

Exemple avec la recherche petit pain au chocolat qui affiche en gras le mot « pains » au pluriel : Résultats de la recherche "petit pain au chocolat"

Exemple avec la recherche installer une patinoire qui affiche en gras le mot « installation » en plus du mot « installer » : Résultats de la recherche "installer une patinoire"

En conclusion, il reste à faire des tests pour savoir si cette prise en compte des différentes formes des mots (ou mots proches) est faite uniquement à l’affichage ou bien aussi dans l’algorithme de Google. Si cette deuxième hypothèse se révélait vérifiée, il faudrait certainement revoir sa façon d’optimiser ses pages (même si conseiller d’utiliser différentes variations de mots n’est pas nouveau…). Ceux qui en sont restés au stade de la répétition dans une page de la même forme d’un mot vont devoir changer leurs habitudes.

Venez donner votre avis dans ces discussions :

(*) J’utilise l’expression « sémantiquement proche » entre guillemets car je ne sais pas comment la définir autrement. Les spécialistes de linguistique me corrigeront sans doute…

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

2 commentaires

Gabos

Bonjour

Je confirme que les "s" posent un problème. Moi qui anime un certain nombre d’annuaires, les variations sur la requête fabricant(s) + produit sont très importantes.
Du coup, je ne sais pas si je dois mettre un S ou pas. Dans un annuaire, a priori, il y en a plusieurs, donc le S s’impose mais lors d’une requete, un internaute en cherche-t-il plusirus ou un seul ? Met-il le S ou non ?

That’S the queStion….

Répondre
claude38

Dans le domainede la location saisoniere d`appartements a budapest la simple consultation des stats de mon site et des clients me permet de voir que les francais effectuent tres majoritairement leurs requettes au singulier, du type "appartement budapest" par ex, les italiens et les anglophones au pluriel, du type  »appartamenti budapest" et "budapest apartments", ce qui regle le probleme.
En regardant les resultats affiches sur google selon la presence d’un singulier sur un mot ou expression cle les resultats sont sensiblement differents selon la densite de ces mots cles dans les sites affiches, ce qui est encore tres logique.
Les concurrents qui tabasent le plus avec ces mots cles obtiennent cependant un meilleur classement, ce qui m’irite beaucoup car j’aimerais penser que les sites qui font du spaming indexing soient ecartes!
Par contre je trouve interessante l’evolution de google et selon laquelle sont ou vont etre prises en compte des familles de mots, ce qui solutionnerait ce probleme en valorisant les sites les mieux rediges et non des torchons penses uniquement en terme de positionnement.

Répondre