Lemmatisation
Dans les dossiers :
Dans : Ecrire pour le web et le référencement - Par Véronique, le 20 avril 2009
... ou les relations particulières de Google avec la pomme de terre et l'indice de densité !
Reconnaître un mot écrit pour tout lecteur va de soi mais comment un robot fait-il pour "lire", c'est-à-dire identifier et traiter ce fameux mot ? Pour vous, c'est évident, vous en lisez et en écrivez tous les jours, vous les repérez sans même vous en rendre-compte mais un moteur, un robot, comment fait-il ? A-t-il simplement avalé un dictionnaire ? Ceux qui ont participé à ma formation le savent déjà, pour les autres voici un petit aperçu des traitements linguistiques sur la question...
Dans : Actualité - Par Olivier Duffez, le 9 septembre 2008
Comment les moteurs de recherche tiennent-ils compte des différentes formes d'un mot (singulier/pluriel) ? Nous savons bien que les moteurs repèrent la racine commune du mot (stemming), si bien qu'en utilisant le singulier sur une page, on peut bien sortir dans les résultats pour une requête au pluriel (et réciproquement). L'attribution d'un brevet sur la question à Yahoo est l'occasion de revenir sur ce sujet d'étude du référencement...
Dans : Actualité - Par Olivier Duffez, le 4 octobre 2005
Depuis longtemps, pour Google, les mots "patinoire" et "patinoires" sont différents, si bien que si on veut être positionné sur les 2 formes, il faut prévoir les 2 cas (par exemple créer 2 pages). Il est possible que ceci soit en train de changer, voici donc quelques pistes de réflexion.
Dans : Techniques de référencement - Par Olivier Duffez, le 13 janvier 2004
Depuis la Google Dance baptisée Florida en novembre dernier, les changements dans l'algorithme de Google ont été nombreux. Mais sont-ils pour autant évidents à identifier ? Je vous indique quelques pistes de réflexion.
Lectures recommandées sur ce thème :