Auteur/autrice : Véronique

Olivier Duffez

Suivez-moi :

Compte LinkedIn Olivier Duffez Compte Twitter Olivier Duffez Compte Facebook Olivier Duffez Chaine Youtube WebRankInfo

Brevet de Google : l'indexation basée sur l'analyse des syntagmes

Google vient d'obtenir un (nouveau) brevet sur l'indexation basée sur l'analyse des extraits de phrases. Cette méthode, basée sur les syntagmes, apporte quelques nouveautés dans l'indexation des pages web.

Après le traitement des mots, Google en vient à celui des groupes de mots (bientôt la phrase ?). Il ne s'intéresse pas à proprement parler à la syntaxe (la construction de la phrase type sujet, verbe et complément) mais à la phraséologie c'est à dire à la modélisation de groupes de mots, à la relation des mots qui sont associés dans une requête ou dans un document.

Comment Google traite-t-il le sens des lexèmes ?

... ou les relations particulières de Google avec le chant et le canard !

Après l'introduction du lexème et du morphème grâce à la pomme de terre, je vous propose aujourd'hui de continuer notre  découverte des aspects linguistiques des moteurs de recherche grâce au canard et au sème !

Cet article est rédigé selon la même approche que le précédent, il ne prétend pas être exhaustif sur la question ni s'adresser à des spécialistes du langage ou de linguistique informatique. Il s'agit d'un kit de survie linguistique à l'usage du référencement ;-)

Comment Google reconnaît-il les mots ?

... ou les relations particulières de Google avec la pomme de terre et l'indice de densité !

Reconnaître un mot écrit pour tout lecteur va de soi mais comment un robot fait-il pour "lire", c'est-à-dire identifier et traiter ce fameux mot ? Pour vous, c'est évident, vous en lisez et en écrivez tous les jours, vous les repérez sans même vous en rendre-compte mais un moteur, un robot, comment fait-il ? A-t-il simplement avalé un dictionnaire ? Ceux qui ont participé à ma formation le savent déjà, pour les autres voici un petit aperçu des traitements linguistiques sur la question...