Importance du traitement des mots par Google

Discussion dans 'Rédaction web et référencement' créé par Véronique, 20 Avril 2009.

  1. Véronique
    Véronique Nouveau WRInaute
    Inscrit:
    30 Décembre 2002
    Messages:
    12
    J'aime reçus:
    0
  2. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 139
    J'aime reçus:
    272
    Merci Véronique pour cet article. ;)
     
  3. 5_legs
    5_legs WRInaute passionné
    Inscrit:
    30 Avril 2006
    Messages:
    1 551
    J'aime reçus:
    0
    J'étais sûr qu'avec la pomme de terre viendrait la pomme à terre :)

    Merci pour cette "mise en bouche" :lol:
     
  4. Clement B
    Clement B Nouveau WRInaute
    Inscrit:
    2 Février 2009
    Messages:
    14
    J'aime reçus:
    0
    Bel article, merci :)
     
  5. djmael
    djmael WRInaute occasionnel
    Inscrit:
    2 Juillet 2008
    Messages:
    289
    J'aime reçus:
    0
    bienvenue véronique, le sujet traiter est très intéressant !!
    bonne continuation :wink:
     
  6. detectimmobilier
    detectimmobilier WRInaute passionné
    Inscrit:
    21 Février 2009
    Messages:
    1 919
    J'aime reçus:
    0
    Et bien voilà un article qui met l'eau à la bouche :wink:
     
  7. skyll
    skyll WRInaute passionné
    Inscrit:
    14 Octobre 2005
    Messages:
    1 088
    J'aime reçus:
    0
    Enfin quelque chose à se mettre sous la dent :mrgreen:
    très intéressant en tout cas :)
     
  8. L.Jee
    L.Jee WRInaute accro
    Inscrit:
    11 Décembre 2007
    Messages:
    5 429
    J'aime reçus:
    0
    Merci bien pour ce cours intéressant et bienvenue ici :)
     
  9. dorian53
    dorian53 WRInaute passionné
    Inscrit:
    10 Avril 2005
    Messages:
    1 909
    J'aime reçus:
    1
    Très bel article, merci.
     
  10. visites-web
    visites-web WRInaute discret
    Inscrit:
    1 Août 2008
    Messages:
    72
    J'aime reçus:
    0
    Merci pour cet article enrichissant.
     
  11. Véronique
    Véronique Nouveau WRInaute
    Inscrit:
    30 Décembre 2002
    Messages:
    12
    J'aime reçus:
    0
    Merci pour vos retours, j'ai également apprécié les messages envoyés en MP.
     
  12. Raspailloux
    Raspailloux WRInaute occasionnel
    Inscrit:
    19 Février 2009
    Messages:
    401
    J'aime reçus:
    0
    Super intéressant cet article :p en plus j'ai appris des mots (lexème, morphème... première fois que j'entends parler de ces choses).

    C'est donc pour moi un article très enrichissant.

    Merci.
     
  13. honolulu
    honolulu WRInaute impliqué
    Inscrit:
    8 Novembre 2005
    Messages:
    755
    J'aime reçus:
    0
    En revoyant certains termes, je me serais cru de retour à la fac :wink:
    Excellent article qui donne encore plus de relief au travail de référencement !
     
  14. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 978
    J'aime reçus:
    292
    Je vois que l'accueil est très positif pour ce premier article, c'est bien ! Ca mérite même une petite reco !
     
  15. pcamliti
    pcamliti WRInaute impliqué
    Inscrit:
    9 Mars 2007
    Messages:
    706
    J'aime reçus:
    1
    Je n'est qu'une chose a dire : "Oh Oui ! "

    Bravo et attendons la suite des lexèmes :wink:
     
  16. Bellegarde-webb
    Bellegarde-webb WRInaute passionné
    Inscrit:
    12 Juillet 2006
    Messages:
    1 004
    J'aime reçus:
    0
    Bonjour Véronique et merci pour ce début de linguistique. J'en ai étudié un peu .... hum :D il y a bien longtemps.
    Il faudrait aussi des cours de français, de grammaire et de conjuguaison pour beaucoup d'entre les écrivains :D :D de sites
    (pas ceux de wri ! :eek: ). Non je ne veux pas faire trop d'humour mais il est vrai que le référenceur doit connaître des bases de linguistique. Le web l'exigera d'eux petit à petit. Le chemin est encore long mais j'ai parfois été surprise par la rapidité des choses donc il faudrait mieux prendre un peu d'avance, je le concède. :)
     
  17. Thierry Bugs
    Thierry Bugs WRInaute accro
    Inscrit:
    16 Juin 2004
    Messages:
    3 397
    J'aime reçus:
    1
    merci pour ces précisions linguistiques et explications ;)

    à lire ton article tu ne parles pas des reconnaissances d'expressions complètes, ni des questions que l'on a déjà posé aux moteurs qui peuvent aussi l'aider à trouver la bonne réponse
    ex "apaumme de xeere" google répond en me proposant la pomme de terre
    (néanmoins j'ai fais quelques essais auparavant et donc j'imagine bien que le moteur comprend/répond differemment selon si ce sera ma premiere demande ou bien (sur le meme poste et IP) la 5e, la 10e.
     
  18. tonguide
    tonguide WRInaute passionné
    Inscrit:
    28 Novembre 2003
    Messages:
    1 169
    J'aime reçus:
    0
    Pour te répondre Thierry Bugs, il m'a proposé directement "pomme de terre" dès la première recherche (pour "apaumme de xeere").
     
  19. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 978
    J'aime reçus:
    292
    Thierry, tu fais référence à des traitements effectués par Google sur la base de l'historique des recherches faites par les internautes. Ca n'est pas tout à fait lié à l'analyse linguistique des textes publiés sur le web.
     
  20. sylvMonEscapade
    sylvMonEscapade Nouveau WRInaute
    Inscrit:
    3 Novembre 2008
    Messages:
    17
    J'aime reçus:
    0
    Superbe à la fois cette nouvelle section des forums WRI et les interventions de Veronique. J'ai appris (ou ré-appris) plein de choses ce matin, et surtout cela pousse à se poser de nouvelles questions, ce qui est excellent ! :-D
    Merci pour vos contributions, et j'ai hate de lire la suite de vos articles.

    Quant à moi je vais retourner relire tous mon rédactionel et l'enrichir en variations morphologiques de lexèmes... :p (ça va, j'ai bon ? :wink: )

    Sylv
     
  21. Véronique
    Véronique Nouveau WRInaute
    Inscrit:
    30 Décembre 2002
    Messages:
    12
    J'aime reçus:
    0
    Merci pour ces derniers messages. Bonne (re)plongée dans le monde merveilleux de la linguistique :wink:

    Véronique
     
  22. u8086
    u8086 WRInaute passionné
    Inscrit:
    24 Mai 2004
    Messages:
    2 446
    J'aime reçus:
    0
    Qu'est-ce qui vous permet d'affirmer cela ?
     
  23. Véronique
    Véronique Nouveau WRInaute
    Inscrit:
    30 Décembre 2002
    Messages:
    12
    J'aime reçus:
    0
    L'explication de cette phrase est fournie dans les trois lignes qui suivent (voir l'article).
     
  24. Obeliks
    Obeliks Nouveau WRInaute
    Inscrit:
    16 Avril 2008
    Messages:
    28
    J'aime reçus:
    0
    Bonjour,

    Tout d'abord, merci pour vos articles très intéressants et bienvenue sur WRI :)
    J'ai une question pour vous svp : ces traitements sematiques se font à quel étape ? pendant l'indexation des pages ou après la saisie de requête par l'internaute ?

    Merci d'avance
     
  25. Véronique
    Véronique Nouveau WRInaute
    Inscrit:
    30 Décembre 2002
    Messages:
    12
    J'aime reçus:
    0
    Des traitements morphologiques et sémantiques existent à ces deux étapes mais ne sont pas de même ampleur.
    Les analyses les plus poussées sont réalisées pendant la phase d'indexation, les robots "lisent" et traitent l'information récupérée. Lorsqu'une requête est saisie, un traitement plus simple est opéré.
    Le principe de la composition des mots (lexème, morphème) expliqué dans l'article est un point de départ, il est utilisé aussi bien pour l'indexation que pour le traitement de la requête. Il permet par exemple de reconnaître un mot quelle que soit son orthographe dans une page ou dans votre requête.
     
  26. u8086
    u8086 WRInaute passionné
    Inscrit:
    24 Mai 2004
    Messages:
    2 446
    J'aime reçus:
    0
    Ma question est plus pratique que théorique.
    Ce qui marche en théorie dans un labo n'est pas forcément efficace à l'échelle d'un moteur de recherche grand public.


    Si je re-précise ma question :
    Pensez-vous que Google utilise ces techniques de lemmatisation ? Pour la compréhension de la requête ? Pour l'analyse de la page ?
    Si oui, quels indices permettent d'affirmer :

    Merci de votre éclairage expert. :wink:
     
  27. honolulu
    honolulu WRInaute impliqué
    Inscrit:
    8 Novembre 2005
    Messages:
    755
    J'aime reçus:
    0
    Ce qui sous-entendrait que pour chaque moteur "régional" (ex, pour le français, le finnois etc), il existerait une petite armée de linguistes qui ont participé aux algorithmes de recherche ? :?:
     
  28. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 978
    J'aime reçus:
    292
    @MagicYoyo : pour ta 1ère question, tu as la réponse juste au-dessus de ton post (ils se sont croisés)

    pour l'autre : c'est pourtant écrit dans l'article !!!
    @honolulu : bien entendu
     
  29. Altenide
    Altenide WRInaute impliqué
    Inscrit:
    26 Novembre 2003
    Messages:
    528
    J'aime reçus:
    2
    Sémantique et linguistique appliqué au Seo. !! Sujet intéressant s'il en est. Bienvenue parmi nous et merci pour ce forum.
     
  30. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    Je UP le sujet (désolé) mais il est totalement approprié a ce que je cherche et sa relecture (je l'avais vu passer a l'époque de la création) ne m'apporte pas plus de réponses (si elles existent).

    Je voudrais revenir sur l'exemple de la "pomme de terre" qui a un sens précis et différent de "pomme" ou "terre".
    Si on applique le concept des lemmes a une partie de la phrase d'intro du sujet :
    "Les relations particulières de Google avec la pomme de terre ou les pommes de terre."
    on a une décomposition possible comme suit :
    mots bruts / occurrences
    de 3
    terre 2
    les 2
    ou 1
    pommes 1
    pomme 1
    avec 1
    relations 1
    particulières 1
    google 1
    la 1

    lemmes / occurrences (les lemmes non identifiés comme "google" sont écartés de cette liste)
    de 3
    les 2
    pomme 2
    terre 2
    la 1
    particulier 1
    avec 1
    ou 1
    relation 1

    Si on se base sur une simple analyse des mots en écartant les mots de liaison on aurait tendance a penser que la phrase parle de "terre" (2 occurrences), si en revanche on se base sur les lemmes, cela prend plus de sens car on voie que les lemmes opèrent une sorte de pondération puisque c'est "pomme" et "terre" qui ressortent (2 occurrences chacun).

    Mais le souci c'est que dans les deux cas "pomme de terre" ne sort pas (logique me direz vous c'est une forme composée).

    Ma questions est donc comment pouvons nous envisager de détecter cette forme de mot qui casse tout le sens de la phrase ? sous forme d'algo bien sur ...

    Il serait bien possible d'introduire "pomme de terre" et "pommes de terre" dans le dictionnaire de lemmes, mais alors nous serions face a un autre problème qui est le choix de la forme à retenir ...
    Tout comme "pommes" qui a pour lemme "pomme" et qui peut être attribué :
    au nom "pomme" pour son pluriel
    ou au verbe "pommer" (subjonctif présent deuxième personne)
     
  31. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    18 978
    J'aime reçus:
    292
  32. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    En fait je me demande comment fait google pour détecter les formes compliquées que l'on ne peut pas assimiler a des lemmes comme "pomme de terre" par exemple.

    Ton article sur l'analyse des syntagmes répond en grande partie à cette question dans la mesure ou il semble que cela donne la possibilité d'extraire "pomme de terre" d'un corpus de texte, mais la mise en oeuvre d'un algo de ce type semble assez complexe. Je vais toutefois creuser un peut ce sujet pour voir si il n'y a pas moyen d'en sortir qque chose de "simple" (j'ai pas encore fouillé mais ça me semble "hard").

    Mon idée est que je voudrais être en mesure de mesurer la pertinence d'un texte en comparant son analyse des lemmes a des moyennes connues tirées de la littérature (ça c'est pas compliqué et fonctionne déjà) tout en essayant d'en extraire le sujet (thème abordé).

    Mais comme le montre le petit exemple ci dessus, les syntagmes viennent perturber fortement l'analyse du thème car arriver a la conclusion que la phrase parle de "terre" et "pomme" est complètement fantaisiste si on prend en compte les syntagmes et de fait "pomme de terre".
     
  33. zeb
    zeb WRInaute accro
    Inscrit:
    5 Décembre 2004
    Messages:
    12 196
    J'aime reçus:
    1
    Un embryon de réponse pour moi, c'est pas déterminer les syntagmes (sous leur différentes formes) que je cherche à réaliser mais a identifier les "mots composés", ce qui dans mon approche est moins pertinent mais déjà plus avancé que de regarder juste les lemmes.
     
Chargement...
Similar Threads - Importance traitement mots Forum Date
De l'importance des metadonnées Techniques avancées de référencement 29 Août 2018
Importance du nombre de pages d'un site pour le SEO Débuter en référencement 7 Juin 2018
Importance mots clés Débuter en référencement 20 Mars 2018
Importance de mettre à jour le contenu du site ? Débuter en référencement 14 Décembre 2017
Optimisation fiche produit : importance du fil d'ariane et balises Débuter en référencement 16 Octobre 2017
SEO sur Drupal - importance chaîne de caractères ? Débuter en référencement 20 Juillet 2017
Comment contourner l'importance du S dans Google Problèmes de référencement spécifiques à vos sites 30 Novembre 2016
Questionnaire : Impact et importance de l'utilisation des moteurs de recherche Débuter en référencement 25 Juillet 2016
Importance du crawl en cas de présence d'un sitemap XML dans Search Console Crawl et indexation Google, sitemaps 23 Juin 2016
[SEO] Importance de l'extension de nom de domaine en 2016? Débuter en référencement 4 Mars 2016
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice