Recherche full-text Mysql et fautes d'orthographes

Discussion dans 'Administration d'un site Web' créé par theJB, 24 Avril 2007.

  1. theJB
    theJB WRInaute occasionnel
    Inscrit:
    7 Avril 2006
    Messages:
    375
    J'aime reçus:
    0
    Est-ce qu'il exite un truc tout fait dans msyql pour chercher un mot dans une db en prenant en compte les fautes d'orthographes?

    par exemple dans une db contenant les villes de France, une recherche qui sur le mot "Parris" trouverai toute seule "Paris".
     
  2. Popop56
    Popop56 WRInaute discret
    Inscrit:
    5 Janvier 2007
    Messages:
    105
    J'aime reçus:
    0
    Perso j'ai fais un script qui gère les fautes d'orthographe mais c'est pas évident.
    De plus j'utilise un simple LIKE pour ma recherche

    Voici son fonctionnement avec ton exemple:
    -je fais une première recherche avec le mot "Paaris"
    -pour chaque resultat je calcul la différence entre les 2 variables
    -Si un correspond à 100% parfait
    -Si aucun résultat ou ressemblance inférieur à par ex 50% je compare chaque entrée de la table avec mon mot clé et je sors celui qui a la plus forte ressemblance.

    Voila en gros comment je procède après on peut améliorer pas mal de truc. Je pense que tu peux appliquer ce principe pour la recherche FULL TEXT
     
  3. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    2
    question bete... en full text y'a pas un pb pour les recherches où le mot fait 3 caractères ou moins ?
     
  4. nalrem
    nalrem WRInaute occasionnel
    Inscrit:
    6 Avril 2003
    Messages:
    351
    J'aime reçus:
    0
    Cherche peut-être du côté du soundex, ça peut être une piste.
     
  5. theJB
    theJB WRInaute occasionnel
    Inscrit:
    7 Avril 2006
    Messages:
    375
    J'aime reçus:
    0
    oué ya aussi LIKE mais je pensais pouvoir etre paresseux sur ce coup, mais apparement c raté..
     
  6. Mumuri
    Mumuri WRInaute passionné
    Inscrit:
    3 Novembre 2004
    Messages:
    1 417
    J'aime reçus:
    0
    +1 pour soundex, c'est ce qu'il te faut
     
  7. Leonick
    Leonick WRInaute accro
    Inscrit:
    8 Août 2004
    Messages:
    19 417
    J'aime reçus:
    0
    j'avais fait quelques essais et ce n'était pas trop top au niveau des retours
     
  8. julienr
    julienr WRInaute impliqué
    Inscrit:
    5 Août 2003
    Messages:
    941
    J'aime reçus:
    0
    par défaut il est à 4 caractères, ça se configure dans le my.cnf comme ceci si l'on peut :
    Code:
    ft_min_word_len         = 3
    
     
  9. mx
    mx WRInaute impliqué
    Inscrit:
    16 Juin 2003
    Messages:
    526
    J'aime reçus:
    0
    c'est du costaud les fautes d'ortographe ...
     
  10. Popop56
    Popop56 WRInaute discret
    Inscrit:
    5 Janvier 2007
    Messages:
    105
    J'aime reçus:
    0
    soundex j'ai pas trouvé cela terrible... Ca marche pas trop mal en anglais mais avec des mots francais c'est pas trop ça...
     
  11. finstreet
    finstreet WRInaute accro
    Inscrit:
    10 Juillet 2005
    Messages:
    13 473
    J'aime reçus:
    2
    Alors ca c très très sympa

    Merci :)
     
  12. nalrem
    nalrem WRInaute occasionnel
    Inscrit:
    6 Avril 2003
    Messages:
    351
    J'aime reçus:
    0
    Il existe un algo soundex propre au français. J'avais croisé ça sur le net il y a quelques mois (années ?).
     
  13. Zecat
    Zecat WRInaute accro
    Inscrit:
    1 Mars 2005
    Messages:
    9 176
    J'aime reçus:
    1
    Se coder une recherche phonétique n'est pas monstrueux ... j'avais fait ca il y a quelques années . C'ets juste une histoire de remplacement de chaine de type

    ai en e
    ou en u
    y en i
    au en o
    eau en o
    que final en c
    qu en c
    th en t
    dedoublonnage de rr en r tt en t ss en s
    Simplification des double consonnes
    Suppression des consonnes en derniere lettre

    (bon c'est de mémoire tout ca ... y a tioute une serie a faire et dans le bon ordre)

    etc etc

    Bref toute une series de manip pour transformer un mot en son expression phonetique. Une fois cette routine au point, tu l'appliques a tous tes textes et quand on fait une recherche on recherche le mot phonétisé dans les texte phonetisés ...

    Bon y a un peu d'huile de coude pour optimiser mais rien de monstrueux.

    Appliqué au cas que tu décris :

    Paris --> pari
    Parriss --> pari

    ou encore :

    Bateau --> bato
    batteau --> bato
    bateaus --> bato
    battau -- > bato
    barque -> bato (heu non je déconne :D). barque devient barc
     
Chargement...
Similar Threads - Recherche full Mysql Forum Date
Recherche full-texte Développement d'un site Web ou d'une appli mobile 31 Janvier 2015
Recherche fulltext mot féminin et pluriel ? Développement d'un site Web ou d'une appli mobile 18 Mars 2011
Recherches en FULLTEXT ? Développement d'un site Web ou d'une appli mobile 11 Octobre 2010
Le moteur de recherche neeva.com demande de payer pour rechercher Autres moteurs de recherche connus 23 Août 2021
Recherche vocale de Google Développement d'un site Web ou d'une appli mobile 11 Août 2021
Search Console Problème de version de langue dans les résultats de recherche Google Référencement international (langues, pays) 17 Juin 2021
Optimiser les vidéos pour la recherche YouTube YouTube, Google Images et Google Maps 27 Avril 2021
Mots-clés longue traîne algorithme moteur de recherche Rédaction web et référencement 20 Avril 2021
Recherche Rédacteur Web Technique AUTO Rédaction web et référencement 9 Avril 2021
Recherche conseils et aide pour hébergement Administration d'un site Web 14 Mars 2021