Bonne Année 2016 a tous et a toutes ^^
Me voilà depuis quelques mois penché sur la sémantique, pour le moteur Premsgo que je développe .
J'avoue avoir eut beaucoup de mal a constituer les données de base, car il existe très peu ou pas de données complete a télécharger sur les mots de la langue Française. On trouve des fichiers avec tous les mots, mais quasiment aucun avec la totalité de ceux-ci et les attributs grammaticaux (singulier, pluriel, verbe conjugué avec toutes les personnes, masculin, féminin, adjectifs, adverbe, etc etc).
Je ne parles pas dutout de "définition dictionnaire" qui est propre a chacun (larousse, petit robert etc), mais uniquement des attributs grammaticaux. C'est un pieds de nez a l'une des langues les plus complexe de la planète, obligatoire. Même l'académie Française ou le ministère de l'éducation ne donnent pas la possibilité de télécharger de tels fichiers.
A elle seule, la conjugaison des quelques 8 000 verbes Français génère 2 191 312 conjugaisons possibles, en comptant les doublons en fonction des temps et personnes (le même mot est identique a la 3eme personne du singulier si c'est au masculin et féminin parfois etc.).
Une fois dédoublonnés, on arrive quand même au chiffre de 217 632 mots différents pour seulement les verbes conjugués...
Au total, avec quelques noms communs et noms propres courant, on arrive vite a 3 millions de mots.
Ayant terminé cette classification, je mettrais en ligne les fichiers librement dans quelques temps si cela intéresse du monde.
Aussi, je me pose la question de savoir , en raison d'une certaine limite de capacité cérébrale que la nature nous impose, si la complexité de la langue Française n'est pas un frein a l'exploitation de la capacité intellectuelle de chaque individu, ou au contraire, la finesse des mots et expression par rapport a d'autres langues telle que l'Anglais l'éveille-t-elle?
Voszavisminteresses ^^
Me voilà depuis quelques mois penché sur la sémantique, pour le moteur Premsgo que je développe .
J'avoue avoir eut beaucoup de mal a constituer les données de base, car il existe très peu ou pas de données complete a télécharger sur les mots de la langue Française. On trouve des fichiers avec tous les mots, mais quasiment aucun avec la totalité de ceux-ci et les attributs grammaticaux (singulier, pluriel, verbe conjugué avec toutes les personnes, masculin, féminin, adjectifs, adverbe, etc etc).
Je ne parles pas dutout de "définition dictionnaire" qui est propre a chacun (larousse, petit robert etc), mais uniquement des attributs grammaticaux. C'est un pieds de nez a l'une des langues les plus complexe de la planète, obligatoire. Même l'académie Française ou le ministère de l'éducation ne donnent pas la possibilité de télécharger de tels fichiers.
A elle seule, la conjugaison des quelques 8 000 verbes Français génère 2 191 312 conjugaisons possibles, en comptant les doublons en fonction des temps et personnes (le même mot est identique a la 3eme personne du singulier si c'est au masculin et féminin parfois etc.).
Une fois dédoublonnés, on arrive quand même au chiffre de 217 632 mots différents pour seulement les verbes conjugués...
Au total, avec quelques noms communs et noms propres courant, on arrive vite a 3 millions de mots.
Ayant terminé cette classification, je mettrais en ligne les fichiers librement dans quelques temps si cela intéresse du monde.
Aussi, je me pose la question de savoir , en raison d'une certaine limite de capacité cérébrale que la nature nous impose, si la complexité de la langue Française n'est pas un frein a l'exploitation de la capacité intellectuelle de chaque individu, ou au contraire, la finesse des mots et expression par rapport a d'autres langues telle que l'Anglais l'éveille-t-elle?
Voszavisminteresses ^^