Créer un système de mot clés

WRInaute occasionnel
Salut,

Voilà ce que je souhaiterai faire en simplifié : j'ai une table avec des articles tappés dedans. Je souhaite crééer un lexique, c'est à dire une base de mots associées à leur définition.

Et vous l'aurez compris, je souhaite que les mots présents dans l'article qui contienne une difinition est un lien vers cette même définition comme ici : -http://fr.wikipedia.org/wiki/Ordinateur

J'ai noté différente solution et j'aimerai votre avis sur celle qui aurait le meilleure rapport lourdeur/efficacité. J'entend par lourdeur le travail que ca va demander au serveur. Et si vous avez également d'autres solutions à proposer ... :D

* Dejà je pourrais simplement tapper les liens vers les définitions en statique dans les articles, mais plutot chiant et peu évolutif :D

* Je pourrais vérifier tous les mots d'un article lorsqu'il est envoyé et rajouter automatiquement les liens à ce moment. Le hic, c'est que si on envoie des nouvelles définitions après, les liens dans l'articles seront pas à jour ...

* Je peux aussi faire ce que j'ai dis précédemment mais lors de la lecture d'un article ce qui enlève le soucis des mises à jours. Le hic c'est que beaucoup de lecture, et vérifier la correspondance de chaque mot d'une page entre un tableau de mots définit, ca risque d'être lourd non ? qu'en pensez vous ?

* Pour tenter d'alleger la solution d'avant, on pourrais stocker la liste de mots dans un doc XML qui serait mis à jour de temps en temps en fonction de la table sql, mais bon ca n'allège finalement le tout que d'une requete sql par lecture ...

* On pourrait mettre des liens en dur dans les article par l'intermédiaire de balise genre [def=26]mot[/def] et il s'agirait de vérifier de temps en temps tous les mots de tout les articles, et rajouter les liens vers les nouveaux mot apparu dans le lexique, ou enlever les liens devenu obselete.

Qu'en pensez-vous ? La dernière solution me semble correcte au niveau de l'utilisation par contre je pense pas que ce soit très simple a faire pour le parsage, notament pour virer les mots obselete car il faudrait séparer chaque mot, detecter les mots obselete, et les remettre à jour dans le texte même ...

La solution de parser dès l'affichage me semble plutot simple à réaliser, mais niveau lourdeur , je sais pas trop (je suis sur un mutualisé). Il s'agit de vérifier en fait la concordance entre une table d'environ 1000 mots et les 1000 mots composant une page moyenne (j'ai un peu exagéré les chiffres) , et le tout multiplié par pas mal d'affichage de pages par jours. Qu'en pensez vous ?
 
WRInaute discret
C'est vrai que le formatage à la volée risque d'être lourd. Moi j'ai opté pour une solution qui trasnscrit en dur les liens vers les définitions dans les articles, et le script de formatage est lancé à chaque semaine pour tenir compte des nouvelles définitions.
 
WRInaute occasionnel
Salut, héhé merci ! En effet, ca sera pas la plus simple à coder, mais niveau maintenance c'est niquel et pour le serveur c'est pas méchant !
 
WRInaute occasionnel
vin-moi a dit:
Salut,

Voilà ce que je souhaiterai faire en simplifié : j'ai une table avec des articles tappés dedans. Je souhaite crééer un lexique, c'est à dire une base de mots associées à leur définition.

Et vous l'aurez compris, je souhaite que les mots présents dans l'article qui contienne une difinition est un lien vers cette même définition comme ici : -http://fr.wikipedia.org/wiki/Ordinateur

J'ai noté différente solution et j'aimerai votre avis sur celle qui aurait le meilleure rapport lourdeur/efficacité. J'entend par lourdeur le travail que ca va demander au serveur. Et si vous avez également d'autres solutions à proposer ... :D

* Dejà je pourrais simplement tapper les liens vers les définitions en statique dans les articles, mais plutot chiant et peu évolutif :D

* Je pourrais vérifier tous les mots d'un article lorsqu'il est envoyé et rajouter automatiquement les liens à ce moment. Le hic, c'est que si on envoie des nouvelles définitions après, les liens dans l'articles seront pas à jour ...

* Je peux aussi faire ce que j'ai dis précédemment mais lors de la lecture d'un article ce qui enlève le soucis des mises à jours. Le hic c'est que beaucoup de lecture, et vérifier la correspondance de chaque mot d'une page entre un tableau de mots définit, ca risque d'être lourd non ? qu'en pensez vous ?

* Pour tenter d'alleger la solution d'avant, on pourrais stocker la liste de mots dans un doc XML qui serait mis à jour de temps en temps en fonction de la table sql, mais bon ca n'allège finalement le tout que d'une requete sql par lecture ...

* On pourrait mettre des liens en dur dans les article par l'intermédiaire de balise genre [def=26]mot[/def] et il s'agirait de vérifier de temps en temps tous les mots de tout les articles, et rajouter les liens vers les nouveaux mot apparu dans le lexique, ou enlever les liens devenu obselete.

Qu'en pensez-vous ? La dernière solution me semble correcte au niveau de l'utilisation par contre je pense pas que ce soit très simple a faire pour le parsage, notament pour virer les mots obselete car il faudrait séparer chaque mot, detecter les mots obselete, et les remettre à jour dans le texte même ...

La solution de parser dès l'affichage me semble plutot simple à réaliser, mais niveau lourdeur , je sais pas trop (je suis sur un mutualisé). Il s'agit de vérifier en fait la concordance entre une table d'environ 1000 mots et les 1000 mots composant une page moyenne (j'ai un peu exagéré les chiffres) , et le tout multiplié par pas mal d'affichage de pages par jours. Qu'en pensez vous ?
 
Discussions similaires
Haut