Moteur de recherche interne

WRInaute accro
Bonsoir,

Je souhaite ajouter à mon site un moteur de recherche interne.
Pour info, j'utilise actuellement Google, mais ça ne me convient pas trop pour la présentation.

J'aimerais donc développer un moteur interne. Existe t-il des outils "tout faits" ou à adapter, ou bien doit-on forcément coder un moteur propre à son site ?

Peut-on envisager un bot interne (façon Google, mais avec la certitude d'une indexation totale et rapide du site) ou faut-il chercher soi-même dans les bases, à la demande ? Et quid du contenu non "sqlisé" ?

Enfin, faut-on proposer à la fois au visiteur l'outil GG et l'outil interne sans le perturber ?

Merci à ceux qui m'éclaireront !

OTP
 
WRInaute accro
Deux blocs de recherche, tu risques de créer le trouble dans la tête des visiteurs.

Sinon, j'ai eu la même réflexion que toi il y a peu de temps et je n'ai pas fouillé. Un moteur comme Exalead n'est pas centré la dessus et sur l'intranet ?
 
WRInaute passionné
Par mon expérience :
- Sphider : entre 1h et 2h de travail pour comprendre, installer, intégrer et templagter. Très facile à intégrer. Trop facile :) par contre il faut prévoir un CRON pour indexer régulièrement (=tous les jours, toutes les heures ? en fonction des besoins) les nouvelles données/textes.
- Sphinx : un peu plus dur mais la recherche est en TR et on a à disposition un excellent moteur de recherche.

voilà. A toi de choisir. Pour mon prochain projet, j'hésite encore. ça dépend si le client veut un moteur de recherche ou bien un moteur de recherche performant et très pertinent. La simplicité Versus le travail d'intégration.
 
WRInaute accro
Ok, merci pour les conseils.
En gros, je laisse déjà tomber l'idée de coder moi-même un truc qui cherche dans les bases, ok ?
Sphider est tentant, je vais regarder de près.
 
WRInaute passionné
évidemment. Pourquoi réinventer la roue ? Parce qu'on est sportif ? :p

Sinon j'ai vu qu'il y avait sphider-plus, une évolution de l'outil (un fork à priori). Pour 25 €, à voir si ça peut être intéressant.
 
WRInaute accro
loran750 a dit:
évidemment. Pourquoi réinventer la roue ? Parce qu'on est sportif ? :p

Tout simplement parce que je me disais que personne ne connait mieux mes bases que moi.
Mais si on raisonne spider, ça ne tient plus.
 
WRInaute passionné
/!\ attend, si tes bases sont complexes et que tu veux choisir quelles informations (champs) sont à indexer, alors il vaut mieux voir Sphinx car tu lies les champs & tables à indexer au moteur de Sphinx.

=> Sphinx indexe directement les champs de la base de données, tandis que Sphider crawle les pages de ton site.
(bon sphinx crawle aussi mais sa spécialité c'est l'indexation directement branché à la bdd)
 
WRInaute accro
Franchement je ne sais pas trop quoi privilégier.
Tout le contenu n'est pas en base, donc...
 
WRInaute passionné
OTP a dit:
loran750 a dit:
évidemment. Pourquoi réinventer la roue ? Parce qu'on est sportif ? :p

Tout simplement parce que je me disais que personne ne connait mieux mes bases que moi.
Mais si on raisonne spider, ça ne tient plus.

Tout dépend du type de moteur que tu souhaites mettre en place.

1/ En moteur généraliste en interne sur l'ensemble du contenu des pages.
ou
2/ Un moteur qui s'applique à des sections de contenu (membres, articles, liens, ressources, etc).

Dans le premier cas, oui clairement je partirais sur la piste d'un spider.
Dans le second, je le ferais moi même avec ni plus ni moins qu'une recherche full-text. Avec ce type d'indexation issue d'un simple champ d'une table de base de données il y a la possibilité d'avoir des jeux de résultats trié par pertinence.


Edit : grillé par 2 posts pendant la rédaction de ma réponse
 
WRInaute accro
Je fais un up car je viens d'installer la chose, lancer l'indexation et je vois la taille de ma base mysql qui monte, qui monte...
Au point que je me dis que ça va coincer...

Ca créée de grosses tables ce truc d'habitude ?
 
WRInaute passionné
je m'en souviens plus :)
jette un oeil sur le forum officiel.
Et regarde tes paramétrages, mais c'est pas forcément délirant.
 
WRInaute accro
J'ai fouillé à droite à gauche sans succès.
Et stoppé le script une fois mes 25 Mo remplis ! :|
 
Discussions similaires
Haut