WRInaute occasionnel
Hello,
A l'approche du froid.. j'ai réalisé un moteur de sites dans le domaine du jeux (Bourse et forex compris). J'avais ce nom de domaine depuis quelques années et j'ai enfin pris le temps de préparer ce moteur dans mon temps libre..
http://www.jeux-annuaire.com
Il ne s'agit pas d'un annuaire ni d'un moteur de pages : mais bien d'un moteur de sites.
En quelques lignes..
-Seul l'index (première page) d'un site est indexé et ce, tous les 5 jours en moyenne (à voir encore avec le temps)
-Uniquement les Tld (top level domain) sont acceptés dans un premier temps.. (AJOUT GRATUIT)
-Les liens affichés dans le résultat d'une recherche ne sont pas en dur
-Bouton "analyse" avec titre du site rewiter et analyse de l'index du site (exemple ici)
-Flux rss si disponible, avec un filtre sur les images (aucune image est prise en compte)
-Statistiques de chaque sites (trop peu de sites pour les afficher.. pour plus tard..)
-Reconnaissance automatique du charset pour l'indexation et pour le flux rss
-Rapido, système pré-maché selon des mots-clés régulièrement utilisé dans cette thématique (trop peu de sites pour bien le tester..)
-Pour éviter du duplicate, il est demandé de proposer un titre et une description unique
Sytème utilisé...
Recherche en full-text sur le titre, la description, les mots clés et sur le texte html (c'est cette dernière partie qui sera "spider" tous les 5 jours)
La pertinence est affiché selon un score spécifique sur ces 4 champs ci-dessus, si le score est trop faible voir néant, je switch en LIKE pour y afficher des résultats moins pertinent.
Voilà en quelques lignes, reste qu'il manque encore des sites pour étoffer la base de données..mais chaque chose en son temps
Si ce n'est de m'éclater et de me faire plaisir, ce moteur de sites n'a aucune prétention :wink: vos remarques constructives sont les bienvenues !
Cordialement
Yule
A l'approche du froid.. j'ai réalisé un moteur de sites dans le domaine du jeux (Bourse et forex compris). J'avais ce nom de domaine depuis quelques années et j'ai enfin pris le temps de préparer ce moteur dans mon temps libre..
http://www.jeux-annuaire.com
Il ne s'agit pas d'un annuaire ni d'un moteur de pages : mais bien d'un moteur de sites.
En quelques lignes..
-Seul l'index (première page) d'un site est indexé et ce, tous les 5 jours en moyenne (à voir encore avec le temps)
-Uniquement les Tld (top level domain) sont acceptés dans un premier temps.. (AJOUT GRATUIT)
-Les liens affichés dans le résultat d'une recherche ne sont pas en dur
-Bouton "analyse" avec titre du site rewiter et analyse de l'index du site (exemple ici)
-Flux rss si disponible, avec un filtre sur les images (aucune image est prise en compte)
-Statistiques de chaque sites (trop peu de sites pour les afficher.. pour plus tard..)
-Reconnaissance automatique du charset pour l'indexation et pour le flux rss
-Rapido, système pré-maché selon des mots-clés régulièrement utilisé dans cette thématique (trop peu de sites pour bien le tester..)
-Pour éviter du duplicate, il est demandé de proposer un titre et une description unique
Sytème utilisé...
Recherche en full-text sur le titre, la description, les mots clés et sur le texte html (c'est cette dernière partie qui sera "spider" tous les 5 jours)
La pertinence est affiché selon un score spécifique sur ces 4 champs ci-dessus, si le score est trop faible voir néant, je switch en LIKE pour y afficher des résultats moins pertinent.
Voilà en quelques lignes, reste qu'il manque encore des sites pour étoffer la base de données..mais chaque chose en son temps
Si ce n'est de m'éclater et de me faire plaisir, ce moteur de sites n'a aucune prétention :wink: vos remarques constructives sont les bienvenues !
Cordialement
Yule