Recherchons passionnés pour bosser sur Mozdo.com

WRInaute discret
Hello,

Nous recherchons vraiment des gens passionnés pour bosser sur notre moteur de recherche.
Au niveau de la pertinence des recherches.
Vous aurez des liens sponsorisés gratuit, t-shirts, stikers et bien sur vous toucherez une partie des bénéfices que feras Mozdo.

Donc faites nous signe, ceux qui veulent faire partie de l'équipe

Aidez nous à faire grandir Mozdo!
[Edit kazhar : Les signatures sont interdites sur WRI]
 
WRInaute discret
Quels connaissances seront neccesaires ?


Sinon un idée : creer un service de page d'accueil personalisable(avec bien sur le champ de recherche mozdo) et faites passer un message du genre "bonjour j'ai decouvert un truc trop cool, c'est mozdo inscris toi et envois ce message a tout tes contacts".Ce qui vous permettra de vous creer une base d'utilisateurs autres que ceux qui vont verifier leur positionnement ou ceux qui aurait vu une news sur un site quelqonque.
 
WRInaute discret
Quels types d'algorithmes/modèles utilisez-vous actuellement pour la pertinence ?
* quels modèles ensemblistes ?
* quels modèles algébriques ?
* quels modèles probabilistiques ?
 
WRInaute discret
Moi je suis le graphiste et le créateur, c'est mon collègue qui gère la programmation, mais nous cherchons vraiments des spécialistes de la pertinence pour faire évoluer Mozdo.
Si tu es intérressé je peut te laisser les login et pass du FTP et de l'admin pour que tu puisse regarder l'intérieur de la bête lool.
 
WRInaute discret
J'avais commencé la création d'un moteur de recherche, mais abandonné car trop lourd et manque de partenaires (aucun pour tout vous dire).
Je serais vraiment partant pour vous suivre si j'ai le niveau que vous recherchez.
 
WRInaute discret
Vu que tu est le graphiste pourrais tu enlever les preview snap ??

sinon niveau pertinence c'est pas mal

bon courage(vous aurez besoin :D )
 
WRInaute discret
Le niveau c'est du php et de la base de données et des compétences pour réorganiser les recherches pour qu'elles soient plus pertinentes.
 
WRInaute impliqué
réorganiser les recherches, certes, mais je ne pense pas que la pertinence se construise uniquement à partir d'un algo qui va betement aller chercher des mots dans une page
le plus gros travail est de construire les bases de données de cohérences qui vont servir à " l'algo " pour qualifier d'abord un site en amont de toutes recherches, puis qualifier en temps réel une page sur une recherche donnée en se servant aussi des attributs connus
j'ai des idees precises sur la question, maintenant, reste à savoir quel but tu veux atteindre, car cela implique de gros moyens humains et financiers
si il s'agit vraiment d'un projet ambitieux, je veux bien m'impliquer meme financierement
il faudrait tester en travaillant sur un seul theme et mesurer les résultats afin d'avancer sans trop se disperser en temps et en argent
 
WRInaute discret
crindor> si tu t'intéresses à ce genre de choses, je te conseille de consulter déjà la page wikipédia dédiée à l'information retrieval, qui explique très brièvement certains des modèles actuellement utilisés ou prévus.
En l'occurrence, tous les gros moteurs travaillent depuis quelques temps à une amélioration du modèle des espaces vectoriels, qui, bien que puissant (voire ultra-puissant), nécessite des ressources trop importantes à l'heure actuelle.
 
WRInaute accro
C'est vrai qu'il y a bien besoin de plus de pertinence. En cherchant "php", je tombe sur un site de cul ...

Et en cherchant "kazhar", j'ai un résultat venant de dmoz.org, dont la description a des problèmes d'encodage utf8.
 
WRInaute discret
Mozdo-guy,

Une fois trouvé ton codeur, demande-lui de mettre une temporisation pour le scan des pages indexées STP : la dedibox de ton serveur se fait régulièrement bannir par mon dispositif anti-aspirateur.

A mon avis, tenter de récupérer plus de 30 pages / minute est excessif (sauf si on s'appelle google auquel cas, je veux bien faire une exception ;)).

Par contre, pour le moment, les temps d'excécution des requêtes sont très faibles, félicitations.
Reste à voir si ce sera toujours pareil avec quelques millions de pages dans l'index (60.000 pages indexées seulement pour le moment ?)
 
Haut