compiler nutch

Nouveau WRInaute
bonjour,

je viens d'utiliser le projet nutch pour réaliser un moteur de recherche pour concurer google mais je me suis bloqué dés le début :cry: , bon j 'ai réussi à mettre en place le binaire de nutch-0.9 , à configurer mon tomcat et à indexer quelques urls mais j'ai des problemes :

le premier est que j'arrive pas à ajouter des autres urls pour l'indexation sans effacer mon crawldir, j'ai trouvés des scripts de recrawling mais ce derniers fait juste la mise à our de mon crawldb , il n'ajoute pas les nouveaux urls ..

le deuxieme problems consiste à la compilation de la source de nutch : en fait j'ai compris d'apres les etudes que j ai fait que la compilation d'un tel projet peut etre soit par le "ant" soit directement sur un environnement de developpemnt java soit par exemple jbuilder mais j'arrive encore pas ..

s'il vous plait si qq un a des idées ou des tutoriaux merci de les communiquer .
soit dans le forum soit en privé : skype ytlassaad
mail ing.lassaad@hotmail.com

Cordialemnt...
Lassaad
 
Nouveau WRInaute
merci beaucoup pour votre reponse

mais j ai regardé ce lien mais ca ne sert rien dans le cas de l'ajout des autres urls pour l'indexation
 
WRInaute accro
mathlouthi a dit:
bonjour,

je viens d'utiliser le projet nutch pour réaliser un moteur de recherche pour concurer google

concurer

Ca commence bien !

Et tu viens royal sur un forum spécialisé Google pour annoncer ton projet!
Tu viens nous troller ??
 
Nouveau WRInaute
mon probleme maitenant est
comment ajouter des urls à urls.txt et lancer un script qui fait l'indexation sans effacer l'ancien crawldir
 
Haut