Article a but informatif :
Dérriere ce titre plus que racoleur se cache la naissance d'un projet Open-Source de création d'un moteur de recherche web , un équivalent de Google mais dont les algorithmes seraient publiés.
Nutch , c'est un nom c'est un nom , a été intité dans le secret l'année derniére et se trouve setenu, entre autres,par un responsable de la recherche et développement chez Overture ( un concurent de Google ) et par l'aquéreur d'Altavista et All The Web , qui a initié le projet et financé son lancement.
le 16Juin , Nutch a réaliser un premier test qualifié "d'encourageant" sur un index de 100 milliones de pages , ce qui ne represente toutefois qu'une fraction des deux à trois milliards d'url référencés par Google.
Tout les moteurs de recherche existants ont des méthodes secretes pour décider quel documents sont les meilleures ; L'idée est de rendre public l'ensemble du fonctionnement de Nutch depuis sa maniere d'indexer les pages web jusqu'aux algorithmes servant à leur classement.
Pour autant Overture ne subvient pas à tous les besoins de Nutch et Doug Cutting cherche activement des fonds pour monter une démonstration publique avant la fin de l'année . En attendant , Nutch focntionne sur trois ordinateurs "de base" et supporte trois requetes par seconde.
La route et encore longue pour contrer Google .
( planet Magazine novembre 2003 )
p.s : aritcle accepté par WRI avant d'etre poster
Dérriere ce titre plus que racoleur se cache la naissance d'un projet Open-Source de création d'un moteur de recherche web , un équivalent de Google mais dont les algorithmes seraient publiés.
Nutch , c'est un nom c'est un nom , a été intité dans le secret l'année derniére et se trouve setenu, entre autres,par un responsable de la recherche et développement chez Overture ( un concurent de Google ) et par l'aquéreur d'Altavista et All The Web , qui a initié le projet et financé son lancement.
le 16Juin , Nutch a réaliser un premier test qualifié "d'encourageant" sur un index de 100 milliones de pages , ce qui ne represente toutefois qu'une fraction des deux à trois milliards d'url référencés par Google.
Tout les moteurs de recherche existants ont des méthodes secretes pour décider quel documents sont les meilleures ; L'idée est de rendre public l'ensemble du fonctionnement de Nutch depuis sa maniere d'indexer les pages web jusqu'aux algorithmes servant à leur classement.
Pour autant Overture ne subvient pas à tous les besoins de Nutch et Doug Cutting cherche activement des fonds pour monter une démonstration publique avant la fin de l'année . En attendant , Nutch focntionne sur trois ordinateurs "de base" et supporte trois requetes par seconde.
La route et encore longue pour contrer Google .
( planet Magazine novembre 2003 )
p.s : aritcle accepté par WRI avant d'etre poster