Le projet PITA

Discussion dans 'Autres moteurs de recherche connus' créé par enfincom, 28 Juin 2003.

  1. enfincom
    enfincom WRInaute discret
    Inscrit:
    25 Avril 2003
    Messages:
    86
    J'aime reçus:
    0
    Pour le mois de juin, Enfin s'est fait avant tout crawlé par Google suivi ensuite par Pita, Fast et Scooter.

    Pour Pita, il laisse comme identifiant :
    Pita (webmaster@pita.stanford.edu)

    Une recherche sur l'URL http://pita.stanford.edu/ conduit vers le site suivant : http://www-diglib.stanford.edu/~testbed/doc2/WebBase/

    L'introduction est :
    « The Stanford WebBase project is investigating various issues in crawling, storage, indexing, and querying of large collections of Web pages. The project builds on the previous Google activity that was part of the DLI1 initiative. The DLI2 WebBase project aims to build the necessary infrastructure to facilitate the development and testing of new algorithms for clustering, searching, mining, and classification of Web content. »

    Est-ce que cela veut dire qu'après avoir produit Yahoo! puis Google, l'université de Stanford travaille sur un nouveau projet ?


    Certains d'entre-vous ont des infos dessus ?!


    CHRis
     
  2. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    Je ne pense pas ce que cela soit vraiment un projet nouveau...

    Ils ont toujours eu des projets de recherches sur le sujet (enfin depuis quelque chose comme 1997) et le projet Webbase date de 1999/2000...

    J'ai encore lu un article sur ce truc hier soir et cela datait de 2000.

    Mais pour "Pita", cela mérite que l'on creuse le sujet...

    Pour l'anecdote, le comportement de Googlebot aujourd'hui ressemble fort à celui décrit par des chercheurs de Stanford il y'a trois ans... (Cho et Garcia Molina)
     
  3. cariboo
    cariboo WRInaute impliqué
    Inscrit:
    8 Février 2003
    Messages:
    600
    J'aime reçus:
    0
    J'ai retrouvé les références de l'article sur webbase

    http://dbpubs.stanford.edu:8090/pub/sho ... mpression=

    Apparemment, le crawler Pita a au moins deux ans, et tourne sur une plateforme Java... Ils ont de l'humour chez Stanford, car il semble que ce truc a été baptisé ainsi, non pas à cause du pain Pita, mais plutôt parce que le crawler, dans ses premières versions, avait le don de saturer le réseau et les sites internet cibles.

    PITA : pain in the ass (désolé, fallait bien préciser) :oops:
     
  4. enfincom
    enfincom WRInaute discret
    Inscrit:
    25 Avril 2003
    Messages:
    86
    J'aime reçus:
    0
    En regardant dans les archives de mes stats, PITA passe sur Enfin uniquement depuis mai 2003.

    A priori, si c'est un projet ancien, il a du être réactivé dernièrement.


    CHRis
     
  5. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 124
    J'aime reçus:
    347
    Le responsable du projet PITA vient de m'écrire ce mail qu'il me demande de publier ici :
     
  6. Gilbert Wayenborgh
    Gilbert Wayenborgh WRInaute occasionnel
    Inscrit:
    16 Décembre 2002
    Messages:
    387
    J'aime reçus:
    0
    que son francais soit pardonné ... :)

    Best regards
     
Chargement...
Similar Threads - projet PITA Forum Date
Projet : Crawler de site pour mise en cache chez Fasterize Développement d'un site Web ou d'une appli mobile 7 Septembre 2017
Dotclear - projet communautaire open-source a besoin de vous Développement d'un site Web ou d'une appli mobile 29 Juin 2017
Pétition SaveTheLink contre un projet de l'Europe de taxe sur les liens Internet Le café de WebRankInfo 21 Janvier 2017
Que fait un chef de projet seo chez l'annonceur ? Débuter en référencement 21 Juillet 2016
Outils de CRM ? Outils de gestion de projets ? Le café de WebRankInfo 20 Avril 2016
Demande d'avis sur un projet de blog Demandes d'avis et de conseils sur vos sites 2 Février 2016
Participez au projet de loi numérique, RDV demain Paris e-commerce 15 Octobre 2015
finalisation d'un projet Droit du web (juridique, fiscalité...) 15 Octobre 2015
CMS de gestion de projets Administration d'un site Web 21 Juillet 2015
Projet de loi sur le renseignement : les principaux hébergeurs français se rebiffent Le café de WebRankInfo 11 Avril 2015
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice