Comment ils font ce truc.... !! Ca m'interesse!

WRInaute passionné
Bonjour a tous!

J'ai une petite question technique:
Apres avoir visité ce site: http://www.aboutus.org/ (et y avoir ajouté mon site internet)
Je me suis rendu compte que "aboutus.org" avait visité mon site.

Il a récupéré les métablaises description et title (OK, un grand nombre de sites arrivent également a faire ça!) mais en plus, il a assigné a mon site des "catégories" (catégories qu'ils doit avoir en mémoire dans sa base de données).

Quel type de script/langage permet d'explorer un site tiers et de récupérer des données permettant de faire cela...??

Un grand merci a tous ceux qui pourraient m'aiguiller, ce systeme m'interesse beaucoup!!

Anto
 
WRInaute accro
Maintenant, peut-on pousser un peu plus loin et carrément "crawler" le site web sur une profondeur de 2-3 links... Pour avoir un résultat plus fin...?
La seule limite en développement, c'est ton imagination.
Donc oui tu peut crawler autant de pages du site que tu veut ... Google le fait bien.
Après non, il n'y a pas de méthode stricte pour le faire. C'est trop précis. A toi de développer la chose.
 
Discussions similaires
Haut