[Réglé] Liste de liens

WRInaute passionné
J'aimerais récupérer la liste des liens pointant sur un site Web et la traiter sur un tableur.
Idéalement il s agirait de la liste de liens fournie par Yahoo avec la commande link:h--p://www.lesite.com.
Avez vous une idée ? Merci !
 
WRInaute passionné
je vais peut etre dire une connerie, mais en php, avec la fonction "ereg" tu dois pouvoir rapatrier les adresses d'une url precise, en l'occurence celle de tes resultats dans google. Ensuite, les exporter devrait etre facile.
A+!
 
WRInaute passionné
la meilleure solution consiste à parser le code HTML avec ton langage préféré, après avoir fait une requête HTTP :
Ex en PHP ( avec PEAR ), les urls à interroger sont dans une DB :
Code:
	include_once( "HTTP/Request.php" ) ;
       // La requete SQL qui va bien
       $res = ........ ;
	$req =& new HTTP_Request("") ;
	while ( $row = $res->fetchRow() ) {
		$req->setUrl( $row->url ) ;
		$req->sendRequest() ;
		$code = $req->getResponseCode() ;
               // Il faut bien sur traiter les codes de réponses : 200, 404, etc...
                $html = $req->getResponseBody() ;
        
             // Ici tu travaille sur ton code HTML

       }

Il existe une solution plus simple avec Excel :

Données -> Données Externe -> Nouvelles Requêtes Web

Perso, je n'ai jamais été convaincu par cette possibilité d'Excel, mais bon tu peux tjrs essayer.

Si tu travaille en Perl, tu vas utiliser un module CPAN du type : HTML::TreeBuilder qui te permet de manipuler directement la dom, sans passer par les expressions régulières. C +sympa, et plus fiable.
ça marche aussi sur du code HTML, mal formaté
Je ne sais pas s'il existe l'équivalent en Php.
 
WRInaute passionné
Merci á vous deux, c est super sympa

J ai réussi á récupérer une liste avec Open Office > Insert > External Data

C est pas top mais ca va le faire :wink:
 
Discussions similaires
Haut