Je souhaite extraire la position d'un site sur une requete précise (ou une autre info, genre le nombre de résultats trouvés, ou nb de backlinks) sur Google en créant une requete HTTP puis un peu d'expressions régulieres. Jusque là pas de soucis.
J'obtiens les données que je veux pour 1 ou quelques sites. Le problème survient quand je veux "processer" une base de sites (10000 URL environ)" afin de les analyser successivement. En effet Google restreint le nb de requetes par IP. Du coup il active le captcha et en gros je ne peux plus rien faire.
Pourtant des soft comme AgentWebRank permettent de checker des combinaisons URL x mot clés sans problèmes en créant des milliers de requetes successives et cela sans etre inquiété
J'ai bien tenté d'utiliser différents proxy dans mes requetes, rien de bien concluant.
Quelqu'un aurait une idée ?
merci
J'obtiens les données que je veux pour 1 ou quelques sites. Le problème survient quand je veux "processer" une base de sites (10000 URL environ)" afin de les analyser successivement. En effet Google restreint le nb de requetes par IP. Du coup il active le captcha et en gros je ne peux plus rien faire.
Pourtant des soft comme AgentWebRank permettent de checker des combinaisons URL x mot clés sans problèmes en créant des milliers de requetes successives et cela sans etre inquiété
J'ai bien tenté d'utiliser différents proxy dans mes requetes, rien de bien concluant.
Quelqu'un aurait une idée ?
merci