Bonjour,
je m'arrache les cheveux (tant mieux, je dois passer chez le coiffeur).
Je cherche à obtenir pour une liste de mots clés le nombre total de résultats ("Résultats 1 à 10 sur un total d'environ 1234567890").
Jusque là, je le faisais en "scrappant" la page de google ("https://www.google.fr/search?q=domaine").
Le problème, c'est que c'est lent et que si on va trop vite, on se fait blacklister au moins 1 heure par Google *
Donc, j'attaque par les webservices de "Google Search API".
Et là, le paramètre "estimatedResultCount" est sensé donné le nombre total de résultat **.
Le problème : ce n'est pas le cas, et d'autre part, il est complètement buggé ***.
Ma question : existe-t-il une une autre méthode pour obtenir le nombre total de résultat d'une requête à Google Search ?
lolo
* J'ai tenté de faire tourner mes requêtes sur une 50aine de datacenters. ça ne marche pas, Google n'est pas con et considère qu'un appel vers 50 datacenters = 50 appels vers Google bien tenté petit scarabée.
De même, j'ai tenté de passer par des proxies mais je me heurte aux timeout ou à des blacklists déjà existants, même en utilisant des High Anonymous/Elite proxies.
** exemple : 148000 résultats pour webrankinfo au lieu de 500000 : http://ajax.googleapis.com/ajax/services/search/web?v=2.0&q=webrankinf ... utf-8&aq=t
*** une recherche sur google suffit à trouver plein de personnes dans mon cas...http://code.google.com/p/google-ajax-apis/issues/detail?id=32
je m'arrache les cheveux (tant mieux, je dois passer chez le coiffeur).
Je cherche à obtenir pour une liste de mots clés le nombre total de résultats ("Résultats 1 à 10 sur un total d'environ 1234567890").
Jusque là, je le faisais en "scrappant" la page de google ("https://www.google.fr/search?q=domaine").
Le problème, c'est que c'est lent et que si on va trop vite, on se fait blacklister au moins 1 heure par Google *
Donc, j'attaque par les webservices de "Google Search API".
Et là, le paramètre "estimatedResultCount" est sensé donné le nombre total de résultat **.
Le problème : ce n'est pas le cas, et d'autre part, il est complètement buggé ***.
Ma question : existe-t-il une une autre méthode pour obtenir le nombre total de résultat d'une requête à Google Search ?
lolo
* J'ai tenté de faire tourner mes requêtes sur une 50aine de datacenters. ça ne marche pas, Google n'est pas con et considère qu'un appel vers 50 datacenters = 50 appels vers Google bien tenté petit scarabée.
De même, j'ai tenté de passer par des proxies mais je me heurte aux timeout ou à des blacklists déjà existants, même en utilisant des High Anonymous/Elite proxies.
** exemple : 148000 résultats pour webrankinfo au lieu de 500000 : http://ajax.googleapis.com/ajax/services/search/web?v=2.0&q=webrankinf ... utf-8&aq=t
*** une recherche sur google suffit à trouver plein de personnes dans mon cas...http://code.google.com/p/google-ajax-apis/issues/detail?id=32