script java pour obtenir le pagerank

Nouveau WRInaute
Bonjour,

Je viens de faire mon propre script d'annuaire en grails sous forme de plugin. c'est pour utiliser sur tous les sites que je fait en grails. c'est intéressant d'ajouter un annuaire pour apporter un peu de valeur au site et de visite. J'ai mis en place un annuaire "test" : http://directory.bibichette.com/ pour corriger les milliers de bugs qui sont présent :D

Bref, ce n'est pas l'objet de ce post. Je désire classer les sites par pagerank. J'avais trouvé un script java qui semblait fonctionner. J'ai du obtenir le PR de 2000 sites et puis plus rien. j'avais ajouté un timer pour ne faire qu'une demande toutes les 10 à 30 secondes. j'obtiens maintenant un code 403 (non authorisé) quand je fais une requête. j'ai le problème de chez moi de mon boulot, de mon hébergement ovh.

Quelqu'un connait-il un script java interressant pour un pr google. Mais je ne suis pas fixé à Google. si Yahoo propose le même service mais pas bridé, je suis prenneur. Ou tout autre organisme.

Merci pour vos conseils.
Bibich.[/url]
 
Nouveau WRInaute
Non c'est pas du javascript sinon je vais avoir du mal à faire des tris dessus. C'est bien en java que je cherche. pour sauvegarder les PR en base de données. ou bien un service web qui permet d'obtenir le pr en fonction de l'url (mais ca doit pas courir les rues).

Merci quand même.
 
Nouveau WRInaute
Ce script semble fonctionner corrctement aprés quelques petites adaptations. déjà 50 PR trouvé sur 140000 ;)

Est-ce google bloque des IP si il y a trop de requêtes faites (j'imagine que oui) et à quelle fréquence raisonnable peut on les faire.

si quelqu'un a une idée sur la question.

Merci
 
WRInaute accro
bibich a dit:
Est-ce google bloque des IP si il y a trop de requêtes faites (j'imagine que oui)
oui, et ça arrive assez rapidement même.
la durée du blackilistage d'ip, je ne sais pas, car comme je n'ai pas d'ip fixe, je réinitialise ma connexion et c'est bon ensuite... jusqu'à la prochaine fois
 
Discussions similaires
Haut