Risques d'un site extrayant ses données depuis google?

  • Auteur de la discussion Auteur de la discussion Podvin
  • Date de début Date de début
Nouveau WRInaute
Bonjour,

Inspiré de ce post https://www.webrankinfo.com/forum/t/un-petit-script-php-de-test-de-positionnement-google.44365/,
j'ai réalisé un prototype d'outil de positionnement de sites à partir de données extraites depuis les requêtes sur google...

J'incorporerais bien ce proto dans un site officiel mais
il semblerait que cela puisse ne pas respecter les conditions d'utilisation google (https://www.google.com/accounts/TOS?loc=FR
- "5. Utilisation des Services")

Quelles sont les conséquences réelles de ce type de sites vis-à-vis de google?
tant au niveau du référencement que du nombre de requêtes faites...

blacklistage de la page? du domaine? simplement de l'ip pour limitation des requêtes? rien?

Est-ce qu'il y a des expériences?

D'autre part, qui peut-on éventuellement contacter chez google pour avoir une réponse de leur part? voire une autorisation?
Il y a bien le "bureau de vente local france"?...

Le prototype peut être consulté ici : http://www.majolieentreprise.com/googletest/

Pour ceux qui les souhaiteraient...
Les sources (brut de fonderie/non optimisé/compliqué/etc!) sont disponibles à cette adresse :
http://www.majolieentreprise.com/googletest/googletest.zip


Merci d'avance pour vos réponses...
Emmanuel
PS: c'est mon premier post :) alors pardon d'avance pour mes éventuelles bourdes de débutants...
 
WRInaute accro
si tu as une ip fixe, google va te bannir quelques minutes (ou heures ?) et à chaque requête, tu seras obligé de saisir un captcha, sinon, il suffit de réinitialiser ta connexion pour obtenir une autre ip :wink:
 
WRInaute passionné
Je pense que le seul risque de blacklistage est celui de l'IP et cela juste pour acceder a Google. Et seulement s'il y a trop de requetes. Legalement, je ne pense pas que Google fera qqch.

Leonick: un captcha chez Google?
 
Nouveau WRInaute
Merci de vos réponses.

Je n'ai effectivement pas connaissance de captcha sur google...?
Il faut dire que je ne l'ai jamais énervé jusqu'à ce point pour le savoir!

Pour ce qui est de l'IP, elle serait a priori fixe...
L'idée est que ce script soit public... et je préfèrerais que
cela ne soit pas générateur de problèmes de référencement,
plutot le contraire d'ailleurs :wink: ...

Est-ce qu'un blacklistage d'IP s'applique aux différents serveurs google?

Ce que je n'arrive pas trop à sentir, c'est le degré d'acceptation/tolérance
(ou de sanction) de google vis-à-vis des sites qui explorent ses résultats
autrement que par la voie royale...
 
WRInaute accro
Podvin a dit:
Je n'ai effectivement pas connaissance de captcha sur google...?
Il faut dire que je ne l'ai jamais énervé jusqu'à ce point pour le savoir!
Ca arrive très vite : une dizaine de requête sur une cinquantaine d'ip à la suite et hop bloqué. ET là, si on fait une recherche google, il y a le captcha avec un message comme quoi on a peut-être un virus qui fait des requêtes automatiques.
 
WRInaute occasionnel
Ca m'arrive fréquemment avec certains outils d'analyse de positionnement ( free monitor for google ) qui n'utilisent pas l'API, et qui se contentent de taper chez google directement.

Ca fait tout drole la premiere fois :D
 
WRInaute accro
j'avais essayé une tempo assez courte (1 ou 2 sec) mais ce n'était pas suffisant, même en allant chercher sur d'autres ip, mais de même classe
 
Nouveau WRInaute
Bon, il faudrait un mécanisme d'interrogations tournant depuis différents serveurs avec différentes ip... ca commence à faire un peu usine à gaz!

Est-ce que c'est la même chose chez Yahoo?
même si cela présente un peu moins d'intérêt, cela peut peut-être être utile d'en extraire des résultats...
 
WRInaute accro
je n'ai pas encore pris de temps pour faire des extractions auto sur d'autres moteurs, mais c'est dans ma todo list 8)
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut