Récupérer contenu de la page google par file_get_contents

007007

Nouveau WRInaute
Bonjour,

dans mon site j'ai créé une page pour récupérer le contenu de la recherche de google, voici le code :

Code:
<?php

echo file_get_contents('https://www.google.co.ma/search?q=site+php&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_fr___MA368');

?>

mais cela semble être bloqué par google, la page m'affiche :

Forbidden
Your client does not have permission to get URL /search?q=fgdfg&num=20&start=0&hl=fr&safe=active&sa=N&ie=utf-8&oe=utf-8 from this server. (Client IP address: 194.150.236.223)

Please see Google's Terms of Service posted at https://www.google.com/terms_of_service.html


If you believe that you have received this response in error, please report your problem. However, please make sure to take a look at our Terms of Service (https://www.google.com/terms_of_service.html). In your email, please send us the entire code displayed below. Please also send us any information you may know about how you are performing your Google searches-- for example, "I'm using the Opera browser on Linux to do searches from home. My Internet access is through a dial-up account I have with the FooCorp ISP." or "I'm using the Konqueror browser on Linux to search from my job at myFoo.com. My machine's IP address is 10.20.30.40, but all of myFoo's web traffic goes through some kind of proxy server whose IP address is 10.11.12.13." (If you don't know any information like this, that's OK. But this kind of information can help us track down problems, so please tell us what you can.)

We will use all this information to diagnose the problem, and we'll hopefully have you back up and searching with Google again quickly!

Please note that although we read all the email we receive, we are not always able to send a personal response to each and every email. So don't despair if you don't hear back from us!

Also note that if you do not send us the entire code below, we will not be able to help you.

Best wishes,
The Google Team
/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/
AVAGuupwibvAOk_UZWWrghMu8UdUEHPQ-BVJjqD5xed6fpX9p
Ck7qrR-dRZrcqcu86kqA90D5Iu7ZSwEqQI6TgA81XstgtZEXD
sMkdZkMH4nx6KBfkHJeNa60l7V6uCWmSLe-n6TNEaOsFOx6Dq
4YHKmJu5M0ZJ46gq2GagNGjCJF3KceNpueLdzifrwC4RgbekM
kVMq39ktDlb6DWXQbD57VIGK2l1eGqYeGpToKZfCWHd3vmRA5
7am2NDosOcZOLRxtdcFg_Dj9AfcY26TDnYgIsj-HdWKTpHZdA
4fmhI_QFn3PZgmtuZlhZU9b--3pDYjU5n-c8n_3QCW_wvT09i
4t7YFRwzY1O4QvZsiRkzqA-_oNXksLZRFhpjbF9aGkND9fVVO
STejuGvLrCp8Q8gGAVYLLGiWvG4Scm8G2GoeVoyzrTSNrsV7w
PH3uN7_2_-mf0-OAI8KSG1lKW05M3IXnVCu9uRLUcwnCfvt16
p90B-UaDf8TayQiNF-2Vh49oB_L2Oa1hVS6PdmZAwDfDbwniy
yXjYmkzyb_N24fHfliH1kEdhTsnPrbmkR1-nNza86TQ1_Wbnx
Xzl0TZGjkYmSfSWRscNyihQhm-ZEVHIE-elHKGPGMLdzifrwC
4Rge0xNWZsr5_Iy1xYsxNVfMoU3r9P9g1hy1qtgH_c27OBMsp
4QSk1L5u6pI6Z9MOZxRcAetF34tCqjIAxB1Isubl-8bDZjdf3
k6zcNMPr9FJ8qq_YLuoQcdRJbfwVZooHGGyO-i49KyNRPkoRu
+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+/+


une idée svp ? c'est important pour moi, j'ai fait tout un script pour récupérer les résultats depuis google, en local ça marche bien mais en ligne ça coince ....


merci
 

Dr DLP

WRInaute impliqué
Pourquoi ne pas passer par l'API Google?
Tu peux même récupérer les résultats au format XML :)
 

007007

Nouveau WRInaute
Dr DLP a dit:
Pourquoi ne pas passer par l'API Google?
Tu peux même récupérer les résultats au format XML :)

car j'ai déjà codé tout un script pour récupérer les résultats de google (variables liens, description, titre ...), donc refaire tout ça prendrai trop de temps

un ami m'a dit que l'exemple en haut ça marchez chez lui, il voit bien les résultats de google, quelqu'un peut il confirmer ça ?

merci
 

VisitezMonSite

WRInaute impliqué
Pas besoin de verifier, l'exemple marche certainement, tant que Googe n'a pas bloque l'ip de ton serveur.
Utiliser l'API te permet de pouvoir obtenir beaucoup plus de resultats avant d'etre banni, meme des fois ils ne te banissent pas :)
 

007007

Nouveau WRInaute
VisitezMonSite a dit:
Pas besoin de verifier, l'exemple marche certainement, tant que Googe n'a pas bloque l'ip de ton serveur.
Utiliser l'API te permet de pouvoir obtenir beaucoup plus de resultats avant d'etre banni, meme des fois ils ne te banissent pas :)

mais l'api ne permet pas de récupérer les résultats, par ex un tableau de liens, un tableau contenant les description de ce lien ... il permet juste d'afficher les résultats sur ta page ...

quand google banni ? si je fais par ex des requêtes de 20 liens une fois par heure je risque d'être banni ?
 

VisitezMonSite

WRInaute impliqué
Si, l'api permet de recuperer les resultats, les description, le titre, le lien, et plus encore. Lis la doc de l'api, il y a meme un exemple de code php. Par contre oui tu es limite dans le nombre de resultats, mais c'est largement suffisant, du moment que tu as une dizaine des premiers. Apres cela depend de ce que tu veux faire avec.

A propos du bannissement, ils ne precisent rien, et encore moins quand tu ne passes pas par leur API.
 

Discussions similaires

Haut