API : pour quoi faire ???

Nouveau WRInaute
Bonjour,

J'ai fait un petit script PHP qui analyse le positionnement de certains mots-clefs sur google.
Jusque maintenant, j'apelle directement https://www.google.fr/search?q=mot+clef...via un fopen, et je parse le résultat...
si pas de mon site dans la page 1, j'apelle https://www.google.fr/search?q=mot+clef&start=10... ainsi de suite jusque la page 20.

Bref, ca marche tres bien, alors pourquoi devoir passer par leur API ?
Risque t-on qqchose à appeler Google de cette facon ? (Je vois mal un blacklistage de tous les sites ayant l'IP de mon serveur.. Dans un hébergement mutualisé, ca ferait un sacré dégat !!!)

Voilà, merci aux experts qui pourront partager leur idée sur le sujet.
.....
 
WRInaute occasionnel
Ce que tu fait là ce sont des requetes automatisées et oui c'est interdit par Google, c'est d'ailleurs pour ca qu'ils ont cree l'API. A termes si tu fais trop de recherches avec ca, il font bannir ton IP, du moins des recherches pas de leur Index! Essai qd meme l'API elle est simple a manipuler, et les resultats arrivent sous forme de tableau, c'est plus sympa que d'avoir à parser une page HTML mal-ecrite en plus. (D'ailleurs je serais curieux de voir ta routine qui fait le parse)

@+
David
 
Nouveau WRInaute
Ok Ok... Je me suis renseigné un peu plus... Mais.. On est limité qu'à 1000 requetes par jour ???!!?? Pas moyen d'en avoir plus ?? Imaginons que je propose un service qui se base sur Google et qui ne marche qu'une heure par jour "Désolé, les 1000 requetes ont été atteintes.. veuillez revenir demain.."


Benh... sinon, la routine que j'ai faite.. c'était pas pour le web, mais pour les images.. Bon, c'est un peu plus simple.. mais le principe reste sensiblement le meme !

Code:
$racine_google="http://images.google.fr";
		$recherche=rawurlencode($motclefs);
		
		$url=$racine_google."/images?hl=fr&lr=&ie=UTF-8&q=".$recherche."&start=".$start;	
		$contenu=file_get_contents($url);	
		preg_match_all("/<a href=\/imgres\?imgurl=([^& <>']+)&([^<>]+)><img src=([^ <>]+) width=([0-9]+) height=([0-9]+)><\/a>/i",$contenu,$tab);
			
		for ($i=0;$i<count($tab[1]);$i++) {
		
			$img_originale=$tab[1][$i];
			$img_min=$tab[3][$i];
			$img_min_largeur=$tab[4][$i];
			$img_min_hauteur=$tab[5][$i];				
		}	
		if (ereg("<img src=/intl/fr/nav_next.gif",$contenu)) {
			// Il existe une page suivante.. donc, on recommence avec un start+=10
			...
			
		}
 
WRInaute occasionnel
Merci pour le bout de code :D c'est vrai que c'est plus simple pour les images.

Pour en revenir a l'API 1 requete te donne 10 resultats, donc avec 1000 requetes par jour ca donne 10'000 resultats c'est deja pas mal, sinon tu peux proposer aux utilisateurs de rentrer leurs propres clefs, ou toi d'en avoir plusieurs et de les faire tourner!

Encore un truc, on ne peut pas chercher dans google image ou google news avec l'API, alors si c'est seulement là que tu veux faire des recherches, continue avec ton systeme.

@+
David
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut