Lister toutes les url non indéxées dans Google ?

WRInaute discret
Salut,

Tout est dans le sujet :wink:

je voudrais savoir s'il existe un moyen de connaître toutes les pages d'un site non indéxées dans Google ?

Genre, par exemple, en entrée, on donne à manger une liste d'urls dans un fichier sitemap xml et en sortie on obtient la liste de toutes les urls non indéxées dans Google...

Si quelqu'un sait comment faire je suis preneur !

Merci d'avance :)
 
WRInaute discret
Rod la Kox a dit:
Une différence de la commande site:www.exemple.com et du sitemap correspondant.

Lol merci Rod pour le tuyau mais je cherche quelques chose de plus rapide :wink:
Quand tu dis faire la différence, comment tu la fais la différence ?

Si seulement il y avait moyen de récupérer les résultats de la commande site:www.exemple.com au format excel, il y aurait moyen de faire un truc mais là des résultats au format HTML il n'y a pas grand chose à faire avec...

Peut être il y a t'il moyen avec un script php qui récupère tous les résultats de la commande site:www.exemple.com pour les parser. Mais Google n'aime pas trop ce genre de requête automatisée me semble t'il... ?

Personne a un outil pour faire ce genre de chose ? ou un logiciel ?
 
WRInaute accro
Marie-Aude a dit:
Oui mais quand on a un peu plus d'une dizaines de pages d'indexées, c'est sympa de pouvoir automatiser :)
webstorm a dit:
Si seulement il y avait moyen de récupérer les résultats de la commande site:www.exemple.com au format excel
Bah je le fais pour mes test de positionnement.
Ensuite, tu fais une rouyine qui compare les pages indexées et celle du sitemap.

Je ne vois pas de problème.


... si on sait codé, of course. :mrgreen:
 
WRInaute accro
Bah, c'est un script perso, mais pour toi, il ferait :

Récupération du contenu de la requête site:machin.tld (fonction php)
Extraction des url. (preg match)
Boucle pour le faire sur toutes les pages données par GG (donc 1000 URL maxi.)
Mise en bdd

Récupération du sitemap de machin.tld (fonction php)
Extraction des URL (preg match)
Mise en bdd

Comparaison.
 
WRInaute accro
saypee a dit:
Oui , au lieu de vous la raconter , faites peter vos codes quoi :mrgreen:
je n'avais même pas pensé à faire un tel script. C'est ce fil qui m'en a donné l'idée. Mais bon, j'ai tellement d'autres priorités
 
Discussions similaires
Haut