Récupérer toutes les pages indéxées

WRInaute discret
Bonjour,

Je suis en phase d'étude de projet pour un client.
J'ai tout d'abord analysé les pages indéxées actuellement.

J'aimerais savoir s'il est possible ou s'il existe un script pour :

- Lister toutes les pages indéxées de Google de mon site ? via la commande site:
- Avec l'URL indéxée
- ainsi que le title de la page...

Et plus d'information si c'est possible (PR...)

Je ne sais pas si ce genre de script existe déjà mais je n'en ai pas trouvé ?

A l'avance merci.
 
WRInaute discret
Ce n'est pas vraiment ça que je veux faire.

je veux récupérer dans un fichier excel si cela est possible le résultat de la commande site:monsite.com

Avec le title de la page, l'url
 
WRInaute accro
Etan donné que le title affiché dans les SERP n'est aps forcément le contenu de la balise title (idem pour la meta desc), il faut en effet crawler chaque page de ta requête site: pour avoir ces infos.
 
WRInaute discret
@webrankinfo Quel genre d'outils spécialisés ?

@usagiYojimbo : je veux juste essayer d'au moins gagner un peu de temps en récupérant dans un fichier toutes les urls indexées histoire de travailler dessus
 
WRInaute accro
Je sais pas combien t'as de pages indexées donc combien de page google va te renvoyer mais les enregistrer en local et faire un peu de nettoyage avec deux trois regex c'est pas non plus un travail de fou. Vue que le sujet a deux jours tu pourrait avoir déjà fini.
 
WRInaute discret
Et pour ceux qui n'ont pas ce genre d'outils, personne n'a développer ce genre de script ?
Tanpis je vais me lancer à la mano..
 
WRInaute discret
Bonjour Olivier,

Je suis tombé sur un de vos articles sur WRI qui parle de SEO quake : https://www.webrankinfo.com/dossiers/outils/seoquake


Apparamment avec cet outils il est possible d'extraire dans un fichier CSV les urls indéxées mais je n'ai pas trouvé comment faire, auriez-vous un peu plus d'informations ?


Bien cordialement.

Allan Jocalaz

EDIT

J'ai trouvé comment faire :

J'ai affiché 100 résultats par pages dans les résultats Google ensuite en activant SEO quake on peut faire sav as csv (un truc comme ça)

Ensuite on peut traiter les informations dans un CSV, dommage que celui-ci ne récupère pas les title
 
Nouveau WRInaute
Bonjour Allan,

Je viens de tomber sur ton post. Est-ce que tu as trouvé ?

Sinon, je peux peut-être te renseigner pour SeoQuake + exploitation excel pour récupérer des datas.
 
WRInaute accro
Tu peux utiliser un outils de création de sitemap en ligne
tu lui donnes l'url racine du site et il va te faire la liste de toutes les pages accessibles via des liens
ensuite tu compares avec ce que te donne Google. Pour 200 pages ce n'est pas énorme.
 
Discussions similaires
Haut