Comment trouver des pages non indexées sur mon site ?

WRInaute discret
Bonjour a tous,
Voila une petite question assez simple et qui peut avoir son importance !
Le site que je gère a un peu plus d'un millier de pages, google m'en annonce 1021 envoyées sur le sitmap et n'en retiens que 1012 ! une broutille vous allez me dire ! Mais toutefois j'aimerais bien retrouver ces 9 pages d'écart pour comprendre ce qu'il se passe et pourquoi pas faire le necessaire pour qu'elles soinet indexées.
Toutefois, je ne me sent pas de me taper toutes les pages unes par unes et de cocher pour savoir si c'est bon, j'ai recherché un outils mais tous les outils proposent la même chose, c'est la liste des pages indexées, et non l'inverse !
Est ce que quelqu'un a déja été confronté au problème, et avez vous une solution ?
Bonne soirée !
 
WRInaute accro
Tu connais tes contenus j'imagine (je veux dire tu connais leurs url) ? Il te suffit donc de faire la différence entre les url de tous les contenus du site et celles des pages indexées.

Si ton outil ne repose pas sur un CMS particulier, tu peux utiliser Xenu Link Sleuth pour récupérer la liste des pages indexables du site.
 
WRInaute occasionnel
Si tu gère des sites, tu dois savoir programmer.
Une moulinette qui compare ton sitemap avec les serps de GG n'est pas difficile à réaliser.
 
WRInaute discret
Bonjour,

Merci UsagiYojimbo, mais c'est justement ce que je ne veux pas faire car comparer 1021 url j'en ai pour la journée ! Ce que je recherche c'est justement une moulinette comme me le suggère Ehplod ! Seulement mes connaissances en programmation sont assez limitées !

Toutefois je vous remercie d'avoir pris le temps de me répondre !

Bonne journée a tous !
 
WRInaute accro
Une fois que tu as les deux lots d'url (la liste complète des pages de ton site et la liste des pages indexées), c'est pas forcément très compliqué de les charger dans des tableaux en PHP et d'utiliser une fonction qui te renverrais la différence entre les deux tableaux.
 
Nouveau WRInaute
Bonjour,

je suis exactement dans cette problématique et je suis bloqué.
Via Xenu, j'ai créé un sitemap de mon site qui a un peu plus de 7000 pages.
J'uploade le dit sitemap dans GWT et il me dit que 5500 pages sont indexées.

J'ai donc un trou de 1500 pages et je voudrais avoir la liste de ces pages de mon sitemap non indexées.
Effectivement, je peux les obtenir par un différentiel si je connais la liste de mes pages indexées, mais je ne sais pas comment obtenir cette liste...

De plus, si je fais la commande site:monsite.com, je vais pouvoir obtenir des pages indexées mais je n'ai accès qu'à 100 pages de résultats, soit les 1000 premières pages indexées...
UsagiYojimbo tu as visiblement trouvé une solution, pourrais-tu nous éclairer?

Cordialement,
 
Nouveau WRInaute
Up,
je suis en train de bricoler une moulinette sur le thème.
Les débuts étaient intéressants et j'ai trouvé des urls non indexées effectivement.
Toutefois, je me suis retrouvé assez vite refoulé pour cause de requêtes automatiques.
J'imagine que je vais être banni pour quelques heures...

Je retenterai demain en mettant des pauses dans mon script...
Allez, 7000 Urls à tester :) (pas grand chose en soi, de plus).
 
WRInaute occasionnel
Bah faut pas tester 50 000 url en me^me temps... Faut laisser le temps...
Sinon, tu récupères la liste de tes url indexé via ton compte webamster tools et ensuite tu la compare sur ton PC avec ton sitemap.
 
Nouveau WRInaute
Bonjour,
Ou est-ce qu'on peut récupérer la liste des urls indexées dans GWT?
Je croyais qu'on ne peut avoir que le nombre par rapport aux sitemaps fournis.
 
Nouveau WRInaute
Je galère dans ma recherche, je me heurte toujours plus ou moins à cette limite de Google...

Est-ce que quelqu'un sait si je peux arriver à ce résultat via Agent Web Ranking par exemple?
 
Discussions similaires
Haut