Comment trouver des pages non indexées sur mon site ?

Discussion dans 'Crawl et indexation Google, sitemaps' créé par jeffman, 15 Novembre 2010.

  1. jeffman
    jeffman WRInaute discret
    Inscrit:
    25 Septembre 2006
    Messages:
    160
    J'aime reçus:
    0
    Bonjour a tous,
    Voila une petite question assez simple et qui peut avoir son importance !
    Le site que je gère a un peu plus d'un millier de pages, google m'en annonce 1021 envoyées sur le sitmap et n'en retiens que 1012 ! une broutille vous allez me dire ! Mais toutefois j'aimerais bien retrouver ces 9 pages d'écart pour comprendre ce qu'il se passe et pourquoi pas faire le necessaire pour qu'elles soinet indexées.
    Toutefois, je ne me sent pas de me taper toutes les pages unes par unes et de cocher pour savoir si c'est bon, j'ai recherché un outils mais tous les outils proposent la même chose, c'est la liste des pages indexées, et non l'inverse !
    Est ce que quelqu'un a déja été confronté au problème, et avez vous une solution ?
    Bonne soirée !
     
  2. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 925
    J'aime reçus:
    77
    Tu connais tes contenus j'imagine (je veux dire tu connais leurs url) ? Il te suffit donc de faire la différence entre les url de tous les contenus du site et celles des pages indexées.

    Si ton outil ne repose pas sur un CMS particulier, tu peux utiliser Xenu Link Sleuth pour récupérer la liste des pages indexables du site.
     
  3. ap34df
    ap34df WRInaute occasionnel
    Inscrit:
    7 Septembre 2010
    Messages:
    414
    J'aime reçus:
    0
    Si tu gère des sites, tu dois savoir programmer.
    Une moulinette qui compare ton sitemap avec les serps de GG n'est pas difficile à réaliser.
     
  4. jeffman
    jeffman WRInaute discret
    Inscrit:
    25 Septembre 2006
    Messages:
    160
    J'aime reçus:
    0
    Bonjour,

    Merci UsagiYojimbo, mais c'est justement ce que je ne veux pas faire car comparer 1021 url j'en ai pour la journée ! Ce que je recherche c'est justement une moulinette comme me le suggère Ehplod ! Seulement mes connaissances en programmation sont assez limitées !

    Toutefois je vous remercie d'avoir pris le temps de me répondre !

    Bonne journée a tous !
     
  5. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 925
    J'aime reçus:
    77
    Une fois que tu as les deux lots d'url (la liste complète des pages de ton site et la liste des pages indexées), c'est pas forcément très compliqué de les charger dans des tableaux en PHP et d'utiliser une fonction qui te renverrais la différence entre les deux tableaux.
     
  6. jeffman
    jeffman WRInaute discret
    Inscrit:
    25 Septembre 2006
    Messages:
    160
    J'aime reçus:
    0
    Oui, comme ca c'est plus clair, merci UsagiYojimbo !!!
    bonne journée a+
     
  7. fobec
    fobec WRInaute discret
    Inscrit:
    10 Mai 2005
    Messages:
    189
    J'aime reçus:
    0
    Bonjour,

    quelle méthode utilisez-vous pour connaitre la liste des URL indexées par Google ?
     
  8. LeGastronome
    LeGastronome Nouveau WRInaute
    Inscrit:
    18 Novembre 2009
    Messages:
    35
    J'aime reçus:
    0
    Même question :)

    Comment faites vous pour sortir un tableau des pages indexés ?
     
  9. Madrileño
    Madrileño Membre Honoré
    Inscrit:
    7 Juillet 2004
    Messages:
    32 079
    J'aime reçus:
    283
  10. lost-in-seo
    lost-in-seo Nouveau WRInaute
    Inscrit:
    16 Novembre 2010
    Messages:
    11
    J'aime reçus:
    0
    Bonjour,

    je suis exactement dans cette problématique et je suis bloqué.
    Via Xenu, j'ai créé un sitemap de mon site qui a un peu plus de 7000 pages.
    J'uploade le dit sitemap dans GWT et il me dit que 5500 pages sont indexées.

    J'ai donc un trou de 1500 pages et je voudrais avoir la liste de ces pages de mon sitemap non indexées.
    Effectivement, je peux les obtenir par un différentiel si je connais la liste de mes pages indexées, mais je ne sais pas comment obtenir cette liste...

    De plus, si je fais la commande site:monsite.com, je vais pouvoir obtenir des pages indexées mais je n'ai accès qu'à 100 pages de résultats, soit les 1000 premières pages indexées...
    UsagiYojimbo tu as visiblement trouvé une solution, pourrais-tu nous éclairer?

    Cordialement,
     
  11. lost-in-seo
    lost-in-seo Nouveau WRInaute
    Inscrit:
    16 Novembre 2010
    Messages:
    11
    J'aime reçus:
    0
    Up,
    je suis en train de bricoler une moulinette sur le thème.
    Les débuts étaient intéressants et j'ai trouvé des urls non indexées effectivement.
    Toutefois, je me suis retrouvé assez vite refoulé pour cause de requêtes automatiques.
    J'imagine que je vais être banni pour quelques heures...

    Je retenterai demain en mettant des pauses dans mon script...
    Allez, 7000 Urls à tester :) (pas grand chose en soi, de plus).
     
  12. ap34df
    ap34df WRInaute occasionnel
    Inscrit:
    7 Septembre 2010
    Messages:
    414
    J'aime reçus:
    0
    Bah faut pas tester 50 000 url en me^me temps... Faut laisser le temps...
    Sinon, tu récupères la liste de tes url indexé via ton compte webamster tools et ensuite tu la compare sur ton PC avec ton sitemap.
     
  13. lost-in-seo
    lost-in-seo Nouveau WRInaute
    Inscrit:
    16 Novembre 2010
    Messages:
    11
    J'aime reçus:
    0
    Bonjour,
    Ou est-ce qu'on peut récupérer la liste des urls indexées dans GWT?
    Je croyais qu'on ne peut avoir que le nombre par rapport aux sitemaps fournis.
     
  14. lost-in-seo
    lost-in-seo Nouveau WRInaute
    Inscrit:
    16 Novembre 2010
    Messages:
    11
    J'aime reçus:
    0
    Je galère dans ma recherche, je me heurte toujours plus ou moins à cette limite de Google...

    Est-ce que quelqu'un sait si je peux arriver à ce résultat via Agent Web Ranking par exemple?
     
Chargement...
Similar Threads - trouver indexées Forum Date
Comment trouver les URL indexées cassées ? Débuter en référencement 12 Novembre 2020
Trouver les noms de domaines contenant un mot particulier Noms de domaine et référencement 22 Mai 2021
Comment trouver la position de mon site sur Google ? Débuter en référencement 13 Mai 2021
retrouver mot de passe Facebook 10 Avril 2021
Des sites pour trouver des petits jobs freelance en traduction ? Le café de WebRankInfo 16 Mars 2021
Comment trouver des clients en rédaction web ? Rédaction web et référencement 16 Février 2021
Comment trouver des liens en dofollow gratuits ? Netlinking, backlinks, liens et redirections 21 Juin 2020
Où trouver le trafic incorrect Adsense détaillé par jour ? AdSense 5 Mai 2020
WordPress Comment retrouver où est faite une redirection 301 ? Administration d'un site Web 2 Mars 2020
Je n'arrive pas à trouver la balise h1 sur mon Blogger. Problèmes de référencement spécifiques à vos sites 5 Février 2020