Pourquoi ai-je 2,5 fois plus de pages indexées que d'URL ?

Discussion dans 'Débuter en référencement' créé par Icipierrot, 9 Mars 2017.

  1. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Bonjour à toutes et à tous,

    Voilà, c'est bien simple : le 5 mars Google search console m'annonce que j'ai 2270 pages indexées. Et pourtant lorsque je regarde sur ma plate-forme WordPress, je n'ai que 90 pages et 797 articles. Mais qu'est-ce que c'est que ce binz ?

    Merci d'avance :wink: .
     
  2. GBB N12
    GBB N12 Nouveau WRInaute
    Inscrit:
    9 Mars 2017
    Messages:
    12
    J'aime reçus:
    0
  3. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 419
    J'aime reçus:
    9
    Pas mieux, sans l'url aucune chance de trouver la réponse.
     
  4. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    22 903
    J'aime reçus:
    27
    il s'agit sans doute de ce que chez Ranking Metrics on appelle la masse noire
    lance un outil de crawl sur ton site et tu auras sans doute la réponse
     
  5. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Celle de mon www :wink: . Je voulais pas donner l'impression de me faire de la pub. :roll:
     
  6. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Je viens de lancer MRT, qui me retourne 39 % de pages non-indexables car "URL canonique fournie (différente de l'URL crawlée)". En regardant de plus près, il s'agit de différences entre http et https.

    Par exemple, celle ci http://www.emprunter-malin.com/taux-immobiliers/ existe en double avec celle-ci https://www.emprunter-malin.com/taux-immobiliers/.

    Et pourtant mon développeur a fait la redirection http https. Par exemple, celle de mon index http://www.emprunter-malin.com/ pointe bien vers http://www.emprunter-malin.com/. C'est là où je ne comprends plus rien, je croyais que toutes les URL en http étaient dirigées vers https. 8O.
     
  7. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Bon, entre mon message précédent et maintenant, j'ai pu joindre mon développeur qui s'est aperçu que la redirection https avait sauté… Et maintenant, c'est réparé.

    Par contre, ça n'explique toujours pas pourquoi je 2 fois plus d'URL indexées…

    J'ai plus qu'à repasser un autre crawl sur MRT pour tenter d'identifier ce problème de masse noire....
     
  8. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Me revoici avec les derniers résultats du crawl MRT, qui dit :

    si votre nombre de pages à indexer est égal à 888, alors vous n'avez aucun problème.

    Nb de pages indexables 888.

    Dois-je en conclure que je n'ai pas de problème avec cette fameuse masse noire ?

    Merci d'avance pour votre aide, tous ces trucs techniques qu'on ne comprend pas et sur lesquels on ne peut pas agir, c'est très stressant. :evil:
     
  9. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 419
    J'aime reçus:
    9
    Penses aussi que tu as tes pages de pagination qui sont indexées. Ça augmente de facto le volume de tes pages.
     
  10. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    Ça fait quand même 2 fois plus. Et surtout, c'est l'analyse du nouveau compte créé sur GSA, spécialement pour la nouvelle URL en https. Ça voudrait dire que dès sa première indexation, il me donne autant de pages de pagination (t'as remarqué, je fais comme si je savais ce que c'était qu'une page de pagination :D ) que d'URL ?
     
  11. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 419
    J'aime reçus:
    9
  12. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    OK, admettons. Donc GSA devrait m'indexer environ 1700 pages, au lieu de 2200… Et puis tiens d'ailleurs, je me rends compte que décidément je ne sais même pas ce que sont ces page de pages de pagination. Encore un truc qui vient compliquer les choses. :|
     
  13. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 419
    J'aime reçus:
    9
    Bein, sur Wordpress, pour les pages de type taxonomie, catégorie, etc, par défaut tu n'as que 10 items par pages (ça peut se changer en backoffice). Après, ça pagine.
     
  14. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0
    OK, merci je comprends mieux. Mais le problème est que dès lors qu'une page de catégorie ou de tag contient plus de 10 articles (ou plus selon réglages), WordPress crée automatiquement une autre page. Ça finit par faire beaucoup de pages avec des balises méta en double, surtout quand on rajoute du contenu tous les jours comme moi. Il reste à savoir si ça représente vraiment un problème pour le référencement ?

    Et puis il me reste aussi à trouver d'où viennent ces autres pages indexées, et si elles peuvent être un problème pour mon référencement. Car si 1000 pages de pagination sont mal fichues, effectivement ça peut faire pencher la balance du mauvais côté.
     
  15. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    12 419
    J'aime reçus:
    9
    Normalement si tu as un plugin type Yoast d'indexé, il gère ça pas trop mal (activation des balises prev / next). Même si se pose l'intérêt d'indexer ou pas (tout en les laissant crawlables) ce genre de page
     
  16. Icipierrot
    Icipierrot WRInaute discret
    Inscrit:
    30 Octobre 2013
    Messages:
    207
    J'aime reçus:
    0

    Hmmmmm. J'ai un yoast tout bête, le gratuit, reste à savoir s'il est bien réglé. Va falloir que je me penche la-dessus...