Pagination et SEO
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Guide de la pagination pour le SEO (+ impact sur maillage interne)

La pagination web est très présente mais rarement bien faite. Découvrez comment la faire de façon optimale pour le SEO et les utilisateurs. Voyez aussi pourquoi il faut éviter la pagination et quoi faire à la place.

Dernière mise à jour : 24/06/2019

Voici ce que vous allez trouver dans ce guide :

  • dans les cas où vous devez utiliser la pagination, suivez bien toutes les bonnes pratiques (ci-dessous) et vérifiez par un audit qu’elles sont appliquées à 100%
  • je vous conseille de suivre mes conseils pour limiter le recours à la pagination, voire ne plus l’utiliser (à condition évidemment d’avoir un bon maillage interne qui donne accès à toutes les pages)
  • la pagination concerne des listings, pas les articles découpés en plusieurs parties

💡 En suivant ce dossier vous pouvez tout faire tout seul, mais ça risque d’être long, même avec un bon outil. J’ai passé des mois à étudier à fond l’impact de la pagination sur le maillage interne et donc sur les performances SEO. Fort de cette expérience, j’ai fait développer RM Pagination, le meilleur audit de la pagination pour le SEO qui existe. Oui oui, rien que ça ! Je suis sérieux, il analyse tout et inclut des algorithmes avancés.

Analysez en détails ce que ça donne pour votre site : lancez RM Pagination

👉 Google a changé sa gestion de la pagination, est-ce encore utile ?

On sait depuis le 21/03/2019 que Google n’utilise plus link rel=next/prev. Qu’est-ce que ça change et comment faut-il gérer la pagination désormais ?

Pour moi, ça change la façon d’auditer la pagination basée sur link rel next/prev, dans le sens où il n’est plus nécessaire de faire de vérification sur l’utilisation de ces directives. Mais j’ai toujours dit que la pagination est une très mauvaise solution au maillage interne !

Oubliez que c’est de la pagination et étudiez ce que votre implémentation a comme conséquences sur le maillage interne, sur la profondeur de vos pages stratégiques (fiches produits, articles…). Demandez-vous aussi si chaque page paginée est vraiment de qualité et mérite d’arriver en tête des SERP.

Bref, pour moi, ce qui est intéressant avec l’analyse de la pagination, c’est de mesurer à quel point elle dégrade votre référencement. Vous devriez revoir votre façon de penser maillage interne et pagination.

Allez, cette fois-ci il est temps de commencer :-)

Selon mes recherches, ce dossier est le plus complet qui existe. Suivez le sommaire ci-dessous et posez vos questions en commentaires…

Sommaire :

  1. Qu’est-ce que la pagination
  2. Toutes les solutions possibles
  3. Link rel=next/prev
  4. Encore mieux que la pagination…

Qu’est-ce que la pagination ?

Après une définition de la pagination web, je montre des exemples de pagination, indique les avantages mais surtout les inconvénients aussi bien pour le référencement naturel que pour l’expérience utilisateur.

Définition

Sur le web, la pagination est un système permettant de découper un grand listing en plusieurs pages (chacune avec son URL) définissant une séquence. L’internaute peut la parcourir en cliquant sur des liens de pagination.

Pagination Google
La célèbre pagination du moteur de recherche Google

Les pages autres que la 1ère page sont appelées « pages paginées » ou « pages 2+ ».

Un groupe de pages paginées (la 1ère et les suivantes) est appelé série ou séquence.

J’appelle « pages de détail » celles qui reçoivent des liens depuis cette séquence de pages. Ce sont par exemple des fiches produits, des articles de blog, des petites annonces, etc.

Exemples de pagination HTML

On trouve de la pagination dans plein de types de sites :

  • sur un site ecommerce dans les pages de catégories listant des produits
  • sur un site de contenus éditoriaux ou un blog dans les pages de catégories listant des articles
  • sur un site de petites annonces dans les pages de catégories listant les annonces
  • sur un forum dans les pages de sous-forums listant les discussions (et parfois dans les pages de discussions listant les messages)
  • etc.

Quelques exemples de liens de pagination sur des sites connus :

Pagination Amazon
Sur Amazon, on a accès à la page suivante et à 2 ou 3 pages précédentes ; on sait combien il y en a en tout
Pagination Airbnb
Chez Airbnb, on a accès à la page suivante et celle d’après, ainsi que la dernière. En plus des numéros de pages, le site rappelle les numéros d’annonces
Pagination Ouest France
Sur un gros site de contenus comme Ouest France, le site a prévu l’accès à de nombreux liens d’un coup. C’est inutile pour l’internaute, mais cela réduit (artificiellement) la profondeur des pages

Les avantages de la pagination

L’internaute peut avoir du mal à gérer une liste qui contient trop d’éléments : trop d’info tue l’info. Le fait de fractionner en plusieurs pages permet de mieux consulter les contenus et d’accélérer la vitesse.

C’est aussi un moyen pour l’utilisateur de se rendre compte du volume (en voyant le nombre de liens de pagination ainsi que le nombre total).

Les inconvénients de la pagination

La pagination est mauvaise pour l’utilisateur car :

  • il doit cliquer et attendre que la page entière (suivante) se charge ce qui est trop long, sans compter que le lien vers la page suivante est parfois difficile à trouver ou à cliquer. D’ailleurs, il est habitué à faire défiler (sur mobile ou tablette) et préfère ça.
  • il ne sait pas s’il va trouver ce qu’il cherche sur la page suivante, ou celle d’après, ou bien plus loin : il préfèrerait pouvoir affiner sa recherche
  • s’il met en favoris une des pages de la pagination, il n’est pas sûr plus tard de retrouver ce qu’il voulait car l’ordre ou la liste des éléments peut avoir changé

La pagination est très mauvaise pour le référencement car :

  • ça multiplie les URL à crawler sans pourtant se diversifier sur des expressions-clés différentes. Dit autrement, ça gâche plein de budget de crawl sans exploiter la longue traîne.
  • s’il y a de nombreuses URL de pagination (pages 2+), tous les liens qu’elles reçoivent font du « jus » en moins pour les pages stratégiques du site. Il serait bien mieux de consacrer les liens à pointer vers des pages stratégiques.
  • les pages 2 et suivantes ont très peu de chances de bien se positionner dans Google, car :
    • leurs balises title et meta description ne sont guère différentes de celles de la page 1
    • les textes des liens qu’elles reçoivent n’ont pas de sens (pas de mots-clés)
    • aucune autre page du site ne leur fait de lien
    • généralement, elles ne reçoivent jamais aucun lien venant d’autres sites
  • les pages recevant des liens depuis les pages 2+ sont donc défavorisées, puisqu’elles reçoivent des liens venant de pages à très faible popularité (PageRank ou PageRank interne). Dans certains cas extrêmes, des pages ne reçoivent pourtant que des liens depuis ces pages 2+, ce qui est très mauvais (je les appelle pages Lost In Pagination).
  • un maillage reposant en majorité sur de la pagination augmente la profondeur des pages qui y sont liées. Et comme + une page est profonde, moins elle est performante en SEO, c’est une très mauvaise idée, surtout pour les gros sites.
  • s’il y a peu d’éléments par page et aucune optimisation, les pages paginées peuvent s’apparenter à des contenus dupliqués

Pour comprendre tout ça en vidéo, c’est par ici :

Ou bien son transcript texte/images : la pagination, mauvaise idée pour le maillage interne

Toutes les solutions pour gérer la pagination

Je décris toutes les solutions (ne rien faire, view all, CSS, JS ou AJAX, rel next/prev), donne mon avis et détaille les bonnes pratiques de la solution la plus universelle (link rel next/prev).

Je passe en revue toutes les solutions que je connais. S’il en manque, dites-le en commentaires !

La meilleure solution pour la pagination SEO

Le plus efficace, c’est de tout faire pour ne pas avoir besoin de pagination. C’est simple non ?

Je suis très sérieux en fait ! C’est ce que j’ai fait par exemple avec les centaines de dossiers de WebRankInfo. Je l’explique dans les conseils en fin de dossier.

La solution de ne rien prévoir de particulier

Si votre CMS n’a rien prévu et que vous ne faites rien de spécial, les moteurs de recherche vont devoir se débrouiller pour comprendre votre site.

Sans parler des internautes qui devront passer malgré tout par votre pagination 😫…

🚦 Mon avis : c’est la catastrophe.

La solution de la page view all

Elle consiste à :

  • mettre en place une pagination (pages 2+)
  • ajouter une autre page « view all » qui liste 100% des éléments, destinée aux moteurs de recherche
  • déclarer cette page « view all » comme URL canonique sur toutes les URL de la série de pages

L’avantage est que c’est assez simple à faire – si votre CMS l’a prévu.

L’inconvénient est que la page « view all » est souvent très lourde à charger, parfois trop longue (les moteurs n’indexent pas forcément tout, c’est le cas de Bing par exemple).

🚦 Mon avis : par expérience, cette solution n’est pas optimale en référencement car elle consomme trop de budget de crawl inutilement et la page « Tout afficher » n’est pas toujours celle qui est mise en avant dans le maillage (si bien qu’elle a de mauvaises performances SEO).

La pagination CSS

Elle consiste à récupérer la liste de tous les éléments en un seul coup mais à n’afficher la liste que par paquets, les autres étant masqués par CSS. Un clic sur « page suivante » masque le bloc courant et affiche le suivant.

En réalité, ce n’est pas de la pagination, c’est une sorte de variante de la page « view all ». L’avantage est un meilleur confort pour l’internaute mais seulement une fois que la page s’est chargée, ce qui peut être trop long. Ce n’est pas évident à gérer sur mobile.

🚦 Mon avis : ce n’est pas une solution à la pagination.

La pagination avec scroll infini (Ajax)

Elle consiste à afficher en HTML la page 1, puis à gérer via Ajax l’affichage de la suite dès qu’on se met à faire défiler la page plus bas, comme on le trouve sur la plupart des réseaux sociaux.

L’équivalent d’une nouvelle page s’affiche à chaque fois qu’on continue de « scroller », d’où l’appellation « infinite scrolling » (défilement infini) et par extension « pagination infinie ».

Il existe une variante : au lieu de se déclencher au scroll, l’internaute doit cliquer sur un bouton ou un lien du type « Voir la suite » ou « Charger plus de résultats ».

C’est plus agréable pour l’internaute car il n’a pas besoin de trouver le lien vers la page suivante, de cliquer et d’attendre qu’elle se charge avec l’ensemble du design.

Mais d’un point de vue référencement, c’est selon moi un très mauvais choix. En effet, Google aura tendance à indexer seulement la 1ère page (celle qui est disponible sans nécessiter Javascript), ce qui est une catastrophe vu que les pages 2 et suivantes servent à faire des liens vers des produits, articles et autres pages de détails. Dit autrement, ça génère des pages orphelines (des pages existent sur votre site mais Google ne voit aucun lien ne pointe vers elle).

Si l’implémentation est bonne, parfois Google indexe la page 2 mais rarement plus. Et les autres moteurs ne font pas mieux.

🚦 Mon avis : infinite scroll = à oublier pour le SEO.

La solution basée sur link rel=next/prev

Elle consiste à découper la grande liste en plusieurs pages, chacune accessible à une URL précise, et à indiquer comment ces URL s’enchaînent. Concrètement :

  • sur la page 1 vous indiquez l’URL de la page suivante (la 2)
  • sur la page 2 vous indiquez l’URL de la page suivante (la 3) ainsi que l’URL de la page précédente (la 1)
  • etc. jusqu’à la dernière page où vous indiquez l’URL de la page précédente

Ces indications d’enchaînement entre pages paginées doivent se traduire par :

  • des liens HTML pour que l’internaute puisse naviguer et pour que les crawlers puissent suivre les liens
  • des directives pour les moteurs de recherche, parfois appelées attributs de pagination. Il s’agit des « link rel=next » et « link rel=prev » que je décris en détails ci-après.

L’avantage principal est que la plupart des CMS intègrent cette solution.

L’inconvénient est que ça reste de la pagination ! Plus sérieusement, en point négatif je dirais qu’il y a beaucoup d’erreurs possibles… J’explique tout ça ci-dessous.

🚦 Mon avis : si vraiment vous avez besoin de la pagination, alors c’est la solution à choisir. Attention à valider sa bonne mise en place…

La pagination avec link rel=next/prev

Cette méthode a été longtemps recommandée par Google, mais désormais ces balises ne sont plus exploitées dans son algo. Cela n’empêche pas d’autres moteurs (sans doute ?) de l’utiliser, ou vous de l’utiliser. D’ailleurs, elle peut servir dans une politique de meilleure accessibilité.

Retrouvez ici la syntaxe, les bonnes pratiques, les erreurs courantes ainsi que des questions/réponses.

Dans la suite, je vais prendre l’exemple fictif d’un listing de produits dans une catégorie « Tables », contenant en tout 4 pages :

  • Première page : https://example.com/tables/
  • Page 2 : https://example.com/tables/page/2/
  • Page 3 : https://example.com/tables/page/3/
  • Dernière page : https://example.com/tables/page/4/

Syntaxe

Pour indiquer aux robots des moteurs de recherche l’ordre des pages, vous devez utiliser une directive link avec des instructions « next » (pour la page suivante) et « prev » (pour la page précédente).

Vous avez 2 moyens :

Le plus simple est d’utiliser la balise <link> dans l’entête HTML (c’est-à-dire entre <head> et </head>, mais pas dans <body>). L’attribut rel sert à indiquer la relation avec la page courante, tandis que l’attribut href sert à indiquer l’URL de la page suivante ou précédente.

Voici ce qu’il faudrait mettre dans le code HTML de la page 1 :

<link rel="next" href="https://example.com/tables/page/2/">

dans la page 2 :

<link rel="prev" href="https://example.com/tables/">
<link rel="next" href="https://example.com/tables/page/3/">

dans la page 3 :

<link rel="prev" href="https://example.com/tables/page/2/">
<link rel="next" href="https://example.com/tables/page/4/">

dans la page 4 :

<link rel="prev" href="https://example.com/tables/page/3">

Le second moyen est de fournir les mêmes informations dans les en-têtes HTTP. Le principe est identique, c’est juste la syntaxe qui diffère très légèrement. Voici ce que ça donnerait pour la page 2 :

Link: <https://example.com/tables/page/; rel="prev">
Link: <https://example.com/tables/page/3/; rel="next">

ℹ️ Bon à savoir :

  • Vous pouvez utiliser des URL absolues ou relatives. Si vous incluez un lien <base> dans votre document, les chemins d’accès relatifs seront résolus en fonction de l’URL de base.
  • rel=prev et rel=next servent d’indices aux moteurs. Comme pour l’URL canonique, il s’agit juste d’indications, pas de directives absolues

Si vous faites des erreurs liées à la syntaxe, les moteurs auront du mal à « comprendre » votre implémentation et se basera sur sa propre heuristique. Je vous conseille de tout valider avec un outil pour vous assurer que tout est OK. Le référencement n’est-il pas déjà assez concurrentiel ?

Pagination et URL canonique

Indiquer l’URL canonique sert à préciser aux moteurs sous quelle URL « officielle » le contenu devrait être indexé.

Pour en savoir plus : Qu’est-ce que l’URL canonique ?

Fournir l’URL canonique d’une page est une bonne pratique ; elle ne présente aucune contre-indication avec les balises link de la pagination. Dit autrement, même si vous utilisez des balises pour la pagination, vous devriez inclure une balise d’URL canonique.

On parle parfois de self canonical : ça signifie que sur une page (la page 1 ou une des pages paginées), il faut déclarer son URL canonique.

Voici ce qu’on devrait trouver dans l’entête HTML de la page 2 :

<link rel="canonical" href="https://example.com/tables/page/2/">
<link rel="prev" href="https://example.com/tables/page/">
<link rel="next" href="https://example.com/tables/page/3/">

⚠️ Attention : indiquer comme URL canonique l’URL de la page 1 sur toutes les pages paginées est une des erreurs les plus répandues. Je le détaille ci-après.

Pagination et structure d’URL

Il n’existe aucune règle ou standard à suivre concernant le format des URL paginées : à vous de choisir ce qui vous parait le plus simple et surtout qui fonctionnera longtemps (pour garder des URL stables).

Généralement, on utilise un numéro de page et on le fait commencer à 1 (mais on n’affiche pas ce 1 dans l’URL, c’est seulement à partir de la page 2). Parfois, on indique un indice de décalage (offset) : par exemple la 2ème page aura start=10, la 3ème start=20.

Le numéro de page ou d’offset peut être inclus dans de la réécriture d’URL ou associé à un paramètre d’URL, ça ne change strictement rien, les 2 solutions sont bonnes.

Google propose dans Search Console que l’on déclare dans les paramètres d’URL s’il s’agit de pagination. Pour ma part je ne le fais jamais, car je préfère que ces indications soient directement dans le code source. Ainsi c’est valable pour tous les moteurs et c’est plus facile pour le suivi.

Recommandations pour une pagination SEO optimale

Ma longue expérience du SEO m’a permis d’élaborer une liste des bonnes pratiques pour la pagination. Voici la checklist que je vérifie dans mes audits, les consignes suivantes étant globalement classées par ordre d’importance décroissante :

1 Les pages de la pagination doivent toutes être autorisées au crawl : elles ne doivent pas être bloquées dans le fichier robots.txt. Sinon, Google n’a plus accès aux pages 2+ et dans ce cas, les liens qui figurent dans ces pages vers des pages à faire indexer ne seront pas vus par Google. Il y a un risque que des pages soient orphelines.

2 Les pages de la pagination doivent toutes être autorisées à l’indexation : il ne doit pas y avoir d’instruction noindex ou none dans la balise meta robots ou l’entête HTTP X-Robots-Tag. D’une part car cela ne sert à rien, les instructions rel/prev sont mieux pour ce cas, d’autre part car il est connu qu’au bout d’un moment, Googlebot ne vient plus souvent crawler les pages en noindex (et donc il ne voit plus certains liens).

3 Les pages de la pagination doivent toutes renvoyer un code 200. Evident mais parfois on a des redirections ou même des 404.

4 Chaque page de la pagination doit contenir des liens cliquables follow autorisés au crawl vers les URL next/prev, en plus des instructions <link>. Si vous oubliez ces liens, ou s’ils ne sont pas vus/compatibles pour les robots, ça sera très mauvais pour votre référencement.

5 La page 1 doit être travaillée en tant que catégorie, avec du contenu éditorial à forte valeur ajoutée (texte inédit), une excellente UX et seulement après le listing. A l’inverse, les pages 2+ ne doivent contenir que le listing.

6 La page 1 doit toujours être indiquée avec la même URL. Par exemple il ne faut pas parfois indiquer l’URL sans le paramètre page et parfois avec page=1 ou page=0). “Indiquée” fait référence aussi bien aux liens <a> qu’aux balises <link>.

7 Les pages 2+ de la pagination ne doivent pas indiquer la page 1 en tant que canonique. C’est logique, car on doit normalement utiliser l’URL canonique quand le contenu est strictement ou quasiment identique sur plusieurs URL.

8 Les instructions next/prev doivent être toutes cohérentes entre elles : une URL est toujours indiquée comme étant à la même position. Par exemple si l’URL A indique que B est la 2ème de la série et qu’une URL C indique que B est la 3ème de la série, c’est incohérent.

9 Les instructions next/prev ne doivent pas créer de boucle infinie, générant un nombre illimité d’URL dans la série. Quand ça arrive c’est généralement un bug…

10 Les pages de la pagination ne doivent pas déclarer plusieurs URL différentes en tant que next ou en tant que prev. Sinon ça devient le foutoir…

11 Les pages de la pagination doivent toutes être bien ordonnées : sur la page N,
si l’instruction next est présente, elle indique toujours la page N+1
si l’instruction prev est présente, elle indique toujours la page N-1

12 La pagination ne doit pas utiliser d’attribut rel=next/prev dans des balises <a> (uniquement dans <link>). Ces attributs sont généralement ignorés s’ils sont dans une balise <a>.

13 La pagination ne doit pas être utilisée sur des pages non paginées. Il faut l’utiliser sur des listes (de produits, d’articles, peu importe) mais pas pour indiquer l’article suivant ou précédent, comme le font de nombreux thèmes WordPress. La pagination WordPress est donc souvent mal faite, en tout cas pour cet aspect (mais pas pour les listings d’archives).

Même si ça vous parait long, il est important de vérifier que vous respectez toutes ces règles…

Erreurs répandues

D’après mon expérience, voici les erreurs les plus courantes (vérifiez que vous ne les faites pas) :

  • interdire le crawl de la pagination (Disallow dans le fichier robots.txt)
  • noindex et pagination : interdire l’indexation des pages 2+ avec une balise meta robots noindex
  • nofollow et pagination : mettre une balise meta robots nofollow sur les pages 2+
  • déclarer la page 1 en URL canonique sur toutes les pages 2+
  • proposer une pagination sur la page d’accueil d’un blog (WordPress ou autres)

Mais en fait le plus grave (et très fréquent) c’est de :

  • ne pas surveiller combien vous avez d’URL de pagination
  • ne pas évaluer à quel point à cause de ça, le maillage interne est mauvais et la profondeur des pages stratégiques importante
  • ne pas mesurer combien d’internautes utilisent réellement votre pagination (vont-ils sur les pages 2+ ?)

Questions / réponses

Est-ce qu’une page paginée peut être indexée ?

Oui, en théorie les pages 2 et suivantes peuvent être indexées, même avec les indications link rel=next ou prev. Mais en pratique, c’est très souvent la page 1 qui sort dans les résultats. Parfois une des pages apparaît dans les SERP, cela signifie qu’elle a du contenu spécifique (absent de la page 1) qui répond très bien à la requête de l’utilisateur.

Peut-on utiliser rel=next et rel=prev dans un sitemap XML ?

Non ce n’est pas possible, les 2 endroits sont l’entête HTML et l’entête HTTP de chaque page HTML.

Faut-il lister les pages 2+ dans les sitemaps ?

Les avis sont partagés, mais pour ma part je trouve que c’est logique de les inclure puisqu’il s’agit de pages autorisées au crawl et à l’indexation. Par ailleurs, avoir ces URL dans un sitemap permet de faire un audit avancé, pour vérifier notamment qu’elles sont crawlables, accessibles, indexables.

Comment gérer les doublons de balises Title du contenu paginé ?

Si vous suivez à la lettre toutes les consignes de ce dossier, vous n’avez pas à craindre de contenus dupliqués même si la balise title est identique sur chaque page d’une série. Les instructions link rel=prev/next servent à ça.

Idem pour la balise meta description et la balise H1.

Peut-on afficher les listes dans un ordre aléatoire ?

Si la liste de vos produits ou articles est triée de façon aléatoire, à chaque fois que Google viendra crawler une page, il aura l’impression que son contenu a pas mal changé, ce qui risque de créer pas mal d’instabilité. Un jour il considère que la page est pertinente pour certaines requêtes (en fonction du contenu), et la prochaine fois ça ne sera plus le cas.

Bref, à mon avis il vaut mieux éviter.

Comment gérer la pagination WordPress ?

Tout dépend de votre thème (et des templates), mais généralement on trouve de la pagination sur les pages d’archives et parfois aussi sur la page d’accueil.

Comme sur tous les autres sites, je vous déconseille d’avoir de la pagination sur la page d’accueil : mettez en avant un certain nombre d’articles puis proposez des liens vers vos catégories, mais sans pagination.

Pour les archives (catégories), suivez les conseils déjà donnés pour éviter au maximum la pagination. Augmentez le nombre d’articles par page en allant dans « Réglages » > « Lecture » > « Les pages du site doivent afficher au plus ». Faites aussi des sous-catégories, ainsi que des liens intégrés dans les contenus.

Faire mieux que la pagination

Le recours à la pagination a tendance à augmenter la profondeur des pages stratégiques et à diminuer leurs performances SEO. Découvrez ce qu’il faut faire à la place, bien mieux également pour l’utilisateur.

Réduire les cas où la pagination est nécessaire

La première des choses à faire est d’augmenter le nombre d’éléments par page. C’est extrêmement simple, rapide et efficace – jusqu’à un certain niveau.

Passer de 10 éléments à 20 divise par 2 le nombre de pages nécessaires et réduit donc fortement les problèmes.

Bien entendu, il y a des limites, car + vous augmentez le nombre d’éléments par page, + la page devient lourde (et complexe à générer pour le serveur). Si chaque élément est seulement un peu de texte, ça va. Mais s’il y a une ou plusieurs images par élément, ainsi que d’autres données, ça finit par faire trop.

Il faut choisir le nombre d’éléments par page en fonction de la complexité du listing, mais aussi de la taille du site.

A mon avis, 10 est beaucoup trop faible, 20 ou 30 est souvent un bon choix, parfois 50. Dans des cas avec un très grand nombre d’éléments, j’ai déjà choisi de monter à 100.

Exploiter le concept de la longue traîne

Il est là le miracle ! C’est la technique qui va vous faire énormément gagner (si vous avez beaucoup de produits ou d’articles, et trop de pagination).

Imaginons que vous vendiez plein de meubles sur votre site. Vous avez une catégorie « tables » avec 500 produits différents.

  • est-ce vraiment intéressant pour l’utilisateur d’avoir une énorme liste, avec une belle pagination ? Non !
  • est-ce efficace en référencement de tout miser sur des requêtes du type « achat table » quand on a autant de choix à proposer ? Non !

La solution est évidemment de créer plein de sous-catégories, et/ou des moyens d’affiner selon des critères (à condition que cela passe par des liens et non un formulaire ou de l’Ajax).

Prenez le temps de réfléchir à tous les besoins de vos clients qui veulent acheter des tables, et à leur façon de les exprimer dans Google. Certains cherchent par matière (tables en bois, plastique, métal…), d’autres par forme (table carrée, rectangulaire, ronde…), d’autres par pièce (table de salon, de cuisine, de jardin…).

En croisant avec votre offre, vous en déduisez toute une arborescence de sous-catégories à créer.

Au final :

  • vous continuez de vous battre sur les requêtes générales du type « achat table »
  • vous vous donnez des chances de vous positionner sur de très nombreuses autres requêtes hyper stratégiques pour votre business. C’est ce qu’on appelle exploiter la longue traîne (des besoins).
  • vous réduisez ou supprimer le besoin de passer par de la pagination. A un niveau donné, vous listez d’abord les sous-catégories ainsi qu’un échantillon de produits (ceux à promouvoir), mais vous n’avez pas besoin de les lister tous (on peut les trouver dans les sous-catégories).
  • si c’est bien fait, vous réduisez la profondeur des pages stratégiques (fiches produits)

Optimiser le maillage

Parfois il reste encore des cas où vous n’arrivez pas à supprimer la pagination, car votre site est assez gros et que vous ne pouvez pas/plus créer de sous-catégories.

Dans ce cas, en complément de tout ce que j’ai conseillé ci-avant, il faut travailler le maillage interne. Dit autrement, il faut trouver d’autres endroits de votre site (que les pages listings) pour faire des liens vers les pages de détail (fiches produits, articles, annonces, etc.).

Quelques suggestions :

  • insérez des liens au cœur des contenus éditoriaux (comme je l’ai fait dans ce dossier) : ce sont les liens les plus efficaces
  • sur une page de détail, mettez en place un système qui ajoute des liens vers d’autres pages de détail similaires (articles en rapport, produits associés, etc.).
  • faites des « raccourcis » : si une catégorie a plusieurs niveaux de catégories enfants, ne faites pas seulement des liens vers uniquement le niveau inférieur. Faites parfois aussi des liens vers certains éléments situés à 2 niveaux.

Pour finir…

Avez-vous trouvé toutes les infos que vous cherchiez pour bien paginer votre contenu ?

N’hésitez pas à poser vos questions ou faire des remarques.

Cet article vous a-t-il plu ?

Note : 4.4 (23 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

33 commentaires

Thierry

Bjr

Articles tous très informatifs ..
Bravo et merci

Mon point :
————

Concernant les pages PAGINÉES
je ne suis pas certain d’avoir compris comment rediriger l’URL

J’ai compris de l’article qu’il faut créer un. DOSSIER JAUNE
entre la page à découper et les pages paginées issues du d’écoulement …

Je m’explique avec un exemple sur ce que j’ai compris :

Soit /grosse-page.php la page à découper

J’ai compris que les pages découpées demandent la création d’un dossier (jaune). …
et que les pages découpées se trouvent à l’intérieur du dossier (et donc qu’elles ne se trouvent pas au même rang dans l’arborescence que la page-mère)

Soit /grosse-page.php/DOSSIER/2 la page 2

En fait je n’ai pas perçu où se trouvent les pages et à quel moment on place l’extension .php dans l’URL des pages paginées

Merci de vos précisions

Remerciements et Respectueuses salutations

Répondre
Olivier Duffez

Si votre site est fait avec des pages statiques, sans CMS (comme par exemple WordPress), vous n’avez pas de raison d’être concerné par la pagination.
Pourquoi voulez-vous découper la « grosse page » ? Si vous préférez découper en 4 parties, faites un sommaire sur la page 1 avec des liens vers les 3 autres pages.

Répondre
Marc Royère

Bonjour Olivier, merci pour cet article clair et à jour,
Une petite remarque sur l’une des erreurs répandues signalées: « proposer une pagination sur la page d’accueil d’un blog (WordPress ou autres) ».
Pourquoi éviter une pagination en page d’accueil ? C’est pourtant un point d’entrée important des robots auxquels on donne accès à de nombreux contenus via justement la pagination…
Ne perdons-nous pas en exploration en conservant la pagination uniquement sur les pages catégories ?
Ou l’idée serait justement de favoriser l’exploration prioritaire des articles à la une sans ajouter une pagination ?

Répondre
Olivier Duffez

Bonjour
Mon article est censé avoir convaincu que la pagination n’est pas une bonne solution… Alors pourquoi la mettre en place sur l’accueil, c’est-à-dire un listing sans aucune catégorisation ? Quel intérêt pour l’internaute ? Quelle logique SEO ?

Répondre
Franky01

Bonjour Olivier,

Tout d’abord, merci pour cet article.

Je suis très surpris (pour une fois) par vos recommandations concernant la pagination. J’ai pu voir depuis de nombreuses années de gros sites qui utilisent l’inverse de ce que vous préconisez. En effet, les sites comme Sarenza ou encore Zalando (qui pour moi est une référence en SEO même si parfois un peu aggressif) mettent toutes leurs pages 2,3,4 (pages paginées) etc en noindex. Cela sans doute pour éviter le duplicate content (à cause de la balise title, du h1 etc). Pourtant, vous préconisez l’inverse ! En effet, vous préconisez d’indexer ces pages paginées.

De plus, j’ai pu voir sur Zalando et d’autres gros sites que la page canonique citée dans les pages paginées est la page 1 ce qui justifie l’utilisation de la meta noindex. On dit à Google : « n’indexe pas cette page de pagination. Pourquoi ? Va voir la page 1, c’est la page de référence ». De plus, pour finir, les pages paginées sont marquées en follow avec la balise de manière à ce que Google suivent les liens et donne du poids aux pages (articles / produits) linkées sur les pages paginées. Pour toutes ces raisons, je pense qu’il s’agit de loin de la meilleure méthode SEO pour gérer la pagination.

Si on suit vos conseils, on risque d’entrer dans du duplicate content surtout que Google ne reconnait plus les balises next et prev depuis presque un an maintenant.

Le seul inconvénient que je vois pour la technique citée ci-dessus est l’idée que vous avez émise et qui consiste à dire que Google finit par ne plus crawler les pages en noindex. Contrairement à votre avis, je pense qu’à partir du moment où on lui indique que ces pages sont en follow, il ne cessera pas de les crawler.

Pour finir, le fait qu’on utilise comme URL de référence / canonique la page 1 sur toutes les autres pages paginées donne beaucoup de poids à Google à cette fameuse page 1 qu’on veut voir apparaître sur les SERPs.

J’aimerais donc avoir votre avis sur cette réflexion.

Bien à vous.

Franky

Répondre
Olivier Duffez

Bonjour
D’abord, mes recommandations sur la pagination sont prioritairement : évitez le recours à la pagination, c’est la pire solution.
Maintenant, dans les cas où on n’arrive pas à faire autrement, je recommande de faire comme le conseille Google ;-)
A savoir, pas de noindex sur la pagination et surtout pas de canonique vers la page 1 (rappel : on utilise la canonique pour 2 URL dont le contenu est quasi identique, ce qui n’est pas du tout le cas de 2 pages de pagination).
Mais surtout : tout ça est extrêmement simple à vérifier, alors ne nous privons pas. J’ai fait des tests sur des milliers d’audits, je ne donne pas ces conseils en l’air sans avoir testé. Chacun de vous peut tester avec mon outil d’audit de la pagination.

Répondre
papyjo

Bonjour Olivier, Merci pour ces infos utiles. Sur notre site, on a des pages de pagination qui peuvent aller jusqu’à 20 parfois voire plus, cependant quand on utilise un outil de crawl, on constate qu’en profondeur de liens, on est à 3 clics par exemple pour la plupart de ces pages de pagination ce qui est plutôt bien grace au maillage interne particulier. On respecte pratiquement toutes les recommandations sauf le noindex, je pense que c’était la peur de toutes ces balises dupliquées. On va prendre le temps de les rendre toutes indexables à présent !

Répondre
carthagod

Merci Olivier pour ce guide très complet !
Nous gérons environ 3000 pages avec des tags et non des catégories. Nous avons de la pagination sur les pages tags. Je souhaite suivre votre conseil et supprimer la pagination, le problème est que comme une page peut avoir plusieurs tags, elle peut se retrouver dans plusieurs pages tags et donc il risque d’être compliqué de faire en sorte que chaque page tag aie suffisamment peu d’éléments à lister.
Si nous avions des catégories ce serait plus simple car une page ne peut appartenir qu’à une seule catégorie. Mais d’un point de vue UX nous avons besoin de tags et non de catégories.

Comment faire ?
Merci de votre éclairage !

Répondre
Olivier Duffez

Désolé, je ne vois pas en quoi c’est particulièrement un problème parce qu’il s’agit de pages tags.
Je me demande s’il n’y a pas un problème dans la phrase « il risque d’être compliqué de faire en sorte que chaque page tag ait suffisamment peu d’éléments à lister. »

Au passage, je serais curieux de savoir si ces pages tags sont utilisées par les internautes (1er point) et si elles génèrent des visites SEO (2ème point). Dit autrement, je me demande si la plupart des pages tags ne sont pas zombies…

Répondre
carthagod

Le problème est le suivant :
– Nous listons 50 liens sur une page tag. On pourrait peut être en mettre plus, mais enfin on ne peut pas étendre à l’infini.
– Admettons que j’ai 40 pages qui partagent 3 tags en commun. Ces 40 pages vont donc se retrouver sur ces 3 pages tags, et donc vont occuper 40/50 des espaces disponibles.

Dit autrement, votre solution qui consiste à multiplier le nombre de sous catégorie pour augmenter le nombre de pages qu’on peut lister sans avoir recours à la pagination ne marche plus aussi bien si on a des tags et non des catégories, car une page peut avoir plusieurs tags.

J’espère avoir clarifié la question !

Répondre
Olivier Duffez

Je ne vois pas bien ce que ça change en fait. Dans le fond, faire une page tag/catégorie est une bonne idée si les 2 points suivants sont remplis :
– les internautes la consultent souvent (on peut mesurer le nb de consultations de la page, quelle que soit la source de trafic, et pas forcément en tant que page d’arrivée sur le site)
– la page génère du trafic par le référencement naturel.
Evidemment, pour juger la page, il ne faut pas se contenter de regarder sur une courte période (genre 30 jours), moi je conseille 1 an.
Pour que la page ait des chances de réussir en SEO, il faut :
– qu’elle ait un contenu inédit (au moins une partie de la page)
– qu’elle cible une requête principale / un sujet non concurrente d’autres pages du site, mais pas trop précis non plus car il faut qu’il y ait suffisamment d’articles listés dedans
– qu’elle reçoive des liens au moins depuis des pages internes dans la même thématique

Vos pages tags sont-elles performantes ? (l’avez-vous mesuré et si oui avec quel outil ?)
Respectent-elles au moins toutes ces recommandations ?

XavierPN

Hello,

Merci pour ce très bon dossier très complet qui explique bien comment faire face à l’envie insatiable des responsables de sites de ne rien afficher dans les pages et de devoir cliquer encore et encore dans l’espoir de tomber sur le lien qu’il nous fallait !

Je suis très surpris que Google ait décidé de laisser tomber l’utilisation de la balise link meta rel prev/next, c’est dommage parce que ça avait le mérite d’être très clair. Cela veut sans doute dire que Google utilise d’autres signaux pour créer la hiérarchie des pages entre elles (j’avais eu ouïe dire fin 2018 que les balises link rel prev/next faisait que toutes les pages concernées ne faisaient en fait qu’une seule page, ce qui annihile un peu l’argument du niveau de profondeur, d’un grand ponte français pourtant).

Bref, excellent dossier très complet, où on retiendra que si on peut, on se passera de pagination

Répondre
Pierre-13

Bonjour et merci pour ton article très complet.

Si tu le permets, j’aimerais avoir ton avis concernant les pages de tris (Articles les mieux notés, les plus vus …ect …). C’est plus ou moins similaire à la pagination, mais tu conseillerais quoi dans ce cas là ? Reprendre les même étapes que tu décris plus haut dans tes recommandations ? Ou au contraire ne pas les faire indexer ?

Merci :)

Répondre
Olivier Duffez

Si le tri génère une autre URL, il faut l’interdire d’indexation et même de crawl.

Répondre
Pierre-13

Je te remercie. Je vais ajouter l’interdiction de les crawler.

Répondre
Djo

Bonjour,

Concernant la partie « La pagination est mauvaise pour l’utilisateur car … », autant certains points semblent pertinents, autant d’autres clairement pas. Auriez-vous des données tangibles à communiquer à ce sujet ? Des sources, des tests UX, etc. Je tique en particulier sur les mots suivants : « et préfère ça. » dans le premier élément de liste.
Quand on parle d’expérience utilisateur, il me semble de bon ton d’utiliser des statistiques et des études pour appuyer ses propos.

Je ne remet pas en question le reste du dossier qui est une mine d’informations vraiment conséquente et appréciable, et vous remercie pour tout le travail fourni !

Bonne journée

Répondre
Olivier Duffez

Non je n’ai pas d’études à citer ou de sources autres que mes propres mesures pour différents sites (pour moi ou mes clients). Je mesure notamment :
– combien les pages de la pagination arrivent à générer de visites via le référencement naturel : c’est sans surprise très peu
– combien de fois les internautes consultent les pages de pagination (qu’ils viennent du canal organic ou pas, qu’ils atterrissent sur ces pages ou pas) : c’est très rare, sans surprise là non plus
C’est largement plus accentué sur mobile, là aussi ça ne surprendra personne.
Constatez-vous autre chose sur vos sites ?

Répondre
Francois

Bonjour Olivier,
Bravo pour votre guide très complet et je partage vos avis sur la manière de faire une bonne pagination pour les utilisateurs ET Google. Une petite remarque cependant, à la lecture de votre guide, on peut avoir l’impression que la pagination est à éviter complètement.
Il faudrait préciser dès le début qu’il faille bien une pagination, à condition qu’elle respecte les aspects que vous détaillez ensuite.
Je me permet de faire cette remarque, car j’ai eu plusieurs clients qui n’avaient pas mis de pagination du tout, en ayant lu que d’avoir trop de pagination pouvait nuire au référencement. Ils ont surement lu le guide en vitesse :)

Répondre
Olivier Duffez

Je ne suis pas d’accord avec vous : il ne faut pas dire que la pagination est nécessaire. Je n’ai jamais vu un seul cas où le recours à la pagination est meilleur qu’un bon maillage interne qui permette de l’éviter.
J’ai néanmoins ajouté une phrase dans mon 1er encadré en haut de l’article, afin que les choses soient vraiment claires.

Répondre
Francois

Effectivement, le maillage interne est à privilégier. Lors de mon précédent commentaire, j’avais en tête des sites éditoriaux de plusieurs milliers de pages, ou des forums de plusieurs millions de pages où la pagination permet facilement d’avoir au moins un lien vers chaque contenu.

Répondre
Olivier Duffez

Exact. C’est justement sur des sites comme ça qu’un travail sur le maillage interne permet de réduire l’usage de la pagination et d’améliorer le référencement. Je crois bien que le pire, ce sont les forums, car il y a rarement des sous-catégories ou des filtres permettant d’affiner (taxonomies).

Adam

Bonjour Olivier,

J’aimerais savoir ce que tu en penses des « related articles » dans les CMS, est-ce un bon moyen de faire des liens internes dans les articles eux-mêmes ?
Merci à toi.

Répondre
Olivier Duffez

Ce n’est pas « dans les articles » car c’est en dehors du contenu de l’article. C’est mieux que rien, à condition que l’algo qui les sélectionne soit bon.
Les liens intégrés au contenu sont bien meilleurs je pense.
Ma règle : le meilleur lien est celui qui est souvent cliqué.

Répondre
MakeOnlineShop

Super utile ! merci !

Répondre
Mango

Une pagination est justifiée si elle découpe en tranches un contenu non structurable, qui serait trop lourd à stocker sur serveur, puis à transporter et afficher. La première page est légère, et détermine l’utilité de poursuivre la navigation. Google fait tellement cela qu’on sait tous ce que vaut de passer en deuxième page dans les résultats.

Ce qui me manque le plus dans la gestion des « link rel » c’est un maillage vertical, c’est à dire de pouvoir indiquer les branches en amont, jusqu’à « link rel index » et « link rel domaine ».

« up » semblait pouvoir le faire sans gêner Google, mais le W3C n’est pas d’accord et ne reconnaît pas (plus) cet argument. Et pourtant ce serait utile je trouve.

Répondre
Mango

Merci Olivier pour ce rappel des bonnes pratiques.

Je découvre l’utilité de déclarer canonical la page courante de cette pagination.

De mémoire, Google m’a longtemps signalé des doublons dans les balises title et meta description, lorsque le numéro de la page courante n’y était pas précisé. Cela me parait solidement logique.

En revanche, dans le corps lisible, la situation de cette page courante étant indiquée dans la grille d’onglets de navigation, je n’ai pas jugé nécessaire de préciser cette pagination dans le H1.

Au niveau de Google, sans l’avoir mesuré méthodiquement, il m’a semblé que toute erreur dans le futur ex « Améliorations HTML » pouvait être un indice négatif en SEO.

Répondre
Olivier Duffez

Je déconseille de passer du temps à supprimer les doublons de balises title sur les pages de la pagination…

Répondre
Djam

Merci Olivier pour ces recommandations que j’ai lu avec attention !
Tu dis que l’idéal est d’avoir un contenu thématique spécifique pour la première page de la catégorie uniquement.
Ma question est de savoir comment tu procèdes pour qu’il n’apparaisse pas sur les pages 2 et +.
Peux-tu éclairer ma lanterne stp ?
Cdlt

Répondre
Olivier Duffez

C’est à chacun de se débrouiller pour personnaliser son CMS ou faire un développement sur-mesure.

Répondre
Guillaume

Bonjour et merci pour ce guide complet Olivier. En attente des précisions concernant rel=prev/next. Étonnant de lire que Google ne les prend pas en compte.

Y a t-il une étude qui permet d’affirmer ceci : « La pagination est mauvaise pour l’utilisateur car l’utilisateur […] est habitué à faire défiler (sur mobile ou tablette) et préfère ça. »

J’ai quelques doutes… concernant la mémoire requise par l’appareil (le navigateur) pour gérer la longue liste d’éléments, il existe bien des solutions de mise en cache, mais concernant le besoin de retrouver un élément dans une liste, je préfère retenir (voire mettre en favoris) un numéro de page que de compter le nombre de swipe.

Répondre
Olivier Duffez

« Mettre un numéro de page en favoris » alors que rien ne garantit que les éléments qui étaient sur cette page le seront à notre prochaine visite ?

Pour les études, il suffit de regarder pour son propre site si les internautes vont souvent sur les pages 2+. Pour l’avoir testé sur un grand nombre de sites, je peux dire que c’est très rare. Donc la pagination n’est pas un bon moyen de gérer le maillage interne !

Répondre
Olivier Duffez

Oui j’ai vu tout ça sur Twitter, j’ai mis à jour mon dossier.

Répondre