Que faire des pages inactives ?
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Que faire des pages inactives en SEO ? Conseils et méthode détaillée

Comme vous le savez, il est conseillé d’avoir le maximum de pages actives sur votre site (celles qui génèrent des visites sur 1 an, en référencement naturel). Faut-il supprimer les pages inactives ou peut-on en sauver ? Réponse dans ce dossier.

Avant de démarrer, je suppose que si vous lisez cet article, vous avez déjà lu les précédents. Si ce n’est pas le cas, voici les liens :

  1.  Qu’est-ce que la méthode des « Pages Actives sur 1 an » ?
  2. Les principales causes d’un mauvais référencement
  3. Comment obtenir un meilleur référencement naturel avec cette méthode

Vous êtes donc ici pour comprendre comment traiter les pages inactives sur un site (générant aucune visite sur 1 an, ou très peu).

Je vous alerte sur 2 points majeurs :

  • Avant toute désindexation ou suppression, il faut comprendre la cause et toujours tenter d’abord de conserver la page en l’améliorant.
  • Même si les outils aident énormément dans ce type d’analyse, c’est bien une réflexion humaine qui doit avoir le dernier mot. Ne vous basez pas aveuglément sur des recommandations automatisées, c’est à vous de décider au final.

D’abord, je vais commencer par traiter certains cas particuliers.

Cas particuliers de pages inactives en référencement

Que faire des pages contact, mentions légales, politique de confidentialité, CGU, conditions de livraison ?

Je conseille de laisser ces pages se faire crawler et même indexer, car elles jouent un rôle important pour l’analyse du sérieux et de la réputation du site (cf. analyse E.A.T.). Certains internautes pourraient même les chercher depuis Google et s’étonner de ne pas les trouver pour votre site. Il est assez fréquent que ces pages soient actives (sur 1 an). Enfin, ces pages ne représentent sans doute qu’une très faible partie de vos pages.

Faut-il supprimer les vieilles actualités ?

Si l’internaute arrive sur une très vieille actu mais que la date est clairement indiquée et qu’il est logique que le contenu n’ait pas changé (car cela ne le nécessitait pas), je ne pense pas que ça pose problème.

Cela dit, c’est à vous de choisir, si vous souhaitez supprimer des actualités vraiment très vieilles et jamais consultées, cette méthode vous aide à les repérer.

Si l’article n’est pas une actualité mais plutôt des conseils ou un tutoriel, c’est très différent. On pourrait même dire que c’est l’inverse, l’âge de l’article ne joue pas en sa faveur, notamment car l’internaute risque d’avoir un a priori négatif sur la fiabilité des informations.

Que faire des (vieilles) discussions d’un forum ?

Plus largement, faut-il supprimer les pages inactives dont le contenu est généré par l’utilisateur (UGC) ?

Bien souvent, passé un certain délai, ces pages ne génèrent aucune ou très peu de visites par an.

A quoi bon conserver une discussion n’ayant eu aucune réponse ? Ou bien le cas d’une demande d’aide très spécifique à un site, résolue depuis des années ? Ou bien pour aborder un sujet ou une techno totalement dépassée ou inutilisée aujourd’hui ?

A mon avis, c’est surtout un choix du propriétaire du forum : souhaite-t-il conserver tout un historique – par principe, ou préfère-t-il être pragmatique et retirer tout ce qui n’a aucune chance d’intéresser du monde dans le futur ?

L’autre problème est le temps que ça prend…

J’ai commencé à le faire sur WebRankInfo, mais avec 1,5 million de messages depuis 2002, ça prend beaucoup de temps à « nettoyer »…

La page bénéficie-t-elle d’un bon maillage interne ?

Dans tous les audits que j’ai fait, j’ai remarqué qu’il est encore très fréquent que le maillage interne soit très insuffisant. Si vous ne faites pas assez de liens vers une page, ou mal faits, alors la page est handicapée d’un point de vue SEO.

Si une page est inactive ou très faiblement active, vérifiez qu’elle dispose de suffisamment de liens entrants internes :

  • si elle n’a qu’un seul lien, c’est souvent insuffisant
  • le nombre de liens minimum dépend de la taille du site, mais essayez d’en avoir plusieurs
  • tant qu’à faire, vérifiez que les ancres des liens vers la page sont variées (ceci optimise pour la longue traîne)
  • mais surtout : évitez que la page ne reçoive qu’un (ou plusieurs) lien depuis de la pagination (page 2 et plus)

Pour vérifiez tout ça, si vous avez fait un audit en ligne RM Tech, vous avez toutes les infos :

  • l’analyse de la profondeur vous dit si la page est trop profonde
  • elle vous indique également combien la page reçoit de backlinks, ainsi que d’anchor text distincts
  • dans la conclusion, la deuxième annexe liste tous les backlinks internes follow de toutes les URL étudiées, avec l’ancre de chacun. Vous saurez donc si votre page reçoit des liens autres que de la pagination.

Parfois le problème ne vient pas du contenu de la page

Si la page ne génère aucune visite ou très peu à l’année, la raison n’est pas toujours la page elle-même et son contenu. Avant d’envisager la supprimer ou désindexer, vérifiez donc tout ce qui a un impact sur ses performances SEO :

  • vitesse de téléchargement et de chargement complet
  • profondeur, backlinks internes, variété des ancres dans les backlinks internes
  • compatibilité mobile
  • expérience utilisateur
  • a-t-elle des concurrentes sur le même site (« cannibalisation ») ?

Si vous avez lancé un audit RM Tech, vous avez déjà la plupart de ces informations, pour chaque page.

Corrigez d’abord tous ces points, attendez quelques semaines puis relancez un audit complet pour vérifier si elles sont toujours inactives.

La page peut-elle être considérée comme une page satellite ?

Demandez-vous si la page est créée avant tout pour le référencement et non pour répondre à un réel besoin de l’internaute ou pour présenter votre offre…

La page fait-elle partie d’une (très) grande collection de pages construites de façon très similaire ? Par exemple la seule chose qui change est le nom d’une ville, et très peu de choses ailleurs dans le contenu. Dans ce cas, il faut se demander si ces pages sont réellement d’une grande qualité.

Regardez combien Google a bien voulu indexer de cette collection de pages. Si le taux est faible, c’est mauvais signe.

Envisagez de faire moins de pages (en les regroupant) mais de meilleure qualité.

Faut-il supprimer les pages inactives ?

Si vous en êtes ici, c’est que les pages à traiter ne correspondent à aucun des cas précédents. A vrai dire, c’est le plus répandu.

Que faire de chaque page inactive ? Plusieurs solutions sont possibles :

  • 📝 améliorer la page
  • 📎 la fusionner avec d’autres pages
  • ⛔️ la désindexer tout en la conservant sur le site
  • 🗑 la supprimer complètement
  • 🙏 ne rien faire, la laisser telle quelle (et espérer un miracle)

Pour savoir quoi faire, vous devez récupérer d’autres données spécifiques au site puis prendre une décision « humaine ».

Voici les données que j’ai l’habitude de récupérer, puis de fusionner dans Excel avec l’annexe générale de RM Tech :

  • nombre de consultations de la page (nb de fois où elle a été affichée, qu’elle soit une page de destination ou pas, que le support soit le référencement naturel ou pas), afin de ne pas supprimer une page consultée même si inactive SEO
  • nombre de mots ou caractères du contenu (si je peux le savoir facilement, par exemple par mon CMS), afin d’affiner l’évaluation de faiblesse du contenu
  • nombre de réponses au 1er message quand il s’agit d’une discussion
  • date de publication ou de dernière modification, afin de calculer un âge
  • type de contenu (actualité, tutoriel, conseils, catégorie d’articles, fiche produit, catégorie de produits, petite annonce, catégorie d’annonces, etc.)
  • chiffre d’affaires généré ou associé à la page afin de ne pas supprimer une page qui génère des revenus
  • nombre de sites faisant des backlinks (ou d’autres indicateurs du netlinking) afin de ne pas supprimer une page ayant du PageRank sans le savoir ou sans faire de redirection
💡 Astuce : comment exploiter toutes ces données ? Comment prioriser les actions et repérer quelles pages traiter en premier ? Une technique possible est de calculer l’indice zombie de chaque page : je vous la détaille ci-dessous.
Pages zombie et SEO

Brian Dean (Backlinko) recommande fortement d’identifier et supprimer les pages zombie

« Zombie » car plus cet indice est élevé, plus la page est irrécupérable. C’est aussi une référence à un terme utilisé par Brian Dean de Backlinko qui partage exactement la même vision que moi : un site devrait avoir une grande majorité de pages de forte qualité, actives, et très peu de pages zombies. C’est même la 1ère chose à faire selon lui dans cette vidéo.

Plusieurs solutions s’offrent à vous. Une assez simple consiste à multiplier tout ce qui est néfaste (noté N), à multiplier tout ce qui est positif (résultat noté P) et à diviser N par P. Ensuite vous triez selon cet indice, quitte à le multiplier par 10000 et cacher les décimales.

Par exemple :

  • N = âge_en _années
  • P = (1 + nb_sessions_générées) * (1 + nb_consultations) * (1 + nb_mots) * (1 + CA) * score_netlinking

J’ajoute « 1 » pour certains éléments afin d’éviter de finir avec un zéro dès que je multiple par zéro. Cette formule peut facilement être améliorée (donnez votre avis en commentaires) !

Maintenant que vous avez toutes les infos et étudié la page, suivez ceci :

Cas #1 si le contenu de la page est améliorable, c’est la meilleure chose à faire📝. Complétez les informations, mettez-les à jour, vérifiez si vous ciblez les bons mots-clés et que la richesse sémantique du texte est supérieure à celle de vos concurrents dans Google, améliorez l’UX, ajoutez des liens vers d’autres pages internes, précisez vos sources (avec des liens sortants externes), mettez en avant l’auteur, illustrez par des images ou des vidéos, etc. Ajoutez-lui des liens entrants internes et faites-en la promotion sur les réseaux sociaux ou dans vos mailings.

Cas #2 sinon, si le contenu est juste trop faible et que d’autres pages sont concernées, regroupez-les 📎. Choisissez la meilleure de ce groupe (cluster), fusionnez les contenus et reformatez le résultat final. N’oubliez pas de supprimer les autres pages du cluster et de faire des redirections 301 vers l’URL qui les regroupera. Parfois, aucune URL existante n’est adaptée pour les regrouper : vous pouvez en créer une toute nouvelle et rediriger toutes les autres vers elle.

Cas #3 sinon, si le contenu peut malgré tout intéresser des internautes ou générer des revenus, désindexez la page ⛔️ mais laissez-la en ligne. Sauf cas particulier, cela signifie que vous ne touchez pas au maillage interne : les liens vers la page restent en place. Si vous avez besoin d’aide, j’ai un tuto pour apprendre à désindexer une page.

Cas #4 sinon, le contenu est irrécupérable et la page doit être supprimée 🗑 (et désindexée). Elle doit donc renvoyer un code 410. Si vous ne pouvez pas faire la 410, renvoyez un 404. Ca ne change pas grand chose mais c’est pour éviter de polluer votre rapport d’erreurs 404 dans Search Console notamment. Vérifiez que plus aucun lien interne ne pointe vers elle.

En résumé…

Cet article fait partie d’une série sur ce que j’ai appelé la méthode des « Pages Actives sur 1 an » :

  • cette méthode permet de se rendre compte des faiblesses SEO d’un site (qui passent souvent inaperçues, même chez les référenceurs chevronnés)
  • vous allez repérer des pages totalement inactives sur 1 an : vous devez décider en priorité quoi faire avec elles, c’est le but de cet article
  • il faudra aussi vous attaquer aux pages qui génèrent  très peu de visites par an
  • ceci permet de remonter la visibilité Google d’un site qui avait trop de pages de faible qualité
  • mais aussi d’améliorer encore le référencement naturel d’un site qui performe déjà bien

Cet article vous a-t-il plu ?

Note : 4.6 (10 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

8 commentaires

David

Super article merci. Petite question, dans le cas#1, si le contenu de la page est amélioré, faut-il remplacer la date de publication de l’article par la date de mise à jour ?

Répondre
Olivier Duffez

S’il s’agit d’une mise à jour importante, oui autant modifier la date.
Sinon, pas la peine.

Répondre
emipoker

Ce que je ne comprends pas c comment concrètement supprimer une page. Parce que si je mets une redirection 410, cela veut aussi dire que je garde la page sur mon serveur ?
Exemple :
Avant : example.com/page
Après : example.com/page (avec redirection afin de ne plus afficher le contenu de cette page mais vers la page d’accueil ou une page type « le contenu n’explique plus »)
Je ne sais pas si je m’explique bien, mais par exemple, est-ce que je peux juste supprimer des pages sur mon serveur? Comment s’opère la redirection?
Merci Olivier !

Répondre
Olivier Duffez

Si c’est un code 410 qui est envoyé, alors ça veut dire que la page n’est plus accessible (elle affiche un message d’erreur, celui d’une page 410 personnalisée). Et ça veut aussi dire que ce n’est pas une redirection (les redirections ont des codes HTTP du type 3XX comme 301 ou 302).
Pour supprimer une page du site, il faut voir comment faire dans le back-office du site, c’est selon le CMS. Selon les cas :
– ça enverra un code 404 (page introuvable) ou un code 410 (page a disparu)
– ça fera une redirection (si c’est prévu). Dans ce cas, il faut faire une redirection vers une page qui traite du même sujet (pas de redirections en masse vers une même page, sinon Google considère ça comme une soft 404)

Tu peux vérifier le code HTTP avec un outil comme le mien.

Pour des explications plus complètes, ça serait mieux de créer une nouvelle discussion dans le forum.

Répondre
Olivier Duffez

Merci pour l’info, même ancienne (2016) elle est intéressante. Connais-tu d’autres exemples réussis de « content pruning » ?

Répondre
thomasss

@Olivier, dans le cas 3 de cet article, les liens qui pointent vers les pages mis en no-index doivent-ils être mis en no-follow ? s’il s’agit de menu de navigation par exemple.
Google apprécie t-il qu’un lien en follow soit à l’arrivé une page en no-index ?

Répondre
Olivier Duffez

Oui tant qu’à faire je pense que c’est mieux de mettre les liens en nofollow pour tenter d’éviter que Google les crawle, mais ça ne change pas grand chose au final.
De toutes façons, le noindex n’est pas une solution durable : au bout d’un moment il faut avoir choisi : soit la page est conservée sur le site et améliorée (sans noindex), soit la page est supprimée du site.

Répondre