Bon référencement pages actives sur 1 an
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Conseils pour un référencement Google au top (méthode pages actives sur 1 an)

L’analyse des Pages Actives sur 1 an apporte une nouvelle vision sur votre référencement. Mais que faire des pages inactives ? Dans ce dossier, découvrez les étapes à suivre et tous les cas de figure à appliquer.

Vous avez besoin d’une méthode SEO qui pourrait vous apporter de nouvelles idées ?

Vous êtes au bon endroit !

Cet article est la 3ème partie de mon grand dossier consacré à la méthode d’analyse des pages actives sur 1 an.

Si vous avez raté les 2 premiers, allez les lire et revenez ici ensuite :

En résumé :

  • la méthode dite des « Pages Actives sur 1 an » permet de se rendre compte des faiblesses SEO d’un site (qui passent souvent inaperçues, même chez les référenceurs chevronnés)
  • vous allez repérer des pages totalement inactives sur 1 an : vous devez décider en priorité quoi faire avec elles, c’est le but de cet article
  • il faudra aussi vous attaquer aux pages qui génèrent  très peu de visites par an
  • ceci permet de remonter la visibilité Google d’un site qui avait trop de pages de faible qualité
  • mais aussi d’améliorer encore le référencement naturel d’un site qui performe déjà bien

Alors concrètement, voici les actions à mettre en place…

Elles sont toutes importantes et doivent être effectuées dans l’ordre.

1 Lancez un audit SEO complet

Utilisez l’outil de votre choix, sachant qu’il faut :

  • choisir un crawler qui suive 100% des liens sur votre site, comme Googlebot. Le crawl doit être exhaustif.
  • repérer les URL indexables (et baser tout le reste de l’analyse sur celles-ci)
  • vérifier les points techniques fondamentaux comme la profondeur, le temps de téléchargement, les balises title/meta description/h1 mais aussi la diversité des ancres des liens internes)
  • pouvoir identifier les pages qui n’ont pas assez de contenu dans la zone principale (ne vous basez pas sur le ratio texte/code, ce n’est pas assez fiable)
  • calculer un indice de qualité de chaque page (on a vu qu’il faut savoir repérer les pages qui accumulent plusieurs petits problèmes, sinon cela passera inaperçu)
  • combiner avec les données fournies par Google Analytics et Search Console

Je vous conseille évidemment d’utiliser mon outil en ligne RM Tech, qui fait tout ça très bien !

2 Ayez un sitemap exhaustif

La première chose à faire, c’est de savoir avec combien de pages vous souhaitez « jouer dans Google ». Comme le dit mon associé Fabien avec humour pendant nos formations :

Comme le berger qui sait exactement le nombre de moutons dans son troupeau, un SEO doit connaitre précisément le nombre d’URL avec lesquelles il souhaite jouer dans Google.

Concrètement, vous devriez savoir exactement quelles URL doivent être indexées (et uniquement celles-là). Pour cela, ayez un sitemap exhaustif (ou plusieurs, ça ne change rien).

On est bien d’accord qu’il ne s’agit que de pages dont vous êtes fier, tellement la qualité est au rendez-vous, n’est-ce pas ?

3 Vérifiez ce que vous faites indexer

Vérifiez que vous remplissez bien toutes les exigences suivantes :

  • 100% des URL de votre sitemap (qui est exhaustif je le rappelle) doivent se retrouver dans la liste des pages indexables (trouvée par l’audit). S’il en manque, les pages concernées risquent d’être orphelines, c’est-à-dire qu’il n’existe pas de moyen pour les trouver en cliquant sur des liens internes dans le site. Dans ce cas, corrigez le maillage ou revoyez votre sitemap s’il n’est pas correct.
  • Toutes les pages indexables trouvées dans l’audit doivent être des pages prévues, des pages que vous avez travaillées pour qu’elles soient dans Google. Si ce n’est pas le cas, vous générez ce que j’appelle de la masse noire (pas qui ne devraient pas être indexables, parfois pas crawlables, et parfois même ne pas exister du tout). Il faut corriger ça…

4 Calculez votre taux de pages actives sur 1 an

Je vous recommande d’avoir un taux de pages actives très élevé (supérieur à 95%).

S’il est trop faible, suivez les étapes suivantes.

S’il est très faible ou même nul, c’est bien ! Mais ça ne suffit pas, peut-être avez-vous un grand nombre de pages très faiblement actives (quelques visites par an). Dans votre audit RM Tech, observez l’histogramme concerné. Si vous avez beaucoup de pages « très faiblement actives sur 1 an », suivez les étapes suivantes.

Voici à quoi ressemble dans un rapport d’audit RM Tech un histogramme représentant la répartition des pages selon le nombre de visites qu’elles ont généré sur 1 an (en référencement naturel) :

Trop de pages inactives

Ce site dont le trafic SEO chute en permanence a bien trop de pages inactives, il doit faire le ménage.

5 Traitez les pages inactives et faiblement actives

C’est la partie la plus importante de l’article ! Si j’ai oublié des cas, utilisez les commentaires.

Je vous alerte sur 2 points majeurs :

  • Avant toute désindexation ou suppression, il faut comprendre la cause et toujours tenter d’abord de conserver la page en l’améliorant.
  • Même si les outils aident énormément dans ce type d’analyse, c’est bien une réflexion humaine qui doit avoir le dernier mot. Ne vous basez pas aveuglément sur des recommandations automatisées, c’est à vous de décider au final.

D’abord, je vais commencer par traiter certains cas particuliers.

Que faire des pages contact, mentions légales, politique de confidentialité, CGU, conditions de livraison ?

Je conseille de laisser ces pages se faire crawler et même indexer, car elles jouent un rôle important pour l’analyse du sérieux et de la réputation du site (cf. analyse E.A.T.). Certains internautes pourraient même les chercher depuis Google et s’étonner de ne pas les trouver pour votre site. Il est assez fréquent que ces pages soient actives (sur 1 an). Enfin, ces pages ne représentent sans doute qu’une très faible partie de vos pages.

Faut-il supprimer les vieilles actualités ?

Si l’internaute arrive sur une très vieille actu mais que la date est clairement indiquée et qu’il est logique que le contenu n’ait pas changé (car cela ne le nécessitait pas), je ne pense pas que ça pose problème.

Cela dit, c’est à vous de choisir, si vous souhaitez supprimer des actualités vraiment très vieilles et jamais consultées, cette méthode vous aide à les repérer.

Si l’article n’est pas une actualité mais plutôt des conseils ou un tutoriel, c’est très différent. On pourrait même dire que c’est l’inverse, l’âge de l’article ne joue pas en sa faveur, notamment car l’internaute risque d’avoir un a priori négatif sur la fiabilité des informations.

Que faire des (vieilles) discussions d’un forum ?

Plus largement, faut-il supprimer les pages inactives dont le contenu est généré par l’utilisateur (UGC) ?

Bien souvent, passé un certain délai, ces pages ne génèrent aucune ou très peu de visites par an.

A quoi bon conserver une discussion n’ayant eu aucune réponse ? Ou bien le cas d’une demande d’aide très spécifique à un site, résolue depuis des années ? Ou bien pour aborder un sujet ou une techno totalement dépassée ou inutilisée aujourd’hui ?

A mon avis, c’est surtout un choix du propriétaire du forum : souhaite-t-il conserver tout un historique – par principe, ou préfère-t-il être pragmatique et retirer tout ce qui n’a aucune chance d’intéresser du monde dans le futur ?

L’autre problème est le temps que ça prend…

J’ai commencé à le faire sur WebRankInfo, mais avec 1,5 million de messages depuis 2002, ça prend beaucoup de temps à « nettoyer »…

La page bénéficie-t-elle d’un bon maillage interne ?

Dans tous les audits que j’ai fait, j’ai remarqué qu’il est encore très fréquent que le maillage interne soit très insuffisant. Si vous ne faites pas assez de liens vers une page, ou mal faits, alors la page est handicapée d’un point de vue SEO.

Si une page est inactive ou très faiblement active, vérifiez qu’elle dispose de suffisamment de liens entrants internes :

  • si elle n’a qu’un seul lien, c’est souvent insuffisant
  • le nombre de liens minimum dépend de la taille du site, mais essayez d’en avoir plusieurs
  • tant qu’à faire, vérifiez que les ancres des liens vers la page sont variées (ceci optimise pour la longue traîne)
  • mais surtout : évitez que la page ne reçoive qu’un (ou plusieurs) lien depuis de la pagination (page 2 et plus)

Pour vérifiez tout ça, si vous avez fait un audit en ligne RM Tech, vous avez toutes les infos :

  • l’analyse de la profondeur vous dit si la page est trop profonde
  • elle vous indique également combien la page reçoit de backlinks, ainsi que d’anchor text distincts
  • dans la conclusion, la deuxième annexe liste tous les backlinks internes follow de toutes les URL étudiées, avec l’ancre de chacun. Vous saurez donc si votre page reçoit des liens autres que de la pagination.

Parfois le problème ne vient pas du contenu de la page

Si la page ne génère aucune visite ou très peu à l’année, la raison n’est pas toujours la page elle-même et son contenu. Avant d’envisager la supprimer ou désindexer, vérifiez donc tout ce qui a un impact sur ses performances SEO :

  • vitesse de téléchargement et de chargement complet
  • profondeur, backlinks internes, variété des ancres dans les backlinks internes
  • compatibilité mobile
  • expérience utilisateur
  • a-t-elle des concurrentes sur le même site (« cannibalisation ») ?

Si vous avez lancé un audit RM Tech, vous avez déjà la plupart de ces informations, pour chaque page.

Corrigez d’abord tous ces points, attendez quelques semaines puis relancez un audit complet pour vérifier si elles sont toujours inactives.

La page peut-elle être considérée comme une page satellite ?

Demandez-vous si la page est créée avant tout pour le référencement et non pour répondre à un réel besoin de l’internaute ou pour présenter votre offre…

La page fait-elle partie d’une (très) grande collection de pages construites de façon très similaire ? Par exemple la seule chose qui change est le nom d’une ville, et très peu de choses ailleurs dans le contenu. Dans ce cas, il faut se demander si ces pages sont réellement d’une grande qualité.

Regardez combien Google a bien voulu indexer de cette collection de pages. Si le taux est faible, c’est mauvais signe.

Envisagez de faire moins de pages (en les regroupant) mais de meilleure qualité.

Faut-il supprimer les pages inactives ?

Si vous en êtes ici, c’est que les pages à traiter ne correspondent à aucun des cas précédents. A vrai dire, c’est le plus répandu.

Que faire de chaque page inactive ? Plusieurs solutions sont possibles :

  • 📝 améliorer la page
  • 📎 la fusionner avec d’autres pages
  • ⛔️ la désindexer tout en la conservant sur le site
  • 🗑 la supprimer complètement
  • 🙏 ne rien faire, la laisser telle quelle (et espérer un miracle)

Pour savoir quoi faire, vous devez récupérer d’autres données spécifiques au site puis prendre une décision « humaine ».

Voici les données que j’ai l’habitude de récupérer, puis de fusionner dans Excel avec l’annexe générale de RM Tech :

  • nombre de consultations de la page (nb de fois où elle a été affichée, qu’elle soit une page de destination ou pas, que le support soit le référencement naturel ou pas), afin de ne pas supprimer une page consultée même si inactive SEO
  • nombre de mots ou caractères du contenu (si je peux le savoir facilement, par exemple par mon CMS), afin d’affiner l’évaluation de faiblesse du contenu
  • nombre de réponses au 1er message quand il s’agit d’une discussion
  • date de publication ou de dernière modification, afin de calculer un âge
  • type de contenu (actualité, tutoriel, conseils, catégorie d’articles, fiche produit, catégorie de produits, petite annonce, catégorie d’annonces, etc.)
  • chiffre d’affaires généré ou associé à la page afin de ne pas supprimer une page qui génère des revenus
  • nombre de sites faisant des backlinks (ou d’autres indicateurs du netlinking) afin de ne pas supprimer une page ayant du PageRank sans le savoir ou sans faire de redirection
💡 Astuce : comment exploiter toutes ces données ? Comment prioriser les actions et repérer quelles pages traiter en premier ? Une technique possible est de calculer l’indice zombie de chaque page : je vous la détaille ci-dessous.
Pages zombie et SEO

Brian Dean (Backlinko) recommande fortement d’identifier et supprimer les pages zombie

« Zombie » car plus cet indice est élevé, plus la page est irrécupérable. C’est aussi une référence à un terme utilisé par Brian Dean de Backlinko qui partage exactement la même vision que moi : un site devrait avoir une grande majorité de pages de forte qualité, actives, et très peu de pages zombies. C’est même la 1ère chose à faire selon lui dans cette vidéo.

Plusieurs solutions s’offrent à vous. Une assez simple consiste à multiplier tout ce qui est néfaste (noté N), à multiplier tout ce qui est positif (résultat noté P) et à diviser N par P. Ensuite vous triez selon cet indice, quitte à le multiplier par 10000 et cacher les décimales.

Par exemple :

  • N = âge_en _années
  • P = (1 + nb_sessions_générées) * (1 + nb_consultations) * (1 + nb_mots) * (1 + CA) * score_netlinking

J’ajoute « 1 » pour certains éléments afin d’éviter de finir avec un zéro dès que je multiple par zéro. Cette formule peut facilement être améliorée (donnez votre avis en commentaires) !

Maintenant que vous avez toutes les infos et étudié la page, suivez ceci :

Cas #1 si le contenu de la page est améliorable, c’est la meilleure chose à faire📝. Complétez les informations, mettez-les à jour, vérifiez si vous ciblez les bons mots-clés et que la richesse sémantique du texte est supérieure à celle de vos concurrents dans Google, améliorez l’UX, ajoutez des liens vers d’autres pages internes, précisez vos sources (avec des liens sortants externes), mettez en avant l’auteur, illustrez par des images ou des vidéos, etc. Ajoutez-lui des liens entrants internes et faites-en la promotion sur les réseaux sociaux ou dans vos mailings.

Cas #2 sinon, si le contenu est juste trop faible et que d’autres pages sont concernées, regroupez-les 📎. Choisissez la meilleure de ce groupe (cluster), fusionnez les contenus et reformatez le résultat final. N’oubliez pas de supprimer les autres pages du cluster et de faire des redirections 301 vers l’URL qui les regroupera. Parfois, aucune URL existante n’est adaptée pour les regrouper : vous pouvez en créer une toute nouvelle et rediriger toutes les autres vers elle.

Cas #3 sinon, si le contenu peut malgré tout intéresser des internautes ou générer des revenus, désindexez la page ⛔️ mais laissez-la en ligne. Sauf cas particulier, cela signifie que vous ne touchez pas au maillage interne : les liens vers la page restent en place. Si vous avez besoin d’aide, j’ai un tuto pour apprendre à désindexer une page.

Cas #4 sinon, le contenu est irrécupérable et la page doit être supprimée 🗑 (et désindexée). Elle doit donc renvoyer un code 404 (ou 410). Vérifiez que plus aucun lien interne ne pointe vers elle.

6 Relancez un audit et soyez patients

Pour valider que toutes vos actions sont correctes, relancez un audit. Celui-ci doit montrer que tout ce que vous avez entrepris a effectivement corrigé les problèmes identifiés.

Ensuite, ne soyez pas trop pressés, surtout si vous avez modifié ou supprimé beaucoup de pages. Laissez le temps à Googlebot de les recrawler puis de tenir compte de tous vos changements. Google doit aussi amasser suffisamment de données sur le comportement de l’internaute.

Et vous ?

Cette méthode a été testée sur de nombreux sites, comment pensez-vous l’appliquer au vôtre ?

Dites-moi ce que vous en pensez, posez vos questions dans les commentaires !

Cet article vous a-t-il plu ?

Note : 4.4 (7 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

6 commentaires

Gerard

Bjr,
Vraiment très intéressant mais comment gérer les urls de post à durée temporaires comme par exemple ( annonces d’un article vendue ) donc annonces supprimées.
La page informant le post absent est bien présente mais peut-on améliorer ?

Répondre
Olivier Duffez

Si l’annonce n’est plus disponible, autant renvoyer un code 404 ou 410.
Si on sait à l’avance que la page ne sera disponible que très peu de temps (même pas quelques jours), mieux vaut ne pas la faire indexer du tout.

Répondre
BrunoChauzi

Sauf erreur de ma part les pages actives dont il est question ici sont au format htm ; est-il possible que les pages au format pdf impactent aussi négativement la qualité d’un site si elles ne sont pas visitées ? je pense que mon site est dans ce cas ce qui expliquerait une baisse continue du référencement malgré un audit positif RM tech très favorable.

Répondre
Olivier Duffez

A part le début avec l’analyse des codes HTTP trouvés sur le site, l’analyse des pages indexables et tout ce qui suit dans un rapport RM Tech est basée sur les pages HTML. C’est d’ailleurs bien précisé.
Donc oui, c’est possible qu’avoir plein de PDF de mauvaise qualité indexés fasse baisser une sorte de note moyenne de qualité du site, calculée par Google.
Dans un rapport RM Tech, il faut regarder la section 3.4 Types MIME pour vérifier ce qu’il y a comme documents autres que HTML.

Répondre
Ludo

Bonjour,
Il y a un autre point, non évoqué ici : les page avec des liens externes en erreur ( 403, 404, ndd n’existant plus … )
Malgré un contenu riche elles sont très mal indexées et ne génèrent que très peu de visites.
Pour exemple une partie annuaire d’un de mes sites ( avec descriptions uniques) ou les liens vers les sites inscrits n’avaient pas été vérifiés depuis longtemps, le ménage vient d’être fait mais pas assez de recul pour en mesurer l’effet.

Répondre
Olivier Duffez

Je conseille de corriger régulièrement les liens sortants externes en erreur, mais à ma connaissance cette correction n’apporte pas d’amélioration du référencement (ou alors de façon indirecte impossible à repérer).

Répondre