Que faire des pages inactives ?
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Conseils pour un référencement Google en page 1 (méthode pages actives sur 1 an)

L'analyse des Pages Actives sur 1 an apporte une nouvelle vision sur votre référencement. Mais que faire des pages inactives ? Dans ce dossier, découvrez les étapes à suivre et tous les cas de figure à appliquer.

Vous avez besoin d'une méthode SEO qui pourrait vous apporter de nouvelles idées ?

Vous êtes au bon endroit !

Cet article est la 3ème partie de mon grand dossier consacré à la méthode d'analyse des pages actives sur 1 an.

Si vous avez raté les 2 premiers, allez les lire et revenez ici ensuite :

En résumé :

  • la méthode dite des « Pages Actives sur 1 an » permet de se rendre compte des faiblesses SEO d'un site (qui passent souvent inaperçues, même chez les référenceurs chevronnés)
  • vous allez repérer des pages totalement inactives sur 1 an : vous devez décider en priorité quoi faire avec elles, c'est le but de cet article
  • il faudra aussi vous attaquer aux pages qui génèrent  très peu de visites par an
  • ceci permet de remonter la visibilité Google d'un site qui avait trop de pages de faible qualité
  • mais aussi d'améliorer encore le référencement naturel d'un site qui performe déjà bien

Alors concrètement, voici les actions à mettre en place...

Elles sont toutes importantes et doivent être effectuées dans l'ordre.

1 Lancez un audit SEO complet

Utilisez l'outil de votre choix, sachant qu'il faut :

  • choisir un crawler qui suive 100% des liens sur votre site, comme Googlebot. Le crawl doit être exhaustif.
  • repérer les URL indexables (et baser tout le reste de l'analyse sur celles-ci)
  • vérifier les points techniques fondamentaux comme la profondeur, le temps de téléchargement, les balises title/meta description/h1 mais aussi la diversité des ancres des liens internes)
  • pouvoir identifier les pages qui n'ont pas assez de contenu dans la zone principale (ne vous basez pas sur le ratio texte/code, ce n'est pas assez fiable)
  • calculer un indice de qualité de chaque page (on a vu qu'il faut savoir repérer les pages qui accumulent plusieurs petits problèmes, sinon cela passera inaperçu)
  • combiner avec les données fournies par Google Analytics et Search Console

Je vous conseille évidemment d'utiliser mon outil en ligne RM Tech, qui fait tout ça très bien !

2 Ayez un sitemap exhaustif

La première chose à faire, c'est de savoir avec combien de pages vous souhaitez "jouer dans Google". Comme le dit mon associé Fabien avec humour pendant nos formations :

Comme le berger qui sait exactement le nombre de moutons dans son troupeau, un SEO doit connaitre précisément le nombre d'URL avec lesquelles il souhaite jouer dans Google.

Concrètement, vous devriez savoir exactement quelles URL doivent être indexées (et uniquement celles-là). Pour cela, ayez un sitemap exhaustif (ou plusieurs, ça ne change rien).

On est bien d'accord qu'il ne s'agit que de pages dont vous êtes fier, tellement la qualité est au rendez-vous, n'est-ce pas ?

3 Vérifiez ce que vous faites indexer

Vérifiez que vous remplissez bien toutes les exigences suivantes :

  • 100% des URL de votre sitemap (qui est exhaustif je le rappelle) doivent se retrouver dans la liste des pages indexables (trouvée par l'audit). S'il en manque, les pages concernées risquent d'être orphelines, c'est-à-dire qu'il n'existe pas de moyen pour les trouver en cliquant sur des liens internes dans le site. Dans ce cas, corrigez le maillage ou revoyez votre sitemap s'il n'est pas correct.
  • Toutes les pages indexables trouvées dans l'audit doivent être des pages prévues, des pages que vous avez travaillées pour qu'elles soient dans Google. Si ce n'est pas le cas, vous générez ce que j'appelle de la masse noire (pas qui ne devraient pas être indexables, parfois pas crawlables, et parfois même ne pas exister du tout). Il faut corriger ça...

4 Calculez votre taux de pages actives sur 1 an

Je vous recommande d'avoir un taux de pages actives très élevé (supérieur à 95%).

S'il est trop faible, suivez les étapes suivantes.

S'il est très faible ou même nul, c'est bien ! Mais ça ne suffit pas, peut-être avez-vous un grand nombre de pages très faiblement actives (quelques visites par an). Dans votre audit RM Tech, observez l'histogramme concerné. Si vous avez beaucoup de pages "très faiblement actives sur 1 an", suivez les étapes suivantes.

Voici à quoi ressemble dans un rapport d'audit RM Tech un histogramme représentant la répartition des pages selon le nombre de visites qu'elles ont généré sur 1 an (en référencement naturel) :

Trop de pages inactives
Ce site dont le trafic SEO chute en permanence a bien trop de pages inactives, il doit faire le ménage.

5 Traitez les pages inactives et faiblement actives

Maintenant que vous savez quelles pages sont actives et lesquelles sont inactives, il va falloir agir !

Il y a plusieurs cas de figure parmi vos pages inactives (ou trop faiblement actives) :

  • trop faible optimisation à l'intérieur du site (profondeur, maillage interne) ou sur la page elle-même (balises title, Hn, contenu trop faible ou de piètre qualité)
  • le contenu n'intéresse plus personne
  • la page est jugée "spam" par l'algo de Google
  • il s'agit d'un contenu généré par les utilisateurs (UGC, comme les forums par exemple)
  • la page correspond à des cas particuliers (contact, mentions légales, CGU, etc.)

OK mais au final, faut-il supprimer toutes les pages inactives ?

Non ! Il faut suivre une méthode bien précise.

Tout ceci étant extrêmement important, j'ai préféré le détailler dans un article à part : Que faire des pages inactives en référencement ? Allez donc le lire puis revenez lire la suite ici !

6 Relancez un audit et soyez patients

Pour valider que toutes vos actions sont correctes, relancez un audit. Celui-ci doit montrer que tout ce que vous avez entrepris a effectivement corrigé les problèmes identifiés.

Ensuite, ne soyez pas trop pressés, surtout si vous avez modifié ou supprimé beaucoup de pages. Laissez le temps à Googlebot de les recrawler puis de tenir compte de tous vos changements. Google doit aussi amasser suffisamment de données sur le comportement de l'internaute.

Et vous ?

Cette méthode a été testée sur de nombreux sites, comment pensez-vous l'appliquer au vôtre ?

Dites-moi ce que vous en pensez, posez vos questions dans les commentaires !

Cet article vous a-t-il plu ?

Note : 4.5 (8 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

8 commentaires

Arno C.

J'ai un site de vente en ligne traduit dans plusieurs langues et donc indéxé dans plusieurs langues (avec des balise href lang ok). certaines langues sont plus actives que d'autres.
est ce que les langues les moins actives pénalisent l'ensemble de mon site?
La structure des url est avec la langue en répertoire à la racine /fr ou /ru par exemple
Sachant que j'avais testé une langue peu répandu (le catalan) et que j'hésite à la désactiver puisqu'elle n'apporte pas beaucoup de CA (moins de 1%)

Répondre
Olivier Duffez

Je ne sais pas si Google considère ce cas de façon très différente. Au final, il y a un site qui est analysé en entier, donc si une grosse partie des pages est de faible qualité, ça peut jouer de façon négative. L'analyse des pages actives sur 1 an permet d'évaluer des choses avant toute décision.
Avant de décider de supprimer une langue, il faut voir tous les aspects, pas seulement SEO (combien ça a coûté de la faire, combien elle rapporte, quel impact sur la maintenance et mise à jour, etc.).

Répondre
Ludo

Bonjour,
Il y a un autre point, non évoqué ici : les page avec des liens externes en erreur ( 403, 404, ndd n'existant plus ... )
Malgré un contenu riche elles sont très mal indexées et ne génèrent que très peu de visites.
Pour exemple une partie annuaire d'un de mes sites ( avec descriptions uniques) ou les liens vers les sites inscrits n'avaient pas été vérifiés depuis longtemps, le ménage vient d'être fait mais pas assez de recul pour en mesurer l'effet.

Répondre
Olivier Duffez

Je conseille de corriger régulièrement les liens sortants externes en erreur, mais à ma connaissance cette correction n'apporte pas d'amélioration du référencement (ou alors de façon indirecte impossible à repérer).

Répondre
BrunoChauzi

Sauf erreur de ma part les pages actives dont il est question ici sont au format htm ; est-il possible que les pages au format pdf impactent aussi négativement la qualité d'un site si elles ne sont pas visitées ? je pense que mon site est dans ce cas ce qui expliquerait une baisse continue du référencement malgré un audit positif RM tech très favorable.

Répondre
Olivier Duffez

A part le début avec l'analyse des codes HTTP trouvés sur le site, l'analyse des pages indexables et tout ce qui suit dans un rapport RM Tech est basée sur les pages HTML. C'est d'ailleurs bien précisé.
Donc oui, c'est possible qu'avoir plein de PDF de mauvaise qualité indexés fasse baisser une sorte de note moyenne de qualité du site, calculée par Google.
Dans un rapport RM Tech, il faut regarder la section 3.4 Types MIME pour vérifier ce qu'il y a comme documents autres que HTML.

Répondre
Gerard

Bjr,
Vraiment très intéressant mais comment gérer les urls de post à durée temporaires comme par exemple ( annonces d'un article vendue ) donc annonces supprimées.
La page informant le post absent est bien présente mais peut-on améliorer ?

Répondre
Olivier Duffez

Si l'annonce n'est plus disponible, autant renvoyer un code 404 ou 410.
Si on sait à l'avance que la page ne sera disponible que très peu de temps (même pas quelques jours), mieux vaut ne pas la faire indexer du tout.

Répondre