🧟‍♂️️ Vérifiez vos pages zombies SEO sur votre site !!! 🧟‍♀️️

Elles plombent votre référencement et ne vous rapportent rien...

Je le détaille dans mon tuto Pages Zombies

Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Pages zombies : détection et gestion avec RM Tech

Avez-vous des pages zombies sur votre site ? Avec une performance SEO nulle ou très mauvaise, un contenu et un intérêt très faibles, elles plombent votre référencement. RM Tech les détecte, les classe et vous aide à savoir quoi en faire.

Sommaire : afficher/masquer

  1. Définition
  2. Comment les trouver
  3. Que faire
  4. Exemples de succès
  5. Exemples de pages

Qu’est-ce qu’une page zombie ?

Définition

Une page zombie est une page qui non seulement cumule énormément de problèmes (et risque de décevoir l’internaute) mais aussi qui n’a pas de succès (génère pas ou très peu de visites SEO sur 1 an, est rarement consultée, rank très mal…).

Est-ce gênant pour le référencement d’avoir des pages zombies sur son site ?

Oui !

D’abord, si vous avez trop de pages zombies, cela signifie que vous avez trop de pages de mauvaise qualité (et qu’en plus les internautes ET l’algo de Google ne les apprécient pas). Rappelez-vous que Google juge la qualité globale de votre site : il tient compte de toutes les pages que vous lui demandez d’indexer. On retrouve cette affirmation dans le blog officiel de Google, dans l’article donnant des conseils sur Panda dont voici ma traduction :

Si certaines parties d’un site sont des contenus de faible qualité, alors cela peut dégrader le positionnement de l’ensemble du site. En conséquence, le positionnement de votre contenu de haute qualité pourrait progresser si vous supprimez les pages de faible qualité, ou si vous regroupez ou améliorez le contenu de certaines pages superficielles pour en faire des pages plus utiles, ou si vous migrez vos pages de mauvaise qualité vers un autre nom de domaine.

Vous devez donc être « fier » de 100% des pages que vous décidez de faire indexer.

Je résume : si vous avez trop de pages zombies 🧟‍♂️ 🧟‍♀️, comme dans l’imaginaire fantastique, elles vont attaquer les bonnes pages 😱

Partagez l'info à vos contacts Twitter !Click to Tweet

Je plaisante mais uniquement sur la façon de le décrire, car c’est bien la réalité de ce qui se passe avec l’algo de Google.

Ensuite, il y a une autre raison bien plus simple et évidente, sans supposition sur l’algo de Google.

Toutes ces pages ne vous apportent rien (pas ou très très peu de visites, pas de conversions) et dégradent l’image de marque de votre site (et même de l’entreprise associée). A chaque fois que vous allez améliorer une ou des pages zombies, elles vont se mettre à générer du trafic et des conversions, et améliorer votre image de marque. N’est-ce pas le but ?

Google indexe-t-il les pages zombies ?

Certaines sont indexées mais très peu performantes, mais pour d’autres l’algo de Google décide de ne pas les indexer. Autant dire qu’elles ne vont pas vous rapporter grand chose ! Et qu’il faut vraiment régler le problème.

Le pire, ce sont les pages que vous souhaitez que Google indexe (d’ailleurs elles sont dans votre sitemap en plus des liens internes) et que Google décide de ne même pas crawler.

John Mueller (de Google) a expliqué que pour ce dernier cas « Il se peut que le contenu de votre site ne soit pas considéré comme absolument essentiel pour nos résultats de recherche. »

Voici comment vous pouvez savoir si ça concerne votre site :

  • allez dans Google Search Console (nouvelle interface)
  • cliquez sur Index > couverture
  • si vous avez un sitemap exhaustif (je le conseille), au lieu de laisser « Toutes les pages connues » qui est par défaut, cliquez sur « Toutes les pages envoyées » pour filtrer sur uniquement les URL que vous souhaitez vraiment faire indexer :
    Toutes les pages connues (couverture de l'index dans Search Console)
  • cliquez sur l’onglet « Exclues » puis cliquez sur « Erreur » pour désélectionner le cas des pages en erreur
  • regardez si dans les lignes du tableau vous voyez 1 ou 2 des cas suivants :
    • « Explorée, actuellement non indexée » : Google a bien crawlé votre page mais décidé qu’elle ne méritait pas d’être indexée
    • « Découverte, actuellement non indexée » : Google a bien crawlé votre page mais décidé qu’elle ne méritait pas d’être indexée

Voici un exemple de site qui a énormément de pages concernées (et pourtant il s’agit de pages que le propriétaire du site souhaite faire indexer) :

Pages non indexées selon Search Console

Si ce rapport de Search Console vous liste des pages non indexées et pourtant crawlées ou découvertes, faites une analyse des pages Zombies avec RM Tech…

Si vous avez des pages avec ce type de problème, elles rentrent dans la catégorie des pages zombies… Il y a 2 cas de figure :

  • des URL qui n’auraient pas dû exister : j’appelle ça de la masse noire, c’est un problème technique et un crawler comme RM Tech vous aide à corriger ça
  • des URL qui cumulent trop de problème : c’est typiquement des pages zombies et l’audit RM Tech vous aide à les traiter

Je continue avec les conseils de John Mueller (de Google) déjà évoqués précédemment. Voici sa marche à suivre :

  1. « d’abord, vérifiez s’il n’y a pas de problèmes techniques »
  2. « ensuite, vérifiez que tout est OK dans le maillage interne ». « Prenez un outil de crawl et voyez quelles URL il arrive à trouver. »
  3. « enfin, si ce crawl a fonctionné [et permis de trouver ces pages], concentrez-vous fortement sur la qualité de ces pages. »

Voici une autre citation que je trouve très intéressante :

Peut-être qu’il est judicieux de se dire « bon, si je réduisais le nombre de pages de moitié ». Ou peut-être même réduire le nombre de pages dont je dispose à 10% du nombre actuel. En faisant cela, vous pouvez rendre les pages que vous gardez beaucoup plus fortes. Vous pouvez généralement améliorer un peu la qualité du contenu en ayant un contenu plus complet sur ces pages.

Comment trouver les pages zombies ?

Une prise en compte de très nombreux facteurs

Pour repérer les pages zombies, vous devez récupérer un maximum d’informations sur toutes vos pages :

  • identifiez les pages indexables (pour n’étudier que celles-ci)
  • évaluez les manques de contenu (zone principale de la page) ou les sous-optimisations évidentes (titre très mal fait, etc.)
  • évaluez l’intérêt de l’internaute pour cette page
  • évaluez les performances SEO sur 1 an, en prenant bien soin d’éviter tout échantillonnage : combien de visites la page génère-t-elle via le référencement naturel, quel est son positionnement dans Google et pour quelles requêtes, etc.
  • évaluez les performances de la page en dehors du SEO pour éviter de cataloguer « zombie » une page qui a du succès sur les réseaux sociaux ou via Google Ads, ou qui génère du chiffre d’affaires, ou qui participe à des conversions…

Une fois ces données récupérées (pas toujours simple il est vrai), ce n’est que le début ! Il faut en effet les combiner pour évaluer si une page est tellement mauvaise qu’elle mérite l’appellation zombie.

Et puis il faut calculer une métrique pour trier toutes ces pages de la pire à la moins mauvaise.

L’indice page zombie de RM Tech

My Ranking MetricsTout ça, j’ai passé beaucoup de temps à l’élaborer pour aboutir au calcul de l’indice zombie de chaque page indexable, disponible dans RM Tech, mon outil d’audit SEO sur ma plateforme My Ranking Metrics.

Je me suis basé sur mon expérience en référencement, en particulier ce repérage des pages de mauvaise qualité (cf. mon calcul d’indice QualityRisk) et des pages trop faiblement actives.

J’ai pu faire d’énormes tests grâce à ma plateforme (vive le big data) et à des échanges avec d’autres experts.

Au final, chaque page indexable se voit attribuer un indice zombie entre 0 (aucun problème) et 100 (problème maximal). Cet indice est fourni dans l’annexe située dans la conclusion, juste à côté de l’indice QualityRisk :

Indice zombie RM Tech

L’annexe en conclusion de RM Tech fournit tout, notamment l’indice zombie de chaque page (ici les URL ont été anonymisées)

Pour vous rendre compte très simplement de la présence de pages zombies sur le site que vous analysez et de l’importance du problème, le rapport affiche un histogramme de ce genre :

Histogramme indice zombie

Cet histogramme de RM Tech montre la répartition des pages selon leur indice zombie

Cet histogramme montre si vous avez beaucoup de pages à fort indice zombie. C’est en quelque sorte une version plus élaborée de l’histogramme QualityRisk (qui ne tient pas compte des données Analytics et Search Console).

⚠️ Le calcul de l’indice zombie d’une page ne peut se faire que pour un audit couplé à Google Analytics et Google Search Console sur 1 an, car nous exploitons de nombreuses données. Il n’est donc pas présent dans les audits gratuits (qui ne sont pas reliés à Analytics ou Search Console). En outre, il faut qu’il y ait assez de données exploitables (volume de pages, volume de trafic, etc.).

Repérer les pages zombies et les trier selon un indice c’est bien, mais il reste à gérer ces pages et décider quoi en faire…

Avant ça, je préfère rappeler un point important : disposer de l’indice zombie de chaque page est extrêmement utile pour faciliter la vie, gagner du temps et de l’efficacité, mais ça ne remplace certainement pas l’analyse humaine. Profitez du temps dégagé par ce calcul d’indice zombie (automatique) pour réfléchir à ce qu’il faut prendre comme décision.

Que faire des pages zombies ?

Plus l’indice zombie d’une page est élevé, plus il est probable qu’elle soit « irrécupérable ».

Plus votre site a de pages à fort indice zombie, plus c’est risqué et inefficace :

  • « risqué » car pour juger votre site, Google se base sur l’ensemble des pages que vous demandez de faire indexer. Laisser se faire indexer des pages “zombies” peut pénaliser vos bonnes pages
  • « inefficace » car ces pages génèrent aucune ou très peu de visites et sont pas ou très peu consultées par vos visiteurs

Il est recommandé d’effectuer une analyse humaine suivant la méthode ci-dessous. Attention :

Le but de l'analyse des pages zombies 👽 est d'essayer de sauver 🚑 le maximum de pages et de supprimer ou désindexer seulement en dernier recoursClick to Tweet

Je précise aussi que ne rien faire des pages zombies et espérer un miracle 🙏 n’est pas du tout la bonne solution…

Pour chaque page zombie identifiée, tentez les solutions dans cet ordre (passez à une solution seulement si la précédente n’est pas applicable).

1 🔎 Traitez les cas particuliers

La page est-elle récente ? Si elle est indexée depuis quelques mois à peine, c’est peut-être normal qu’elle n’ait pas encore eu un grand succès, surtout quand on compare avec les autres pages étudiées sur 1 an.

La page est-elle sur un sujet qui n’intéresse plus ? S’il s’agit d’une actualité, vérifiez que la date de publication de votre article est bien visible. Une analyse humaine s’impose ici pour savoir s’il faut conserver la page. Parfois une mise à jour est possible (sans modifier l’URL). A vous de décider si vous souhaitez conserver vos « archives ».

La page concerne-t-elle une niche très petite ? Si très peu de monde s’intéresse au sujet abordé, même sur 1 an, mais que le contenu est excellent et les (rares) conversions sont très rentables, alors vous pouvez décider de la conserver.

Certaines pages sont des exceptions sur le site, que vous pouvez ignorer ici : mentions légales, CGU/CGV, pages de contact mais également des URL de pagination (si celle-ci est gérée correctement) ou d’autres URL spéciales. RM Tech les ignore automatiquement 😎

2 📝 Améliorez la page

Il s’agit essentiellement d’améliorer le contenu, mais parfois aussi des aspects techniques (vitesse, profondeur et maillage…). Quelques pistes (je les ai toutes pratiquées avec succès…) :

  • complétez les informations et/ou mettez-les à jour
  • vérifiez si vous ciblez les bons mots-clés
  • assurez-vous que la richesse sémantique du texte est supérieure à celle de vos concurrents dans Google
  • améliorez l’UX
  • ajoutez des liens vers d’autres pages internes
  • ajoutez-lui des liens entrants internes (en variant les textes de ces liens)
  • précisez vos sources, avec des liens sortants externes (hyper important pour un site Your Money Your Life)
  • mettez en avant l’auteur
  • illustrez par des images (bien compressées) ou des vidéos
  • faites-en la promotion sur les réseaux sociaux ou dans vos mailings
  • (re)vérifiez l’orthographe et la grammaire, assurez-vous que vos textes sont faciles à lire
  • ajoutez des données structurées (référentiel schema.org)

3 📎 Regroupez des pages

Si plusieurs pages ont un contenu trop faible traitant d’un même sujet, regroupez-les. Choisissez la meilleure de ce groupe (cluster), fusionnez les contenus et reformatez le résultat final. N’oubliez pas de supprimer les autres pages du cluster et de faire des redirections 301 vers l’URL qui les regroupera.

Parfois, aucune URL existante n’est adaptée pour les regrouper : vous pouvez en créer une toute nouvelle et rediriger toutes les autres vers elle.

En aucun cas il ne faut faire des redirections massives vers une même URL, surtout n’ayant pas de contenu équivalent aux pages supprimées (l’erreur classique étant de rediriger en masse vers l’accueil).

4 ⛔️ Désindexez la page

Si vous pensez que le contenu peut malgré tout intéresser des internautes ou générer des revenus, désindexez la page mais laissez-la en ligne. Si besoin j’ai un tutoriel pour désindexer des pages.

Sauf cas particulier, cela signifie que vous ne touchez pas au maillage interne : les liens vers la page restent en place.

A vous d’évaluer si, une fois la page désindexée, il faut aussi la bloquer au crawl (fichier robots.txt).

5 🗑 Supprimez (et désindexez) la page

Il s’agit ici d’une page irrécupérable ou d’une URL qui n’aurait jamais dû être indexée (« masse noire »). La page doit donc être supprimée (et désindexée).

  • Si l’URL bénéfice de bons backlinks externes, faites une redirection 301 vers la meilleure page ayant un contenu sémantiquement proche. Vous pouvez trouver les backlinks dans Search Console (ou dans des outils SEO spécialisés).
  • Sinon, votre serveur doit renvoyer un code 410. Si vous ne pouvez pas faire la 410, renvoyez un 404. Ca ne change pas grand chose mais c’est pour éviter de polluer votre rapport d’erreurs 404 dans Search Console notamment.

Vérifiez que plus aucun lien interne ne pointe vers elle.

A votre tour de tester ! Lancez RM Tech

Sites ayant progressé en gérant les pages zombies avec RM Tech

J’ai trouvé sur Internet plusieurs exemples de retours d’expérience positifs suite à un gros nettoyage de pages de type zombies. Je n’ai pas la liste, consultez par exemple Ahrefs (en 2016), Beetle SEO et Raphaël Doucet. Si vous l’avez aussi travaillé, contactez-moi pour en parler !

J’aimerais aussi citer Brian Dean (du site Backlinko) qui a également utilisé l’expression « zombie pages ». Ce SEO reconnu aux USA recommande le repérage et la suppression de ces pages. C’est même l’étape n°1 de son guide !

Ainsi que Mary Bowling (SEO bien connue depuis 2003) qui conseillait dès 2015 de « détruire les pages zombie qui rampent sur votre site ».

Mais j’ai aussi personnellement travaillé sur le sujet, surtout depuis 2016 environ, pour mes clients mais aussi pour WebRankInfo. Voici donc 3 exemples très encourageants…

Client 1 : forte remontée du trafic SEO, durable

Cet exemple concerne un client que j’accompagne depuis pas mal d’années. Son trafic organique est en croissance régulière, grâce à des contenus de grande qualité et une bonne notoriété. En juillet 2017, le trafic SEO Google se met néanmoins à baisser… On laisse filer juillet et août (assez creux) et en septembre on se met au travail.

A l’époque, je n’avais pas encore accès à l’indice zombie dans RM Tech, mais je calculais quelque chose dans le même genre. C’était compliqué à mettre au point et pénible à faire à chaque fois. C’est pourquoi depuis je l’ai fait rajouter dans RM Tech :-)

Je récupérais les données de crawl et les combinais dans Excel avec d’autres informations :

  • date de publication ou dernière mise à jour de l’article
  • nb de fois où la page a été consultée, quelle que soit la source de trafic
  • succès via les réseaux sociaux
  • performances de la page en termes de ranking/mots-clés (via Search Console)
  • etc.

Presque toutes les mauvaises pages identifiées sont améliorées ; quelques unes sont regroupées et d’autres totalement supprimées.

Rien d’autre n’a été fait pendant cette période. Résultat :

pages zombies SEO hausse

Bel exemple de montée du trafic SEO après nettoyage de pages zombies

2 mois après, le trafic organique Google a fortement progressé, et ce fut le début d’une belle progression. 1 an après (octobre 2018), le trafic SEO du site était en hausse de +19% par rapport au plus haut de 2017 (avant la baisse) et de +66% par rapport au plus bas.

Client 2 : remontée à chaque « core update »

Pour cet autre client, le trafic n’était pas terrible début 2018 (et les mois précédents). En février je m’attaque au repérage des pages trop faiblement actives et j’étudie les causes. Cela m’a permis de trouver de nouvelles métriques à utiliser pour mon futur algo « zombies », désormais inclus dans RM Tech.

En avril 2018 Google effectue une mise à jour importante (« core update ») et le trafic monte d’un coup. A l’été 2018, on a finalisé le travail sur les autres pages trop faibles, et à chaque mise à jour le trafic monte :

Nettoyage des pages zombies, forte hausse SEO

Autre exemple de progression nette du trafic organique suite à un nettoyage du site (améliorations de pages, regroupements, désindexations)

Client 3 : meilleur référencement

Pour celui-ci, aucune page n’a été supprimée du site, par contre suite à l’analyse des pages zombie un travail important a été effectué :

  • les pages ayant un intérêt à titre d’archives mais aucun pour le SEO ont été mises en noindex
  • les autres ont été mises à jour, complétées et parfois regroupées quand c’était possible
Meilleur référencement après gestion des pages zombie

Le trafic référencement naturel en forte augmentation après gros travail des pages zombies

Client 4 : gros succès de la méthode

Pour ce client, j’ai suivi scrupuleusement la méthode décrite ci-dessus. Résultat : client (très) content, la courbe Search Console parle d’elle-même :

Méthode Pages Zombies SEO

Gros succès avec la méthode Pages Zombies SEO

Exemples de pages zombies trouvées par RM Tech

Je termine ce dossier avec une sélection d’exemples de pages de type « zombie » trouvées par RM Tech.

Pour simplifier les choses (j’ai plein de sites à montrer avec leur contexte), je l’ai fait en vidéo. Quelques précisions :

  • j’ai essayé de choisir des exemples variés, mais j’aurais pu en fournir 3x plus !
  • j’ai également inclus des exemples de bonnes pages (prises sur les mêmes sites) pour vous aider à comparer. C’est impressionnant de voir que cette analyse aide à identifier les types de contenus qui cartonnent de façon durable.
  • vous pouvez télécharger le rapport d’audit complet de chaque exemple montré ici (voir les liens sous la vidéo)
  • j’ai obtenu l’accord de chacun de ces sites pour tourner cette vidéo

Voici le genre de choses que l’algo zombie de RM Tech repère généralement très bien, même au milieu de dizaines de milliers de pages :

  • les fiches produits périmées ou sans stock
  • les fiches produits sans aucune description (ou 1 ligne)
  • les catégories vides ou presque
  • les pages correctes mais au titre complètement raté (balise title)
  • le spam inefficace et risqué (notamment les pages satellite)
  • les articles dont le contenu est totalement dépassé
  • les pages en erreur qui répondent pourtant en code 200
  • la saturation du (faible) contenu par la pub
  • les problèmes majeurs d’UX (expérience utilisateur)
  • la masse noire technique (URL indexables qui n’auraient même pas dû être crawlables)
  • sur un site multilingue : les pages non traduites, ou trop partiellement

Arrivez-vous à repérer tout ça très rapidement pour chaque site étudié (sans utiliser RM Tech) ?

Retrouvez cette vidéo sur YouTube : Pages zombies SEO trouvées par RM Tech

Voici les liens pour télécharger gratuitement les rapports d’audit RM Tech au format PDF (seules les annexes ne sont pas fournies) :

  • elle.be (presse féminine sur WordPress) : rapport PDF
  • jardinetmaison.fr (média sur Drupal) : rapport PDF
  • billard-toulet.com (présentation des produits et blog sur WordPress) :rapport PDF
  • sweetpartyday.com (ecommerce et blog sur WordPress) :rapport PDF
  • jet-lag-trips.com (blog sur WordPress) : rapport PDF
  • cyberpieces.com (ecommerce sur Prestashop) : rapport PDF
  • feezia.com (ecommerce sur Magento) : rapport PDF
  • regivia.com (édito et ecommerce sur WordPress + WooCommerce) : rapport PDF

Et vous ? Comment repérez-vous et traitez-vous les pages zombies en référencement ?

Cet article vous a-t-il plu ?

Note : 4.6 (10 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

9 commentaires

SEO Marseille

Un article qui va faire grand bruit dans le monde du SEO ! Très intéressant et à partager sans modération

Répondre
Olivier CLEMENCE

Bravo Olivier,
c’est un sujet dont nous avons déjà discuté et sur lequel tu te penches depuis un bon moment.

J’alerte également mes clients sur ce problème qui est très fréquent sur les sites e-commerce (mon coeur de cible).

Avoir un moyen de les repérer facilement et précisément avec RM Tech va simplifier le travail :)

Beau travail !

Répondre
Olivier Duffez

Oui, il faut parfois se rendre compte qu’un travail de qualité sur moins de produits est plus efficace…

Répondre
Jice Lavocat

Hello Olivier,

Tu m’as toujours convaincu de cet aspect important dans le positionnement d’un site.
J’ai une question pratico pratique. Sur un blog de contenu, dans lequel une série d’articles (« Les chiffres de la semaine ») a été créé au fil du temps, avec un ratio texte très faible et des visites quasi nulles … il y en a quelques centaines : quel traitement préconises-tu ? Tu disais que les redirection en masse vers la home peuvent être toxiques… du coup tu suggérerais de mettre tout en 410 ?

Répondre
Olivier Duffez

A priori code 410, sauf s’il y a des cas particuliers (par exemple pour une URL qui a reçu des bons backlinks, une 301 pourrait servir)

Répondre
Jeanviet

Super retour d’expérience, cela donne envie de faire un peu de nettoyage cet hiver. La corrélation entre le nombre de pages désindexées et le boost de trafic du tweet de Raphaël Doucet est éloquent. J’ai eu envie de regarder mon rapport search console d’urls exlcues à la lecture de ton article, ce qui est bizarre, c’est que dans les urls explorées actuellement non indexées, j’ai aussi des articles assez qualitatifs qui ressortent malgré tout sur Google. Peut-on se fier à 100 % à ce rapport ?

Répondre
Olivier Duffez

Merci pour ton commentaire. C’est vrai que j’ai déjà trouvé des exemples de pages soit-disant non indexées qui le sont pourtant bien, mais c’est loin d’être la majorité. L’analyse RM Tech est fiable à 100% par contre, j’ai fait assez de tests pour le dire ;-)

Répondre
AlexandraP

Bonjour, après analyse de ma Search Console, j’ai environ une centaine de pages zombies, de type « explorée mais non-indexée » qui correspondent à tous les médias uploadés sur mon WordPress (documents PDF et images). Ce ne sont donc pas de réelles pages de contenu en soi. Quelle recommandation serait la votre pour rendre ces typologies de pages non indexables ? Merci par avance !

Répondre
Olivier Duffez

S’agit-il vraiment d’URL de médias ou d’URL de pages HTML ne faisant qu’afficher des médias (attachments dans WordPress) ?
en tout cas ça n’est pas bien méchant j’imagine

Répondre