Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Segments avancés Google Analytics pour la Longue Traîne

Dans le cadre de l’analyse des performances SEO de votre site, vous avez certainement besoin d’étudier comment se comporte la longue traine (long tail) sur votre site. C’est particulièrement vrai depuis les changements MayDay sur Google (lisez donc cet article !). Voici un tutoriel pour mettre en place tous les segments avancés Google Analytics nécessaires. Pour des besoins plus complexes, n’oubliez pas de venir vous former à Google Analytics

Sommaire :

  1. Longue Traine et référencement
  2. Comment analyser la Longue Traîne
  3. Les segments avancés Google Analytics
  4. Conseils spécifiques à May Day
  5. Pour aller plus loin…

Edit : à cause du not provided, ces segments ne fonctionnent plus vraiment…

Qu’est-ce que la Longue Traîne dans le cadre du référencement ?

Dans votre stratégie d’optimisation du référencement naturel, vous avez certainement identifié une liste de requêtes ultra-stratégiques, qu’on appelle par abus de langage des « mots-clés » (ce serait déjà mieux de parler « d’expressions-clés »). Vous en avez peut-être quelques-uns seulement, ou des dizaines, ou même quelques centaines.

Mais si vous avez déjà une bonne connaissance du référencement, vous savez sûrement que toutes ces « top-requêtes » réunies ne génèrent qu’une (petite) partie du trafic total – et donc de votre chiffre d’affaires. En effet, les internautes ont des idées incroyablement variées, voire originales pour s’exprimer au moment de faire des recherches sur Google (ou tout autre moteur). Il en résulte une quasi-infinité de requêtes qui, bien que représentant chacune très peu de trafic, peuvent générer globalement l’essentiel du trafic d’un site.

Les requêtes du début de la longue traine (la « tête ») sont celles qui génèrent individuellement beaucoup de trafic. Il s’agit d’expressions assez génériques et compétitives. Inversement, les requêtes du « fond de la longue traine » sont très spécifiques et peu compétitives. Une façon de les déterminer est de se baser sur le nombre de mots constituant chaque requête (voir ci-après).

Cette présentation n’est qu’un tout petit aperçu de ce qu’il faut savoir sur la longue traine et de son rôle clé pour vos activités sur Internet. Vous trouverez dans le forum WebRankInfo de nombreuses discussions sur le sujet. Si vous n’avez pas assez de temps et que vous souhaitez des explications pédagogiques, inscrivez-vous aux formations de Ranking Metrics. Le module A détaille en effet comment tirer profit de la longue traine pour le SEO (et aussi pour votre chiffre d’affaires !). Le module B traite des aspects spécifiques de MayDay. Cela fait 7 ans que je travaille l’optimisation de la longue traine avec mes clients

Comment analyser la longue traine ? Quelles métriques ?

Analyser la Longue Traine selon la règle des proportions

Une première façon d’analyser le format de la longue traine pour votre site consiste à mesurer la part du trafic généré par :

  • les 10 top-requêtes (celles générant le plus de trafic) ou bien les 50, ou les 100…
  • les 1% de top-requêtes, ou bien les 10%, ou les 20%…

Exemple tiré d’un site sur lequel je travaille : vous constatez que les 500 premières requêtes, qui représentent environ 3% des requêtes, génèrent ensemble 9,5% des visites. A vous d’exploiter d’autres chiffres selon votre choix. Bien entendu, comme d’habitude pour les mesures de web analytics, il vaut mieux s’intéresser aux variations de ces mesures, plus exploitables que les données brutes. Pour faire ces analyses dans Google Analytics vous pouvez par exemple exporter les données dans un tableur pour les retravailler. Selon le nombre de lignes que vous aurez sélectionné en bas à droite du tableau, vous aurez les valeurs pour les 10 premières requêtes (par défaut) ou 25, 50, 100, 250, 500. Si vous connaissez d’autres façons simples de procéder, indiquez-les en commentaires SVP !

Analyser la Longue Traine selon le nombre de mots par requête

La seconde façon d’analyser le format de la longue traine pour votre site consiste à effectuer des calculs selon le nombre de mots par requête. Par exemple, on pourrait définir le début de la longue traine comme étant constitué des requêtes de 1 à 3 mots, et le reste par les requêtes de 4 mots et plus. Evidemment, à vous de choisir la définition de la longue traine qui vous semble la meilleure. Une fois ce choix effectué, vous allez suivre les variations (dans le temps) des éléments suivants :

  • pourcentage du trafic généré par les requêtes de la tête (head)
  • pourcentage du trafic généré par les requêtes de la longue traine (tail)

Dans l’idéal, il faudrait faire ces analyses d’une part pour les requêtes liées à votre marque, et séparément pour les autres.

Créer un segment avancé Google Analytics pour la Long Tail

Pour identifier facilement ces 2 groupes de requêtes (d’ailleurs on pourrait en définir 3 si on voulait), une façon de faire est de passer par les segments avancés. Allez dans Sources de trafic > Mots clés, afin d’afficher la liste des requêtes ayant généré du trafic sur votre site.

Cliquez ensuite en haut à droite à côté de « Segments avancés sur « Toutes les visites » afin d’afficher le menu des segments avancés ainsi que les liens associés. Sur la gauche de cette zone qui vient de s’afficher, cliquez sur « Créer un segment avancé ».

Vous arrivez alors sur la page de création d’un nouveau segment. Si vous ne connaissez pas vous allez pouvoir admirer l’ergonomie de l’interface… Nous voulons baser notre segment sur les mots-clés ayant généré du trafic via le référencement naturel. Pour cela :

  • dans la marge de gauche, dans la section « Dimensions », cliquez sur « Sources de trafic » puis glissez-déposez le rectangle « mot-clé » au-dessus de la zone vierge intitulée « dimension ou indicateur ».
  • la condition étant assez complexe ici, nous allons passer par les fameuses expressions régulières. Sélectionnez donc « correspond à l’expression rationnelle ».
  • dans le champ « valeur », tapez très exactement ceci : ^(?:[^s,]+s?){1,3}$
  • vous l’aurez compris, cette expression représente les requêtes constituées de 1 à 3 mots. A vous de remplacer le 4 par le chiffre de votre choix.

Il nous reste à préciser que la visite doit provenir du référencement naturel :

  • cliquez d’abord sur « Ajouter une instruction ‘et' »
  • dans la marge de gauche, dans la section « Dimensions », cliquez sur « Sources de trafic » puis glissez-déposez le rectangle « support » au-dessus de la zone vierge intitulée « dimension ou indicateur ».
  • la condition étant très simple ici, nous choisissons simplement « Correspond exactement à ».
  • dans le champ « valeur », tapez « organic » (sans les guillemets).

En bas de page, donnez un nom à se segment, par exemple « SEO : tête longue traine » ou « SEO long tail : 1 à 3 mots » puis cliquez sur « Tester le segment » pour vérifier que vous n’avez pas fait d’erreur. Google Analytics affiche alors le nombre de visites pour la période sélectionnée ou bien « O visites » (sic) en rouge en cas d’erreur.

Avant de valider, cochez les cases des autres profils de votre compte GA pour lesquels vous souhaitez que ce segment soit disponible. Terminez en cliquant sur « Créer un segment » (ou sur « Créer et appliquer au rapport » pour retourner directement au rapport « mots-clés » précédent).

Refaites la même chose pour créer le segment avancé que vous pourriez intituler « SEO : queue longue traine » ou « SEO long tail : 4 mots et plus ». Pensez à modifier l’expression régulière pour mettre ^(?:[^s,]+s){3,}(?:[^s,]+s?)$

Vous constaterez que ces formules tiennent compte comme il faut des accents, contrairement à d’autres expressions rationnelles que l’on trouve dans d’autres articles, pour lesquelles chaque accent est considéré comme un séparateur, ce qui fait qu’un mot avec 1 accent est considéré comme une expression de 2 mots, etc.

Comme je suis sympa, je vous ai préparé les expressions régulières pour cibler précisément les requêtes selon le nombre exact de mots (pour être honnête elles ne viennent pas de moi mais d’un internaute dans les commentaires d’un autre article) :

  • Pour 1 mot : ^(?:[^s,]+){1}$
  • Pour 2 mots : ^(?:[^s,]+s){1}(?:[^s,]+s?)$
  • Pour 3 mots : ^(?:[^s,]+s){2}(?:[^s,]+s?)$
  • Pour 4 mots : ^(?:[^s,]+s){3}(?:[^s,]+s?)$
  • Pour 5 mots : ^(?:[^s,]+s){4}(?:[^s,]+s?)$
  • etc.

Long Tail, référencement Google et MayDay

Le changement d’algorithme Google baptisé MayDay a été créé par les ingénieurs de Google spécifiquement pour la longue traine. C’est dans cette optique que j’ai rédigé cet article : vous aider à analyser l’impact de ce changement sur votre trafic Google réf. nat. Si vous observez une baisse du trafic depuis ~Mai 2010 surtout visible sur la queue de la longue traine, alors votre site est « victime » de cette mise à jour de l’algo. Dans ce cas :

  • à l’aide de votre outil de web analytics, cernez le plus possible les types de pages et les types de requêtes concernées (celles qui ont le plus baissé)
  • demandez-vous ce qui différencie les pages touchées des autres non touchées
  • demandez-vous pourquoi vos pages se positionnent moins bien qu’avant sur les requêtes touchées
  • si vous suivez votre positionnement de façon précise pour vos principaux mots-clés, vous savez peut-être quels sites arrivent à se positionner maintenant là où avant vous étiez. Demandez-vous ce que ces sites (et même ces pages) ont de mieux que les vôtres : sans doute plus de contenu inédit à haute valeur ajoutée ?

En plus de ces conseils, je vous en donne d’autres dans mon dossier sur MayDay. J’aborde aussi MayDay dans ma formation (module sites dynamiques et contenus dupliqués).

Pour aller plus loin

Mesurer les conversions ou le chiffre d’affaires

Plutôt que de se limiter au trafic généré, il est bien plus intéressant d’étudier l’impact de la longue traine sur les objectifs de votre site. Sérieux comme vous êtes, vous avez pensé à définir des objectifs dans Google Analytics (ou tout autre outil de web analytics) qui correspondent aux objectifs réels du site : vendre en ligne, récolter des contacts commerciaux, etc. Les analyses décrites dans les paragraphes précédents concernent le trafic généré (par exemple le nombre de visites). A vous d’aller un cran plus loin en étudiant le nombre d’objectifs réalisés (conversions) ou le chiffre d’affaires. Vous pouvez aussi étudier le taux de conversion (il est souvent meilleur « au fond de la longue traine » qu’à sa tête car les requêtes sont très ciblées).

Mettre en place tout cela dans Google Analytics

Pour appliquer tout cela sur votre compte Google Analytics, suivez bien les instructions. Si vous n’avez pas l’habitude des filtres, lisez mon tuto sur le filtre par répertoire. Enfin, consultez l’aide en ligne, posez vos questions dans le forum Analytics ou formez-vous… N’hésitez pas à partager vos questions, analyses et découvertes dans les commentaires !

On discute de ce tutoriel Longue Traine dans le forum WRI.

Cet article vous a-t-il plu ?

Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

18 commentaires

Bruno Hug

Bravo Olivier, très bon tuto, par contre je vois que tu te heurtes au même problème que moi lors de l’utilisation des Regex, ce sont les accents. En effet, si je recherche les expressions composées de 4 mots, soit ^(\W*\w+\b\W*){4}$, cela me ressort quand même quelques expressions à 3 ou 5 mots clés, avec accent.

Répondre
Olivier Duffez

Oui c’est vrai. Pour l’instant c’est la meilleure regex que j’ai pu trouver.
J’attends le pro des regexp pour faire mieux !

Répondre
Yves

ca m’intéresse, j’attends la réponse

Répondre
Georgio

Bonjour,

Je ne vois pas l’intérêt d’analyser le format de la longue traîne ? Ce qu’il faudrait c’est un segment avancé qui sépare les mots clés considérés comme longue traîne des autres.

Répondre
Olivier Duffez

Les segments avancés que j’ai détaillés permettent justement d’analyser le trafic généré par les mots-clés longue traine ou à l’inverse par les mots-clés génériques de la tête de la longue traine.

Apparemment malgré toutes mes explications mon article n’était pas assez clair !

Répondre
Bruno Hug

Georgio,

Admettons que tu fasse deux segments avancés:
1- ^(\W*\w+\b\W*){1,4}$ qui va regrouper les expressions composées de 1 à 4 mots clefs
2- ^(\W*\w+\b\W*){5,}$ qui va regrouper les expressions composées de 5 mots clefs ou plus

Tu aura bien une séparation. Sachant qu’en modifiant les chiffres tu peux adapter à ton besoin:
– Le chiffre de gauche {ici,4} indique le nombre minimum de mots clefs que doit contenir ton expression
– Le chiffre de droite {1,ici} indique le nombre maximum de mots clefs que doit contenir ton expression
– Si tu ne mets qu’un chiffre suivi d’une virgule {ici,} cela indique de chercher un nombre équivalent ou supérieur de mots

A toi après d’adapter suivant les segmentations que tu veux faire. Les expressions régulières sont un peu compliquées au départ, on s’y fait après en testant et bidouillant.

Répondre
Christophe

Attention en effet aux expressions régulières qui n’ont pas un fonctionnement très standard sous google analytics, \W ne prend pas en compte les lettres accentuées et les considère comme des séparateurs de mots. Les intervalles de type {5,} , n’ont pas l’air très efficace, il vaut mieux mettre {5,10} et mettre une autre condition expression régulière ne correspond pas à ^(\W*\w+\b\W*){1,4}$
Les . aussi sont considérés comme des séparateurs de mots, ainsi un nom de domaine donnera trois mots

Répondre
Luc

Merci beaucoup pour cet article fort utile!

Dans la même idée, il peut être très intéressant d’analyser la long tail du moteur de recherche interne.

La Long Tail identifiée dans cet article est celle des internautes qui ont réussi à arriver sur le site web via le réf nat.

La Long Tail identifiée sur le moteur de recherche interne permet elle d’identifier les requêtes de la cible marketing du site web au sens large : pas uniquement les requêtes sur lesquelles le site web est assez bien positionné.
Cette 2ème Long Tail permet d’apporter à mon sens plus d’objectivité sur quelles sont les expressions-clefs sur lesquelles il est judicieux de bien se positionner.

Répondre
Julien

Analytics regorge de possibilités mais il est difficile pour les non-pro de l’outil de connaitre toutes ces subtilités. Merci donc pour ce partage d’information, je ne connaissais pas cette astuce.

Répondre
SEOcktail

@Georgio Tu n’y voies pas d’intérêt car tu n’as pas compris l’article :

Il ne faut pas confondre longue traine dans le sens SEO du terme, tel que c’est le cas ici, et longue traine dans le sens commercial du terme, tel qu’un produit de longue traine, qui est le sens dans lequel tu l’as interprété.

Répondre
Yves

pour les requête accentuées, les classes de caractères ne fonctionneraient-elles pas? [éèêîàùçïw], et finalement ^(W*[éèêîàùçïw]+bW*){5,}$

Généralement on utilise le flag LOCALE pour intégrer les caractères accentués dans l’expression w, mais j’ignore si google laisse une telle possibilité

Répondre
truffo

Pour info, « expression rationnelle » est la bonne traduction de regular expression même si expression régulière est rentré dans les moeurs.

Répondre
Hervé

Merci Olivier, très bon tuto.

Répondre
spoke

Dans le tuto, vous partez du principe que la longue traine correspond à un nombre important de mots par requête. Si on revient à la définition historique de ce concept, ça devrait plutôt correspondre aux requêtes très spécifiques ayant généré chacune peu de visites. Hors des requêtes d’un seul mot peuvent correspondre à cette définition.
Ex: mon e-commerce comporte 10000 références, si j’ai 1 requête par référence permettant d’arriver sur le site, ces requêtes font partie de la longue traine mais ne sont pas prises en compte dans votre système.
Non ?

Répondre
Olivier Duffez

C’est exactement ce que j’ai expliqué dans mon article… Mais le filtrage par nombre de mots-clés est plus facile à faire.

Répondre
Lou

Bonjour,

Article très intéressant, comme tous ceux de WRI.
Toutefois, le filtre pour les fainéants ne fonctionne plus, je crois. :p

Répondre
Olivier Duffez

En effet, il faudrait le revoir, mais avec le not provided de Google ça n’est plus vraiment exploitable

Répondre