Annonces Google

Vous êtes ici : Dossiers référencement > Google Analytics

Segments avancés Google Analytics pour la Longue Traîne

Par , le 24 juin 2010

Dans le cadre de l'analyse des performances SEO de votre site, vous avez certainement besoin d'étudier comment se comporte la longue traine (long tail) sur votre site. C'est particulièrement vrai depuis les changements MayDay sur Google (lisez donc cet article !). Voici un tutoriel pour mettre en place tous les segments avancés Google Analytics nécessaires. Pour des besoins plus complexes, n'oubliez pas de venir vous former à Google Analytics...

Sommaire :

  1. Longue Traine et référencement
  2. Comment analyser la Longue Traîne
  3. Les segments avancés Google Analytics
  4. Conseils spécifiques à May Day
  5. Pour aller plus loin...

Edit : à cause du not provided, ces segments ne fonctionnent plus vraiment...

Qu'est-ce que la Longue Traîne dans le cadre du référencement ?

Dans votre stratégie d'optimisation du référencement naturel, vous avez certainement identifié une liste de requêtes ultra-stratégiques, qu'on appelle par abus de langage des "mots-clés" (ce serait déjà mieux de parler "d'expressions-clés"). Vous en avez peut-être quelques-uns seulement, ou des dizaines, ou même quelques centaines.

Mais si vous avez déjà une bonne connaissance du référencement, vous savez sûrement que toutes ces "top-requêtes" réunies ne génèrent qu'une (petite) partie du trafic total - et donc de votre chiffre d'affaires. En effet, les internautes ont des idées incroyablement variées, voire originales pour s'exprimer au moment de faire des recherches sur Google (ou tout autre moteur). Il en résulte une quasi-infinité de requêtes qui, bien que représentant chacune très peu de trafic, peuvent générer globalement l'essentiel du trafic d'un site.

Les requêtes du début de la longue traine (la "tête") sont celles qui génèrent individuellement beaucoup de trafic. Il s'agit d'expressions assez génériques et compétitives. Inversement, les requêtes du "fond de la longue traine" sont très spécifiques et peu compétitives. Une façon de les déterminer est de se baser sur le nombre de mots constituant chaque requête (voir ci-après).

Cette présentation n'est qu'un tout petit aperçu de ce qu'il faut savoir sur la longue traine et de son rôle clé pour vos activités sur Internet. Vous trouverez dans le forum WebRankInfo de nombreuses discussions sur le sujet. Si vous n'avez pas assez de temps et que vous souhaitez des explications pédagogiques, inscrivez-vous aux formations de Ranking Metrics. Le module A détaille en effet comment tirer profit de la longue traine pour le SEO (et aussi pour votre chiffre d'affaires !). Le module B traite des aspects spécifiques de MayDay. Cela fait 7 ans que je travaille l'optimisation de la longue traine avec mes clients...

Comment analyser la longue traine ? Quelles métriques ?

Analyser la Longue Traine selon la règle des proportions

Une première façon d'analyser le format de la longue traine pour votre site consiste à mesurer la part du trafic généré par :

  • les 10 top-requêtes (celles générant le plus de trafic) ou bien les 50, ou les 100...
  • les 1% de top-requêtes, ou bien les 10%, ou les 20%...

Exemple tiré d'un site sur lequel je travaille : vous constatez que les 500 premières requêtes, qui représentent environ 3% des requêtes, génèrent ensemble 9,5% des visites. A vous d'exploiter d'autres chiffres selon votre choix. Bien entendu, comme d'habitude pour les mesures de web analytics, il vaut mieux s'intéresser aux variations de ces mesures, plus exploitables que les données brutes. Pour faire ces analyses dans Google Analytics vous pouvez par exemple exporter les données dans un tableur pour les retravailler. Selon le nombre de lignes que vous aurez sélectionné en bas à droite du tableau, vous aurez les valeurs pour les 10 premières requêtes (par défaut) ou 25, 50, 100, 250, 500. Si vous connaissez d'autres façons simples de procéder, indiquez-les en commentaires SVP !

Analyser la Longue Traine selon le nombre de mots par requête

La seconde façon d'analyser le format de la longue traine pour votre site consiste à effectuer des calculs selon le nombre de mots par requête. Par exemple, on pourrait définir le début de la longue traine comme étant constitué des requêtes de 1 à 3 mots, et le reste par les requêtes de 4 mots et plus. Evidemment, à vous de choisir la définition de la longue traine qui vous semble la meilleure. Une fois ce choix effectué, vous allez suivre les variations (dans le temps) des éléments suivants :

  • pourcentage du trafic généré par les requêtes de la tête (head)
  • pourcentage du trafic généré par les requêtes de la longue traine (tail)

Dans l'idéal, il faudrait faire ces analyses d'une part pour les requêtes liées à votre marque, et séparément pour les autres.

Créer un segment avancé Google Analytics pour la Long Tail

Pour identifier facilement ces 2 groupes de requêtes (d'ailleurs on pourrait en définir 3 si on voulait), une façon de faire est de passer par les segments avancés. Allez dans Sources de trafic > Mots clés, afin d'afficher la liste des requêtes ayant généré du trafic sur votre site.

Cliquez ensuite en haut à droite à côté de "Segments avancés sur "Toutes les visites" afin d'afficher le menu des segments avancés ainsi que les liens associés. Sur la gauche de cette zone qui vient de s'afficher, cliquez sur "Créer un segment avancé".

Vous arrivez alors sur la page de création d'un nouveau segment. Si vous ne connaissez pas vous allez pouvoir admirer l'ergonomie de l'interface... Nous voulons baser notre segment sur les mots-clés ayant généré du trafic via le référencement naturel. Pour cela :

  • dans la marge de gauche, dans la section "Dimensions", cliquez sur "Sources de trafic" puis glissez-déposez le rectangle "mot-clé" au-dessus de la zone vierge intitulée "dimension ou indicateur".
  • la condition étant assez complexe ici, nous allons passer par les fameuses expressions régulières. Sélectionnez donc "correspond à l'expression rationnelle".
  • dans le champ "valeur", tapez très exactement ceci : ^(?:[^s,]+s?){1,3}$
  • vous l'aurez compris, cette expression représente les requêtes constituées de 1 à 3 mots. A vous de remplacer le 4 par le chiffre de votre choix.

Il nous reste à préciser que la visite doit provenir du référencement naturel :

  • cliquez d'abord sur "Ajouter une instruction 'et'"
  • dans la marge de gauche, dans la section "Dimensions", cliquez sur "Sources de trafic" puis glissez-déposez le rectangle "support" au-dessus de la zone vierge intitulée "dimension ou indicateur".
  • la condition étant très simple ici, nous choisissons simplement "Correspond exactement à".
  • dans le champ "valeur", tapez "organic" (sans les guillemets).

En bas de page, donnez un nom à se segment, par exemple "SEO : tête longue traine" ou "SEO long tail : 1 à 3 mots" puis cliquez sur "Tester le segment" pour vérifier que vous n'avez pas fait d'erreur. Google Analytics affiche alors le nombre de visites pour la période sélectionnée ou bien "O visites" (sic) en rouge en cas d'erreur.

Avant de valider, cochez les cases des autres profils de votre compte GA pour lesquels vous souhaitez que ce segment soit disponible. Terminez en cliquant sur "Créer un segment" (ou sur "Créer et appliquer au rapport" pour retourner directement au rapport "mots-clés" précédent).

Refaites la même chose pour créer le segment avancé que vous pourriez intituler "SEO : queue longue traine" ou "SEO long tail : 4 mots et plus". Pensez à modifier l'expression régulière pour mettre ^(?:[^s,]+s){3,}(?:[^s,]+s?)$

Vous constaterez que ces formules tiennent compte comme il faut des accents, contrairement à d'autres expressions rationnelles que l'on trouve dans d'autres articles, pour lesquelles chaque accent est considéré comme un séparateur, ce qui fait qu'un mot avec 1 accent est considéré comme une expression de 2 mots, etc.

Comme je suis sympa, je vous ai préparé les expressions régulières pour cibler précisément les requêtes selon le nombre exact de mots (pour être honnête elles ne viennent pas de moi mais d'un internaute dans les commentaires d'un autre article) :

  • Pour 1 mot : ^(?:[^s,]+){1}$
  • Pour 2 mots : ^(?:[^s,]+s){1}(?:[^s,]+s?)$
  • Pour 3 mots : ^(?:[^s,]+s){2}(?:[^s,]+s?)$
  • Pour 4 mots : ^(?:[^s,]+s){3}(?:[^s,]+s?)$
  • Pour 5 mots : ^(?:[^s,]+s){4}(?:[^s,]+s?)$
  • etc.

Long Tail, référencement Google et MayDay

Le changement d'algorithme Google baptisé MayDay a été créé par les ingénieurs de Google spécifiquement pour la longue traine. C'est dans cette optique que j'ai rédigé cet article : vous aider à analyser l'impact de ce changement sur votre trafic Google réf. nat. Si vous observez une baisse du trafic depuis ~Mai 2010 surtout visible sur la queue de la longue traine, alors votre site est "victime" de cette mise à jour de l'algo. Dans ce cas :

  • à l'aide de votre outil de web analytics, cernez le plus possible les types de pages et les types de requêtes concernées (celles qui ont le plus baissé)
  • demandez-vous ce qui différencie les pages touchées des autres non touchées
  • demandez-vous pourquoi vos pages se positionnent moins bien qu'avant sur les requêtes touchées
  • si vous suivez votre positionnement de façon précise pour vos principaux mots-clés, vous savez peut-être quels sites arrivent à se positionner maintenant là où avant vous étiez. Demandez-vous ce que ces sites (et même ces pages) ont de mieux que les vôtres : sans doute plus de contenu inédit à haute valeur ajoutée ?

En plus de ces conseils, je vous en donne d'autres dans mon dossier sur MayDay. J'aborde aussi MayDay dans ma formation (module sites dynamiques et contenus dupliqués).

Pour aller plus loin

Mesurer les conversions ou le chiffre d'affaires

Plutôt que de se limiter au trafic généré, il est bien plus intéressant d'étudier l'impact de la longue traine sur les objectifs de votre site. Sérieux comme vous êtes, vous avez pensé à définir des objectifs dans Google Analytics (ou tout autre outil de web analytics) qui correspondent aux objectifs réels du site : vendre en ligne, récolter des contacts commerciaux, etc. Les analyses décrites dans les paragraphes précédents concernent le trafic généré (par exemple le nombre de visites). A vous d'aller un cran plus loin en étudiant le nombre d'objectifs réalisés (conversions) ou le chiffre d'affaires. Vous pouvez aussi étudier le taux de conversion (il est souvent meilleur "au fond de la longue traine" qu'à sa tête car les requêtes sont très ciblées).

Mettre en place tout cela dans Google Analytics

Pour appliquer tout cela sur votre compte Google Analytics, suivez bien les instructions. Si vous n'avez pas l'habitude des filtres, lisez mon tuto sur le filtre par répertoire. Enfin, consultez l'aide en ligne, posez vos questions dans le forum Analytics ou formez-vous... N'hésitez pas à partager vos questions, analyses et découvertes dans les commentaires !

On discute de ce tutoriel Longue Traine dans le forum WRI.

Cet article vous a-t-il plu ?
Cliquez pour voter !

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC,...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le SEO (+300.000 membres, 1,5 million de posts). Il est aussi cofondateur de Ranking Metrics, leader des formations webmarketing en France (SEO, AdWords, Analytics, réseaux sociaux) et éditrice de la plateforme MyRankingMetrics (crawler et audit SEO en ligne).

Article (Tutoriel : analyser la Long Tail avec Google Analytics) publié par WebRankInfo dans la rubrique Google Analytics. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

18 commentaires

  • Bruno Hug a dit le

    Bravo Olivier, très bon tuto, par contre je vois que tu te heurtes au même problème que moi lors de l'utilisation des Regex, ce sont les accents. En effet, si je recherche les expressions composées de 4 mots, soit ^(\W*\w+\b\W*){4}$, cela me ressort quand même quelques expressions à 3 ou 5 mots clés, avec accent.

  • Olivier Duffez a dit le

    Oui c'est vrai. Pour l'instant c'est la meilleure regex que j'ai pu trouver.
    J'attends le pro des regexp pour faire mieux !

  • Yves a dit le

    ca m'intéresse, j'attends la réponse

  • Georgio a dit le

    Bonjour,

    Je ne vois pas l'intérêt d'analyser le format de la longue traîne ? Ce qu'il faudrait c'est un segment avancé qui sépare les mots clés considérés comme longue traîne des autres.

  • Olivier Duffez a dit le

    Les segments avancés que j'ai détaillés permettent justement d'analyser le trafic généré par les mots-clés longue traine ou à l'inverse par les mots-clés génériques de la tête de la longue traine.

    Apparemment malgré toutes mes explications mon article n'était pas assez clair !

  • Bruno Hug a dit le

    Georgio,

    Admettons que tu fasse deux segments avancés:
    1- ^(\W*\w+\b\W*){1,4}$ qui va regrouper les expressions composées de 1 à 4 mots clefs
    2- ^(\W*\w+\b\W*){5,}$ qui va regrouper les expressions composées de 5 mots clefs ou plus

    Tu aura bien une séparation. Sachant qu'en modifiant les chiffres tu peux adapter à ton besoin:
    - Le chiffre de gauche {ici,4} indique le nombre minimum de mots clefs que doit contenir ton expression
    - Le chiffre de droite {1,ici} indique le nombre maximum de mots clefs que doit contenir ton expression
    - Si tu ne mets qu'un chiffre suivi d'une virgule {ici,} cela indique de chercher un nombre équivalent ou supérieur de mots

    A toi après d'adapter suivant les segmentations que tu veux faire. Les expressions régulières sont un peu compliquées au départ, on s'y fait après en testant et bidouillant.

  • Christophe a dit le

    Attention en effet aux expressions régulières qui n'ont pas un fonctionnement très standard sous google analytics, \W ne prend pas en compte les lettres accentuées et les considère comme des séparateurs de mots. Les intervalles de type {5,} , n'ont pas l'air très efficace, il vaut mieux mettre {5,10} et mettre une autre condition expression régulière ne correspond pas à ^(\W*\w+\b\W*){1,4}$
    Les . aussi sont considérés comme des séparateurs de mots, ainsi un nom de domaine donnera trois mots

  • Luc a dit le

    Merci beaucoup pour cet article fort utile!

    Dans la même idée, il peut être très intéressant d'analyser la long tail du moteur de recherche interne.

    La Long Tail identifiée dans cet article est celle des internautes qui ont réussi à arriver sur le site web via le réf nat.

    La Long Tail identifiée sur le moteur de recherche interne permet elle d'identifier les requêtes de la cible marketing du site web au sens large : pas uniquement les requêtes sur lesquelles le site web est assez bien positionné.
    Cette 2ème Long Tail permet d'apporter à mon sens plus d'objectivité sur quelles sont les expressions-clefs sur lesquelles il est judicieux de bien se positionner.

  • Julien a dit le

    Analytics regorge de possibilités mais il est difficile pour les non-pro de l'outil de connaitre toutes ces subtilités. Merci donc pour ce partage d'information, je ne connaissais pas cette astuce.

  • SEOcktail a dit le

    @Georgio Tu n'y voies pas d'intérêt car tu n'as pas compris l'article :

    Il ne faut pas confondre longue traine dans le sens SEO du terme, tel que c'est le cas ici, et longue traine dans le sens commercial du terme, tel qu'un produit de longue traine, qui est le sens dans lequel tu l'as interprété.

  • Yves a dit le

    pour les requête accentuées, les classes de caractères ne fonctionneraient-elles pas? [éèêîàùçïw], et finalement ^(W*[éèêîàùçïw]+bW*){5,}$

    Généralement on utilise le flag LOCALE pour intégrer les caractères accentués dans l'expression w, mais j'ignore si google laisse une telle possibilité

  • truffo a dit le

    Pour info, "expression rationnelle" est la bonne traduction de regular expression même si expression régulière est rentré dans les moeurs.

  • Charles a dit le

    Super tutoriel, toujours dur à retenir ces codes de RegEx ;) J'ai bookmarké pour l'avenir.

    Voilà une ressource complémentaire: http://www.lunametrics.com/regex-book/Regular-Expressions-Google-Analytics.pdf

  • Hervé a dit le

    Merci Olivier, très bon tuto.

  • spoke a dit le

    Dans le tuto, vous partez du principe que la longue traine correspond à un nombre important de mots par requête. Si on revient à la définition historique de ce concept, ça devrait plutôt correspondre aux requêtes très spécifiques ayant généré chacune peu de visites. Hors des requêtes d'un seul mot peuvent correspondre à cette définition.
    Ex: mon e-commerce comporte 10000 références, si j'ai 1 requête par référence permettant d'arriver sur le site, ces requêtes font partie de la longue traine mais ne sont pas prises en compte dans votre système.
    Non ?

  • Olivier Duffez a dit le

    C'est exactement ce que j'ai expliqué dans mon article... Mais le filtrage par nombre de mots-clés est plus facile à faire.

  • Lou a dit le

    Bonjour,

    Article très intéressant, comme tous ceux de WRI.
    Toutefois, le filtre pour les fainéants ne fonctionne plus, je crois. :p

  • Olivier Duffez a dit le

    En effet, il faudrait le revoir, mais avec le not provided de Google ça n'est plus vraiment exploitable

Postez un commentaire !

Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.

En postant un commentaire, vous acceptez les CGU du site WebRankInfo.

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.

Annonces Google


12 Partages