Regex pour SEO
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Les meilleures regex à utiliser dans Google Search Console

Depuis avril 2021, on peut enfin utiliser des regex (expressions régulières) dans le rapport Performances de Google Search Console. Je vais vous expliquer ce que c'est, comment s'en servir, et vous offrir les exemples de regex les plus utiles que je connaisse.

Accès rapide : définition - utilité - comment faire - liste d'exemples

C'est quoi une regex ?

Définition

C'est une sorte d'outil informatique permettant de chercher si un texte (chaîne de caractères) correspond à un certain motif (l'expression régulière).

Comment écrire une regex ?

Il faut connaître certains caractères spéciaux, étudier des exemples puis s'entraîner ! Je détaille tout ça dans la suite...

Les caractères spéciaux

Voici les caractères spéciaux génériques à connaître, à inclure dans vos expressions régulières :

Caractère génériqueExplications
.N'importe quel caractère (un seul)
[caractères]N'importe quel caractère (un seul) parmi ceux indiqués entre les crochets
[a-z0-9]Le tiret à l'intérieur des crochets permet de définir des intervalles, par exemple ici ça correspond avec n'importe quelle lettre et n'importe quel chiffre
[^abc]L'accent circonflexe à l'intérieur des crochets permet d'interdire des caractères. Par exemple [^abc] correspond à tout sauf les caractères a, b et c.
()Les parenthèses permettent de regrouper des caractères à chercher. Par exemple (chien|chat) correspond à chien ou à chat
*Indique que l'élément précédent (à gauche) peut être présent zéro, une ou plusieurs fois
+Indique que l'élément précédent (à gauche) doit être présent une ou plusieurs fois
?Indique que l'élément précédent (à gauche) peut être absent, ou présent une fois
{3}Indique que l'élément précédent (à gauche) doit être présent un certain nombre de fois, 3 dans cet exemple. On peut être plus précis avec la syntaxe {2,5} qui impose que l'élément soit présent entre 2 et 5 fois ou avec la syntaxe {3,} qui impose que l'élément soit présent 3 fois ou plus.
|Correspondance avec ce qui est avant ou après (c'est l'opérateur OU)
\Ce symbole permet d'éviter que le caractère qui suit soit considéré comme un caractère spécial. Par exemple \. représente le signe . et pas autre chose
\dUn (seul) chiffre (entre 0 et 9)
\DCaractère qui ne correspond pas à un chiffre
\sCaractère équivalent à un espace (par exemple aussi une tabulation)
\SCaractère qui n'est pas équivalent à un espace
\wCaractère situé dans un mot, c'est-à-dire une lettre, un chiffre ou _
\WCaractère qui n'est pas dans un mot (le contraire de \w)
(?i)Indique que la correspondance ne doit pas être sensible à la casse. Il faut l'indiquer au début de la regex
^Si c'est situé au début de la regex, la correspondance se fait seulement si la chaîne commence par ce qui est juste après ^
$Si c'est situé à la fin de la regex, la correspondance se fait seulement si la chaîne se termine par ce qui est juste avant ^
Les caractères génériques permettant d'écrire des expressions régulières

Attention, Google a choisi d'utiliser la syntaxe RE2, comme dans d'autres de ses outils, par exemple Google Sheets (que vous pouvez utiliser pour tester, avec la fonction RegexMatch).

A quoi sert une regex dans la Search Console ?

Parmi les rapports fournis, celui sur la performance de vos pages dans les SERP est un incontournable. Je dirais même qu'il vaut de l'or... En gros, il peut vous indiquer :

  • sur quelles requêtes vos pages sont sorties dans les SERP
  • quelles pages sont sorties dans les SERP
  • quels types d'appareils, quels pays...

Au lieu d'afficher ça pour tous les cas de figure, vous pouvez filtrer pour que ça ne concerne que certaines requêtes et/ou certaines pages.

2 exemples pour bien comprendre :

  • ajoutez un filtre sur les pages pour voir uniquement les performances de certains types de pages sur votre site (les fiches produits, les catégories, etc.). Dans ce cas, la regex s'applique aux URL.
  • ajoutez un filtre sur les requêtes pour voir les performances de votre site pour les requêtes faisant référence à votre marque

Comment utiliser les regex dans la Search Console ?

Voici les étapes :

  1. Allez sur le rapport Performances
  2. Cliquez sur "+ Nouveau" pour ajouter un filtre
  3. Choisissez "Requête..." pour que la regex s'applique aux requêtes ou "Page..." pour les pages (URL). Vous pourrez ajouter un filtre de chaque type
  4. Tapez la regex dans le champ "Saisir une expression régulière"
  5. Validez en cliquant sur Appliquer

Détails en images...

étape 2 :

nouveau filtre search console
Nouveau filtre dans Search Console

étape 3 :

Filtre de type regex
Filtre de type regex (expression régulière)

étape 4 :

saisie de la regex
Champ pour saisir la regex dans search console

Précision : ce n'était pas possible au lancement des regex dans GSC mais ça l'est maintenant, on peut choisir "Ne correspond pas à l'expression régulière". C'est très pratique...

Une solution bien plus simple !

Grâce à tous les exemples que je donne plus loin, vous pouvez exploiter les expressions régulières directement dans Search Console. C'est gratuit !

Gratuit, mais long et fastidieux. Vous allez le faire 1 fois, ou quelques unes, puis vous trouverez que c'est pénible. Je le sais très bien, c'est ce qui m'est arrivé ainsi qu'à plein de SEO.

C'est pour ça que je l'ai intégré directement dans mon outil RM Console de suivi SEO. Voyez un peu :

  • pas besoin de taper les regex, il suffit de sélectionner une segmentation dans des menus
  • certaines segmentations incluses sont très compliquées à gérer à la main. Par exemple, le top 300 des plus grosses villes de France ou toutes les marques de voitures...
  • vous pouvez ajouter vos propres regex. Vous les tapez une fois et ensuite c'est très simple.
  • si vous le demandez, vous pouvez recevoir chaque semaine les requêtes qui correspondent à l'une des segmentations de votre choix et pour lesquelles le site n'était encore jamais sorti dans Google avec
  • vous pouvez combiner bien plus de filtres que dans GSC

Voici par exemple un filtre qui exploite une regex pour des intentions commerciales et transactionnelles :

Voici quelques exemples des possibilités de recherches de mots-clés dans RM Console :

  • questions (en français ou en anglais)
  • intention de recherche commerciale ou transactionnelle (en français ou en anglais)
  • top villes de france
  • avis produits (français)
  • guides d'achats (français)
  • couleurs (français)
  • fruits (français)
  • légumes (français)
  • marques de voitures (français)
  • moyens de transport (français)
  • marques de vêtements (français)
  • sport (français)
  • SAV (anglais)

Bien entendu, RM Console sait également filtrer les mots-clés longue traîne. Il suffit de bouger le curseur !

Liste de regex utiles dans la Search Console

Voici ce que j'ai trouvé, contactez-moi si vous en connaissez d'autres !

regexsert à repérer...
^\w+$requêtes de 1 mot
^[a-zA-Z0-9À-ÿ]*$requêtes de 1 mot (en gérant les accents)
^([^\s]+\s){3,}[^\s]+$requêtes de + de 3 mots (remplacez 3 par ce que vous voulez)
^(qui|quoi|où|ou|comment|que|quel|quelle|quand|pourquoi|combien)+\sune question en français
\b(are|can|how|what|when|where|which|who|why|will)\bune question en anglais
(bon marché|pas ch|sold|réduc|coupon|remise)du "pas cher" :-)
[a-zA-Z0-9-_.]+@[a-zA-Z0-9-]+.[a-zA-Z0-9-.]+une requête contenant une adresse email
https?:\/\/[^\/]+\/.+une URL autre que la page d'accueil (code à adapter si votre page d'accueil est autre chose que / seulement)
.*/$une URL qui se termine par /
https?:\/\/[^\/]+\/([^\/]+\/){3}une URL ayant exactement 3 répertoires (repérés par /) après la racine. Changez 3 par ce que vous voulez
/page/[0-9]+une URL de pagination au format type /page/2
[?&]p=[0-9]+une URL de pagination au format type ?p=2
.(doc|xls|ppt|pdf|rtf|odp|ods|odt|txt)$une URL d'un document a priori autre que HTML
utm_(source|medium|campaign|content|term)une URL qui contient des paramètres de tracking UTM
^(?:\+33\s|0)[1-9](?:\s\d{2}){4}$un numéro de téléphone (en France)
Expressions régulières utiles en SEO

Sources et sites utiles :

Contactez-moi si vous en connaissez d'autres !

Cet article vous a-t-il plu ?

Note : 4.2 (5 votes)
Cliquez pour voter !

Laisser un commentaire

Remarques :

  • Si vous souhaitez poser une question ou détailler un problème technique, il ne faut pas utiliser le formulaire ci-dessous qui est réservé aux avis. Posez votre question directement dans le forum Gmail de WebRankInfo. L'inscription est gratuite et immédiate.

  • En postant un avis, vous acceptez les CGU du site WebRankInfo. Si votre avis ne respecte pas ces règles, il pourra être refusé. Si vous indiquez votre adresse email, vous serez informé dès que votre avis aura été validé (ou refusé...) ; votre adresse ne sera pas utilisée pour vous envoyer des mailings et ne sera pas revendue ou cédée à des tiers.

Un Commentaire

ONI

Merci pour ce rappel. Je ne sais pas pour les autres, mais je crois que dans mon parcours de codeur, s'il y a au moins un truc qui m'a bien pris le chou, ce sont ces ?#0*£!! d'expressions régulières !!!

Répondre