Accès rapide : définition - utilité - comment faire - liste d'exemples
C'est quoi une regex ?
Définition
C'est une sorte d'outil informatique permettant de chercher si un texte (chaîne de caractères) correspond à un certain motif (l'expression régulière).
Comment écrire une regex ?
Il faut connaître certains caractères spéciaux, étudier des exemples puis s'entraîner ! Je détaille tout ça dans la suite...
Les caractères spéciaux
Voici les caractères spéciaux génériques à connaître, à inclure dans vos expressions régulières :
Caractère générique | Explications |
---|---|
. | N'importe quel caractère (un seul) |
[caractères] | N'importe quel caractère (un seul) parmi ceux indiqués entre les crochets |
[a-z0-9] | Le tiret à l'intérieur des crochets permet de définir des intervalles, par exemple ici ça correspond avec n'importe quelle lettre et n'importe quel chiffre |
[^abc] | L'accent circonflexe à l'intérieur des crochets permet d'interdire des caractères. Par exemple [^abc] correspond à tout sauf les caractères a, b et c. |
() | Les parenthèses permettent de regrouper des caractères à chercher. Par exemple (chien|chat) correspond à chien ou à chat |
* | Indique que l'élément précédent (à gauche) peut être présent zéro, une ou plusieurs fois |
+ | Indique que l'élément précédent (à gauche) doit être présent une ou plusieurs fois |
? | Indique que l'élément précédent (à gauche) peut être absent, ou présent une fois |
{3} | Indique que l'élément précédent (à gauche) doit être présent un certain nombre de fois, 3 dans cet exemple. On peut être plus précis avec la syntaxe {2,5} qui impose que l'élément soit présent entre 2 et 5 fois ou avec la syntaxe {3,} qui impose que l'élément soit présent 3 fois ou plus. |
| | Correspondance avec ce qui est avant ou après (c'est l'opérateur OU) |
\ | Ce symbole permet d'éviter que le caractère qui suit soit considéré comme un caractère spécial. Par exemple \. représente le signe . et pas autre chose |
\d | Un (seul) chiffre (entre 0 et 9) |
\D | Caractère qui ne correspond pas à un chiffre |
\s | Caractère équivalent à un espace (par exemple aussi une tabulation) |
\S | Caractère qui n'est pas équivalent à un espace |
\w | Caractère situé dans un mot, c'est-à-dire une lettre, un chiffre ou _ |
\W | Caractère qui n'est pas dans un mot (le contraire de \w ) |
(?i) | Indique que la correspondance ne doit pas être sensible à la casse. Il faut l'indiquer au début de la regex |
^ | Si c'est situé au début de la regex, la correspondance se fait seulement si la chaîne commence par ce qui est juste après ^ |
$ | Si c'est situé à la fin de la regex, la correspondance se fait seulement si la chaîne se termine par ce qui est juste avant ^ |
Attention, Google a choisi d'utiliser la syntaxe RE2, comme dans d'autres de ses outils, par exemple Google Sheets (que vous pouvez utiliser pour tester, avec la fonction RegexMatch).
A quoi sert une regex dans la Search Console ?
Parmi les rapports fournis, celui sur la performance de vos pages dans les SERP est un incontournable. Je dirais même qu'il vaut de l'or... En gros, il peut vous indiquer :
- sur quelles requêtes vos pages sont sorties dans les SERP
- quelles pages sont sorties dans les SERP
- quels types d'appareils, quels pays...
Au lieu d'afficher ça pour tous les cas de figure, vous pouvez filtrer pour que ça ne concerne que certaines requêtes et/ou certaines pages.
2 exemples pour bien comprendre :
- ajoutez un filtre sur les pages pour voir uniquement les performances de certains types de pages sur votre site (les fiches produits, les catégories, etc.). Dans ce cas, la regex s'applique aux URL.
- ajoutez un filtre sur les requêtes pour voir les performances de votre site pour les requêtes faisant référence à votre marque
Comment utiliser les regex dans la Search Console ?
Voici les étapes :
- Allez sur le rapport Performances
- Cliquez sur "+ Nouveau" pour ajouter un filtre
- Choisissez "Requête..." pour que la regex s'applique aux requêtes ou "Page..." pour les pages (URL). Vous pourrez ajouter un filtre de chaque type
- Tapez la regex dans le champ "Saisir une expression régulière"
- Validez en cliquant sur Appliquer
Détails en images...
étape 2 :

étape 3 :

étape 4 :

Précision : ce n'était pas possible au lancement des regex dans GSC mais ça l'est maintenant, on peut choisir "Ne correspond pas à l'expression régulière". C'est très pratique...
Liste de regex utiles dans la Search Console
Voici ce que j'ai trouvé, contactez-moi si vous en connaissez d'autres !
regex | sert à repérer... |
---|---|
^\w+$ | requêtes de 1 mot |
^[a-zA-Z0-9À-ÿ]*$ | requêtes de 1 mot (en gérant les accents) |
^([^\s]+\s){3,}[^\s]+$ | requêtes de + de 3 mots (remplacez 3 par ce que vous voulez) |
^(qui|quoi|où|ou|comment|que|quel|quelle|quand|pourquoi|combien)+\s | une question en français |
\b(are|can|how|what|when|where|which|who|why|will)\b | une question en anglais |
(bon marché|pas ch|sold|réduc|coupon|remise) | du "pas cher" :-) |
[a-zA-Z0-9-_.]+@[a-zA-Z0-9-]+.[a-zA-Z0-9-.]+ | une requête contenant une adresse email |
https?:\/\/[^\/]+\/.+ | une URL autre que la page d'accueil (code à adapter si votre page d'accueil est autre chose que / seulement) |
.*/$ | une URL qui se termine par / |
https?:\/\/[^\/]+\/([^\/]+\/){3} | une URL ayant exactement 3 répertoires (repérés par /) après la racine. Changez 3 par ce que vous voulez |
/page/[0-9]+ | une URL de pagination au format type /page/2 |
[?&]p=[0-9]+ | une URL de pagination au format type ?p=2 |
.(doc|xls|ppt|pdf|rtf|odp|ods|odt|txt)$ | une URL d'un document a priori autre que HTML |
utm_(source|medium|campaign|content|term) | une URL qui contient des paramètres de tracking UTM |
^(?:\+33\s|0)[1-9](?:\s\d{2}){4}$ | un numéro de téléphone (en France) |
Sources et sites utiles :
- la syntaxe Re2 utilisée par Google
- Regex101 ou RegexTester pour débuguer (ou cette feuille de calcul Google Sheets)
- des exemples chez Sistrix, Bouscas et Neper
Contactez-moi si vous en connaissez d'autres !
Merci pour ce rappel. Je ne sais pas pour les autres, mais je crois que dans mon parcours de codeur, s'il y a au moins un truc qui m'a bien pris le chou, ce sont ces ?#0*£!! d'expressions régulières !!!