Balise meta robots et SEO
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant SEO

  • Olivier Duffez sur LinkedIn
  • Olivier Duffez sur X (Twitter)
  • Chaine Youtube WebRankInfo

Balise meta robots : guide complet SEO

La balise meta robots permet d'indiquer si une page peut être indexée ou pas, ainsi que plusieurs autres cas de figure. Ce tutoriel explique tout ce que vous avez à savoir à ce sujet pour optimiser votre référencement naturel, notamment sur Google.

Résumez ou partagez cette page :

Sommaire :

Avant de poursuivre, sachez que je propose d'autres dossiers similaires :

Meta robots : définition et code HTML

Format de la balise meta robots

La balise meta robots permet de fournir des directives aux robots des moteurs de recherche, par exemple pour interdire l'indexation de la page (robots noindex). Elle est située dans l'entête HTML, c'est-à-dire entre les balises <head> et </head>.

La syntaxe de la balise meta robots est très simple. Voyez cet exemple de meta robots (version XHTML ou HTML5) :

<meta name="robots" content="noindex" />

Parfois vous pouvez avoir besoin d'indiquer plusieurs valeurs (dans "content") : il faut les séparer par une virgule comme dans cet autre exemple :

<meta name="robots" content="noindex,notranslate" />

Quel rapport avec le fichier robots.txt ?

Avant de lister toutes les possibilités du meta tag robots, je vous rappelle que :

  • la balise meta robots sert à fournir des directives aux robots quand ils consultent une page spécifique
  • le fichier robots.txt sert à indiquer aux robots s'ils ont le droit d'accéder à une page ou un groupe de pages du site
Si ce n'est pas clair, je vous conseille de lire mes explications sur le fichier robots.txt

En résumé :

  • pour interdire en amont le crawl (et donc l'indexation) d'une page, bloquez-la dans le fichier robots.txt
  • pour interdire l'indexation d'une page (autorisée au crawl), mettez une balise meta robots noindex dedans
  • attention : si une page est déjà indexée et que vous souhaitez la supprimer de Google, ne la bloquez pas au crawl (dans le robots.txt), car même si vous mettez aussi une meta noindex, Google ne consultera pas la page (à cause du robots.txt) et ne la désindexera pas...

Besoin d'explications plus poussées ? C'est possible, gratuitement :

Ne confondez plus disallow, noindex et nofollow : explications dans ce dossier très clair

Si vous souhaitez désindexer des pages, j'ai un dossier complet sur le sujet...

Meta robots ou URL canonique ?

Si vous indiquez à la fois une URL canonique (différente de l'URL courante) ET une balise meta robots (noindex par exemple), il peut y avoir des contradictions.

En théorie, il n'existe pas d'ordre de priorité de traitement des balises <meta> et <link> donc c'est la logique de l'ensemble qui compte.

En pratique, j'ai l'impression que le noindex l'emporte.

Si besoin, relisez l'article sur la canonique !

Liste des valeurs possibles de la balise meta name=robots

Balise meta robots noindex

Format :

<meta name="robots" content="noindex" />

balise meta robots noindex référencement :

noindex indique au robot qu'il ne faut pas indexer la page. Cela ne signifie pas que le robot ne va pas la crawler : pour cela il faut utiliser le fichier robots.txt.

Ceci ne peut être pris en compte que si Google est autorisé à crawler la page. Une fois qu'il l'aura crawlée, la page sera rapidement désindexée (supprimée de l'index).

Evidemment, si vous mettez par erreur une balise meta robots noindex sur une page stratégique de votre site, la conséquence pour votre référencement sera dramatique. Mieux vaut le repérer très rapidement afin de corriger l'erreur (en retirant cette meta noindex).

Attention : même si cette balise doit se trouver théoriquement dans l'entête HTML (dans la section <head>), si jamais votre page en contient ailleurs (dans la section <body>), alors Google en tiendra également compte. Et si jamais les informations entre des directives multiples sont incohérentes, Google tient compte de la plus restrictive. + d'infos dans le dossier "attention à vos balises meta noindex".

Astuce : en faisant un audit technique RM Tech, vous pouvez savoir si votre site contient des pages non indexables. Le rapport d'audit vous indiquera plein d'autres conseils pour votre référencement.

Testez l'audit SEO en ligne sur votre site ! Ici sur MyRankingMetrics

Balise meta robots nofollow

Format :

<meta name="robots" content="nofollow" />

nofollow indique au robot qu'il ne faut pas suivre les liens dans la page. Cela signifie que Google n'ira pas crawler les pages liées par la page contenant cette balise meta robots. Même si Google ne le précise pas, les moteurs ne tiendront pas non plus compte des liens présents sur la page dans leur algorithme (par exemple celui du PageRank).

⚠️ Il n'y a sans doute aucun cas réel pratique pour lequel il est intéressant d'ajouter cette balise, car elle interdit le suivi de tous les liens, qu'ils soient internes ou externes. Si vous souhaitez interdire la prise en compte d'un lien en particulier dans une page, ajoutez un attribut nofollow à ce lien.

Balise meta robots index

Format :

<meta name="robots" content="index" />

index indique au robot qu'il peut indexer la page. Cette valeur étant celle par défaut, il est totalement inutile de l'indiquer !

Balise meta robots follow

Format :

<meta name="robots" content="follow" />

follow indique au robot qu'il peut suivre les liens dans la page. Cette valeur étant celle par défaut, il est totalement inutile de l'indiquer !

Balise meta robots all

Format :

<meta name="robots" content="all" />

all : cette valeur est l'équivalent de index,follow. Cette valeur étant celle par défaut, il est totalement inutile de l'indiquer.

Balise meta robots none

Format :

<meta name="robots" content="none" />

none : cette valeur est l'équivalent de noindex,nofollow.

⚠️ Si vous souhaitez simplement interdire l'indexation de la page mais pas interdire la prise en compte des liens qu'elle fait, évitez d'utiliser la balise none, mieux vaut utiliser dans ce cas la balise noindex.

Balise meta robots nosnippet

Format :

<meta name="robots" content="nosnippet" />

nosnippet indique au robot qu'il ne faut pas afficher de descriptif (snippet) dans la page de résultats (SERP).

J'ai du mal à voir l'intérêt pour un webmaster d'utiliser cette possibilité puisque ce descriptif permet d'inciter l'internaute à cliquer sur le résultat. Peut-être qu'il existe des cas où le descriptif créé par le moteur n'est pas assez pertinent aux yeux du webmaster, mais c'est encore pire de ne pas en faire apparaître.

💡 Au sujet du snippet, pour vous donner des chances d'avoir un bon descriptif, pensez à rédiger une bonne meta description.

Balise meta robots max-snippet

Format :

<meta name="robots" content="max-snippet:[nombre]" />

max-snippet indique au robot le nombre maximum de caractères à afficher dans le descriptif (snippet) dans la page de résultats. Ceci concerne tous les formats de résultats (résultats classiques, Google Images, Discover, Assistant) mais pas les résultats vidéo ou image.

Par exemple, pour limiter l'extrait à 140 caractères, indiquez :

<meta name="robots" content="max-snippet:140" />

Cette possibilité a été ajoutée par Google pour gérer le droit d'auteur (ou plutôt pour qu'il ne s'applique pas...). Les éditeurs de presse sont les premiers concernés mais cette balise peut être utilisée sur tous les sites.

Remarques :

  • si vous indiquez max-snippet:0, aucun extrait ne pourra être généré par Google. C'est l'équivalent de la meta robots nosnippet.
  • si vous indiquez max-snippet:-1, aucune limite ne sera appliquée. Je suppose que cela signifie la même chose que si cette balise était absente. En clair, ça ne sert à rien.
  • ceci n'a pas d'impact sur la prise en compte des contenus de votre page en termes d'indexation. C'est juste pour l'affichage dans les SERP.
  • cette instruction max-snippet est ignorée si l'éditeur du site a explicitement autorisé l’utilisation du contenu dans les extraits, par exemple avec la présence de données structurées ou dans le cas d'un accord avec Google pour réutilisation de son contenu.
  • la meta max-snippet est ignorée si la valeur [nombre] est illisible ou dans un format non compris.

⚠️ La meta max-snippet n'est gérée que par Google

Balise meta robots max-image-preview

Format :

<meta name="robots" content="max-image-preview:[valeur]" />

max-image-preview indique au robot la taille maximale de l'aperçu de l'image (vignette) à afficher dans la page de résultats.

Voici les valeurs possibles :

  • none : aucun aperçu image ne sera montré pour cette page
  • standard : affichage d’un aperçu image par défaut
  • large : une image de plus grande taille peut être montrée (jusqu’à atteindre la largeur entière du viewport)

Par exemple, pour autoriser l'affichage d'une image de grande taille :

<meta name="robots" content="max-image-preview:large" />

Remarques :

  • pour apparaître dans Google Discover, il est conseillé d'utiliser la valeur "large"
  • ceci n'a pas d'impact sur la prise en compte des contenus de votre page en termes d'indexation. C'est juste pour l'affichage dans les SERP.
  • cette instruction max-image-preview est ignorée si l'éditeur du site a explicitement autorisé l’utilisation du contenu dans les extraits, par exemple avec la présence de données structurées ou dans le cas d'un accord avec Google pour réutilisation de son contenu.
  • la meta max-image-preview est ignorée si la valeur indiquée ne correspond à aucune des valeurs attendues.

⚠️ La meta max-image-preview n'est pour gérée que par Google

Balise meta robots max-video-preview

Format :

<meta name="robots" content="max-video-preview:[nombre]" />

max-video-preview indique au robot le nombre maximum de secondes de l'extrait vidéo à afficher dans la page de résultats, pour un résultat de type vidéo.

Par exemple, pour limiter la preview vidéo à 3 secondes, indiquez :

<meta name="robots" content="max-video-preview:3" />

Remarques :

  • si vous indiquez max-video-preview:0, aucun aperçu vidéo ne pourra être généré par Google. Seule une vignette sera affichée.
  • si vous indiquez max-video-preview:-1, aucune limite ne sera appliquée. Je suppose que cela signifie la même chose que si cette balise était absente. En clair, ça ne sert à rien.
  • ceci n'a pas d'impact sur la prise en compte des contenus de votre page en termes d'indexation. C'est juste pour l'affichage dans les SERP.
  • la meta max-video-preview est ignorée si la valeur [nombre] est illisible ou dans un format non compris.

⚠️ La meta max-video-preview n'est gérée que par Google

Balise meta robots noarchive

Format :

<meta name="robots" content="noarchive" />

noarchive indique au robot qu'il ne faut pas laisser l'accès à la version en cache.

Voici un exemple simplifié dans une page HTML (idem pour HTML5) :

<html><head><meta name="robots" content="noarchive">

Le lien "En cache" dans la page de résultats ne sera donc pas affiché. Ceci peut servir à ceux qui passent leurs contenu d'une version publique accessible à une version archivée payante (sites de journaux par exemple).

L'inconvénient est que le webmaster ne peut plus savoir à quelle date (et heure) Google a indexé la page la dernière fois (il peut toujours voir la date de dernier crawl dans ses fichiers logs).

Balise meta robots nocache

Format :

<meta name="robots" content="nocache" />

nocache : identique à noarchive, ceci est pris en compte par Bing mais pas par Google

Balise meta robots notranslate

Format :

<meta name="robots" content="notranslate" />

notranslate indique à Google que l'on ne souhaite pas qu'un lien Traduire soit affiché à côté du résultat de recherche. Google affiche parfois ce lien donnant accès à une traduction automatique de la page.

Balise meta robots noimageindex

Format :

<meta name="robots" content="noimageindex" />

noimageindex indique à Google qu'aucune image située sur cette page ne doit être indexée dans Google Images.

Balise meta robots noodp

Attention, cette valeur est obsolète car l'annuaire DMOZ a fermé !

Format :

<meta name="robots" content="noodp" />

noodp indiquait au robot qu'il ne fallait pas utiliser les données associées au site par les éditeurs de l'annuaire DMOZ (Open Directory Project, ODP). Ceci était utile si la description ou le titre du site dans DMOZ ne correspondaient pas assez bien à la réalité. Etant donné que DMOZ ne référençait en général que les pages d'accueil, cette balise ne devait être mise que sur cette page (ce n'était donc pas la peine d'ajouter la balise méta robots noodp sur tout le site, mais ça n'avait pas d'impact négatif de le faire).

Pour en savoir plus, lisez l'article sur la balise meta noodp.

Balise meta robots noydir

Attention, cette valeur est obsolète car l'annuaire Yahoo a fermé !

Format :

<meta name="robots" content="noydir" />

Seul Yahoo gérait cette valeur noydir qui permettait comme noodp d'indiquer au moteur qu'on ne souhaitait pas que les données de l'annuaire Yahoo (Yahoo Directory) soient utilisées. Etant donné que cet annuaire a disparu, cette balise n'a plus aucune raison d'exister dans vos pages.

Pour en savoir plus, lisez l'article sur la balise meta noydir.

Balise meta robots unavailable_after

Format (exemple avec la date du 25/08/2025 à 15h EST) :

<meta name="robots" content="unavailable_after:25-Aug-2025 15:00:00 EST" />

unavailable_after:[date] indique au robot que la page ne doit pas ressortir dans les résultats après la date indiquée (au format RFC 850). Pour en savoir plus, apprenez en quoi cela diffère de l'entête HTTP Expires et lisez la discussion sur la balise meta unavailable_after

La directive X-Robots-Tag dans l'entête HTTP

Si vous n'avez pas la possibilité d'ajouter une balise meta dans votre page HTML, sachez que vous pouvez malgré tout fournir des indications aux robots via l'entête HTTP. Il suffit d'ajouter des lignes dans l'entête, d'une façon similaire à cette balise meta robots.

Le X-Robots-Tag peut servir quand votre CMS ne vous laisse pas ajouter une balise meta, ou bien également quand cela concerne des documents autres que HTML (par exemple des PDF ou des images).

Pour en savoir plus, lisez mon article qui explique comment utiliser X-Robots-Tag dans l'entête HTTP.

La balise meta googlebot

Habituellement, on utilise la balise meta robots car les directives d'adressent à tous les robots. Mais saviez-vous que vous pouvez spécifier des directives différentes selon les robots ? Il faut pour cela remplacer name="robots" par name="googlebot" ou tout autre nom de robot.

Par exemple, la ligne ci-dessous demande uniquement au robot standard de Google de ne pas indexer la page :

<meta name="googlebot" content="noindex" />

On peut même imaginer un cas où dans la même page figurent deux instructions différentes. Par exemple, pour autoriser à tous les robots sauf Google de suivre les liens, tout en demandant à tous les moteurs de ne pas indexer la page :

<meta name="robots" content="noindex" />
<meta name="googlebot" content="nofollow" />

Dans le cas de Google, voici les noms d'agents (user agent) que vous pouvez utiliser dans cette balise meta (tout comme dans le fichier robots.txt) :

CrawlerUser-agent (robots.txt, balise meta ou X-Robots-Tag)
Googlebot (web)Googlebot
Googlebot ActualitésGooglebot-News(Googlebot)
Googlebot ImagesGooglebot-Image(Googlebot)
Googlebot VidéoGooglebot-Video(Googlebot)
Googlebot MobileGooglebot-Mobile(Googlebot)
Google Mobile AdSenseMediapartners-GoogleMediapartners(Googlebot)
Google AdSenseMediapartners-GoogleMediapartners(Googlebot)
Google AdsBotAdsBot-Google
Liste des robots de Google avec leur user agent

Autres conseils

L'attribut HTML data-nosnippet

Il ne s'agit pas d'une balise meta, encore moins de la meta robots, mais c'est tout à fait en rapport avec le sujet...

Google propose un moyen d'empêcher que certains textes d'une page soient utilisés pour générer l'extrait dans les SERP (snippet). Pour cela, il suffit d'inclure l'attribut data-nosnippet sur une ou plusieurs balises span, div ou section.

Cet attribut n'a pas besoin d'avoir de valeur, car il est considéré comme un booléen. En d'autres termes, s'il est présent c'est qu'il doit être pris en compte. Inutile d'indiquer quelque chose du genre data-nosnippet="true".

Comment empêcher Google d'utiliser pour le snippet une portion de texte ? En l'encadrant dans une balise span comme ici :

<p>Ce texte peut être affiché dans un extrait (snippet) <span data-nosnippet>mais cette partie est bloquée pour le snippet</span>.</p>

Comment empêcher Google d'utiliser pour le snippet toute une partie d'une page ? En l'encadrant dans une balise div ou section comme ici :

<p>Ce texte peut être affiché dans un extrait (snippet)</p>
<div data-nosnippet>
  <h2>Nouvelle rubrique</h2>
  <p>Cette partie est bloquée pour le snippet.</p>
</div>

Remarques :

  • l'attribut data nosnippet n'est pour l'instant géré que par Google, à partir de fin 2019 (aucune date précise n'est fournie).
  • il n'est pas possible de l'utiliser avec les balises H1, H2... Hn, ou strong, etc. Les 3 seules balises reconnues sont span, div et section.
  • le traitement du data-nosnippet peut être fait aussi bien avant qu'après le rendu de la page par Googlebot. Cela signifie qu'il faut éviter d'avoir des contradictions entre le DOM initial et celui modifié par l'exécution de Javascript.
  • les contenus inclus dans une balise data-nosnippet sont toujours indexés, ils sont pris en compte par l'algo Google de classement, mais ils ne sont pas utilisés pour générer l'extrait (snippet).

E-E-A-T

Bien que la balise meta robots soit un outil technique, son utilisation stratégique a des implications sur la perception E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) de votre site.

Quelles pages mettre en noindex ?

  • pages de faible qualité
  • pages au contenu trop léger
  • pages de résultats de recherche interne
  • pages techniques (comme les pages de connexion)

Cette curation de votre contenu indexable améliore la qualité globale perçue de votre site par les moteurs de recherche.

C'est le principe de ma méthode Pages Zombies.

Un site qui ne présente à Google que ses pages les plus pertinentes et qualitatives renforce indirectement ses signaux de confiance et d'autorité, car il démontre une gestion de contenu rigoureuse et centrée sur l'utilisateur.

Tableau des valeurs de meta robots

Voici toutes les valeurs possibles pour la balise meta robots :

Balise robotsFonction principale
indexAutorise l'indexation de la page (valeur par défaut)
noindexEmpêche l'indexation de la page et son affichage dans les résultats
followAutorise le suivi des liens présents sur la page (valeur par défaut)
nofollowEmpêche le suivi des liens présents sur la page
noneÉquivaut à "noindex, nofollow"
noarchiveEmpêche l'affichage du lien "En cache" dans les résultats de recherche
nosnippetN'affiche aucun extrait de texte (snippet) ni aperçu d'image pour cette page
max-snippet:[nombre]Limite la longueur de l'extrait de texte à [nombre] de caractères (-1 pour aucune limite)
max-image-preview:[valeur]Définit la taille maximale de l'aperçu d'image : none, standard, ou large
max-video-preview:[nombre]Limite la durée de l'aperçu vidéo à [nombre] de secondes (-1 pour aucune limite)
unavailable_after:[date]Demande à ne plus afficher la page dans les résultats après une date/heure spécifique
noimageindexEmpêche l'indexation des images de la page
notranslateEmpêche Google de proposer une traduction de la page dans les résultats
Tableau récapitulatif des valeurs possible de la meta robots, par WebRankInfo

Vos questions

Comment changer la balise meta robots dans WordPress ?

Pour changer la valeur de la balise meta robots dans WordPress, il faut utiliser une extension SEO qui gère ça. Vous avez le choix, par exemple Yoast, Rank Math, All in One SEO, SEOPress, etc. Suivez ensuite la documentation, sachant qu'on peut faire des réglages globaux (par exemple mettre en no index toutes les pages auteurs) et des réglages page par page.

Où placer la balise meta robots no index ?

La balise meta robots noindex doit être placée dans l'entête HTML, c'est-à-dire où vous voulez entre <head> et </head>. Néanmoins, sachez que Google en tient compte même si elle est située ailleurs, notamment dans <body>.

Que signifie "noindex détecté dans la balise meta robots" ?

Ce message signifie que la page HTML contient une balise meta robots avec "noindex". Cette directive indique aux moteurs de recherche qu'il ne faut pas indexer la page (ou qu'il faut la désindexer si elle est actuellement indexée). Si vous souhaitez référencer cette page, il est impératif d'enlever la balise meta robots qui contient ce noindex.

À quoi servent les meta robots pour le référencement ?

La balise meta robots est utilisée en référencement naturel pour donner des instructions aux robots des moteurs de recherche (par exemple Googlebot pour Google). Par défaut, il est inutile d'en utiliser car si cette balise est absente d'une page, cela signifie qu'aucune restriction n'est demandée aux moteurs de recherche.

Combien faut-il de balises meta robots sur un site ?

Chaque page HTML peut inclure une balise meta robots. Si elle en contient, les indications de cette balise ne concernent que la page en question. Vous pouvez donc avoir autant de balises meta robots qu'il y a de pages sur votre site.

Google tient-il encore compte de la balise meta robots ?

Oui, Google tient compte de la balise meta robots avec toutes les valeurs décrites dans ce guide. J'ai tout vérifié !

Peut-on spécifier une date d'expiration pour une page avec la balise meta robots ?

Oui, on peut spécifier une date d'expiration pour une page en utilisant la balise unavailable_after. Cette directive permet d'indiquer à Google une date et une heure précises (au format RFC 850) après lesquelles la page ne doit plus être affichée dans les résultats de recherche. C'est particulièrement utile pour des pages événementielles, des offres à durée limitée ou des annonces qui deviendront obsolètes.

Comment utiliser X-Robots-Tag comme alternative à la balise meta robots ?

L'en-tête HTTP X-Robots-Tag est une alternative puissante qui s'utilise au niveau de la configuration du serveur (par exemple, dans le fichier .htaccess). Contrairement à la balise meta qui ne fonctionne que pour les pages HTML, X-Robots-Tag permet de donner des directives d'indexation pour des fichiers non-HTML comme les PDF, les images ou les vidéos. La syntaxe est similaire, par exemple : Header set X-Robots-Tag "noindex, nofollow".

Comment la balise meta robots interagit-elle avec le Javascript ?

L'interaction de la balise meta robots avec le Javascript est cruciale pour les sites modernes. Si une balise meta robots est injectée dans le DOM via JavaScript, Google ne la prendra en compte qu'après la phase de rendu de la page. Si une balise noindex est présente dans le HTML initial, la page ne sera probablement jamais rendue ni indexée, même si le JS la retire ensuite. Il est donc recommandé de placer les directives critiques comme noindex directement dans le code HTML source.

La balise meta robots peut-elle aider à gérer le contenu dupliqué ?

Oui, la balise meta robots aide à gérer le contenu dupliqué en complément de l'URL canonique. Si vous avez des pages de versions imprimables, des sessions ID ou des pages avec des filtres qui créent du contenu dupliqué, vous pouvez utiliser noindex, follow sur les versions non canoniques. Cela empêche leur indexation tout en permettant aux robots de suivre les liens et de transmettre le "jus de lien" vers les pages importantes de votre site.

Comment auditer les balises meta robots d'un site web ?

Pour auditer les balises meta robots, vous pouvez utiliser des outils de crawl SEO comme RM Tech, Screaming Frog ou Semrush. Ces outils parcourent l'ensemble de votre site et extraient le contenu de la balise meta robots pour chaque URL. Vous pouvez ensuite filtrer les résultats pour identifier rapidement les pages en noindex par erreur, les pages orphelines en nofollow ou toute autre configuration incohérente qui pourrait nuire à votre référencement.

Comment masquer du contenu des extraits de recherche Google ?

Pour masquer une partie spécifique du contenu des extraits Google, vous pouvez utiliser l'attribut HTML data-nosnippet. Il suffit d'entourer le texte, l'image ou la portion de code que vous ne souhaitez pas voir apparaître dans le snippet avec une balise <span> ou <div> dotée de cet attribut. Google ignorera alors cette partie lors de la génération de l'aperçu.

Comment limiter la longueur du snippet Google ?

Pour limiter la longueur du snippet, vous devez utiliser la balise max-snippet:[nombre]. En remplaçant [nombre] par une valeur numérique, vous indiquez à Google le nombre maximal de caractères que vous autorisez pour l'extrait. Par exemple, max-snippet:120 limitera l'extrait à 120 caractères. Utiliser max-snippet:0 équivaut à nosnippet, et max-snippet:-1 indique qu'il n'y a pas de limite.

Comment contrôler l'aperçu vidéo dans les résultats de recherche Google ?

Le contrôle de l'aperçu vidéo se fait avec la balise max-video-preview:[nombre]. Cette balise permet de spécifier la durée maximale en secondes d'un aperçu animé pour les vidéos de votre page. Par exemple, max-video-preview:15 autorise un aperçu de 15 secondes. Mettre la valeur à 0 empêchera tout aperçu vidéo et affichera une image statique, tandis que -1 signifie qu'il n'y a aucune restriction.

Peut-on cibler spécifiquement Googlebot avec la balise meta robots ?

Pour cibler spécifiquement Googlebot, il suffit de remplacer la valeur "robots" de l'attribut name par "googlebot". La balise ressemblera alors à ceci : <meta name="googlebot" content="noindex">. Cette instruction sera alors ignorée par les autres robots des moteurs de recherche, par exemple Bingbot.

A quoi sert max-image-preview dans la balise meta robots ?

La balise max-image-preview:[valeur] sert à indiquer à Google la taille de l'image d'aperçu à utiliser dans les résultats de recherche. Vous pouvez utiliser trois valeurs : none (aucun aperçu d'image), standard (un aperçu de taille standard) ou large (le plus grand aperçu possible). Cette balise est particulièrement utile pour les sites très visuels qui souhaitent maximiser leur impact dans les SERP et Google Discover.

Comment utiliser la balise meta robots pour Google News ?

Pour cibler spécifiquement Google News, vous pouvez utiliser la valeur googlebot-news dans l'attribut name. Par exemple, <meta name="googlebot-news" content="noindex"> empêchera un article d'apparaître sur Google News, mais pas dans la recherche Google classique. C'est utile pour contrôler la distribution de votre contenu d'actualité.

La balise meta robots a-t-elle un impact sur le partage sur les réseaux sociaux ?

Non, la balise meta robots n'a aucun impact direct sur le partage sur les réseaux sociaux. Les plateformes comme Facebook, X ou LinkedIn utilisent leurs propres balises (le protocole Open Graph pour Facebook, les Twitter Cards, etc.) pour générer les aperçus de liens. Une page en noindex peut tout à fait être partagée sur les réseaux sociaux et l'aperçu s'affichera correctement si les balises adéquates sont présentes.

La balise meta robots a-t-elle un impact sur l'accessibilité d'un site web ?

Non, la balise meta robots n'a pas d'impact sur l'accessibilité web. L'accessibilité concerne la capacité des personnes en situation de handicap à utiliser un site web, ce qui est géré par des pratiques de code sémantique (balises alt, ARIA, etc.). La meta robots ne s'adresse qu'aux robots des moteurs de recherche et est totalement invisible et sans effet pour les utilisateurs ou les technologies d'assistance.

La balise meta robots peut-elle être utilisée pour améliorer la sécurité d'un site web ?

Non, la balise meta robots ne doit pas être utilisée comme une mesure de sécurité. Mettre une page en noindex ne la protège pas. L'URL peut toujours être trouvée via des liens externes, et la page reste accessible à quiconque connaît son adresse. Pour sécuriser du contenu sensible, il faut utiliser une authentification (identifiant/mot de passe) ou restreindre l'accès au niveau du serveur.

Comment utiliser la balise meta robots pour gérer les différentes versions linguistiques d'un site web ?

La balise meta robots ne sert pas à gérer les versions linguistiques. Pour cela, on utilise les attributs hreflang qui indiquent à Google les différentes versions d'une page pour chaque langue ou région. La meta robots peut intervenir de manière complémentaire, par exemple pour empêcher l'indexation de pages de sélection de langue qui n'ont que peu de contenu et aucune valeur SEO.

Résumez ou partagez cette page :

Cet article vous a-t-il plu ?

Note : 4.5 (8 votes)
Cliquez pour voter !

Si vous avez des questions, posez-les dans le forum WebRankInfo.

Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.

13 commentaires

Benoit

Bonjour Olivier, je pensais utiliser la balise data-nosnippet, mais de ce que je comprends, google indexe bien le contenu mais l'utilise pas pour générer des snippets. Quelle balise pour dire à google de ne pas prendre en compte le contenu présent dans une div. J'ai des allégations de santé qui reviennent à chaque article et je risque d'avoir bcp de duplicate. Merci par avance.

Olivier Duffez

Il n'existe pas de balise ou moyen HTML pour demander à Google de ne pas indexer une partie de la page

Maud

Merci beaucoup pour cet article !
Claire et concis, il est parfait pour lé débutants du web.

Eddy

Qu'en est il du Allow et disallow ?
Remplace index et no index ou follow et nofollow ?

Merci

Olivier Duffez

@Eddy : il y a parfois de la confusion entre tout ça, c'est une bonne question (peut-être posée trop vite ?) qui mériterait un article, ça me donne une idée !
allow et disallow sont des directives à mettre dans le fichier robots.txt pour paramétrer le crawl et non pas l'indexation
index et noindex sont des directives à mettre dans la balise meta robots (ou via l'entête HTTP) pour paramétrer l'indexation et non pas le crawl
follow et nofollow sont les noms qu'on donne aux liens respectivement pris en compte et non pris en compte par les robots

lagzor

Merci Olivier pour votre réponse !
Il est vrai que ma question n'est pas posée correctement ^^
En lisant l'article j'avais comme l'impression qu'il était dit que Google va prendre en compte le contenu de la page (contenant la META) mais sans l'indexer.
En résumé, si nous avons deux pages A et B avec le même contenu mais que la page B a un "noindex", cela ne posera pas de problème de duplicate content même si la page est crawlée !

Olivier Duffez

si Google crawle une page et voit qu'elle contient une meta noindex, elle ne sera pas indexée (ou sera désindexée si elle l'était au préalable). Elle ne pourra donc pas générer de pb de duplicate content.
cela dit, si les pages A et B ont le même contenu, il vaut mieux définir une URL canonique

lagzor

Bonjour,

Je ne suis pas tout à fait d'accord avec cette partie la de votre article:
"

noindex indique au robot qu'il ne faut pas indexer la page. Cela ne signifie pas que le robot ne va pas la crawler : pour cela il faut utiliser le fichier robots.txt."

Pourquoi doit-on utiliser le fichier robots.txt alors que l'on peut effectuer ceci en utilisant simplement la balise META?
Est-ce que c'est plus effectif en passant par le TXT ?

Merci

Olivier Duffez

@lagzor : le fichier robots.txt ne sert pas à dire si on autorise ou bloque l'indexation, il est prévu pour gérer uniquement le crawl.
La balise meta robots ne le permet pas de bloquer le crawl : logique, vu que Googlebot (ou les autres) doit d'abord télécharger la page pour découvrir cette balise.
Je ne suis pas certain d'avoir compris votre question en fait ;-)

aikido colmar

Bonsoir

j'ai un soucis, j'ai du mal à référencr le blog construit sur wordpress.com http//aikido.colmar.net, visiblement je n'ai pas accès à balise (vu mon niveau en info) y a t'il une astuces quelconque

Merci d'avance pour la réponse

Olivier Duffez

@aikido : Merci de poster dans le forum, ce sera bien plus pratique pour obtenir de l'aide

Nost

Un article bien tourné pour rassembler les infos sur les robots, merci Olivier!

Par contre, petite coquille vu par un malheureux qui bosse ce 26 décembre :

Par exemple, pour autoriser à tous les robots sauf Google de suivre les liens, tout en demandant à tous les moteurs de ne pas donner l'accès à la version en cache :

Ne serait-ce pas content="nocache" au lieu de "nosnippet" ?

Olivier Duffez

Merci Nost, j'avais modifié mon exemple mais pas les explications. J'ai toutefois changé d'exemple pour que ce soit plus simple.

Les commentaires sont fermés