IA générative et SEO
Portrait Olivier Duffez

Olivier Duffez

Créateur de WebRankInfo,
consultant en référencement

Utiliser l'IA générative pour un bon SEO sans risques

Avec l'IA générative, c'est devenu simple de produire des contenus. Comment se démarquer pour dépasser les concurrents sans prendre de risque SEO ?

Ce dossier est en fait une succession de questions qui me sont souvent posées dans le forum, sur les réseaux sociaux ou dans des conférences. Si vous souhaitez m'en poser une, faites-le dans le forum. Je propose aussi du consulting SEO qui inclut l'IA générative.

C'est quoi l'IA générative ?

Définition

L'IA générative, également connue sous le terme GenAI, est une branche de l'intelligence artificielle qui se focalise sur la création de contenus variés. Cela peut aller de la génération de textes à la création d'images, de musique ou encore de vidéos.

Cette capacité de génération s'appuie sur des données existantes : l'IA générative est entraînée à partir de ces données pour produire du contenu similaire mais original. Elle utilise des techniques d'apprentissage automatique pour imiter les créations humaines.

Parmi les exemples notables d'IA générative, on peut citer ChatGPT, Gemini de Google et DALL-E. Ces outils d'IA sont capables de générer des contenus en réponse à une demande précise, appelée prompt.

Comment fonctionnent les IA génératives ?

Les IA génératives fonctionnent grâce à des algorithmes d'apprentissage automatique. Elles sont entraînées sur un large ensemble de données, pour ensuite générer du contenu similaire. Par exemple, une IA générative entraînée sur des images de voitures peut produire de nouvelles images de voitures qui n'existent pas réellement.

Un aspect clé de leur fonctionnement est leur capacité à comprendre et à imiter les motifs et les structures complexes présents dans les données d'entraînement. Par exemple, si une IA est entraînée sur des textes, elle apprendra la structure de la langue, le style d'écriture, etc.

Le processus de génération de contenu est souvent probabiliste. Cela signifie que l'IA génère plusieurs possibilités et choisit la plus probable. C'est pourquoi les résultats peuvent varier à chaque exécution, même avec le même entrainement et les mêmes paramètres.

IA générative et SEO

À quoi sert l'IA générative en SEO ?

L'IA générative joue un rôle essentiel dans le SEO en permettant une génération de contenu rapide et efficace. Comme je l'explique juste après, ça présente à la fois des avantages et des inconvénients.

Dans le secteur du référencement naturel, on parle souvent de "contenu IA" pour désigner un contenu qui a été généré par une intelligence artificielle.

En réalité, il faut distinguer :

  • un contenu 100% IA : il est produit par un outil sans qu'un humain l'améliore ensuite. Je vous déconseille fortement ce process (et je vous l'explique plus loin).
  • un contenu créé par un duo IA-humain, qu'on pourrait qualifier d'hybride. C'est ce que je vous recommande de faire.

Quels sont les avantages et les inconvénients de l'IA générative en SEO ?

Il y a de nombreux avantages, dont voici les principaux :

  • gagner du temps
  • éviter d'être bloqué avec une page blanche
  • découvrir des choses importantes qu'on n'aurait pas eu l'idée d'aborder

Attention, il y a aussi des inconvénients, par exemple :

  • sans effort particulier, vous allez vous retrouver avec le même genre de texte que plein d'autres concurrents. Ce niveau de contenu est insuffisant, même si à première vue vous pouvez estimer qu'il est de qualité
  • risque d'avoir un contenu trop long, qui se répète (ou qui génère du duplicate content avec d'autres pages), pour atteindre des gros scores en mettant trop de mots-clés
  • il restera encore je pense un risque d'inclure des informations fausses (d'autant plus dur à repérer que tout le reste de l'article est très bien)

Comment réussir en SEO grâce à et malgré l'IA générative ?

Suivez mes 3 conseils suivants...

Surveillez vos contenus en déclin grâce à l'indice Page Zombie

Avec l'IA générative, vous allez créer bien plus de contenus qu'avant. C'est peut-être déjà le cas pour vous.

Vous allez être tenté d'en publier sans vérifier autant qu'avant que la qualité est au rendez-vous, tout simplement car le contenu ne vous a pratiquement rien coûté.

Rendez-vous dans 6 mois (en fait, c'est déjà sans doute le cas) et vous allez vous retrouver sur votre site avec bien trop de contenus tout juste corrects, voire médiocres, surtout s'ils deviennent dépassés.

Vous allez être confronté à un problème dont je pressens qu'on va de plus en plus parler : les contenus en déclin (Content Decay). Les performances SEO de ces contenus déclinent au fil des mois et se rapprochent de zéro pour certains.

⚠️ Plus vous laissez ces contenus sur votre site, plus vous augmentez le risque avec les updates de Google, principalement HCU (Helpful Content Update). Si vous ne voyez pas pourquoi je dis ça, lisez mes conseils pour remonter après une chute avec HCU.

C'est pour ça qu'avec mon associé Fabien Facériès chez My Ranking Metrics, nous avons inventé le terme "pages zombies". L'indice page zombie calculé par notre outil RM Tech est un indicateur très utile. Avec Fabien on l'a vu en étudiant des sites qui ont plongé avec HCU, il y a certains patterns qui sautent aux yeux. Si cela vous concerne, demandez de l'aide ici.

Alors que faire ? Repérez ces contenus en déclin et priorisez pour trouver :

  • ceux qu'il faut mettre à jour et améliorer en premier : c'est très très efficace, à condition de bien identifier ceux avec le maximum de potentiel. Vous pouvez utiliser vos propres formules avec les données issues d'un audit, ou profiter que c'est inclus de base dans RM Tech (indice zombie)
  • ceux qui sont irrécupérables : à supprimer après double vérification

Un bon processus de création hybride de contenu IA + humain

La partie purement rédaction devient un élément mineur. Cela ne signifie absolument pas qu'on n'a plus besoin des rédacteurs, mais que leur rôle évolue. Les phases amont et aval deviennent déterminantes.

En amont :

  • faites intervenir un expert du sujet
  • incluez vos propres données
  • cherchez des sources fiables et citez-les
  • ajoutez des exemples qui témoignent de votre expérience

En aval de la rédaction (mais toujours avant la publication) :

  • faites vérifier le contenu final par un expert du sujet. Mentionnez son nom
  • travaillez le maillage interne dans les 2 sens ! C'est ultra important, que l'article soit tout neuf ou retravaillé. L'IA peut vous aider là aussi, par exemple dans mon outil RM Console et son module IA de maillage interne.

Soignez aussi la forme et le type de contenu !

Notamment :

  • simplifiez l'accès à l'information
  • utilisez les médias (texte, images, vidéos, podcasts) vraiment utiles et adaptés à chaque contenu, selon l'intention de recherche associée
  • rajoutez plusieurs éléments de votre touche "personnelle" (ou branding) qui vous distinguent et qu'une IA ne saura pas faire

Conseils pour générer efficacement du contenu à l'aide de l'IA

Voici quelques unes de mes recommandations :

  • prenez du temps pour définir le contexte, le faire valider par des allers retours de prompts
  • découpez en bouts, car c'est compliqué de générer un long article d'un seul coup de façon optimale
  • rajoutez une couche humaine

Cette liste n'est vraiment pas exhaustive, je la complèterai plus tard...

Consignes de Google sur les contenus IA

Google pénalise-t-il les contenus générés par l'intelligence artificielle ?

Non, Google ne pénalise pas les contenus générés par l'IA en soi. En fait, Google reconnaît que l'IA peut être utilisée pour créer du contenu de haute qualité. Pour vous affirmer cela, je m'appuie sur les déclarations les plus récentes de Google, notamment celles de Danny Sullivan et Chris Nelson publiées sur le blog officiel de Google.

Afin de fournir à ses utilisateurs les meilleurs résultats de recherche possibles, Google peut pénaliser les contenus générés par l'IA qui ne répondent pas à ses normes de qualité.

Pour ça, son algorithme d'appuie sur une variété de facteurs pour évaluer la qualité d'un contenu, notamment sa pertinence, son utilité, son originalité ou sa cohérence.

Bien entendu, si le contenu généré s'apparente à du spam, il sera clairement pénalisé. Consultez la liste des exemples que Google considère comme du spam.

Comment Google repère un mauvais contenu IA ?

Voici les caractéristiques les plus courantes que je rencontre dans les contenus généré par IA et considérés mauvais par Google (non indexés ou très mal positionnés) :

  • trop de similitude avec des contenus déjà indexés par Google. Je ne parle pas de duplicate content ou de plagiat. Il s'agit plutôt d'un problème lié au manque de gain d'information (Google a déposé un brevet sur ce sujet)
  • contenus pas assez aboutis sur les aspects EEAT, principalement le E de expérience. Par exemple, Google repère mieux qu'avant un article d'un blogueur qui recommande des restaurants sans jamais y être allé.
  • trop de ressemblance avec les caractéristiques des contenus purement IA non retouchés par des humains
  • trop de lacunes en UX (expérience utilisateur). Je ne me limite surtout pas à la notion de vitesse, je considère tout ce qui réduit les chances pour l'utilisateur venant des SERP de trouver facilement ce qu'il cherchait.

Comment la recherche Google va-t-elle évoluer avec l'adoption massive de l'IA ?

Voici quelques points importants à anticiper selon mon point de vue...

D'ici quelques années, je pense qu'il va y avoir une adoption massive de la recherche conversationnelle. Les utilisateurs vont discuter avec Google (et d'autres), y compris par oral (enfin l'arrivée de la recherche vocale...). Comme avec Discover, cela va sans doute compliquer le suivi SEO (quels mots-clés ?). Vous avez l'impression que dans ces conditions ça ne sert plus à rien de faire indexer des pages ? C'est une erreur je pense. Les contenus indexés peuvent sortir sous des formes nouvelles. Je pense aussi que ça génère encore plus d'opportunités avec la longue traine.

J'anticipe aussi l'arrivée d'une multitude de nouveaux acteurs qui essaient de prendre des parts aux gros moteurs, en sortant des search chat bots. Ça sera compliqué pour la plupart d'entre eux de se faire une place. Et Google (et Bing) ne se laissera pas faire et habituera ses utilisateurs à utiliser son propre outil.

Enfin, cette surenchère de création de contenus qui ne marchent qu'un temps va amplifier les difficultés à faire indexer ses contenus. Si vous ne voyez pas pourquoi je dis ça, lisez mes explications sur le crawl prédictif ainsi que mes solutions pour faire indexer ses pages dans Google.

Cet article vous a-t-il plu ?

Note : 5.0 (4 votes)
Cliquez pour voter !