Article mis à jour le 03/04/2015, publié initialement le 16/05/2014
Thématique et netlinking : les règles à respecter
Thématique par site ou par page ?
Même si Google détermine la thématique générale d'un site, c'est page par page que cette analyse prend du sens. Pour savoir si un lien de la page A vers la page B a du sens (et doit donc aider beaucoup à la visibilité de la page B dans les SERP), il faut que A et B aient une thématique proche.
Certes, il est excellent d'avoir un backlink issu d'un site de niche sur exactement la même thématique que la page qui reçoit le lien.
Mais c'est également très bon d'avoir un backlink depuis un site généraliste, à condition que ce soit sur une page qui traite vraiment de la même chose. Prenez l'exemple d'un article publié sur un site de presse : si le sujet abordé concerne directement la page qui reçoit le lien, c'est tout bon !
Remarque : ceci est loin d'être nouveau, ça fait très longtemps que c'est dans l'algorithme de Google
Liens entrants ET liens sortants
En général, quand vous pensez à la thématique des pages pour le netlinking, vous pensez surtout à vérifier si la thématique de la page qui vous fait un lien est identique à la vôtre.
Mais comprenez bien que cela concerne les liens dans les deux sens : si la thématique de la page A qui fait le lien est trop différente de la page B qui reçoit le lien, c'est néfaste non seulement pour la page B mais aussi pour la page A.
Vous devriez donc bien vérifier si c'est trop fréquent sur votre site que vous fassiez des liens sortants hors thématique.
Dernier point : un lien sortant peut pointer vers un autre site (lien sortant externe) ou vers une autre page du même site (lien sortant interne). Là aussi, vous l'avez peut-être oublié, mais il faut éviter de faire des liens internes vers des pages dont la thématique est trop différente. Prenons l'exemple d'un site ecommerce : sur la fiche produit d'une chemise, n'allez pas faire un lien vers une fiche produit d'une TV même si vous en vendez aussi (et que cette TV est actuellement un best seller).
Toutes les pages sont-elles concernées ?
Pas tout à fait : ne vous inquiétez pas si vous faites un lien vers une page de mentions légales, c'est normal que la "thématique" ne soit pas identique.
Il est important que la thématique soit la même quand il s'agit de liens entre 2 pages exploitées pour le référencement. A l'inverse, les pages qui n'ont pas de thématique précise comme les mentions légales, la page contact, etc. ne sont pas concernées.
La thématique, plus importante que le PageRank !
Pour ma part, ça me semble évident depuis vraiment très longtemps. J'étais bien content d'en avoir la confirmation quand un ancien ingénieur de Google l'a affirmé. Relisez mon dossier basé sur une interview de Andre Weyher, ancien de l'équipe web spam de Matt Cutts. Plutôt que de se baser sur le PageRank, il conseille de se concentrer sur la pertinence du site/page qui nous fait un lien : il faut absolument qu'il soit dans la même thématique.
Comment évaluer la thématique d'une page ?
Le plus simple est évidemment de vous faire votre propre idée, mais cela demande une analyse manuelle.
J'ai cherché s'il existe des outils pour tenter d'automatiser cette tâche, en voici quelques uns mais n'hésitez pas à m'en indiquer d'autres !
Le Topical Trust Flow de Majestic SEO
MajesticSEO propose un outil permettant d'évaluer 2 scores pour chaque URL (je dis bien URL et non pas l'ensemble d'un site, car c'est moins intéressant) :
- le Trust Flow est un indicateur de la confiance que l'on peut accorder à la page, une sorte d'évaluation de la notoriété. Il est inspiré par la formule du TrustRank.
- le Citation Flow est un indicateur de la popularité de la page. Il est inspiré par la formule initiale du PageRank.
Depuis avril 2014, le Trust Flow est détaillé par catégories. Concrètement, l'outil évalue dans quelles thématiques la page est pertinente (parmi environ 800 catégories). Vous trouverez les explications dans cet article de leur blog.
Voici l'exemple d'une page dédiée aux voyages au Mexique sur le site d'un voyagiste généraliste :
Malheureusement, Majestic SEO ne gère que quelques centaines de thématiques, donc elles sont souvent trop peu précises. Dans cet exemple, l'outil indique que la thématique est le tourisme, mais ne précise pas qu'il s'agit en fait du Mexique.
Le planificateur de mots-clés d'AdWords
Le planificateur de mots-clés AdWords permet de trouver des idées d'expressions en rapport avec un ou plusieurs mots-clés fournis en entrée. Saviez-vous que cet outil peut également analyser une page fournie en entrée et proposer des expressions en rapport avec le contenu trouvé sur cette page.
Voici l'exemple avec la même page sur les voyages au Mexique :
Si vous faites cette analyse pour les deux pages (source et cible du lien), vous pouvez comparer les suggestions de mots-clés afin d'évaluer si les thématiques des deux pages sont proches.
Google AdSense
En rachetant Applied Semantics en 2003, Google a récupéré leur technologie CIRCA brevetée d'analyse du contenu d'un site en vue de sa catégorisation. Grâce à ça, Google a pu sortir Google AdSense qui cible de manière automatique les publicités en fonction du thème du site en général mais surtout de la page où est placée la publicité.
AdSense ne permet pas d'automatiser l'analyse de la thématique des pages, mais si la page source du lien et la page cible affichent toutes les deux des publicités AdSense, alors vous pouvez regarder la thématique des publicités.
Autres outils
Je suis sûr qu'il en existe d'autres et je compte sur vous pour me les indiquer !
Si vous avez des questions, posez-les dans le forum WebRankInfo.
Si vous préférez du consulting, j'en propose sur mon site WebRankExpert.
En partant de ce point de vue, un site de news ne pourrait pas se lancer proprement.
Les liens qui en sortent sont nombreux et tous hors thématique...
Ex: lemonde, figaro, etc...
Ils ont certes assez de trustrank pour ne pas être pénalisé.
Mais dans le cas d'un nouveau site par exemple?
@ Emmanuel : relis ce que j'ai indiqué dans l'article : c'est surtout la thématique de la PAGE qui compte, bien plus que celle du SITE. Recevoir un lien depuis lefigaro.fr ou lemonde.fr est excellent quand il provient d'une page de la même thématique.
Oui c'Est tout à fait judicieux et le nouvel outil de Majestic est prometteur. Toutefois moi j'utilise Similarweb pour avoir la catégorie du site et je dois avouer que ça marche plutôt bien
@ Mozalami : le problème de similarweb est qu'il fonctionne site par site et non page par page
Merci pour cet article. Votre exemple du lien de la fiche chemise vers la fiche tv me fait dire que tous les liens hors contexte de mon site qui sont dans le footer (page de contact, faq, cgv etc..) doivent etre en nofollow pour ne pas pénaliser tout mon site ?
@Aurelien : il faut rester "mesuré" : bien entendu qu'il faut laisser ces liens tels quels, sans nofollow. Je vais le préciser dans l'article.
Pour ma part, j'ai le sentiment que dans la définition du thème, il ne faut pas faire une dichotomie entre thème de la page et celui du site.
En fait, tout le processus thématique forme un tout continu, mais chaque stade a un coefficient de pondération propre. C'est comme un caillou qu'on jette dans l'eau: le cercle le proche (le contexte du lien) est le plus important,le cercle plus large (la page) l'est à peine moins, le suivant (répertoire) un peu moins encore, le suivant (le site) encore un peu moins, mais toujours important quand même.