Site multilingue & Canonical

Vverger

WRInaute discret
Bonjour,


J'ai des pages structurelles comme les pages "privacy policy", ou page "carrière".
Ces pages sont exactement les mêmes en français pour plusieurs pays francophone.

Chacune a sa propre URL:
  • /fr-fr/
  • /be-fr/
  • /ch-fr/
....

Mais comme les pages sont les mêmes, nous avons mis des canonical qui pointent sur notre pays principal la France.

D'un point de vue maillage internet, j'ai cru comprendre qu'il n'était pas idéal de pointer des liens internes vers des pages avec une canonical.
D'un point de vue user experience, je trouve ça mauvais qu'une personne sur le site /be-fr/ se retrouve sur une URL /fr-fr/ lorsqu'il va sur la page carrière.

Quel est le meilleur compromis ?

Merci à vous,
 

emualliug

WRInaute impliqué
D'un point de vue maillage internet, j'ai cru comprendre qu'il n'était pas idéal de pointer des liens internes vers des pages avec une canonical.

??? et pourquoi donc ?

D'un point de vue user experience, je trouve ça mauvais qu'une personne sur le site /be-fr/ se retrouve sur une URL /fr-fr/ lorsqu'il va sur la page carrière.

? Il n'est redirigé nulle part.

Je ne suis pas sûr qu'on s'entende sur la notion de canonical :

Pour rappel, canonical c'est la version angloise de canonique, dont l'origine vient du mot "canon", non pas le truc qui tire des boulets / obus, mais au sens de règle, de norme ; c'est ce qu'on retrouve dans les canons ecclésiastiques ou encore dans les canons des beaux arts (un canon de beauté ; oui l'expression est à l'origine moins vulgaire qu'on ne le pense).

Une adresse canonique, est donc l'adresse d'une page qui fait autorité, ce qui a particulièrement du sens lorsqu'une page en a plusieurs (mais on peut avoir une canonique avec une seule adresse, bien entendu).

En SEO, elle permet de favoriser une adresse plutôt qu'une autre, lorsque des pages ont des contenus plus ou moins identiques.

Je dis "favoriser", parce que Google peut outrepasser la directive canonical (lorsqu'il estime qu'elle est utilisée à mauvais escient). Je dis "plus ou moins", parce qu'il est néanmoins pertinent d'utiliser une canonique sur des pages dont le contenu n'est pas strictement identique (par exemple un ordre de tri, un filtre, etc.).
 

Vverger

WRInaute discret
Hello,

Merci pour votre réponse rapide.
Votre est réponse est très claire :) Je pense en effet que j'avais mal compris un élément du canonical mais c'est beaucoup plus clair avec vos explications.

Merci à vous,
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
Mais comme les pages sont les mêmes, nous avons mis des canonical qui pointent sur notre pays principal la France.
à mon avis c'est une erreur
le fait qu'on ait plusieurs combinaisons langues/pays ne doit rien changer au choix des URL canoniques
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
la canonique est là pour indiquer l'URL officielle de la page.
si tu ne veux pas ou ne peux pas modifier le contenu dans des cas multilingues, les balises hreflang sont faites pour ça

selon moi, le choix des canoniques ne devrait pas avoir de rapport avec les autres versions langues/pays
 

kristel

WRInaute impliqué
Pour ma part, je partage et confirme les deux réponses de Webrankinfo:
- "avoir mis des canonical qui pointent sur notre pays principal la France" est une erreur dans le cas présent.
- les hreflang ont été créés par google expressément pour des cas tels que le cas visé ici (et d'autres).

https://developers.google.com/search/blog/2011/12/new-markup-for-multilingual-content

La source est ancienne, mais en gros, reste valable.

Mon raisonnement est que Google fonctionne par pays et que si les hreflang sont correctement placés (les be-fr,.. dans l'url ne suffisent pas), Google considère que, par ex, la version avec le hreflang langue française région Belgique est la version pour les SERPs en Belgique et les autres versions pour les SERPs de leur pays propre. Mais, dans chaque pays, il n'y a qu'une version et donc pas de duplicate content.

En multi-pays (ou en multi-langue), renvoyer une page vers une autre par le canonical est correct dans des cas de doublons tels que example.com/fr/ et example.fr ou bien même url avec et sans ".html", mais PAS dans des contenus de même langue pour des pays différents.
 
Dernière édition:

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
merci !

j'ajoute qu'il est conseillé de créer 3 version en français seulement si on a des bonnes raisons de vouloir dupliquer (x3) un site. sinon, c'est se créer des pb pour pas grand chose. Peut-être qu'ici c'est une bonne idée de créer 3 versions FR, je ne sais pas.
 

Vverger

WRInaute discret
Bonjour,

Je déterre ce sujet car je viens justement de recevoir une alerte par GSC:
Page is not indexed: Duplicate, Google chose different canonical than user

J'ai un article de blog X qui est disponible dans plusieurs langues / pays:

- fr-fr pour la France
- be-fr pour la Belgique francophone
- nl-nl pour les Pays-Bas
- be-nl pour la Belgique néerlandophone

Chaque URL a un hreflang vers le bon pays.
Chaque URL a une self canonique.

Pour la page be-nl, Google a décider de prendre comme URL canonique celle nl-nl.

La page n'est donc plus indexée à cause de duplicate content.


Du coup quelle solution ?
De ce qu'on avait discuté précédemment, j'avais cru comprendre que le href-lang faisait le job :p
 

emualliug

WRInaute impliqué
j'ajoute qu'il est conseillé de créer 3 version en français seulement si on a des bonnes raisons de vouloir dupliquer (x3) un site. sinon, c'est se créer des pb pour pas grand chose.
Remplacer "français" par "néerlandais" et tu as ta réponse.

hreflang n'est pas magique, ça ne supprime pas le risque de duplicate, ça permet de lier des pages en fonction de la langue, mais a priori des pages différentes (parce qu'elles n'emploient pas la même langue) même si le contenu (du moins la matière) est la même.

Il n'y a donc rien d'étonnant à ce que Google estime que be-nl soit un duplicate de nl-nl. Est-ce que la définition d'une canonique (par exemple depuis be-nl vers nl-nl) aurait changé quelque chose ? Oui et non : Google n'aurait plus refusé d'indexer parce qu'il détecté du duplicate, mais parce que la page désigne une autre canonique. Donc finalement la page n'aurait pas été indexée en tant que telle.

Là où il ne faut pas s'affoler, c'est que le duplicate interne n'est pas forcément catastrophique, tu as deux pages identiques, détectées comme identiques. Et l'une d'elle demeure indexée.

La question c'est pourquoi avoir créé deux pages distinctes si le contenu est identique ? Si c'est pour orienter vers des options en matière de frais de port ou de paiement, peut-être organiser ça sur le site lorsque l'internaute arrive et lui proposer d'être redirigé vers le site de son pays.
 

kristel

WRInaute impliqué
+1

il est vrai que les hreflang conviennent aussi (dixit Google) pour distinguer, comme ici, des contenus similaires dans une même langue ciblant des pays différents. Mais, cela n'empêche pas que multiplier de cette façon les versions similaires diluent fortement et inutilement le PR juice dont elles bénéficient, ce qui est un autre élément de base de l'algorithme de Google.

La seule chose que tu pourrais/ devrais faire (sans garantie de succès), c'est de récolter des backlinks de qualité en faveur de ta page be-nl. Et aussi en faveur de ton site entier, car les "erreurs" d'indexation sont souvent liées à un manque d'autorité du site.

Entre-temps, il n'y a pas le feu: le visiteur belge néerlandophone ne sera pas désorienté par une page en néerlandais nl-nl et, s'il veut conclure plus à fond, il pourra changer de version par les boutons ad hoc que tu auras mis sur chaque version.
 

WebRankInfo

Olivier Duffez (admin)
Membre du personnel
et quand les "écarts" sont plus grands en termes de localisations ? je m'explique, un visiteur US en anglais se voit proposer une version européenne du site, c'est pas cool. @kristel tu penses que c'est surtout les backlinks (issus des US dans mon exemple, vers les pages US) qui peuvent aider ?
 

kristel

WRInaute impliqué
Entre les USA et le UK, je crois que Google est bien armé pour bien faire la différence. Outre tout l'attirail SEO, les différences de langue et même de typographie entre les deux sont plus importantes que beaucoup en dehors de ces deux pays ne l'imaginent. J''entends rarement parler de problèmes de confusion entre les deux pays.

Les webmasters de ces pays sont mieux placés que moi pour répondre, y compris pour ce qui concerne l'influence de l'origine géographique des backlinks. Mais, personnellement, je ne crois pas que celle-ci ait un poids considérable dans la qualité du backlink *. Evidemment tout est toujours question de mesure (90 % de BL de sources étrangères à la version, ce n'est pas la même chose que 10 %).

Etant de la vieille école, j'ai toujours considéré qu'il valait mieux ne pas démultiplier les versions pour des pays différents si l'on n'a pas des contenus différents ou des raisons vraiment majeures de le faire.

Et d'une façon générale, je pense que les problèmes d'indexation sont souvent liés à une faiblesse du site.


* en tous cas, dans un site avec répertoires linguistiques/géographiques, Google semble s'accommoder, sans inconvénient pour le site, que la home soient largement soutenues par des BL d'autres langues/pays.
 

Vverger

WRInaute discret
Bonjour @kristel , @WebRankInfo , @emualliug ,

Merci pour vos réponses.

Dans le fond et la forme je suis 100% d'accord avec vous qu'un article FR ou NL doit pouvoir suffire.

Dans la pratique, actuellement, j'ai une structure blog en fonction du pays et de la langue (fr-fr, be-fr...etc.)
Le produit que nous vendons est différent en fonction des pays (fr-fr n'est pas be-fr).
Du coup, sa navigation sur l'ensemble du site est liée à son pays et sa langue.

Si demain, je supprime la structure "fr-fr" "be-fr" pour ne garder qu'une structure "fr"
Je dois pouvoir appliquer un script qui va rediriger la navigation sur le reste du site dans le bon pays (je ne suis pas dev, mais ça me semble possible).

Ma question restante est plutôt: est-ce que le jeu en vaut la chandelle ?
Restructure tout un blog veut dire de nombreuses 301... Qu'en pensez-vous ?
 

emualliug

WRInaute impliqué
Il ne s'agit pas forcément de supprimer les pages, mais simplement de rediriger l'internaute vers les pages de son pays.
 

emualliug

WRInaute impliqué
Quand tu veux dire "même page", tu veux dire "même contenu dans la même langue" ?

Je ne vois pas trop ce que tu veux dire par "même URL".

De ce que je comprends de ta structure, je ne vois pas ce qu'il serait impératif de changer. Chaque URL a hreflang qui indiquent les différentes langues et pays : c'est comme ça que c'est supposé fonctionner.
 

Vverger

WRInaute discret
Quand tu veux dire "même page", tu veux dire "même contenu dans la même langue" ?

Je ne vois pas trop ce que tu veux dire par "même URL".

De ce que je comprends de ta structure, je ne vois pas ce qu'il serait impératif de changer. Chaque URL a hreflang qui indiquent les différentes langues et pays : c'est comme ça que c'est supposé fonctionner.

Désolé si je ne suis pas claire.

Pour reprendre, voici ma structure actuelle pour un article A (=même contenu).
- /fr-fr/articleA ==> français pour la France
- /be-fr/articleA ==> français pour la Belgique
- /nl-nl/articleA ==> néerlandais pour les Pays-Bas
- /be-nl/articleA ==> néerlandais pour la Belgiuque
Le contenu est toujours le même.

Cependant, Google a décidé de ne pas indexer la page /be-nl/articleA et de prendre la page /nl-nl/articleA comme URL canonique à indexer.

Ma question est: quelle est la meilleure pratique pour indexer /be-nl/articleA et /nl-nl/articleA malgré un contenu identique ?

Dans les réponses que j'ai lu, si j'ai bien compris, on propose d'avoir 1 seule URL par langue, par exemple: /nl/articleA.
Alors je pourrais, et je mets une 301 de /be-nl/articleA et /nl-nl/articleA vers /nl/articleA.
Mais mon autre interrogation est alors: qui du hreflang? Puisque cette page servirai alors pour be-nl et nl-nl à la fois.
Est ce que je peux techniquement mettre sur une même page ?
- < link rel="alternate" href="http://example.com/nl/articleA" Hreflang="nl-be">
- < link rel="alternate" href="http://example.com/nl/articleA" Hreflang="nl-nl">

Merci à vous

(j'espère que c'est plus clair :) )
 

kristel

WRInaute impliqué
Ce n'est pas parce que des intervenants (dont je suis) ont indiqué préférer ne pas multiplier sans raison majeure des versions identiques pour des pays différents que tu dois obligatoirement changer de stratégie.

Ton problème d'indexation est limité à une seule version et , vu la similarité de la langue et la présence indispensable d'un bouton quelconque permettant de changer de version, il ne devrait pas avoir de grandes conséquences commerciales.

Avec le temps, Google pourrait peut-être corriger de lui-même son erreur (à supposer que l'erreur est bien chez lui, car, nous parlons ici sans avoir visité le site et ne savons même pas si le site a une extension générique). Mais, personnellement (je me répète), tu pourrais l'y inciter en donnant à la page en cause et d'une façon générale à ton site davantage de backlinks de qualité . De toute façon, ceci ne peut que positif.

Ta stratégie (multiples versions identiques) est pratiquée par bien d'autres sites, surtout dans l'e-commerce. Changer ou non de stratégie, seul toi , peut peser le pour et le contre (comment marchent les autres versions ?), mais , personnellement, je trouverai incongru de mettre des hreflang géographiques différentes sur une même URL.
 

emualliug

WRInaute impliqué
- /fr-fr/articleA ==> français pour la France
- /be-fr/articleA ==> français pour la Belgique
- /nl-nl/articleA ==> néerlandais pour les Pays-Bas
- /be-nl/articleA ==> néerlandais pour la Belgiuque
Si tu reprends la même notation dans tes hreflang, il y a une erreur dans ton emploi des codes, c'est code_langue-CODE_PAYS
et non l'inverse. Le problème est particulièrement criant pour ch ou be qui ont une signification différente en ISO 639-1 (langue) et ISO 3166-1 (pays) :

BE = Belgique, be = biélorusse
CH = Suisse, ch = chamorro (bon pas dit que ce soit très employé, mais quand même).

Les bons codes sont :

fr-BE : pour une page français à destination des belges wallons
nl-BE : pour une page en néerlandais à destinations des belges flamands

On se fout des majuscules / minuscules, mais je les reprends conformément aux normes ISO (bas de casse pour les langues, capitale pour les pays / régions).

Ceci étant, il est très peu probable que ça ait un lien quelconque avec ton soucis.

quelle est la meilleure pratique pour indexer /be-nl/articleA et /nl-nl/articleA malgré un contenu identique

C'est un peu la quadrature du cercle. Tout le concept de la détection du duplicate est de ne pas indexer deux pages avec un contenu identique ou similaire, et Google ne sera pas guère aux "carabistouilles" pour faire oublier que le contenu est le même.

Mais le duplicate n'est pas en problème en lui-même, ce qu'il faut voir c'est quelle est l'incidence sur ton business.

Imaginons que tu vendes des pièces pour voiture, et que tu que ta page /nl-nl/articleA se place sur la requête "auto-onderdelen". Ton inquiétude est que seule la page /nl-nl/articleA est proposée et que la page /be-nl/articleA n'est pas indexée.

Et alors ? Si le belge flamand tape "auto-onderdelen" et qu'on lui propose la page /nl-nl/articleA, ce n'est guère un problème pour lui, surtout si sur la page /nl-nl/articleA il est accueilli par une gentille popup qui lui dit "il semblerait que vous consultez le site depuis la Belgique, souhaitez-vous poursuivre avec les options disponibles pour une expédition vers la Belgique ?", ou un truc du genre (mais en néerlandais : "Het lijkt erop dat u de site bezoekt vanuit België, wilt u doorgaan met de beschikbare opties voor verzending naar België?"), et un petit menu déroulant pour naviguer parmi toutes les options de pays / monnaie (plein de sites le font).

on propose d'avoir 1 seule URL par langue, par exemple: /nl/articleA
Oui mais du coup tu perds la spécificités suivant le produit, tu indiquais :
Le produit que nous vendons est différent en fonction des pays (fr-fr n'est pas be-fr).

On en revient un peu à la question de base : est-il utile de distinguer les pages fr-FR des pages fr-BE ou fr-CH ?

Les produits sont différents, la disponibilité et les délais de livraison ne sont pas les mêmes, les prix ne sont pas identiques, la monnaie est différente, les offres promo ne sont pas les mêmes, etc. → OUI

Une partie du site est différentes (la partie marchande), du coup on reprend la structure qui distingue les régions pour la partie blog alors que le contenu est le même entre les régions BE, CH et FR → nettement moins.

Mais même dans ce second cas, le remède ne doit pas être pire que le mal, et le mal est faible. Changer de structure, bousculer les URL c'est loin d'être innocent en terme de SEO (et c'est lourd à mettre en place).
 

Vverger

WRInaute discret
Bonjour,

Merci @kristel et @emualliug pour vos réponses détaillés.

@emualliug pas d'inquiétude, notre hreflang est bien encodé, j'écris be-nl car c'est plus compréhensible à la lecture, mais la balise est bien encodé.

L'impact business reste en effet limité et l'internaute peut toujours changer de pays.
Vos réponses montrent bien qu'il n'existe pas de solution miracle :)

Encore un tout grand merci.
 

Discussions similaires

Haut