Site Multilingue : la méthode officielle de Google fonctionne pas...

WRInaute impliqué
Bonjour,

J'ai mis en place une méthode décrite sur Google pour un site multilingue (https://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=189077) et malheureusement cela ne fonctionne pas...

Je m'explique : J'ai un site chinesedic.com en anglais, français et chinois. Les résultats de requête, ainsi que la page d'accueil sont les mêmes dans chaque langue mis à part l'"interface" qui est traduite.

Alors pour éviter le Duplicate Content, et afficher le résultat dans la bonne langue lors d'une recherche, j'ai installé les balises conseillées par Google mais ca ne semble pas fonctionner et pourtant en regardant le cache des résultats de Google, il a bien la dernière version du site.

L'exemple testé sont les mots clés "Dictionnaire Chinois" et le résultat retourné par Google est "Chinese Dictionary • English - Chinese Translator" alors qu'il devrait être en français dans Google Fr...

J'ai installé les balises comme suit :

SITE FR et SITE EN :
<link rel="canonical" href="http:**www.chinesedic.com/zh/" />
<link rel="alternate" hreflang="zh" href="http:**www.chinesedic.com/zh/" />

SITE ZH (Chinois) :
<link rel="canonical" href="http:**www.chinesedic.com/zh/" />
<link rel="alternate" hreflang="en" href="http:**www.chinesedic.com/en/" />
<link rel="alternate" hreflang="fr" href="http:**www.chinesedic.com/fr/" />

... Je n'ai pas l'impression d'avoir fait d'erreur alors que faire ? Je laisse comme ça et attend encore, change de méthode ?? Merci de vos conseils !!
 
WRInaute discret
Quelles sont exactement les adresses des pages d'accueil localisées de ton site ?

/fr pour le français, /en pour l'anglais et /zh pour le chinois ?
 
WRInaute discret
Si sur les pages /fr et /en, tu annonces canonical=/zh, tu dis simplement à Google "oublies cette page, c'est la version chinoise qui compte" (il me semble, hein).

En fait, tu n'as pas en théorie de problèmes de duplicate content entre différentes langues. Ce qu'il te faut, à mon avis c'est :
Page /fr : canonical=/fr, alternate=/en, alternate=/zh
Page /en : canonical=/en, alternate=/fr, alternate=/zh
Page /zh : canonical=/zh, alternate=/fr, alternate=/en

D'un point de vue recherche, tu ne cherches pas l'équivalence entre les différentes langues, donc elles sont "autonomes", et tu dois travailler le référencement de chacune d'entre elles.

Par contre, LE point de duplicate content à vérifier, c'est ce qu'il se passe à la racine du site (page /) : de quelle langue s'agit-il ? Il faut bien veiller :
- soit à faire une redirection permanente vers la langue "par défaut"
- soit mettre un canonical = page de la langue par défaut

Tout cela avec des réserves, bien sûr, je n'ai pas beaucoup d'expérience dans le domaine, mais cela me semble logique.
 
WRInaute impliqué
Seb's a dit:
Si sur les pages /fr et /en, tu annonces canonical=/zh, tu dis simplement à Google "oublies cette page, c'est la version chinoise qui compte" (il me semble, hein).

Oui c'est ca... C'est la méthode décrite par Google...

Seb's a dit:
En fait, tu n'as pas en théorie de problèmes de duplicate content entre différentes langues. Ce qu'il te faut, à mon avis c'est :
Page /fr : canonical=/fr, alternate=/en, alternate=/zh
Page /en : canonical=/en, alternate=/fr, alternate=/zh
Page /zh : canonical=/zh, alternate=/fr, alternate=/en

C'est ce que je souhaitais faire dès le départ, ce qui me parait également plus logique.... mais j'ai suivi l'explication de Google encore une fois...

Seb's a dit:
D'un point de vue recherche, tu ne cherches pas l'équivalence entre les différentes langues, donc elles sont "autonomes", et tu dois travailler le référencement de chacune d'entre elles.

Sisi c'est quand même la même chose en fait...

Seb's a dit:
Par contre, LE point de duplicate content à vérifier, c'est ce qu'il se passe à la racine du site (page /) : de quelle langue s'agit-il ? Il faut bien veiller :
- soit à faire une redirection permanente vers la langue "par défaut"
- soit mettre un canonical = page de la langue par défaut

Oui ca c'est fait mais pas très bien... normalement ca détecte la langue de l'utilisateur en php, mais ca marche pas avec les bots...

Merci en tout cas de tes remarques pertinentes !
 
WRInaute accro
Je ne comprends pas, pourquoi dis tu qu'il y a du duplicate content ?
Je ne connais pas le chinois, mais cat et chat, c'est pas du DC

Pour la détection de la langue de l'utilisateur en php, il suffit de rajouter une langue par défaut, qui sera pour les bots
 
WRInaute discret
Marie-Aude a dit:
Je ne connais pas le chinois, mais cat et chat, c'est pas du DC

Je suis d'accord. Il est essentiel que ces deux pages aient des urls différentes. Ce qui nous ramène à ceci :
Dharius a dit:
Sisi c'est quand même la même chose en fait...

Pour moi, la recherche "cat" doit faire apparaître la page /en/cat, et la recherche "chat" la page /fr/chat.

Dharius a dit:
SITE FR et SITE EN :
<link rel="canonical" href="http:**www.chinesedic.com/zh/" />
<link rel="alternate" hreflang="zh" href="http:**www.chinesedic.com/zh/" />

De ce que tu dis à Google ici, c'est fr = en = zh (en contenu). Après, ce qu'il se passe chez Google reste mystérieux : quel contenu associe-t-il à la page ? C'est à mon sens très mauvais.

Attention avec les conseils Google, il faut faire très attention à la distinction géolocalisé/multilingue.

Le géolocalisé, c'est pour cibler plusieurs pays ayant la même langue avec des contenus/variantes différent(e)s (France et Belgique, par exemple).

Pour le multilingue, ce que j'avais retenu est assez simple :
- une url spécifique au contenu de chaque langue (en commençant par /fr, /en, par exemple)
- faire très attention à la page racine, qui doit rediriger vers une de ces versions (de ton choix)

Pour la détection automatique de la langue, ce n'est pas utile (à proscrire ?) : une recherche en chinois montre les pages chinoises, en anglais les pages anglaises, etc.
 
WRInaute impliqué
Je confirme le duplicate content car je ne peux analyser la langue d'un mot-clé, surtout entre anglais et français donc /fr/cat, /en/cat, /fr/chat, et /en/chat peuvent exister...
 
WRInaute accro
Euh, c'est quoi ton CMS ? Normalement les mots clés sont attachés à une langue ?

Sinon, un conseil, le truc qui gigote, moi ça me fait fuir plutôt qu'autre chose...
 
WRInaute impliqué
Pas de CMS, en fait c'est un dico PHP maison.

Et ce qu'il y a c'est qu'un français peut très bien chercher dans le dictionnaire un mot chinois, pas seulement en français (c'est aussi tout le sens d'un dico...).

Bon, je pense que je vais laisser 3 balises sur toutes les pages
<link rel="alternate" hreflang="en" href="http:**www.chinesedic.com/en/xxx" />
<link rel="alternate" hreflang="fr" href="http:**www.chinesedic.com/fr/xxx" />
<link rel="alternate" hreflang="zh" href="http:**www.chinesedic.com/zh/xxx" />
et virer le canonical et laisser Google se débrouiller avec ça car là je suis trop embrouillé...

Sinon il n'y a pas de "truc qui gigote" lol... peut-être une pub?!
 
WRInaute accro
Oui, mais en fait ton français il peut chercher deux choses :

- la définition en chinois d'un mot chinois (il parle chinois parfaitement) -> page chinoise

- la traduction en chinois d'un mot français ou la traduction en français d'un mot chinois. Dans ce cas, de deux choses l'une, ou bien ton dictionnaire est "réellement" un dico, c'est à dire qu'il donne des définitions, des exemples, des explications, ou bien c'est juste une liste mot à mot.

Si c'est réellement un dictionnaire, les explications sont en français, et majoritaires, donc page française, sans ambiguité et sans DC
Si c'est du "mot à mot" là effectivement tu as un problème de DC. Pour avoir bossé sur un site similaire, on l'avait résolu en deux temps :
- définition d'une langue favorisée par rapport aux autres (tu peux le faire par mot si tu veux)
- rajout dans la page de texte propre à la langue : mot connexes, synonymes, antonymes + exemples
C'est du boulot, sur le long terme c'est payant
 
WRInaute impliqué
En fait c'est plutôt un dico (ou traducteur) mot à mot, pas de chinois - > chinois.

Pour le contenu propre à la langue, je vais y réflechire. Mais dans le cas où je laisse comme actuellement il y aura DC, mais au pire il devrait au moins référencer un mot dans au moins une des trois langues je pense.

Merci en tout cas ! :)
 
WRInaute discret
Je ne connaissais pas la balise rel=alternate. La doc Google est ici.

En gros elle n'est utile que dans le cas où les menus, etc. sont localisés, mais pas le contenu principal (cas de contenu généré par les utilisateurs, par exemple).

C'est le cas de ton site ? Le contenu principal est toujours dans la même langue ?
 
WRInaute impliqué
En effet il y a que les menus qui changent de langue, le contenu est toujours le même dans les 3 langues : anglais, chinois et français.
 
WRInaute discret
Si une même page mélange du contenu anglais, français et chinois, ce n'est pas vraiment étonnant si Google a du mal à gérer, en fait. Il me semble même que c'est très déconseillé dans les guidelines...
 
WRInaute discret
Salut,

Dharius a dit:
L'exemple testé sont les mots clés "Dictionnaire Chinois" et le résultat retourné par Google est "Chinese Dictionary • English - Chinese Translator" alors qu'il devrait être en français dans Google Fr...

Non:
[url=https://www.google.com/support/webmasters/bin/answer.py?hl=fr&answer=189077:3g0j9dzt]Google[/url] a dit:
Le titre et l'extrait affichés dans les résultats de recherche pour toutes les langues seront sélectionnés à partir de cette URL canonique.

Dans la mesure où ton URL canonique est le chinois, c'est normalement les infos de cette page qui sont affichées dans le résultat. Pour avoir un résultat différent dans chaque langue, il faut un "vrai" site multilingue.

L'avantage de la méthode, c'est surtout de renvoyer les visiteur de Google FR vers ta version FR.

Cédric
 
WRInaute impliqué
Bonjour,
Voilà comment j'interprète la réponse de Google

SITE FR et SITE EN :
<link rel="canonical" href="http:**www.chinesedic.com/zh/" />

SITE ZH (Chinois) :
<link rel="canonical" href="http:**www.chinesedic.com/zh/" />
<link rel="alternate" hreflang="en" href="http:**www.chinesedic.com/en/" />
<link rel="alternate" hreflang="fr" href="http:**www.chinesedic.com/fr/" />

donc sans le alternate ZH dans les sites EN et FR
 
WRInaute discret
Je dirais même surtout sans le alternate ZH... puisque ZH est la version canonique

Sinon je l'interprète de la même façon, j'ajouterais juste que le "canonical ZH" est facultatif dans la version ZH
Ou plus généralement que le link rel="canonical" est facultatif dans la page canonique
 
Discussions similaires
Haut