Vous êtes ici : Dossiers référencement > Techniques de référencement

Membre WebRankInfo ?

S'inscrire Aide

Architecture et référencement des sites multilingues

Un article de Cyril, Avril 2004

EasyExpat - Expatriation / Expatrié - Portail de la Mobilité InternationaleExpatriation / Expatrié – Portail de la Mobilité Internationale

EasyExpat est un site accessible en 5 langues, dont le référencement a été spécialement étudié en fonction de cette contrainte. Son webmaster a bien voulu expliquer sur WebRankInfo comment il a architecturé et optimisé le référencement de son site multilingue. Veuillez noter qu'il ne s'agit que d'un exemple d'architecture de site et d'optimisation pour le référencement : il peut y avoir d'autres méthodes, chacune ayant des avantages et des inconvénients.

Google.com, Google.fr, Yahoo en français, en anglais, en italien… De très nombreux sites tournés vers l'international proposent actuellement des versions en langues différentes. Cela permet, tel Yahoo, de se rapprocher de sa cible locale, ou tel Amazon de pouvoir présenter une offre commerciale plus étoffée. Si vous souhaitez attirer un public français mais aussi étranger, vous devrez vous aussi décliner votre site en plusieurs langues. Nous verrons ici les choix qui s'offrent pour l'architecture d'un site multilingue et les conséquences et méthodes pour son référencement.

Cet article est constitué de deux parties :

  • L'architecture d'un site multilingue
  • Les conséquences et méthodes de référencement

L'architecture d'un site multilingue

La page d'accueil et la redirection automatique

La première page n'est pas forcement la page que visitera en premier l'internaute s'il vient d'un moteur de recherche. Mais c'est une « vitrine » du site qu'il convient particulièrement de soigner. Dans le cas d'un site multilingue il existe plusieurs possibilités :

> Proposer une page d'accueil qui demandera explicitement à l'internaute de choisir une langue avant d'aller plus loin dans le site.
C'est la porte d'entrée. Avant de pénétrer plus avant dans le site l'internaute fera explicitement le choix de la langue. Il verra donc dès le départ qu'il est possible de choisir plusieurs langues pour le site. L'inconvénient est bien souvent d'avoir une page d'accueil très dépouillée et peu optimisée pour les moteurs de recherche.

> Prévoir une langue par défaut, et laisser la possibilité à l'internaute de choisir lui même une autre langue.
Vous pouvez déterminer une langue par défaut qui sera affichée lorsque l'internaute proviendra de la racine du site (http://www.monsite.com/). Vous la déterminerez généralement en fonction de vos prévisions de la provenance de la majorité de vos visiteurs et de l'image que vous souhaitez donner. A partir de là vous offrirez la possibilité à l'internaute de choisir une autre langue.

> Détecter automatiquement la langue
Il est possible d'analyser la langue utilisée pour le navigateur et en déduire le langage de préférence de l'internaute.

Pour cela vous pouvez utiliser la variable $HTTP_ACCEPT_LANGUAGE de PHP :

$lang = explode(",",$HTTP_ACCEPT_LANGUAGE);
$lang = StrToLower(substr(chop($lang[0]),0,2));

Il est aussi possible d'utiliser un code Javascript pour faire une redirection JavaScript :

<script LANGUAGE="JavaScript">
<!--
if (top==self) {
  if (navigator.appName == 'Netscape')
  //Reconnaitre le type de navigateur
    var language= navigator.language;
  else
    var language = navigator.browserLanguage;
  if (bl == "fr" || bl == "fr-be" || bl == "fr-ca"
|| bl == "fr-lu" || bl == "fr-mc" || bl == "fr-ch")
  //il faut penser aux variantes de la langue {
   this.location = "default.php?lang=fr"
  }
  else
    this.location = "default.php?lang=en"
} //-->
</script>

Le paramètre de la langue

Il y a plusieurs façons de passer un paramètre de langue dans une page. Vous pouvez tout d'abord utiliser un cookie qui récupèrera la préférence de l'utilisateur (par exemple en fonction de la page d'accueil ou de la langue du navigateur). Vous pouvez aussi utiliser une variable de session afin de pouvoir récupérer la variable de langue sur chaque page. Il ne faudra pas oublier de prévoir une langue par défaut pour ceux qui refuseront les cookies et les robots qui viendront réferencer votre site.

La troisième méthode, que l'on préfèrera largement aux deux autres, est de modifier les URL afin de passer un paramètre supplémentaire décrivant la langue, de type http://www.monsite.com?lang=fr en français ou http://www.monsite.com?lang=en en anglais. Cela permet de gérer très facilement le contenu de la page et fournit une adresse différente pour chaque langue, ce qui permettra aux moteurs de recherche de les référencer différemment. Vous pourrez ainsi très facilement créer des sites multilingues en gardant une architecture commune alors que tous les mots de vocabulaire propre à la langue seront stokés dans un fichier langfr.inc ou langen.inc par exemple. Il suffira alors d'inclure :

include ('lang'.$lang.'.inc');

Pour de plus gros textes, vous pourrez les garder en base de données, avec un champs lang pour chaque entrée.

A noter, au cas où l'internaute modifierait à la main son URL, ou plus fréquemment lorsque certains moteurs de recherche ne référencent pas correctement les URLs avec variables, il est conseillé de prévoir une redirection lorsque le paramètre de langue est absent, de type :

if ( !isset($lang) )
{
  header('Location: http://www.monsite.com/error404.php');
}

ou

if (!isset($lang))
{
  $lang = explode(",",$HTTP_ACCEPT_LANGUAGE);
  $lang = StrToLower(substr(chop($lang[0]),0,2));
}

Dans l'idéal, il vaut mieux que le paramètre de langue dans l'URL apparaisse à en endroit clé :

  • soit dans l'extension du nom de domaine (example.fr, example.co.uk, example.it, etc.)
  • soit dans le sous-domaine (fr.example.com, en.example.com, it.example.com, etc.)
  • soit dans un répertoire à la racine du site (www.example.com/fr/, www.example.com/en/, www.example.com/it/, etc.)

L'URL rewriting

Une fois que vous avez le paramètre langue pour chaque page, il est conseillé d'utiliser l'URL rewriting afin d'optimiser vos URL, de les rendre un peu plus « propres ».

Un exemple simple de fichier .htaccess est :

RewriteEngine on
RewriteRule ^default_([a-z]*)\.htm$ default.php?lang=$1 [L]

Vous trouverez plus d'explications dans la rubrique consacrée à l'URL rewriting.

Les codes de langue du W3C

Les codes de langue consistent en un code principal et une suite éventuellement vide de sous-codes :

code-de-langue = code-principal ( « - » sous-code )*

Les codes principaux de deux lettres sont réservés aux abréviations de langues [ISO639]. Parmi les codes de deux lettres, citons : « en » (anglais), « de » (allemand), « it » (italien), « nl » (néerlandais), « el » (grec), « es » (espagnol), « pt » (portugais), « ar » (arabe), « he » (hébreu), « ru » (russe), « zh » (chinois), « ja » (japonais), « hi » (hindi), « ur » (ourdou) et « sa » (sanscrit).

La balise meta <META HTTP-EQUIV= »Content-Language » content= »fr »> va définir le langage principal du document, ici en français.
Cette balise était à l'origine dédiée aux moteurs de recherche, mais elle est très peu utilisée en pratique. Google définira ainsi la langue du document en fonction de son contenu.
Elle peut aussi être utilisée dans la sélection de la typographie des polices, les choix des caractères de cotation, pour connaître les emplacements de rupture des mots et les espacements inter-caractère. Elle pourrait aussi servir dans une utilisation future à la correction automatique des fautes d'orthographe des pages HTML. L'orientation permet de spécifier si l'écriture de la page se fait de droite à gauche ou de gauche à droite et permet maintenant aux pages de langue arabe de voir le jour sans les artifices de textes en bitmap.

Par ailleurs il est aussi possible de définir, à l'intérieur d'un document, une autre langue. Il suffira d'intégrer le paramètre lang dans la balise. L'attribut de langue est LANG=EN|FR|EN-US|DE|AR|RU|JA (FR représente bien sûr le français, EN-US l'américain, RU le russe, AR l'arabe et JA le japonais). La liste complète de tous les pays possibles peut être consultée dans les documents de référence [RFC1766] et [ISO639].

Voyons un exemple :

<HTML lang="fr">
<HEAD>
<TITLE>Un document multilingue</TITLE> 

</HEAD>
<BODY>
<P>...Interprété comme du français... </P>
<P lang="en">...in English</P>
<P>...À nouveau interprété comme du français...
</P>
<P>...Texte français interrompu par <EM
lang="ja">du japonais</EM> Le français
reprend ici... </P>
</BODY>

</HTML>

Pour de plus amples informations, vous pouvez consulter la documentation sur le site du W3C.

Le type de caractères

Voyons d'abord ce qu'en dit le W3C :

Les encodages de caractères couramment utilisés sur le Web comprennent ISO-8859-1 (appelé aussi « Latin-1 », utilisable pour la plupart des langues d'Europe de l'Ouest), ISO-8859-5 (qui gère le cyrillique), SHIFT_JIS (un encodage du japonais), EUC-JP (un autre encodage du japonais) et UTF-8 (un encodage de ISO 10646 qui utilise un nombre différent d'octets pour différents caractères). Les noms des jeux de caractères sont insensibles à la casse, de sorte que, par exemple, « SHIFT_JIS », « Shift_JIS », et « shift_jis » sont équivalents.

La plupart de ceux qui utilisent IE sont en Western European ISO-8859-1 (ou Latin-1). Cette norme permet de traiter le texte qui contient nativement des caractères accentués tels que é qui ne sont pas codés en HTML en &eacute; .

Le Unicode (UTF-8) convient bien pour des sites en anglais (car il n'y a aucun caractère accentué) ou des sites asiatiques. Mais dans cette norme les caractères accentués qui ne seraient pas proprement codés (&eacute;) apparaitront sous forme de caractères chinois (vous pouvez essayer en changeant le code sous IE : Vue->Encodage), à moins de spécifier l'option d'encodage UTF-8 au moment de l'enregistrement du fichier, mais cela dépend de l'outil utilisé pour gérer son site.

Les conséquences et méthodes de référencement

Un site multilingue n'aura aucun mal à être référencé par un moteur de recherche. Celui-ci analysant les mots du texte, il retrouvera les pages qui correspondent le mieux aux requêtes. Le site multilingue aura aussi l'avantage de pouvoir être présent aussi bien avec une recherche des pages en français que des pages en italien par exemple (pour un site en français et en italien).

La propagation du PageRank Google

Le PageRank Google (PR) est une expression de l'importance que Google attribue à la page. Il est déterminé notamment en fonction du nombre de liens (BL ou backlink) pointant vers cette page.

Afin d'améliorer le PR de votre page d'accueil, il est donc important de lier toutes les pages de votre site avec celle ci.

Par ailleurs il est conseillé de mettre une véritable page d'accueil index.php (ou index.html) qui contiendra la langue par défaut du site plutôt qu'une page uniquement de redirection.

Si vous utilisez la redirection javascript, n'oubliez pas de mettre des liens autres dans votre page afin que le robot Googlebot puisse les suivre… car jusqu'à présent il ne comprend pas le JavaScript.

L'idéal est de respecter la structure des URL que vous avez choisie (voir précédemment dans cet article) et de faire un lien vers la bonne page d'accueil, selon la langue de la page qui fait ce lien.

Le choix du lieu d'hébergement web

Google permet de rechercher par exemple tous les sites situés en France (dont l'adresse IP du serveur est en fait localisée en France, ou pour des sites ayant un nom de domaine en .fr) pour une requête précise. Ce paramètre a une importance relative pour un site multilingue. En effet vos visiteurs venant de pays variés, la localisation ne pourra que contenter un groupe défini. Vous pouvez par exemple choisir le pays dont provient le plus grand nombre de vos visiteurs, afin de renforcer cet aspect pour des recherches locales; ou bien au contraire privilégier l'anglais ; ou encore tout simplement choisir l'offre d'hébergement la moins chère en rapport avec vos besoins.

L'idéal (pas simple à mettre en place) est d'héberger chaque version du site multilingue dans le pays correspondant à sa cible principale.

Inscrire son site dans les annuaires

Que ce soit pour les annuaires DMOZ ou Yahoo, il est possible de référencer son site dans autant de langues dont dispose le site, peu importe que le nom de domaine soit unique. Il suffit de rechercher la catégorie correcte… et ne pas oublier que le référencement se faisant manuellement (une personne physique va visiter votre site avant de l'inclure) il faudra qu'il soit jugé digne d'intérêt pour la catégorie postulée.

Le cas DMOZ

Supposons que votre site parle de voyages et soit diffusé en anglais, français et italien. Vous chercherez donc à vous faire référencer dans DMOZ en anglais dans Top:Recreation: Travel , en français dans Top: World: Français: Loisirs: Voyage et en italien dans Top: World: Italiano: Tempo Libero: Viaggi . Pour chaque catégorie, il suffira d'envoyer une demande via le lien qui correspondra à proposer un site dans chaque section. Faites attention à bien lire la description de la catégorie avant votre soumission, cela vous évitera ainsi de soumettre un site dans une mauvaise section.

Si après quelque temps (disons 1 mois) vous n'avez toujours pas de nouvelles, vous pouvez contacter l'éditeur de la catégorie (la liste se trouve en bas des pages). S'il n'y en a pas, vous devez alors contacter l'éditeur de la catégorie supérieure, et ainsi de suite jusqu'à trouver un éditeur (ils peuvent parfois être rares dans certaines langues).

Vous pouvez aussi utiliser le forum Resource-zone de DMOZ ou leurs forums World dans les différentes langues. Des éditeurs ODP vous répondront et pourront vous donner nouvelles et conseils pour votre référencement dans l'annuaire.

Le Guide Web de Yahoo

Contrairement à DMOZ, vous devrez vous rendre dans les différentes versions de l'annuaire de Yahoo pour référencer votre site. Reprenons notre exemple sur le tourisme. Vous chercherez à référencer votre site dans les annuaires de yahoo.com et probablement yahoo.co.uk (Royaume Uni et Irlande), yahoo.fr, yahoo.it . Si votre catégorie se termine par le symbole @, elle est réservée aux sites professionnels et seule la soumission payante est possible. Dans les autres cas vous pourrez suggérer un site à Yahoo via une soumission standard gratuite mais sans délais garanti.

Si après un ou deux mois vous n'avez toujours pas vu votre site apparaître, il peut être envisagé de soumettre à nouveau le site. Lorsque celui ci sera accepté, un email vous en informant vous sera envoyé. Il est souvent plus facile d'être accepté dans les Yahoo régionaux (yahoo.fr, …) que dans yahoo.com.

Dans tous les cas il est fortement conseillé de prendre connaissance des règles pour suggérer un site sur Yahoo.

Vous trouverez également sur WebRankInfo des conseils pour le référencement sur Yahoo (l'annuaire Yahoo ou le moteur Yahoo Search).

Les liens fournis par les annuaires peuvent tous pointer sur votre page d'accueil (qui fera une redirection en fonction de la langue du navigateur), ce qui augmentera le PR transmis à votre site plus rapidement que si vous soumettez une page différente pour chaque version de votre site.

Conclusion

Google analyse tout simplement la page avec son contenu qu'il soit en français, en anglais…etc. Si vous avez correctement référencé votre site dans une langue, alors il ne devrait pas y avoir de difficultés pour que les moteurs de recherche trouvent les autres versions. N'oubliez pas que tout fonctionne par mot clef !

En résumé, le référencement d'un site multilingue, c'est avant tout du contenu (encore une fois c'est l'essentiel), des titres différents avec mots clefs sur toutes les pages, des mots clefs dans les titres (avec des balises titre)… et bien sur des langues différentes. Google ou tout autre moteur fera le reste.


Formation référencement et webmarketing

Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).


Lectures recommandées sur ce thème :

  • Test du code HTTP d'une page
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
  • Calculer l'indice de densité
    Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
  • Tester la validité d'un lien
    Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
  • Similarité et duplicate content
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Les sous-domaines d'un site
    Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.


Un commentaire sur “Exemple d’architecture d’un site multilingue pour le référencement”

  1. blanchat dit :

    Bravo pour vos conseils, j’ai pu m’apercevoir des difficultes a se referencer sur Google avec mon site jedonnetout.com. Meme avec un certain succes de la part des utilisateurs et un buzz considerable le site n’est pas dans les premiers. En tout cas il est vrai que google n’a plus du tout le meme comportement que les autres moteurs (balises…)
    Bravo

Laisser une réponse

Hébergement web

Sivit

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.

A partir de 1,90 EUR HT/mois.

A la une sur WebRankInfo

Formation au référencement

Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.

Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !

Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.

Détails et inscription

Logiciel de pro

Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.

Téléchargement télécharger le logiciel de référencement AgentWebRanking