Site en partie multilingue - visibilité par les moteurs

Nouveau WRInaute
Bonjour,


Je vais bientôt mettre en ligne, pour le site web de ma société, certaines rubriques traduites en 2 ou 3 langues.

Pour permettre au visiteur de changer de langue, j'ai mis une liste déroulante <select> en haut à droite de la page. Lorsqu'il change la langue choisie dans la liste (javascript "onchange"), la page se recharge automatiquement avec la bonne langue (l'URL de la page - par exemple ma_page.php - ne change pas : la langue courante est gérée en session).

Mon souci au niveau référencement, c'est qu'avec ce système, un visiteur humain peut très bien changer de langue, mais que les robots eux, ne vont certainement pas être capables de détecter correctement tout le traitement javascript <select onchange="..."> + redirection, pour référencer les pages dans toutes les langues.

Donc, pour le moment, la seule solution que je verrais, serait de générer automatiquement des liens invisibles aux visiteurs, mais visibles pour les robots (par ex. avec un basique <div style="display:none;">...</div>)

Par exemple, si mes 3 langues sont français, anglais et arabe, et que je consulte la page en arabe, des liens permettant d'aller sur la page en français et en anglais (par ex. avec ma_page.php?lang=eng et ma_page.php?lang=fre - ça pourrait être plus joli avec de l'URL rewriting, mais le problème reste le même), seraient générés automatiquement dans le <div> invisible.

Même si ce n'est pas (à mon avis) du "cloaking agressif", je crains que certains moteurs considèrent ma manip. comme telle, même si par exemple je mets le "display:none" du <div> dans une feuille de style à part, par exemple...

Qu'en pensez-vous ? Auriez-vous une meilleure solution à suggérer ?
Merci.

PS. J'ai utilisé une liste déroulante avec les noms des langues traduits, plutôt que des drapeaux, pour la raison expliquée ici : http://www.rumbatraciens.com/label/index.php?option=com_content&task=view&id=41&Itemid=35
 
Nouveau WRInaute
Merci pour ta réponse.

En fait, je suis aussi en train de penser au fait de lier correctement les pages traduites entre elles...
Par exemple, la langue par défaut est l'anglais. Avec le système de liens cachés il trouve la page en français. Mais tous les liens qui sont sur cette page sont de la forme ma_page.php, sans rien pour indiquer la langue (ni paramètre, ni sous-répertoire, ni sous-domaine...).

Du coup, le visiteur (qui a un cookie de session) verra toujours les pages en français, alors que le robot (s'il ne gère pas les cookies comme ce que j'imagine), va toujours voir les pages en anglais.

De plus, si jamais le robot gère les cookies, il va référencer deux contenus différents (les versions anglaise et française) pour une même page (du coup je crois qu'il ne référencera qu'un des deux contenus...), bref, c'est pas top.

Donc en suivant les conseils de ce site, il faudrait que tous mes liens entre pages soient de la forme ma_page.php?lang=fre sur les pages en français, ou mieux, par exemple www/fre/ma_page.php avec URL rewriting.

Merci de m'indiquer si ça vous paraît Ok, et surtout si le système de "cloaking non agressif" décrit dans mon 1er post ne risque pas de donner lieu à des "blacklistages" par exemple...
 
WRInaute accro
et pk tu te prends la tete à faire ca en menu déroulant ? t'as pas 500 langues non ? des petits drapeaux cliquables et hop fini le pb
 
Nouveau WRInaute
Alors pour une partie des choses (notamment l'utilisation du "display:none"), je me réponds à moi-même :
https://www.webrankinfo.com/forum/topic ... 932_45.htm

Vu cette discussion, si je fais bien les choses la technique ne sera pas trop "dangereuse" vis à vis des moteurs, mais à priori il faut au minimum mettre le "display:none" dans une feuille de style à part.
Une autre solution peut être de mettre une classe CSS pour les liens que je souhaite cacher aux visiteurs, et mettre un "display:none" pour cette classe dans la feuille de style séparée.

finstreet > Concernant le choix drapeaux / liste déroulante, j'ai déjà indiqué pourquoi dans mon premier message

PS. J'ai utilisé une liste déroulante avec les noms des langues traduits, plutôt que des drapeaux, pour la raison expliquée ici : http://www.rumbatraciens.com/label/index.php?option=com_content&task=view&id=41&Itemid=35

A cela, il y a aussi des raisons cosmétiques et de place disponible (d'autant plus qu'il risque d'y avoir bien plus de 3 langues dans un avenir plus ou moins proche) ; je n'ai donc pas trouvé de meilleure façon de faire.
 
WRInaute passionné
Frosty a dit:
De plus, si jamais le robot gère les cookies, il va référencer deux contenus différents (les versions anglaise et française) pour une même page (du coup je crois qu'il ne référencera qu'un des deux contenus...), bref, c'est pas top.

Je n'ai jamais eu de problème à ce sujet, les contenus dans deux langues sont vus comme différents.
 
Nouveau WRInaute
Jeviensderio > Ah, tant mieux. J'ai dû confondre avec le "duplicate content" (même contenu pour 2 URL différentes).
Cela dit, si les moteurs ne gèrent pas les cookies (je vais me renseigner là-dessus), je pense qu'il vaut mieux mettre des URLs permettant de préciser la langue.
Par exemple, tous les liens des pages en français seraient de la forme /www/fre/un_dossier/une_page.php au lieu de /un_dossier/une_page.php
 
Nouveau WRInaute
D'après ce site, les moteurs ne gèrent pas les cookies et donc, en partant d'une page en français, vont systématiquement se retrouver sur une version anglaise en suivant un lien, ce qui ne me plait pas du tout...

Je pense donc que je dois changer les liens dans les contenus traduits pour faire apparaître la langue (cf. mes messages précédents), cela devrait donner un référencement plus "cohérent".

J'aimerais qu'on me confirme que les moteurs ne gèrent absolument pas les cookies, j'ai du mal à trouver de l'info là-dessus... Merci.
 
Nouveau WRInaute
Bon, je me réponds :wink:

Certainement tout un tas de choses que tout le monde sait déjà ici... Alors petite piqûre de rappel :D
http://s.billard.free.fr/referencem...-robot-avec-firefox-et-la-barre-web-developer
- Les moteurs n'interprêtent pas javascript, ni les applets java [...]
- Les moteurs n'acceptent pas les cookies [...]
- Les moteurs ignorent les couleurs des pages ainsi que les feuilles de style [...]
- Les moteurs ne savent pas lire les images, mais tiennent compte des attribut alt [...]
- Les moteurs lisent le contenu dans l'ordre du code

https://www.webrankinfo.com/forum/t...chargee-par-le-robot-google-en-acceuil.51581/
quand on va a l'adresse patatorandco.free.fr/ et qu'on a pas de cookie (ce qui est le cas des robots)

Je mets aussi un lien vers ce site, bien utile pour voir son site comme si on était un moteur de recherche : http://www.seo-browser.com/

Voili voilou... Je sais vers quels choix techniques m'orienter à présent.
 
Discussions similaires
Haut