Comment indiquer a google la langue d’un site ?

WRInaute impliqué
bonjour,

Si la page index d’un site est on plusieurs langues comment indique ça a google ?

La balise meta : <meta http-equiv="Content-Language" content="en,fr,es…"> ni plus utilisée par google

Alors si en dit que google détecter automatique la langue de site : pourquoi si en met un requête (exemple : url de site) dans google.com il affiche [ Translate this page ] ?

est ce que google comprende la langue de balise <titre> comme langue de toute la page ?

Merci d’avance
 
WRInaute discret
bonjour,

Google dispose de 3 indicateurs pour la langue d'un site web :

- GG sait déterminer la langue par analyse sémantique, c'est à dire qu'il arrive à déduire la langue d'après sa structure, son vocabulaire etc...

- l'extension (TLD) du nom de domaine donne également un indice (.ma -> maroc, .fr -> france, ) bien que ceci ne soit pas forcement vrai pour .com / autre possibilité : les sous-domaines par ex. fr.site.com et de.site.com

-enfin l'adresse IP permet de connaître le pays où est hébergé le site ce qui donne également une piste (attention, même remarque que pour le NDD)

C'est une combinaison de ces 3 facteurs qui "indique" la langue d'un site à Google, bien que, par expérience, je pencherais plutôt pour le premier facteur (analyse linguistique et sémantique)

Met la balise Meta, ça ne coute pas grand chose et peux aider d'autres moteurs que Google à connaitre la langue de ton site

EDIT : Google peut aussi bien analyser la langue des sites qui te lient pour en déduire la langue de ton site. Ce n'est qu'une hypothèse qu'il faut véifier par des tests et une démarche empirique..

Cdt,

Elcantar
 
WRInaute impliqué
merci elcantar

pour : l'extension (TLD) : je parle de .com

pour : l'adresse IP permet de connaître le pays où est hébergé le site : un site en anglais peut hébergé en france et un autre en français peut hébergé en usa.....

alors : est ce que on peut dire que google regarde le pays au le nombre supérieure de visite à ce site ?

ou la langue de balise <titre> ?
 
WRInaute impliqué
google webmaster

dans googlewebmaster, on peut aussi indiquer le pays et du pays à la langue, il n'y a qu'un petit pas
 
WRInaute accro
Re: Comment indiquer a google la langue d&#8217;un site

mahdivitche a dit:
Si la page index d’un site est on plusieurs langues comment indique ça a google ?

Je ne suis pas sûr qu'on puisse. Je pense qu'ils considèrent (comme beaucoup d'autres) que la page a une seule langue.

mahdivitche a dit:
La balise meta : <meta http-equiv="Content-Language" content="en,fr,es…"> ni plus utilisée par google

Malheureusement, il y a énormément de sites (et pas que des petits) qui publient des headers Content-Language ou mette des lang=xxx dans leur tag HTML qui sont complètement faux (le cas le plus classique étant que quelqu'un a recopié un template avec cette information, et qu'on se retrouve avec du "en" partout alors qu'il y a des pages dans d'autres langues, quand ce n'est pas le site entier). Il est donc relativement normal qu'ils ignorent cette information (ou qu'ils ne l'utilisent que pour départager des langues proches, par exemple). Ceci dit, ça ne veut pas dire que ce n'est pas une bonne idée de le mettre, mais je pense que peu de monde "comprendra" le cas où tu mets plusieurs langues.

Un truc que tu peux essayer (aucune idée si ça marche ou pas, je n'ai jamais essayé), c'est d'appliquer l'attribut "lang" sur des tags (span ou div). Il y a plus de chances que cette information soit exacte, donc que Google puisse lui faire confiance. De là à dire qu'ils le font, c'est un autre problème...

Ceci dit, la "bonne" solution c'est probablement d'avoir des pages d'acceuil séparées, de faire une redirection de / vers chacun d'elles en fonction du Accept-Language envoyé par le navigateur (et/ou le pays du visiteur), avec évidemment toujours un moyen de passer d'une version à l'autre, et une langue "par défaut" quand on n'a pas la langue demandée sous la main. Non?

Jacques.
 
WRInaute accro
Il est possible de mettre des balise indiquant la langue dans le corps du texte, sur des div différents, our de mettre plusieurs langue dans la meta, mais tout ça ne conduit qu'à confusionner notre petit google.

La langue du site, par ailleurs, n'est pas tellement importante pour le "classement" dans les serp, par rapport à la géolocalisation (ip, tld, ou gwt)

Faut pas oublier que bien rares sont les pays n'ayant qu'une langue. En France, on a le basque et le breton, la Belgique a le français, le flamand, l'allemand, et a appelé son site insitutionnel belgium.be...

Beaucoup de sites dans un pays s'adressent aux étrangers, donc dans une autre langue.

Google va donc positionner dans une version locale en fonction de la localisation et de l'adaptation du contenu à la requête.

Comme tout le monde cherche à géolocaliser sur la langue, il devient paradoxalement plus facile de faire monter un site en anglais sur Google.fr et donc truster les résultats pour les anglphones vivant en France.

Mais globalement, comme on te l'a déjà dit, la bonne solution c'est de ne pas mélanger les langues sur une page qu'on souhaite référencer.
 
WRInaute passionné
Marie-Aude a dit:
Faut pas oublier que bien rares sont les pays n'ayant qu'une langue. En France, on a le basque et le breton, la Belgique a le français, le flamand, l'allemand, et a appelé son site insitutionnel belgium.be...
Ne mélange pas tout. La seule langue officielle de la France est le français. Contrairement la Belgique qui elle a officiellement 3 langues : le français, le néerlandais et l'allemand. Les langues dites régionales (breton, basque et cie) sont parlées localement mais non reconnues comme langues officielles de la France. :wink:

Marie-Aude a dit:
Mais globalement, comme on te l'a déjà dit, la bonne solution c'est de ne pas mélanger les langues sur une page qu'on souhaite référencer.
Théoriquement, rien ne l'empêche. Il faut juste définir la langue de la page et ensuite à l'aide d'attributs de balise "lang" spécifier les autres langues du texte. C'est d'ailleurs recommandé pour des raisons d'accessibilité.

Un peu plus de lecture ici : Spécifier la langue d'un document (x)HTML - source : Openweb

_
 
WRInaute accro
Rien ne l'empêche mais ça marche "difficilement", c'est la différence entre la théorie et la pratique.

La position de la France sur les langues régionales est assez difficile, condamnée et en contradiction avec les directives européennes.
Bien que non "officielles", les langues régionales sont autorisées pour l'éducation (DIWAN) et même pour la rédaction des chèques. En revanche, il est exact que l'état français n'a qu'une langue.

https://www.google.com/intl/eu/ et
https://www.google.com/intl/br/ sont considérés comme "internationaux"

La seule chose que je dis, c'est que la langue n'est pas "le truc" pour la géolocallisation :)
 
WRInaute accro
Google ne reconnaît pas la langue d'un site, il reconnaît la langue d'une page. Il y a assez d'exemples de sites où plusieurs langues sont utilisées et où Google reconnaît très bien la langue de chaque page sans qu'aucune indication ne soit présente dans des balises.

Dans quelques cas rares, Google se trompe dans la reconnaissance de la langue d'une page. Par exemple, si vous faites une page en français contenant un grand nombre de termes techniques en anglais ou dans une autre langue, Google pourrait se tromper en se basant sur ces mots pour reconnaître la langue de la page. Même problème avec une page en français qui contient de nombreux noms de villes hollandaises.

Je me souviens aussi d'une page bilingue que Google reconnaissait à la fois comme page en néerlandais et page en français.

Pour le reste, pour les pages plus habituelles, aucun problème.

Jean-Luc
 
Membre Honoré
Re: google webmaster

jeanluc a dit:
Google ne reconnaît pas la langue d'un site, il reconnaît la langue d'une page. Il y a assez d'exemples de sites où plusieurs langues sont utilisées et où Google reconnaît très bien la langue de chaque page sans qu'aucune indication ne soit présente dans des balises.
+1 sachant que l'on peut avoir un site dans un Pays qui a plusieurs langues (par exemple celles régionales).
 
WRInaute impliqué
merci pour tous les reponse

mais :

on peut dire qu'il n'ya pas aucune solution pour referencer un site dans les domaines deffirent de google ( google.fr ( langue français ) , google.es ( langue espagnole ) , google.com (langue anglais ) ) ?

le probleme aussi est si en veut crée à chaque langue un page alors page rank de chaque page est deffirent ?
 
WRInaute accro
mahdivitche a dit:
on peut dire qu'il n'ya pas aucune solution pour referencer un site dans les domaines deffirent de google
Il n'y a pas de solution parce qu'il n'y a pas de problème. Le problème dont tu parles n'existe pas. Les pages françaises ET les pages espagnoles ET les pages anglaises seront bien indexées.

mahdivitche a dit:
le probleme aussi est si en veut crée à chaque langue un page alors page rank de chaque page est deffirent ?
Ce problème-ci non plus n'existe pas. Même si des pages sont dans la même langue, elles ont des PR différents. Le PR n'est pas donné par site, mais séparément pour chaque page.

Jean-Luc
 
WRInaute impliqué
jeanluc a dit:
mahdivitche a dit:
on peut dire qu'il n'ya pas aucune solution pour referencer un site dans les domaines deffirent de google
Il n'y a pas de solution parce qu'il n'y a pas de problème. Le problème dont tu parles n'existe pas. Les pages françaises ET les pages espagnoles ET les pages anglaises seront bien indexées.
Jean-Luc

non . le probleme et d'indexées un page qui contient plusieur langue dans les différent domaine de google

tu peut me donnée un exemple de site multilangue ( page index ) et indexées dans les différent domaines de google ?

le probleme est que google indexée cette page dans même domaine ?

merci Jean-Luc
 
Membre Honoré
mahdivitche a dit:
non . le probleme et d'indexées un page qui contient plusieur langue dans les différent domaine de google
Un utilisateur recherche une page avec les informations qu'il recherche dans la langue qu'il connait. S'il utilise Google.fr il va chercher une page en français (de préférence) avec les informations (pas une page avec plusieurs langues).
 
WRInaute impliqué
merci Madrileño

mais pourquoi google choisir le français pour mon site ?

est ce parce que le <titre> et en français ?

ou les lien vers mon site en franaçaise ?

ou................................

alors que mon site contient 3 langue et avant google il choisir l'angalis

merci en cours
 
WRInaute accro
mahdivitche a dit:
mais pourquoi google choisir le français pour mon site ?

J'aurais tendance à dire "parce qu'il ya plus de texte en français".

mahdivitche a dit:
alors que mon site contient 3 langue et avant google il choisir l'angalis

C'est forcément assez arbitraire dans ce genre de situation, suivant la proportion de texte dans chaque langue, et la possibilité que le texte dans les autres langues puisse être considéré comme étant dans celle choisie. Pas très clair? Ben G pense probablement la même chose.

Pour info, voici ce que notre moteur pense de ta page:

http://www.oxado.com/bin/checkpage?url= ... anguage=fr

(c'est normalement à usage interne, donc ce n'est pas forcément top clair et bien présenté, et il manque les chaînes de localisation)

Ca veut dire qu'il pense que c'est plutôt du français, et l'anglais n'arrive qu'en 4e choix (ouais bon, y'en a qui vont trouver ça drôle le catalan, le galicien ou le latin, mais bon). C'est basé sur notre algo à nous (qui marche plutôt pas mal) qui est une combinaison de plusieurs algos que tu peux voir dans le petit tableau:
- scripts ce sont les types d'alphabets. Comme tout est en alphabet latin, toutes ces langues-là sont à égalité (ça a éliminé les choses genre arabe, russe, chinois, japonais, coréen...)
- blocks ce sont les blocs Unicode, en gros les groupes de caractères accentués (ou pas). En gros toutes les langues indiquées sont dans les mêmes eaux, mais comme tu as des accents du type "Europe de l'Ouest" dans ta page les langues qui en utilisent sont favorisées par rapport à celles qui n'en utilisent pas ou peu (anglais, latin, etc.). Les langues avec des accents plus exotiques (scandinaves, Europe de l'Est) ont probablement été éliminées à ce stade
- ngrams1 c'est la présence de caractères bien particuliers. Là le français et le catalan se détachent nettement
- ngrams3 ce sont des séries de 3 lettres (y compris à cheval sur des mots). Là le français se détache très nettement
- words ce sont les mots les plus courants, là encore le français l'emporte, avec l'espagnol pas trop loin derrière

Suivant les algos utilisés (les plus courants étant les N-grammes, les affixes, les mots les plus courants), le poids donné à chacun, les stratégies d'élimination, et évidemment la base de texte utilisée pour faire les corrélations, le résultat peut varier, mais au final, on ne choisit en général qu'une langue.

Donc, si tu veux que G reconnaisse chaque langue, mon conseil perso c'est (encore une fois) de faire une page pour chaque. Sinon tu peux essayer de mettre un lang=xx sur chaque <div> ou <span> ou <p> ou je ne sais quoi d'autre, mais je n'ai aucune idée sur la façon dont G gère ça (ou pas). En tous cas nous (pour le moment) on ne gère pas ça.

Jacques.
 
WRInaute impliqué
merci Marie-Aude

reponse pour votre question : je cherche dans google.com ( langue français ) je trouve mon site

aussi dans google.es ( langue française ) je trouve mon site .....



un merci speciale pour :
jcaron


merci pour les statistiques

et pour lang=xx sur chaque <div> ou <span> ou <p> ( j'ai utilsée )
 
Discussions similaires
Haut