Charset=iso-8859-1 ou charset=utf-8 ?

Discussion dans 'Administration d'un site Web' créé par metropoway, 21 Juin 2004.

Tags:
  1. metropoway
    metropoway WRInaute discret
    Inscrit:
    3 Mars 2004
    Messages:
    223
    J'aime reçus:
    1
    Bonjour,

    Indépendamment de l'intérêt 'technique' de chacun de ces encodages (qui ferait préféré l'UTF-8), est-il préférable du point de vue du référencement d'utiliser l'un plutôt que l'autre ?

    En effet, avec l'UTF-8 les caractères accentués semblent mal 'lus' par les moteurs.
    Exemple : « Mer méditérannée, Atlantique, plages de sable fin, côtes rocheuses, Corse, Vendée, Bretagne, Espagne ou Italie ».

    La même phrase, dans une page codée en iso-8859-1, est vue 'normalement' par les moteurs : « Mer méditérannée, Atlantique, plages de sable fin, côtes rocheuses, Corse, Vendée, Bretagne, Espagne ou Italie ».

    Est-ce que cela a une incidence réele sur l'indexation et le positionnement d'une page ou bien cela est-il transparent pour les moteurs ?

    Merci
     
  2. SIBELIUS
    SIBELIUS WRInaute occasionnel
    Inscrit:
    21 Décembre 2003
    Messages:
    256
    J'aime reçus:
    0
    Utf-8, c'est pour les caractères anglophones exclusivement (donc pas d'accent ou de caractères spéciaux)

    iso-8859-1, c'est tout simplement le charset de l'Europe occidentale (chez nous quoi). Il faut donc l'utiliser celui là.
     
  3. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    Je ne voudrais pas avoir l'air de te contredire, mais c'est à peu près exactement l'inverse... :?

    UTF-8, c'est l'unicode. Comme son nom l'indique (presque), il permet de coder tous les caractères de toutes les langues de la terre dans un seul jeu.
    8859-1 c'est l'ascii 7 bit au départt, donc pas de caactères accentués par exemple (il faut mettre les joyeusetés du genre &egrumbl;) (ceci dit, on y est habiyué...)
    Edit: "habiyué"... hmmm c'est de quel pays ça ?
     
  4. SIBELIUS
    SIBELIUS WRInaute occasionnel
    Inscrit:
    21 Décembre 2003
    Messages:
    256
    J'aime reçus:
    0
    Ah bon, alors essaye :

    iso :
    Code:
    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">
    <head>
    <title></title>
    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
    <style type="text/css">
    <!--
    
    -->
    </style>
    </head>
    <body>
    et voilà
    </body>
    </html>
    utf8 :
    Code:
    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr" lang="fr">
    <head>
    <title></title>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
    <style type="text/css">
    <!--
    
    -->
    </style>
    </head>
    <body>
    et voilà
    </body>
    </html>
    
    Le premier code (iso) affiche parfaitement l'accent.
    Le second (utf-8) non.
     
  5. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    Et tu as quoi dans le second cas, en UFT-8 ?
    Parce que si tu as un Ã, le problème vient certainement du fait que ton explorer est bloqué en 8859-1. Va dans affichage-> codage et sélectionne "automatique".
     
  6. Bobez
    Bobez WRInaute impliqué
    Inscrit:
    20 Mai 2004
    Messages:
    654
    J'aime reçus:
    0
    Euh, perso j'encode mes pages en iso-8859-1, et les caractères accentués passent tout à fait bien, même si je passe l'encodage de mon browser en utf-8
     
  7. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    C'est normal... ;)
    par contre l'inverse n'est pas vrai puisque l'UTF-8 est par définition beaucoup plus vaste que le 8859-1.

    Bon, mais je ne prône pas l'UTF-8... parce que son gros problème, c'est que 1 explorer sur 2 (pour ne pas dire plus) aura des problèmes à l'affichage à cause de son paramètrage. C'est embêtant... ;)
    (aucun problème avec mozilla)
     
  8. SIBELIUS
    SIBELIUS WRInaute occasionnel
    Inscrit:
    21 Décembre 2003
    Messages:
    256
    J'aime reçus:
    0
    En UTF-8, il m'affiche un caractère spérial : testé sur IE6, IE5.5, Opera 7 et Firefox.
    Pas de soucis avec l'iso avec tous les caractères francophones spéciaux.

    Tu es vraiment sûr de ton coup ?
     
  9. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    J'ai fait un bloc avec ton exemple en UTF-8 et il s'affiche correctement.

    Et quand tu vas sur Google fr, tu vois bien les lignes du bas ou pas ?(publicité... à propos de google) ...parce que la page est en utf-8.
    Observe déjà avec explorer quel codage il prend (affichage->codage).
     
  10. SIBELIUS
    SIBELIUS WRInaute occasionnel
    Inscrit:
    21 Décembre 2003
    Messages:
    256
    J'aime reçus:
    0
    J'ai testé sur ce forum.
    Le navigateur m'affiche un encodage "occidenta"l (iso-8859-1).
    Si je le passe en utf-8, il m'affiche les caractères spéciaux n'importe comment
     
  11. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    Les pages de WRI sont en 8859-1.
    Il faut que tu observes ce qui se passe sur une page en utf-8 : par exemple Google.fr ou dmoz
     
  12. SIBELIUS
    SIBELIUS WRInaute occasionnel
    Inscrit:
    21 Décembre 2003
    Messages:
    256
    J'aime reçus:
    0
    En effet, c'est le phénomène inverse.
     
  13. Bobez
    Bobez WRInaute impliqué
    Inscrit:
    20 Mai 2004
    Messages:
    654
    J'aime reçus:
    0
    De toute façon, si tu fais un site qui s'adresse exclusivement à des français, autant utiliser l'encodage iso-8859-1.
     
  14. Monique
    Monique WRInaute passionné
    Inscrit:
    16 Septembre 2002
    Messages:
    1 154
    J'aime reçus:
    0
    Bonjour,

    Pas simple ces notions de charset, d'unicode :?
    Je ne fait que découvrir en ce moment et je ne pourrais pas facilement résumer les explications données par Anubis.
    Il faut quand même retenir que pour utiliser utf-8, il faut un éditeur capable d'enregistrer en utf-8 et il faut envoyer l'information correctement dans l'en-tête.

    Amicalement,
    Monique
     
  15. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    C'est vrai que pour l'instant, il y a encore beaucoup de problèmes mais l'UTF-8 est une bonne solution quand on veut afficher plusieurs langues avec un même jeu de caractères. Une fois en utf-8, il n'y a théoriquement plus aucune limitation à l'affichage (si ce n'est sous windows de charger les jeux de caractères idoines).

    C'est certainement pour cela que Google ou Dmoz sont passés en utf-8.
     
  16. Bobez
    Bobez WRInaute impliqué
    Inscrit:
    20 Mai 2004
    Messages:
    654
    J'aime reçus:
    0
    Exactement ! Même pour le iso-8859-1, il faut bien faire attention d'enregistrer les pages dans cet encodage. Perso, j'utilise BBEdit sous Mac OS X et c'est vraiment le pied :)
     
  17. metropoway
    metropoway WRInaute discret
    Inscrit:
    3 Mars 2004
    Messages:
    223
    J'aime reçus:
    1
    Tous ces échanges, pour intéressants qu'ils soient, ne répondent cependant pas tout à fait à la question initiale : est-ce que l'encodage utilisé influe sur l'indexation des pages (sur Google et autres) ?

    Merci
     
  18. Remi L.
    Remi L. WRInaute impliqué
    Inscrit:
    6 Septembre 2003
    Messages:
    909
    J'aime reçus:
    0
    A priori: non.
     
  19. thepaut
    thepaut Nouveau WRInaute
    Inscrit:
    8 Octobre 2003
    Messages:
    15
    J'aime reçus:
    0
    la différence entre ISO-8859-1, UTF-8 et Windows-1252 ?

    Je vous conseille vivement le site suivant, pour le respect des standards et pour la clareté de leur explications :
    http://openweb.eu.org/articles/jeux_caracteres/

    Vous saurez tout sur la différence entre ISO-8859-1, UTF-8 et Windows-1252 ...
     
  20. zachbora
    zachbora Nouveau WRInaute
    Inscrit:
    29 Août 2005
    Messages:
    2
    J'aime reçus:
    0
    J'ai effectué un test car je voulais savoir si il pouvais y avoir des différences entre les serveurs.

    Je suis premièrement aller sur google et effectivement ils utilisent bien utf-8, et malgré le codage de IE placé sur UTF-8, les symboles sont là.

    J'ai copier la source sur un de mes sites. http://members.lycos.co.uk/worldcretornica/test.html

    Avec les mêmes options, les charactères sont différents.

    C'est comme si il y avait une autre variable dépendante.

    Je soupçonne le server d'y être pour quelque chose... Le serveur de google.fr est probablement 'français' tandis que mon host est anglais...

    Une enquête approfondit s'impose.
     
  21. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 882
    J'aime reçus:
    0
    Bonjour,

    Explication probable :
    1. La page Google d'origine est codée en UTF-8.
    2. Tu récupères la source et tu l'enregistres sur ton disque local en ISO-8859 ou équivalent.
    3. Tu essaies de réafficher la page qui indique au navigateur UTF-8, mais qui est codée en ISO-8859.

    Jean-Luc
     
  22. nodom
    nodom WRInaute occasionnel
    Inscrit:
    15 Janvier 2005
    Messages:
    281
    J'aime reçus:
    0
    soyons logique
    si une page est enrgistée en utf elle s'affiche bien en utf et mal en iso
    si une page est enrgistée en iso elle s'affiche bien en iso et mal en utf
    si une page est enrgistée en x elle s'affiche bien en x et mal en y

    c'est tout à fait logique non? si une page comportant des accents est enrgistrée en utf. il s'affiche correctement en utf.

    ceci est dit, je crois que les moteurs se débroillent bien pour retrouver les mots quel que soit l'encodage, mais l'affichage dépend de :
    - du codage de la page
    - de la confuguration du poste, navigateur et de la présentation de la page par le moteur.

    maintenant mon avis:
    vous pouvez travailler correctement avec utf, mais vous aurez des problèmes:
    vous deveriez modifier toutes vos page et avoir un éditeur qui permet l'enrgisterement en utf (pas les tag) blocnote le permet.
    après vous auriez quelque problèmes à régler avec mysql.
    conseil: iso.
     
  23. zachbora
    zachbora Nouveau WRInaute
    Inscrit:
    29 Août 2005
    Messages:
    2
    J'aime reçus:
    0
    ce que j'ai fini par faire c'est de mettre toute mes page en UTF8 et de remplacer les characteres speciaux par leur equivalent html. Lorsque je place les infos dans ma DB je laisse les signes mais quand j'affichage, j'utilise une fonction php qui remplace tout les charactere speciaux.
     
  24. touffy-chouchen
    touffy-chouchen Nouveau WRInaute
    Inscrit:
    20 Septembre 2004
    Messages:
    25
    J'aime reçus:
    0
    De plus certains lecteur css préconise l'utf8. Par exemple pour faire un lecteur de flux rss sous flash, il faut que celui ci soit encodé en utf8 pour etre lut correctement.
     
  25. dgavarin
    dgavarin Nouveau WRInaute
    Inscrit:
    26 Novembre 2009
    Messages:
    1
    J'aime reçus:
    0
    je suis tombé par hasard sur ce fil de discussion, si je puis me permettre, on ne peut parler de charset de la page HTML sans parler de l'encoding du flux qui est balancé.

    je m'explique, dans les exemple que j'ai vu plus haut, si un utilisateur lambda cree 2 fichiers textes (par exemple sous windows, avec TextPad ou autre), il va naturellement crée des fichiers "Texte", cad vraiment ANSI, et on aura beau spécifier un encoding "utf-8" les accents seront cassés, mais si par contre ce meme fichier sans rien changé dan le contenu, est maintenant enregistré en encoding "utf-8" alors là le navigateur saura bien interprété l'ensemble des caratères du fichier et là les accents ne seront plus cassés.

    dgavarin
     
  26. kenshuri
    kenshuri Nouveau WRInaute
    Inscrit:
    2 Mai 2010
    Messages:
    4
    J'aime reçus:
    0
    Re:

    en passant par là: Google est américain que soit .be, .fr, .co.uk etc.
     
  27. smorge
    smorge WRInaute occasionnel
    Inscrit:
    17 Juin 2009
    Messages:
    442
    J'aime reçus:
    0
    donc j'ai du mal a suivre : je débute en html et j'ai pris l'habitude de mettre ma page en UFT-8 et de remplacer tous mes caract&egrave;s comme &ccedil;a ! Ca va ou ça sert à rien et mieux vaut que j'encode autrement :? ? (Sur tous les navigateurs et systèmes d'exploitation que j'ai testé ça fonctionne.)
     
  28. luder
    luder Nouveau WRInaute
    Inscrit:
    25 Juin 2010
    Messages:
    1
    J'aime reçus:
    0
    Si vous écrivez charset=utf-8 dans votre fichier index.html, il faut aussi modifier le codage de votre fichier index.html pour le passer en utf-8 ! donc le vrai problème est un problème d'éditeur de texte. En principe un bon éditeur sait faire une conversion, mais encore faut-il savoir comment faire. Je vous propose un test:
    éditer un fichier avec juste deux lettres "éè", sauvegarder, et observer la taille.
    en ISO8859-1 il fait 3 octets, deux lettres et un <EOT>
    en utf-8 il fait 5 octets, deux lettres de deux octets et un <EOT>

    Si vous savez le passer de 3 à 5 octets, et de 5 à 3 octets avec votre éditeur ... tout va bien pour vous.
     
  29. christele2
    christele2 Nouveau WRInaute
    Inscrit:
    7 Août 2010
    Messages:
    2
    J'aime reçus:
    0
    Bonjour,
    Nous vivons dans l'incompréhention totale , je sais combien cela est dur a concevoir,
    mais il se dit dans ce sujet tant de choses erronées ...
    Il faut revenir aux fondamentaux,

    metropoway la réponse a ta question, est que les moteurs traduisent le code des pages en faisant si besoins
    le réencodage entre celui de leur page et celui que tu annonces dans ta page web.

    Alors pourquoi des "caractéres spéciaux curieux" chez google par exemple sur certaines pages ?
    Toujours la même raison, Google passes sur une page déclarée par exemple:
    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> ,
    alors que le texte a un autre encodage ! voila la raison ...

    Donc retiens que dans 99% des cas les pages UTF8 ou iso-8859-1 ou autres ,
    seront bien rendues chez google qui est tout UTF-8 si les pages annoncent leur encodage proprement.


    Alors ces fondamentaux ?

    La réalité est qu' en fait, nous représentons les caractéres selon notre gourmandise

    Quand SIBELIUS dit que
    Utf-8, c'est pour les caractères anglophones exclusivement (donc pas d'accent ou de caractères spéciaux)

    Je crois réver ...

    Du reste toute l'ambiguitée de son test éclaire bien ce que je dis : apparament SIBELIUS
    ne se demandes pas comment s'opére un copié/collé de son "voilà" bien lisible comme ici ,
    je veux dire dans une page de notre forum qui est en UTF-8 que je saches 8O

    Oui Oui entre le copié collé, l'OS qui le prends en mémoire, l'application qui la reçoit etc ...
    il y a un long chemin, avec autant de passages par des réencodages :wink:
     
  30. Tony Monast
    Tony Monast Nouveau WRInaute
    Inscrit:
    12 Août 2009
    Messages:
    19
    J'aime reçus:
    0
    Bonjour,

    Christele, juste comme ça, le message de Sibelius date d'il y a 6 ans, c'est un peu normal d'être étonné de sa réponse sur l'encodage.

    Puis Sibelius, c'est notre bon vieux Raphael d'Alsacreations. Tu as déterré l'un de ses messages préhistoriques. ;)
     
  31. christele2
    christele2 Nouveau WRInaute
    Inscrit:
    7 Août 2010
    Messages:
    2
    J'aime reçus:
    0
    Morte de rire j'étais retombé dessus par Google (concervateur) :D
     
Chargement...
Similar Threads - Charset=iso 8859 charset=utf Forum Date
Comment convertir un site sous SPIP en iso-8859-1 ? Développement d'un site Web ou d'une appli mobile 28 Avril 2011
Encodage utf8 / iso 8859-1 Développement d'un site Web ou d'une appli mobile 28 Février 2011
Mettre de l'iso-8859-1 sur un page en utf8 Développement d'un site Web ou d'une appli mobile 17 Juin 2010
Mon code source est en iso-8859-1 pourquoi corriger en us-ascii ? Débuter en référencement 21 Novembre 2009
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice