Charset=iso-8859-1 ou charset=utf-8 ?

WRInaute discret
bonjour à tous,

La question a déjà été traitée en 2004 mais Internet change si vite ...

En ce qui me concerne j'ai tendance à utiliser les Iso en fonction du public visé et vous ?

Un serveur avec des "character set" utf8 ne risque t il pas des plantages avec un site en ISO ? (ou vis-versa)

Merci
@+
 
WRInaute passionné
Hello,

pour ce qui est du serveur, il y a de très grandes chances pour que les 2 jeux installés (ainsi que d'autres) de toutes façons. Bref, il s'en fout sûrement un peu beaucoup.

Coté navigateur je ne sais pas... la plupart gèrent surement l'utf8 depuis longtemps.

Après pour les sites en eux même... je n'ai pas (encore) vraiment de méthodologie ; j'ai même parfois un mix d'utf8 et iso selon les portions du site.
 
WRInaute accro
Moi only utf-8 maintenant. Beaucoup plus simple à gérer je trouve. Le choix n'a rien a voir avec le public visé, c'est juste que tu as la possibilité d'afficher certains caractères selon celui que tu utilises. L'utf-8 peut tous les afficher et ne possède pas de codes spécifiques comme pour l'iso où tu utilises &eacute pour afficher un é. En utf-8 tu tapes é et tu as é ^^
 
WRInaute passionné
+1 ici pour l'UTF-8.

J'ai eu quelques soucis par le passé avec l'encodage d'un de mes sites multilangue : certains caractères ne passaient pas, ou passaient mal en ISO-8859-1.
J'ai beaucoup galéré et beaucoup de caractères sont restés avec des soucis d'affichage...


Maintenant, je passe tous mes sites (ou presque) systématiquement en UTF-8 dès le départ. Faut dire aussi que je me base souvent sur WordPress qui gère l'UTF-8 en natif : ça aide ! :)
 
WRInaute accro
Tout utf-8 partout, beaucoup plus simple pour gérer les bases de données, les includes, et les sites multilingues.

Sachant que c'est uniquement une décision "développeur", pour le référencement ça n'a aucun impact.

A partit du moment où on a des fonctions "internationalisées' soit maison, soit via des techniques comme gettext, ne pas passer en utf-8 c'est se tirer une balle dans le pied.
 
WRInaute discret
merci à tous les Aoutiens :D

En résumé iso c'est bien mais pour éviter les embrouilles passer en utf8
Bien résumé ? 8)

Autre chose: avec un serveur en utf8 et une base en iso, comme le dit Marie-Aude on risque des pb (mot de passe, identifiant =prénom par exemple) ?
 
WRInaute discret
UTF-8 100% aussi. Pas de prises de tête avec les accents sauf au tout début lorsqu'il faut adapter quelques fonctions.
 
Nouveau WRInaute
Si tu encodes les accents proprement avec des entités html,
il n'y aucune prise de tete et tu peux alors utiliser l'encodage que tu veux indifféremment.

C'est ce que je fais, tous les éèàîö etc... sont encodés en entités html.

Ensuite, c'est au cas par cas sur chaque page :
- Si elle a des glyphes, hieroglyphes machin chinois russes => UTF8
- si elle n'en a pas => ISO
 
WRInaute passionné
Idem que beaucoup, UTF-8. Dès le début d'un site ça permet d'avoir un site lisible partout et d'avoir la possibilité de mettre des alphabet aux caractères bizarroïde sans soucis.
 
WRInaute impliqué
Salut,

A mon avis, le seul élément important, c'est d'être cohérent d'un bout à l'autre de la chaîne de transmission de données. Tu peux indiquer à peu près n'importe quel caractère en iso (il me semble) en spécifiant directement son code unicode. Attention, je ne dis pas que c'est souhaitable ou intelligent, je dis que c'est possible.
Donc, si on est capable de fournir un contenu respectant l'encodage qui est indiqué, et de correctement indiquer à chaque fois qu'on transmet des données d'un point à l'autre de la chaîne (bdd à php, php à html, html à client, ajax ...) l'encodage utilisé, ça se passe généralement très bien.

N.B. : Il n'y a aucune raison d'utiliser utf-8 pour les sites en anglais, puisque l'alphabet anglo-saxon est contenu dans iso-8859-1 (voire ascii si on est plus restrictif), et ne comporte pas de caractères accentués.
 
WRInaute passionné
Personnellement, je ne mets pas d'accent, beaucoup plus rapide :p

UTF-8 quand je peux. Sinon, sur un de mes sites, j'utilise un CMS en iso, donc obligé de rester en iso.
Mais sinon, tous mes é à etc. en entités html. Ca permet de changer beaucoup plus rapidement.
 
Nouveau WRInaute
(désolé, je viens de poster ce message sur un autre mais plus ancien (2007), alors je le reposte ici car plus récent et doncje me dis que j'aurai un feedback plus rapide)

Ma question est que un nouveau site web (fait avec le cms typo3) j'ai un template web en UTF-8 mais je voudrais le mettre en charset=iso-8859-1 pour pouvoir gérer facilement les caractères accentués.
Est-ce qu'il y a un inconvénient à passer de UTF-8 vers iso-8859-1 sachant que mon public cible sera surtout francophone (France, Belgique, canada, suisse )
Merci bien de votre réponse.
Laurent.
 
WRInaute passionné
En théorie l'iso-8859-1 ne gère aucun accent... donc oui il y a un gros inconvénient, puisque tu les perds tous.

Pour gérer les accents "français", il y a 3 solutions répandues :
- "windows cp1252" : c'est l'encodage utilisé par windows
- iso-8859-15 : une extension de l'iso-8859-1 qui contient les caractères français, dont l'euro
- l'UTF-8 : universel, qui passe partout ou presque

Et si tu restes en iso-8859-1, il faut y aller à coup htmlentities pour tout convertir au moment de l'affichage.

Généralement quand on ne veut pas se prendre la tête on passe tout en UTF-8 justement.
 
WRInaute occasionnel
Faux, iso-8859-1 (aussi appelé Latin 1) contient les accents.
iso-8859-15 (Latin 9) en comprend encore plus et aussi le symbole euro.
C'est ASCII qui ne contient aucun accent.
 
Discussions similaires
Haut