Comment écrire en HTML les lettres avec accents ?

Nouveau WRInaute
Bonjour,

J'ai créé un site en français. Tous les fichiers sont encodés en UTF-8.
En écrivant les textes en HTML, je ne remplaçais pas les lettres comme à, é, è, ù etc avec les codes spéciaux.
Pourtant, ils sont tous bien visualisés une fois dans le web.
Juste une petite chause me gène : le VALIDATOR TOOL me donne une alerte suivante:
Byte-Order Mark found in UTF-8 File.
The Unicode Byte-Order Mark (BOM) in UTF-8 encoded files is known to cause problems for some text editors and older browsers. You may want to consider avoiding its use until it is better supported.

Est-ce que ça peut être lié ?
Si oui, comment doit-on écrire les textes en français en HTML ? Je croie que c'est trop dur de remplaçer chaque lettre accentuée avec un code à la main. Il devrait y avoir une méthode automatisée... Non ?
Merci pour vos réponses.
 
WRInaute impliqué
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.
 
WRInaute accro
Vap a dit:
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.
Ha, c'est nouveau?? c'est plutot l'inverse..en iso tu es obligé d'encoder les caratères spéciaux, pas en utf8
 
WRInaute impliqué
bproductiv a dit:
Vap a dit:
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.
Ha, c'est nouveau?? c'est plutot l'inverse..en iso tu es obligé d'encoder les caratères spéciaux, pas en utf8

Ben non c'est pas nouveau. Il y a plusieurs formats iso, et celui que je donne contient les lettre accentuées utilisées en français ... :

http://www.validome.org/doc/HTML_fr/internationalisation/jeux_caracteres.htm
 
WRInaute passionné
bproductiv a dit:
Vap a dit:
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.

Ha, c'est nouveau?? c'est plutot l'inverse..en iso tu es obligé d'encoder les caratères spéciaux, pas en utf8
Ben oui, Vap a raison.

En passant en charset=ISO-8859-1, il n'y a pas besoin d'encoder les caractères spéciaux comme les lettres accentuées puisque ça prend en compte les caractères type Europe de l'ouest (donc notre écriture inclue). :wink:
 
Nouveau WRInaute
Vap a dit:
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.
Mais ça marche très bien avec UTF-8 aussi. A quoi changer ?
C'est le BOM qui me gène seulement.
 
WRInaute impliqué
Anna Nilova a dit:
Vap a dit:
Tu peux aussi utiliser charset=ISO-8859-1 au lieu de UTF-8. Tu peux utiliser directement les lettres accentuées dans ce cas.
Mais ça marche très bien avec UTF-8 aussi. A quoi changer ?
C'est le BOM qui me gène seulement.

Tu pose une question:

Anna Nilova a dit:
Si oui, comment doit-on écrire les textes en français en HTML ? Je croie que c'est trop dur de remplaçer chaque lettre accentuée avec un code à la main. Il devrait y avoir une méthode automatisée... Non ?

J'y répond, c'est tout... Avec le jeux de caratère ISO latin1 (celui que je te conseille), il n'y a aucun des problèmes que tu te pose.

Si la réponse ne te conviens pas, tant pis, mais elle est correcte quand même.
 
Nouveau WRInaute
Dan_A a dit:
Il suffit ici de sauvegarder ses fichiers en utf-8 sans BOM (voir options de sauvegarde de l'éditeur).

Pourriez-vous expliquer plus ?
J'écris en Bloc Notes ; quand j'enregistre le Bloc Notes me permet de choisir le nom de fichier et le codage (ANSI, Unicode, Unicode big endian, UTF-8). C'est tout. Où chercher les options de sauvegarde qui permetteraient de sauvegarder sans BOM ?

Merci
 
Nouveau WRInaute
Vap a dit:
Tu pose une question:
Anna Nilova a dit:
Si oui, comment doit-on écrire les textes en français en HTML ? Je croie que c'est trop dur de remplaçer chaque lettre accentuée avec un code à la main. Il devrait y avoir une méthode automatisée... Non ?
J'y répond, c'est tout... Avec le jeux de caratère ISO latin1 (celui que je te conseille), il n'y a aucun des problèmes que tu te pose.

Si la réponse ne te conviens pas, tant pis, mais elle est correcte quand même.

Cher Vap, je n'ai pas voulu te vexer, je suis désolée, pardonne-moi. Je voudrais juste comprendre : est-ce que le changement d'encodage en ISO latin1 rectifiera le souci avec BOM ? (parce que pour le reste c'est bon avec UTF-8 aussi)

Tu vois, mon site est encodé entièrement en UTF-8 (il est aussi traduit en russe et en anglais). Ca se fait de mettre une partie de site (française en l'occurence) en un autre encodage ?
 
WRInaute impliqué
Anna Nilova a dit:
Cher Vap, je n'ai pas voulu te vexer, je suis désolée, pardonne-moi. Je voudrais juste comprendre : est-ce que le changement d'encodage en ISO latin1 rectifiera le souci avec BOM ? (parce que pour le reste c'est bon avec UTF-8 aussi)

Tu vois, mon site est encodé entièrement en UTF-8 (il est aussi traduit en russe et en anglais). Ca se fait de mettre une partie de site (française en l'occurence) en un autre encodage ?

Chère Anna,

je ne suis pas vexé, rassures toi.

Je te suggere de sauvgarder ton fichier en encodage ASCII, et de mettre le jeux de caractere ISO Latin dans ton en tete. Par exemple, voici le début de mes pages HTML:

Code:
    <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />

Pour les pages en anglais, tu peux laisser le meme encodage. Pour le russe il faut utiliser ISO-8859-2, comme indiqu" sur la page : http://www.validome.org/doc/HTML_fr/internationalisation/jeux_caracteres.htm

Si tu veux tout sur la même page, il faut soit encoder les lettres, soit utiliser unicode, soit UTF-8...
 
WRInaute impliqué
bproductiv a dit:
Qu'on m'explique :
http://fabrik-numerique.com/_test_/iso.php
http://fabrik-numerique.com/_test_/utf8.php
les caractères ne sont pas encodés dans les deux pages (voir source).
Alors soit je comprend rien, soit je comprend rien :|

Je ne sais pas ce que tu voudrais voir. Dans la page de test que tu donne, le source ne contient pas é ni è.

Regarde la page d'accueil de mon www. Est-ce que tu vois des accents ou pas? Par exemple dans le menu à gauche, il devrait y avoir Nouveauté avec un accent sur le e final. Pourtant je n'ai pas encodé les caractères.
 
WRInaute accro
Ben pourtant c'est la même source..je ne change que l'encodage, étrange (j'avais pas regardé la source une fois uploadé).
Enfin ce que je voulais te faire voir c'est qu'en utf8 tu n"encode pas non plus..
 
WRInaute impliqué
bproductiv a dit:
Ben pourtant c'est la même source..je ne change que l'encodage, étrange (j'avais pas regardé la source une fois uploadé).
Enfin ce que je voulais te faire voir c'est qu'en utf8 tu n"encode pas non plus..

Tu as surement raison pour UTF8, je ne connais pas bien car je ne m'en sert pas.
 
WRInaute discret
J'écris en Bloc Notes ; quand j'enregistre le Bloc Notes me permet de choisir le nom de fichier et le codage (ANSI, Unicode, Unicode big endian, UTF-8 ). C'est tout. Où chercher les options de sauvegarde qui permetteraient de sauvegarder sans BOM ?
Il semble que l'option Unicode sauvegarde en ucs-2 little endian, Unicode big endian en ucs-2 big endian, utf-8 en utf-8 avec BOM. L'option Unicode devrait convenir avec le français. Je pense néanmoins qu'il vaut mieux changer d'éditeur. Notepad++, par exemple - option Format, donne le choix en clair même si tout n'est pas parfait.[/quote]
 
Nouveau WRInaute
Vap a dit:
Si tu veux tout sur la même page, il faut soit encoder les lettres, soit utiliser unicode, soit UTF-8...

Bon, je vais suivre ton conseil, Vap.
Alors, j'ai mis l'encodage ANSI (non ANSII car le BlocNotes me propose seulement ANSI, j'espère ce n'est pas grâve... (?)... ), et dans les balises meta charset=ISO-8859-1. Et toute de suite, le mot "russe" (en russe bien évidemment, le lien vers la version russe) est devenu "?????". Pourrais-tu me dire STP comment encoder ces lettres ? Peut-être peux-tu me filer un bon lien pour des tableaux de codes ?
Merci
 
WRInaute accro
UTF8 c'est justement pour l'internationalisation...on peut tout coder avec du russe au chinois en passant par l'arabe..bref c'est LA solution.
 
WRInaute impliqué
bproductiv a dit:
Enfin ce que je voulais te faire voir c'est qu'en utf8 tu n"encode pas non plus..
Ben écoute, je suis obligé d'encoder mes "é" en "&eacute;" (pour donner un exemple) sur mon www sinon ils ne s'affichent pas (ou alors je me plante et les faire afficher via ce code ce n'est pas encoder).
 
WRInaute accro
darkjukka a dit:
bproductiv a dit:
Enfin ce que je voulais te faire voir c'est qu'en utf8 tu n"encode pas non plus..
Ben écoute, je suis obligé d'encoder mes "é" en "&eacute;" (pour donner un exemple) sur mon www sinon ils ne s'affichent pas (ou alors je me plante et les faire afficher via ce code ce n'est pas encoder).
pourtant dans ta source ils ne sont pas encodés :
<strong>Marcus</strong> vient d'être accepté comme professeur de guitare
 
WRInaute impliqué
Ah oui exact, je n'avais pas fait attention à ce point là.

Bizarre comme tu dis oui, je ne vois pas pourquoi les menus passe bien et pas le contenu.
 
WRInaute impliqué
Anna Nilova a dit:
Vap a dit:
Si tu veux tout sur la même page, il faut soit encoder les lettres, soit utiliser unicode, soit UTF-8...

Bon, je vais suivre ton conseil, Vap.
Alors, j'ai mis l'encodage ANSI (non ANSII car le BlocNotes me propose seulement ANSI, j'espère ce n'est pas grâve... (?)... ), et dans les balises meta charset=ISO-8859-1. Et toute de suite, le mot "russe" (en russe bien évidemment, le lien vers la version russe) est devenu "?????". Pourrais-tu me dire STP comment encoder ces lettres ? Peut-être peux-tu me filer un bon lien pour des tableaux de codes ?
Merci

Comme je l'ai dit plus haut, si tu veux a la fois du russe et du français sur la meme page, ISO ne sufit pas. Il reste UTF ou Unicode. Désolé.
 
Nouveau WRInaute
Vap a dit:
Comme je l'ai dit plus haut, si tu veux a la fois du russe et du français sur la meme page, ISO ne sufit pas. Il reste UTF ou Unicode. Désolé.
Dan_A a dit:
Il suffit ici de sauvegarder ses fichiers en utf-8 sans BOM (voir options de sauvegarde de l'éditeur).

Bon, voilà le dilemme: je veux bien rester avec l'UTF-8, cela me convient tout à fait, mais je n'ai toujours pas résolu mon problème de BOM (voir mon tout premier message).
Pourrait quelqu'un enfin me dire où trouver ces options de sauvegardage de l'editeur ? Et qu'est-ce que c'est que ce BOM ?? :roll:
Mille mercis !!!
 
WRInaute passionné
Anna Nilova a dit:
Bon, voilà le dilemme: je veux bien rester avec l'UTF-8, cela me convient tout à fait, mais je n'ai toujours pas résolu mon problème de BOM (voir mon tout premier message).
Pourrait quelqu'un enfin me dire où trouver ces options de sauvegardage de l'editeur ? Et qu'est-ce que c'est que ce BOM ?? :roll:
Quel éditeur utilises-tu ???

Avec Notepad++, dans le menu "Format", tu as une fonction "Encoder en UTF-8 (sans BOM)". Il suffit donc tout simplement de cliquer dessus pour rendre la fonction active. :wink:
 
Nouveau WRInaute
Pandore a dit:
Quel éditeur utilises-tu ???
Avec Notepad++, dans le menu "Format", tu as une fonction "Encoder en UTF-8 (sans BOM)". Il suffit donc tout simplement de cliquer dessus pour rendre la fonction active. :wink:

Bloc-notes (je crois que c'est la version française de Notepad). Mais il n'est pas ++ . C'est un Bloc-notes version 5.1 livré dans le pack avec Windows XP Edition Familiale et tout...
Dans le Format il y a seulement Retour automatique à la ligne et Police...
Une idée quelconque ?
 
Discussions similaires
Haut