problème d'accents dans résultats de recherche google

canibals

Nouveau WRInaute
Bonjour
je m'occupe du site camping-lasirene.fr et j'ai une problème d'accents sur google
quand je tape "camping la sirene" sur google dans le résultat le caractere è est remplacé par č
par contre une fois le site ouvert pas de problèmes ...

voici mon code d'entète de page :

Code:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">
<head>
<title>Camping France La Sirène 4* Argelès-sur-mer vacances location mobil home sud camping club 4 étoiles bord de mer </title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

si vous avez une idée je suis preneur

merci !
 

canibals

Nouveau WRInaute
oui cela est une bonne méthode, mais normalement même en mettant é à la place de
Code:
&eacute;
cela passe lors de l'inexation, c'est la première fois que cela me le fait !

encore merci
 

jcaron

WRInaute accro
Normalement si ton "charset" correspond à celui utilisé pour le fichier, ce n'est pas nécessaire d'utiliser des entités html pour les caractères accentués.

Le "è" a le code hexa e8 en ISO-8859-1. Le "č" a le même code en ISO-8859-2. Donc ça veut dire que quand Google a analysé ta page, il a considéré qu'elle était en ISO-8859-2 (ou alors ta page a été convertie en UTF-8 a un moment donné, en considérant que la source était en ISO-8859-2). Plusieurs possibilités:
- une typo faisait que tu indiquais effectivement ISO-8859-2 plutôt qu'ISO-8859-1?
- tu ne précisais rien, et Google a essayé de deviner, et il s'est trompé (ça me paraît peu vraisemblable, mais ça peut arriver);
- tu as converti en UTF-8 mais la conversion a considéré que le fichier de base était en ISO-8859-2

A l'heure actuelle ton fichier, outre avoir les caractères encodés sous forme d'entités html, indique bien le charset ISO-8859-1, mais je ne sais pas si c'était le cas quand Google est passé la dernière fois? Le cache de Google semble donne des infos contradictoires, et je ne sais pas dans quelle mesure ils rebalancent exactement tel quel ce qu'ils ont récupéré, ou s'ils font de la conversion UTF-8 en chemin.

Jacques.
 

Discussions similaires

Haut