Problème caractères bizzares dans Google (encodage...?)

Nouveau WRInaute
Salut à tous,
Je suis nouveau sur le forum, c'est mon premier post, j'espère que je serai bien accueilli et que je pourrais aussi aider du monde à l'occasion !

Donc voila mon souci :
J'ai crée un site (qui propose des quizs sur les people) avec Wordpress (fortement modifié).
J'ai choisi l'encodage UTF-8 vu que c'est conseillé d'après l'aide de Wordpress etc...
Tout se passe bien à l'affichage de mon site dans les browsers. Les caractères accentués passent bien etc...
Mais j'ai un souci avec Google qui m'indexe des pages avec des caractères bizzares, genre caractères chinois.
Voir ici mes pages indexées : https://www.google.fr/search?q=site...avclient-ff&ie=UTF-8&rlz=1B3GGGL_frFR249FR249
Vous pouvez constater normalement le souci avec les accents, etc...
Pourtant dans les pages j'ai bien cette ligne dans l'entête :
Code:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

De plus certaines pages n'ont pas ce problème. Par exemple dans la 3ème page de résultats à partir du lien ci-dessus, j'ai un quiz "Célébrités à la plage" qui est indexé correctement.
Je suis donc perdu !
Est-ce que vous auriez une piste ?

Merci beaucoup
 
WRInaute accro
alerte-au-feu a dit:
Salut à tous,
Je suis nouveau sur le forum, c'est mon premier post, j'espère que je serai bien accueilli et que je pourrais aussi aider du monde à l'occasion !

Donc voila mon souci :
J'ai crée un site (qui propose des quizs sur les people) avec Wordpress (fortement modifié).
J'ai choisi l'encodage UTF-8 vu que c'est conseillé d'après l'aide de Wordpress etc...
Tout se passe bien à l'affichage de mon site dans les browsers. Les caractères accentués passent bien etc...
Mais j'ai un souci avec Google qui m'indexe des pages avec des caractères bizzares, genre caractères chinois.
Voir ici mes pages indexées : https://www.google.fr/search?q=site...avclient-ff&ie=UTF-8&rlz=1B3GGGL_frFR249FR249
Vous pouvez constater normalement le souci avec les accents, etc...
Pourtant dans les pages j'ai bien cette ligne dans l'entête :
Code:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />

De plus certaines pages n'ont pas ce problème. Par exemple dans la 3ème page de résultats à partir du lien ci-dessus, j'ai un quiz "Célébrités à la plage" qui est indexé correctement.
Je suis donc perdu !
Est-ce que vous auriez une piste ?

Merci beaucoup

Essaie une validation W3C de tes pages, tu verras qu'il y a un problème de mélange UTF-8 et non-UTF-8 (en particulier le commentaire des blocs Adsense genre "créé le..." ou "date de création ..." ou "désactivé pour le moment" que tu as collé en ISO). Vire ces commentaires (ou au moins juste les caractères accentués correspondants, ou mets-les bien en UTF-8), et vois si tu passes la validation W3C dans ce cas (t'as encore du boulot!).

Jacques.
 
Nouveau WRInaute
OK merci pour ta réponse.

Effectivement pour les commentaires où j'avais mis des accents c'était une mauvaise idée... J'ai supprimer tout ca.

Ensuite j'ai bossé 2,3 heure pour passer la validation W3C et c'est bon !!!
http://validator.w3.org/check?uri=http% ... ne&group=0
Je passe la validation avec succès alors que j'avais plus de 80 erreurs, je suis content !
Il me reste juste des erreurs quand j'incorpore du flash venant de Dailymotion par exemple, mais par souci de maintenance facile je vais pas modifier le code qu'ils proposent.

Voila j'ai aussi modifié mon fichier Robots.txt pour que GoogleBot d'indexe pas mon sous-répertoire /tag (qui produit une page pour chaque nouveau mot-clés publié), afin que Google s'intéresse plus à mes pages "importantes".

J'espère donc qu'avec tout ca mes soucis vous disparaitre !
 
Discussions similaires
Haut