[Résolu] Gestion des accents par Google pour le positionnement

WRInaute discret
Bonjour,

Je me posais une question par rapport aux caractères accentués (par exemple le "â") et leur prise en compte par Google pour compter les occurrences d'un mot dans une page.

Je m'explique : j'ai sur mon site une recette de cuisine sur la cuisson des pâtes : http://recette-de-cuisine-facile.net/recettes/cuisson-des-pates-commen ... les-pates/

J'ai donc le mot "pâtes" plusieurs fois. Mais quand j'écris mon article dans Wordpress, il me remplace dans le code HTML le mot "pâtes" par "pâtes".

Si j'analyse ma page avec le site outiref, il me compte séparément les occurrences du mot "pâtes" et celles de "pâtes". Il voit donc ça comme des mots différents...

Je me demandais si c'est un pb d'outiref, ou si Google aussi ne les comptera pas ensemble...

Si c'est le cas, que me conseillez-vous ? Existe-t-il un moyen sous Wordpress de désactiver cette conversion des accents ?
J'ai l'impression que dans mon code HTML, j'ai "pâtes" si le mot était dans le titre de l'article ou dans un champ personnalisé, mais qu'il est "pâtes" si il a été saisi dans un editeur de texte riche (j'utilise au passage le plugin "CKEditor for WordPress")

Merci pour vos réponses !
 
WRInaute accro
Re: Gestion des accents par Google pour le positionnement

iempty a dit:
Si j'analyse ma page avec le site outiref, il me compte séparément les occurrences du mot "pâtes" et celles de "pâtes". Il voit donc ça comme des mots différents...

Je me demandais si c'est un pb d'outiref, ou si Google

Cela semble un problème sur ton site.
Ta page envoie un charset UTF8, hors quand je copie colle une partie du mot "pâtes" sur un script iso, il ne m'ouvre pas une fenêtre d'avertissement pour me dire que c'est de l'UTF8 et qu'il ne peut donc pas l'enregistrer.

Bref outiref détecte autre chose que de l'utf 8 dans ta page (normal) et il te compte cela comme un autre mot.
il y a fort a parier que gg face de même.
 
WRInaute occasionnel
Re: Gestion des accents par Google pour le positionnement

A noter (ce n'était pas le problème initial), mais que Trends fait une différence entre pâte et pate, et qu'il n'y en a aucune sur keyword d'adwords....
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

merci zeb, c'est en effet la piste à suivre...
... je galère tjs à comprendre ces histoires d'encodage... bon ben je vais essayer de trouver d'où ça vient !

le truc, c'est que mon WP est configuré en UTF-8, ma base en UTF-8, ma page en UTF-8...
... ça doit être l'éditeur qui convertit en ISO, mais j'ai pas trouvé de config pour changer ça... je vais creuser !

Si vous avez d'autres idées/conseils d'ici là, je suis preneur ! :)
A+
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

bon, je "progresse"...

j'ai décoché une option de CK Editor sous WP qui disait "Using HTML entities in the output.
(Convert all applicable characters to HTML entities)"

Du coup, je n'ai plus de "â" pour coder le â dans le code HTML généré.

Outiref ne me trouve plus 2 mots différents, mais il ne trouve QUE "pâtes" au lieu de "pâtes".

Je comprends pas trop ce qui ne vas pas alors... :
- mon WP, ma base, mon content-type sont en UTF-8
- tout s'affiche bien dans le navigateur (testé avec Firefox)
=>pourquoi outiref (et donc Google certainement) voit "pâtes" (ce qui n'est pas bon du tout j'imagine pour mon référencement sur "pâtes" ?!?

merci pour votre aide !
:)
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

bon je sèche... :(

j'ai bien revérifié :
- options de lecture dans wordpress : UTF-8 => OK
- encodage des tables de ma base : UTF-8 => OK
- content-type (balise meta) dans le code source de ma page HTML générée : UTF-8 => OK
- content-type renvoyé par le serveur dans les header HTTP (vu avec firebug) : UTF-8 => OK
- encodage des fichiers PHP de mon thème : UTF-8 => OK
- désactivation de l'option "Using HTML entities in the output" du plugin CKEditor => OK

D'un point de vue "rendu utilisateur", tout est OK, j'ai de beaux accents partout : "pâtes".
Dans le code source de ma page (si je fais "clic droit" / "voir le code source" avec firefox), j'ai bien "pâtes" et pas d'entités html "â"

Mais outiref, donc certainement google bot, ne voit pas la même chose... il voit toujours "pâtes"...

Que faire d'autre ?!?
En fait, si je mettais des entités HTML "â" partout, outiref verrait ma page avec le mot "pâtes" comme je veux... Ca va pour ce qui est dans un Editeur riche, puisque CKEditor peut le faire si je laisse l'option "Using HTML entities in the output" par défaut... sauf que je vais pas m'amuser à écrire mes articles en convertissant à la main tous les accents dans les autres champs (titre, champs personnalisés, etc...)

Ce serait peut être la solution, trouver comment faire copnvertir en entités HTML les accents partout ailleurs par wordpress... une idée ?
 
WRInaute accro
Re: Gestion des accents par Google pour le positionnement

iempty a dit:
- mon WP, ma base, mon content-type sont en UTF-8
- tout s'affiche bien dans le navigateur (testé avec Firefox)
il faut que tu regarde du côté de la source de ton contenu. Par exemple chez moi mon PC de travail est en UTF8 (linux) bref tous le système de fichier est en UTF8. C'est bien sur pas une fatalité ça peut se paramétrer. Du coup dans mon IDE (éclipse) et sachant que mes sites sont en iso, je coche sur le dossier du projet "iso" a la place de l'héritage proposé qui lui est celui du système de fichier (donc UTF).

Bref si tu colle un truc qui viens de chez toi (ou d'ailleurs) en iso dans un système UTF (et réciproquement) ça va coincer qque part. Cela semble être ton cas.
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

salut zeb,

désolé, mais je crois que j'ai pas tout compris... :roll: qu'entends-tu par "la source de ton contenu" ? si tu peux préciser...

je ne vois pas trop où je pourrais avoir une différence sur le type d'encodage... J'ai déjà vérifié :
- ma base
- la config de WP
- les fichiers PHP source de mon thème (édités sous Windows avec PSPAD, mais je force bien "UTF-8" dans PSPAD comme encodage)
- ... "what else ?" comme dirait l'ami Georges ? :wink:


Sinon, j'ai fait un test intéressant.
J'ai vérifié sous outiref, j'ai analysé les 3 premiers résultats qui sortent dans Google pour la requête "cuisson pates" ou "cuisson pâtes" (ce sont les mêmes).

Le 1er et le 3ème (charset=UTF-8) apparaissent également avec le mot "pâtes" sous outiref.
Le second (charset=ISO-8859-1) apparaît avec "pâtes" sou outiref.
Les 3 sont bien référencés par Google pour la requête "pates" ou "pâtes"...,

Donc finalement je me dis que je me prends peut-être la tête pour rien, car Google semble interpréter et accepter les deux...

Qu'en pensez-vous ?
Ca vaut le coup que je continue à chercher ou mon référencement sera OK si je laisse comme ça ?

Au passage, je suis pas du tout référencé sur "cuisson pates", mais c'est vrai que mon article est assez récent (moins d'une semaine). Il est indexé mais je suis qd même surpris de ne pas être dans les 100 premiers résultats... :(

Merci pour vos retours ! :)
 
WRInaute accro
Re: Gestion des accents par Google pour le positionnement

iempty a dit:
désolé, mais je crois que j'ai pas tout compris...
Tout ce don tu parle sur ton serveur (base, template etc ...) est OK. Je te dis juste que le souci n'est peut être pas là.
Si par exemple tu te connecte chez toi a ton site et que tu copie colle un caractère au mauvais format dans fck, il se peut qu'il passe sur le site. (il sera simplement stocké dans ta base sous la forme cabalistique que tu constate chez outilref).

Bref ce qu'il faut que tu fasse c'est regarder une de tes pages a souci dans le cache de google. si tu constate le problème dans le cache il faut le régler sinon tu peux laisser courir.

L'erreur peut aussi venir d'outilref.
 
Olivier Duffez (admin)
Membre du personnel
Re: Gestion des accents par Google pour le positionnement

tu penses vraiment qu'il y a encore un problème avec ta page ? pour moi tout s'affiche correctement. le pb doit venir de l'outil que tu as utilisé pour tester
tu as par contre un erreur dans ton code Analytics (cf. _setDomainName)
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

Salut WebRankInfo, et merci pour ton message !

J'en profite pour remercier ce forum, j'y reviens de temps en temps quand j'ai une question SEO, et il est toujours autant de qualité et convivial, grâce à ses membres... Félicitations, c'est toujours autant un plaisir de venir ici ! :D

Bon sinon pour résumer, j'ai corrigé mon premier problème qui était d'avoir deux écritures" des mes mots accentués (à cause des conversions automatiques en HTML entities par mon plugin WP FCKEditor)

Mon second "problème" est que l'outil SEO "outiref" m'affiche "pâtes" par exemple au lieu de "pâtes" comme je pensais avoir... mais je me demande vraiment de plus en plus si ce n'est pas un pb de leur côté...

J'ai essayé comme le préconisait zeb d'afficher ma page en cache... bon entre temps je ne la vois plus indexée 8O , mais du coup j'ai essayé avec ma page sur la recette du gâteau au yaourt (avec un "â" : même combat ! ) : Voici la page en cache. Les accents semblent bien affichés. C'est bien cela que tu voulais que je vérifie zeb ?

Je suis aussi allé faire un tour dans mon GWT. J'ai essayé la rubrique "diagnostic / analyser comme Google bot"... je me dis vu le nom que ça doit vraiment représenter ce qu'utilise Google pour son indexation !
Je me retrouve avec le code source de ma page (comme quand je fais "clic droit / Code source de la page" dans Firefox), c'est-à-dire avec de beaux "â" partout... ce qui est plutôt rassurant !

Je crois que je vais donc en rester là et surveiller si ma page est bien indexée dans la semaine, et surtout ensuite si j’apparais au moins dans les 100 premiers résultats... car pour le moment ce n'est pas le cas (ni pour mes pâtes, ni pour mon gâteau au yaourt... les pôvres ! ). C'est pourquoi je m'inquiétais un peu, car sur mes 2 recettes "à accents", les deux sont dans les choux au niveau positionnement...

Je vous tiens au courant de mes "aventures passionnantes" ! :mrgreen:
Bonne soirée à tous et à bientôt.
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

... et bien vu pour le code Google Analytics... !
c'est corrigé, je ne me suis jamais posé de questions car "bizarrement" je retrouvais bien le suivi de mon site dans analytics... curieux...
 
WRInaute accro
Re: Gestion des accents par Google pour le positionnement

iempty a dit:
avec ma page sur la recette du gâteau au yaourt (avec un "â" : même combat ! ) : Voici la page en cache. Les accents semblent bien affichés. C'est bien cela que tu voulais que je vérifie zeb ?
Oui c'est ce que j'aurais fait personnellement si j'avais voulu voir comment google se comporte avec mon site.
J'ai regardé aussi je n'y ai rien vu de mauvais on peut surement conclure que c'est outilref qui bug ou don les scripts ne prennent pas bien en compte le charset.
 
WRInaute discret
Yep !

Je vais donc en rester là et attendre voir si je finis par apparaître à peu près bien positionné un de ces jours...

Au passage, n'hésitez pas si vous voyez des choses "bof" au niveau de mon référencement naturel et si vous avez des conseils à me donner, je suis toujours preneur ! :)

En attendant, je passe mon post à "résolu".
Merci à tous pour votre aide.
 
WRInaute discret
Re: Gestion des accents par Google pour le positionnement

euh... d'ailleurs y'a un moyen de passer un post à résolu ? je trouve pas...
 
WRInaute accro
Re: Gestion des accents par Google pour le positionnement

iempty a dit:
euh... d'ailleurs y'a un moyen de passer un post à résolu ? je trouve pas...
non il n'y a pas mais c'est pas utilisé ici il me semble.
 
Discussions similaires
Haut