url incompréhensible pour google ?

WRInaute occasionnel
google vient de me virer toute mes urls codé avec rawurlencode() du type -http://www.loupetiart.org/stan-un%20%e9pisode%20de%20mes%20vacances/
J'ai l'impression qu'il a du mal à comprendre les accents genre é -> %e9

Je pense que google les avaient indexé ces pages avant mais là j'ai un doute,
celà vient t'il du fait que %e9 ne soit pas valide (car celà s'ecris normalement %E9).

Pourquoi quand je veux essayé à grande échelle si google tient compte des accents dans els urls je me plante lamentablement ? Conclusion le rawurlencode() pour faire des urls c'est pas la joie.
 
WRInaute impliqué
Le problème ne vient pas de rawurlencode car %e9 est tout à fait valide. Le problème vient du fait que %e9 correspond à un encodage ISO-8859-x et Google utilise UTF8 donc %3c%e9.

Pour éviter ce genre de problèmes:
- ne pas utiliser de caractères spéciaux dans les url
- utiliser toujours l'équivalent html des caractères spéciaux dans les pages
 
WRInaute occasionnel
bon je vais suprimé tout les accents et mettre des tirets à la place des espaces, t'as gagné google !!!
Plus qu'a créer la correspondance url/identifiant de l'article dans une table.
Même chose pour le forum. Bouh et j'ai plus qu'une nuit pour faire ça, je pars travailler demain.
Moi je vous dit à trop vouloir otpimisé on se fini par se tuer !
 
WRInaute passionné
Les espaces et apostrophes passent bien, avec des %... qui sont des references a leur codage ASCII. Pour les caracteres avec accents, comme il n'y a pas 1 seul code ASCII, ca doit davantage coincer.
 
Discussions similaires
Haut