Codage hexadécimal des caractères spéciaux dans l'URL

WRInaute occasionnel
Je souhaite avoir une url qui sécrirait en ASCII :

monsite.com/A_côté_d'ici/St-Antoine-l'Abbaye [1]

Il est très fortement déconseillé, pour des questions d'internationalisation, de coder directement les caractères spéciaux tels que accents, apostrophes ...

Il est recommandé, à ma connaissance, de coder ces caractères sous la forme %xx, xx étant la valeur hexa du code ASCII. Cela donnerait :

monsite.com/A_c%f4t%e9_d%27ici/St-Antoine-l%27Abbaye.html [2]

puisque ô == %f4, é == %e9, et ' == %27.

Je sais, c'est infiniment illisible. Mais ce n'est pas mon vrai souci : GG, dont on suppose qu'il recherche les mots-clé dans les URL, va-t-il y retrouver dans [2] les mots-clef présents dans [1] :( ?

Je pense que la question peut être positive, il suffit d'aller voir quel codage DMOZ fait de ses URLs, toutes en UTF-8.

Merci !
 
WRInaute occasionnel
Mon problème est que l'url est interprétée par un script PHP qui la met en titre <h1> de la page. J'aimerais conserver quelque chose qui ressemble à du français ...

Si je fais sauter tous les accents, je n'ai plus aucun moyen de les y replacer ultérieurement, c'est imparable.
 
WRInaute impliqué
Si l'objectif est de positionner ton site sur les mots clés "A côté d'ici St-Antoine-l'Abbaye", l'url que je t'indique y contribuera un peu, mais pas moins (voire même plus?) que celle que tu proposes
 
WRInaute impliqué
loobot a dit:
Mon problème est que l'url est interprétée par un script PHP qui la met en titre <h1> de la page. J'aimerais conserver quelque chose qui ressemble à du français ...

Si je fais sauter tous les accents, je n'ai plus aucun moyen de les y replacer ultérieurement, c'est imparable.
Pour ce point effectivement, si tu n'as rien d'autre que l'URL pour créer ta <h1> c'est un problème. Ne peux tu pas créer une table de correspondance entre les url (sans accents) et les <h1> (avec accents)? C'est ce que je fais sur le site dans ma signature: tu peux jeter un oeil.
 
WRInaute occasionnel
J'ai effectivement, parmi les solutions disponibles, envisagé de travailler avec une table de correspondance. Mais cela va représenter un travail assez important vu le nombre très important de répertoires.

Je serais obligé d'automatiser la génération de cette table. C'est toujours possible, mais enfin ... avant de m'engager dans ce développement j'aurais souhaité m'assurer que le jeu en valait bien la chandelle, autrement dit que le codage sans accent me serait bénéfique en terme de mots-clé.
 
WRInaute occasionnel
Bon, allez, je suis trop gentil ... Je vais me fendre d'un appel à str_replace() pour convertir mon url lisible par les robots en une url qui correspond à mon arborescence.

Que ne ferait-on pas pour plaire à ces petits bots ...
 
WRInaute impliqué
loobot a dit:
Bon, allez, je suis trop gentil ... Je vais me fendre d'un appel à str_replace() pour convertir mon url lisible par les robots en une url qui correspond à mon arborescence.

Que ne ferait-on pas pour plaire à ces petits bots ...
Oui, ce n'est pas si lourd que ça. Et plus sur de plaire aux bots (bien que je ne sois pas formel sur le fait que ton idée leur aurait déplu)
 
Discussions similaires
Haut