Noms des fichiers (URL) : faut-il des accents ?

WRInaute occasionnel
La longueur des chemins d'accès
Autrefois la norme était de 256 caractères maximum pour le stockage du chemin complet des fichiers. Certains navigateurs se limitaient cependant à 80 caractères. La norme est maintenant de 32 767 caractères (NTFS sur Windows NT et suivant). Cette information est en fait donnée par le paramètre de l'lpMaximumComponentLength GetVolumeInformation.

Qu'en est-il des systèmes exotiques ?

Les caractères spéciaux
Les caractères accentués des noms sont autorisés et sont remplacés par un équivalent tiré de la vieille table de correspondance de la norme ISO-8859-1 (dit autrement, ça ne fonctionne que dans les pays latins).

Qu'en est-il maintenant ? Vaut-il mieux un fichier qui s'appelle épée.php ou epee.php ?

Merci pour vos réponses.
 
WRInaute passionné
epee.php

A certains endroits, les lettres accentuées de épée.php seront remplacés par des caractères exotiques, et dans certains cas ça peut poser problème.
 
WRInaute occasionnel
Nous avons réalisé quelques recherches dont voici la synthèse.

Dans l'exemple épée contre epee, il est important de tenir compte de l'évolution des modes dans le temps et du positionnement des concurrents.
90395674.png


On s'aperçoit que :
Le mot épée devient plus recherché que epee.
Le mot épée est plus référencé que epee. 7 420 000 contre 4 770 000.

Faut-il se heurter de front au mot le plus utilisé par les sites et les internautes ? Cela va dépendre de la politique de chacun et du temps dont il dispose pour se positionner.

De plus :
Un nom accentué (épée.php) ne rencontre aucun problème de reconnaissance par les navigateurs. Il peut en provoquer avec certains mauvais outils qu'utilisent certains annuaires.
Un nom de dossier (/épée/) met légèrement plus de temps à être chargé qu'un dossier (/epee/).

Dans cet exemple particulier, on ne peut donc trancher. Il peut être judicieux de créer les deux fichiers simultanément.
 
WRInaute accro
Tu mélanges allègrement deux choses, un référencement et une identification de fichier (en fait d'url, mais tu parles de fichier).
Ta comparaison ne neut rien dire, le mot dans l'url doit être pris en compte avec les éléments on page, le title, les anchors pour pouvoir parler de "référencement".

Quand à parler de "certains mauvais outils qu'utilisent certains annuaires"... je crois que tu sous estimes le problème. Dans un des domaines où je travaille, "le" forum où il faut être n'interprête pas les accents et certains séparateurs.
"Créer les deux fichiers simultanément", cela veut dire faire du duplicate content. Pour un accent ?
 
WRInaute accro
juste un exemple : www.example.com/une-épée et www.example.com/une-epee lequel va vous renvoyer une erreur 404 ?
arrêtez de vous prendre la tête avec les mots clés dans le ndd et l'url. le plus important reste le contenu.
Pour moi, les url descriptives me servent surtout dans mes stats : c'est quand même plus pratique pour suivre le cheminement des internautes plutôt que de savoir que l'internaute a été de la page index.php?id=852 à index.php?id=901
 
WRInaute accro
D'ailleurs il suffit de voir comment WRI a traité l'url... sympa de parler de "certains mauvais outils qu'utilisent certains annuaires" à propos d'un des premiers forums de ref francophone et de phpBB un des scripts de forum les plus populaires...
 
WRInaute occasionnel
Marie-Aude a dit:
référencement et identification de fichier (en fait d'url, mais tu parles de fichier).
Mais que vas-tu chercher !

Lorsqu'un mot clé est présent dans le nom d'un fichier, pour reprendre l'exemple de l'épée si une page s'appelle epee.html (et a donc par exemple une URL http://www.monsite.fr/epee.html), elle sera légèrement moins bien positionnée sur ce mot clé (avec évidemment un contenu parlant d'épée) que si elle s'appelle épée.html. Pour d'autres mots utilisant l'accentuation, cela pourra être l'inverse.

Lorsque le mot clé est vraiment important, il peut également être parfois utile de créer des pages utilisant les unes un nom accentué, les autres pas dixit différents référenceurs. Je veux bien les croire.
Ce sera par exemple :
épée-de-poing.html
epee-de-corps.html

:lol: P.S. : Ne me dit pas que ces épées-là n'existent pas. Si c'est le cas, je veux te croire, car je ne connais strictement rien aux épées.

J'ai l'impression quant à moi que c'est un peu la même discussion qu'entre les mots clés au singulier ou au pluriel. Que ce sont finalement les mêmes genres de règles (et c'est logique) qui s'appliquent.

Marie-Aude a dit:
D'ailleurs il suffit de voir comment WRI a traité l'url
Non ! Comment un outil forum (au demeurant le meilleur) a traité l'accentuation. Ce n'est pas parce que beaucoup de monde croit également à l'astrologie que l'astrologie a raison.
 
WRInaute accro
Bon alors ...
1- la différence entre fichier et url : de nombreuses "pages html" n'existent pas sur le serveur, ou existent sous un nom de fichier qui est modifié par l'url rewriting. (Au passage, on peut utiliser l'url rewriting sans CMS ^^)
2- tu sembles aborder le positionnement d'une page comme un ensemble de critères à additionner, ce n'est pas comme cela que ça marche. Sur ton exemple une url accentuée sera mieux positionnée qu'une url non accentuée, "toutes choses strictement égales par ailleurs". Les autres choses, comme le title, le contenu textuel, ont plus d'importance, et eux auront leur mot clé accentué
3- tu as à choisir entre une url avec accent et le risque réel de générer de nombreuses erreurs 404 sur ton site, et donc globalement d'en dégrader la qualité aux yeux de Google, ou de te passer du petit avantage relatif de l'url accentuée. La problématique est donc totalement différente de "mot clé au singulier / mot clé au pluriel"

Si tu regarde par exemple le mot clé Arménie, tu vois que la première url aux caractères accentués, en dehors de Wikipedia qui est un cas à part, et qui ne peut pas être pris en exemple pour du référencement normal, arrive en 5° page, alors qu'elle provient aussi d'un site à très fort trustrank, yahoo.

Non WRI n'a pas traité une accentuation. phpBB a cassé une url dont il ne comprenait pas les caractères accentués. C'est bien l'url qui est mal comprise.
 
WRInaute occasionnel
:D Et bien voilà. On y arrive.

Pour notre part, nous avons constaté un grand bond en avant en renommant une page caractères-spéciaux.html au lieu de caracteres-speciaux.html. On est passé de 250 à 20 sur le mot clé "caractères spéciaux html". Inversement, une page avec le mot clé "communautés" s'est beaucoup mieux positionnée en passant de communautés.html à communautes.html
 
WRInaute passionné
L'accentuation va en effet poser des problèmes lors d'une reprise du lien par diverses méthodes automatiques, qui risque d'etre tronqué et finalement renvoyer une erreur 404, ce qui est pire.

Si tu prend l'exemple de "épée chinoise" et "epee chinoise" dans google, tu trouvera dans les résultat de la première page un vieux site que j'avais fait pour un ami : martialboutique.com . Tu constatera que le lien de Google se fait sur le NDD du site, qui ne comprends nulle part le mot épée ou epee chinoise, ni dans l'url, ni dans le titre ... C'est pourtant une requête un peu concurrentielle.

Par contre, il est un peu mieux placé sur le mot accentué, pour les raisons que tu as évoquées de meilleur positionnement.
Mais la raison du meilleur placement n'est pas dans l'url, ni dans le titre dailleur. C'est le mot qui constitue le lien (les) , qui est la version avec accent .. toujours bien orthographier le mot puisque google corrige.

Cet exemple prouve qu'il vaut mieux éviter de créer des problèmes avec des urls accentuées et que l'on peu s'en passer efficacement par d'autres méthodes. Une double url serait a mon avis néfaste. Après, chacun prend ses risques.
 
WRInaute accro
phpDesigner a dit:
Lorsque le mot clé est vraiment important, il peut également être parfois utile de créer des pages utilisant les unes un nom accentué, les autres pas dixit différents référenceurs. Je veux bien les croire.
moi non ! 8)
 
WRInaute accro
phpDesigner a dit:
Pour notre part, nous avons constaté un grand bond en avant en renommant une page caractères-spéciaux.html au lieu de caracteres-speciaux.html. On est passé de 250 à 20 sur le mot clé "caractères spéciaux html"

Sur la requête sans guillemets (qui est celle que les gens saisissent) vous êtes en 38° position, il faut aussi savoir taper les requêtes "comme les gens" et pas pour trouver sa page.

Non sérieusement, tu as plein d'autres moyens de promouvoir ta page. A commencer par une structure de titres correcte et optimisée...
 
WRInaute occasionnel
Marie-Aude a dit:
Sur la requête sans guillemets[...]A commencer par une structure de titres correcte et optimisée.
:D Tu le fais expres ou quoi ? Dois-je te répéter une cinquième fois que le site actuel ne date que de 5 mois et était écrit avec un CMS et que nous allons basculer ce weekend ?

Marie-Aude a dit:
tu as plein d'autres moyens de promouvoir ta page.
:lol: Mais là n'était pas la question.
 
WRInaute accro
Non je ne le fais pas exprès. Je prends ton exemple. Soit il est significatif, et dans ce cas là ton positionnement sur "ton site actuel qui ne date que de 5 mois" vaut la peine d'être regardé, soit ça ne sert à rien, et je ne vois pas pourquoi tu en parles ^^


phpDesigner a dit:
Marie-Aude a dit:
tu as plein d'autres moyens de promouvoir ta page.
:lol: Mais là n'était pas la question.

Si puisqu'on parle de positionnement et de référencement
 
WRInaute occasionnel
:lol: Mais si tu le fais expres. Je crois par contre qu'on parle en fait uniquement de nom de fichiers si j'en crois la question initiale. Faudrait demander à celui qui l'a posée.

Avec les mêmes mots sans guillemets, les conséquences sont les mêmes.

Avec le nom de fichier non accentué, nous étions au-delà de 50 pages pour ces 3 mots (sans guillemets). Il nous a été conseillé de mettre les accents. Nous n'avons modifié rien d'autre. En quelques jours, nous avons bondi dans le classement pour arriver vers la position actuelle, 38eme avec les 3 mots (sans guillemet). Cette page est pourtant très très mal écrite et accumule les erreurs. Dans cet exemple il nous apparait donc évident que c'est uniquement l'accentuation du nom du fichier qui a fait la différence.
 
WRInaute accro
phpDesigner a dit:
:lol: Mais si tu le fais expres. Je crois par contre qu'on parle en fait uniquement de nom de fichiers si j'en crois la question initiale. Faudrait demander à celui qui l'a posée.
C'est pas toi ?

phpDesigner a dit:
Avec les mêmes mots sans guillemets, les conséquences sont les mêmes.
Oui et non... on considère en général que les positionnements au delà de 20 ou 30 pages ne sont pas vraiment significatifs

phpDesigner a dit:
Dans cet exemple il nous apparait donc évident que c'est uniquement l'accentuation du nom du fichier qui a fait la différence.
Je n'ai jamais dit le contraire. J'ai juste dit que cet "avantage" léger était contrebalancé par d'autres inconvénients, forts.
 
WRInaute accro
phpDesigner a dit:
Avec le nom de fichier non accentué, nous étions au-delà de 50 pages pour ces 3 mots (sans guillemets). Il nous a été conseillé de mettre les accents. Nous n'avons modifié rien d'autre. En quelques jours, nous avons bondi dans le classement pour arriver vers la position actuelle, 38eme avec les 3 mots (sans guillemet).
en clair, tu es passé du statut d'invisible à quasi inexistant :mrgreen:
 
Discussions similaires
Haut