.htaccess et index Google

WRInaute discret
Bonjour,

Comme j'ai finalement un doute, je préfère poser la question...

le contexte:
Voilà, mon CMS "comprend" et "génère" des pages html avec '_' (le bougre ne supporte pas les '-', le changer est en cours de réflexion, mais va demander un temps certain).
Donc pour l'instant je voulais trouver un contournement pour bien faire indexer mes pages truc-machin.htm.

Donc j'ai :

-changé les noms de fichier sur le site pour des 'truc-machin.htm'
-ajouté une règle ds le ht access, format: RewriteRule ^ truc_machin.htm truc-machin.htm

le site fonctionne, donc pour moi tout allait bien.

mon doute:

j'ai voulu refaire le site map, j'ai utilisé un outil automatique (oui je suis fainéant) et il m'a généré un liste de lien qui correspond à 'truc_machin.htm' et non pas 'truc-machin.htm'

Est ce que Google utilise aussi le .htaccess pour le référencement ? ou scrute directement les répertoires (après avoir lu le fichier robot)
-si oui, ce que j'ai fait ne sert à rien alors ? j'aurais pu réécrire directement les noms ds .htaccess ?
 
WRInaute discret
jacquesM a dit:
j'ai voulu refaire le site map, j'ai utilisé un outil automatique (oui je suis fainéant) et il m'a généré un liste de lien qui correspond à 'truc_machin.htm' et non pas 'truc-machin.htm'

Est ce que Google utilise aussi le .htaccess pour le référencement ? ou scrute directement les répertoires (après avoir lu le fichier robot)
-si oui, ce que j'ai fait ne sert à rien alors ? j'aurais pu réécrire directement les noms ds .htaccess ?

Bonjour,

Google "n'utilise" pas le .htaccess, le seul qui l'utilise, c'est ton serveur Apache. Google trouve les adresses qui sont dans tes pages, tout comme l'outil de génération de sitemap. Si cet outil a trouvé ces adresses contenant des "_", c'est qu'elles sont retournées par le serveur au navigateur ou robot qui parcourt le site.
Tu as renommé tes fichiers, mais as-tu changé tous les liens dans les pages qui pointaient vers les fichiers avec "_" ?
Le serveur retourne une page avec "-" si on lui demande (rewriting), mais il retourne celles avec "_" aussi, si on les lui demande.
 
WRInaute accro
Tout ça pour mettre des tirets dans les URLs ?
C'est pas un peu tiré par les cheveux ?

Tu vas y perdre plus que ce qu'il n'y a à y gagner.
 
WRInaute passionné
clair c'est mettre le carnavlat de type web 2.0 dans le cms ça ...
Surtout qu'une url avec ou sans tiret ne change casi rien au ref
 
WRInaute accro
Certes le poids des mots-clés dans l'url tend à se réduire de plus en plus. Mais quitte à réécrire une url, mieux vaut utiliser en effet le -, qui lui est considéré comme un séparateur de mot, tandis que le _, malgré les annonces de Google, ne l'est toujours pas semble t'il.

Pour le reste, +1 Bigbangbel.
 
WRInaute discret
Bigbangbel a dit:
Bonjour,

Google "n'utilise" pas le .htaccess, le seul qui l'utilise, c'est ton serveur Apache. Google trouve les adresses qui sont dans tes pages, tout comme l'outil de génération de sitemap. Si cet outil a trouvé ces adresses contenant des "_", c'est qu'elles sont retournées par le serveur au navigateur ou robot qui parcourt le site.
Tu as renommé tes fichiers, mais as-tu changé tous les liens dans les pages qui pointaient vers les fichiers avec "_" ?
Le serveur retourne une page avec "-" si on lui demande (rewriting), mais il retourne celles avec "_" aussi, si on les lui demande.

non je n'ai pas réécrit les liens internes car ils sont générés par le CMS, par ailleurs c'est pas trop le souci, enfin je pense, ce qui m'intéresse ce sont les url visibles depuis la racine et qui seront indexées par Google, donc avec un séparateur.
Merci.
 
WRInaute discret
parce que tu crois que que ça va influencer GG ?
Renseigne-toi un peu sur le fonctionnement d'un moteur de recherche, juste pour voir...
 
WRInaute accro
En fait ce qu'on essaie de t'expliquer c'est que c'est bien beau d'avoir mis les règles de réécritures en place, il faut aussi changer les url utilisées dans ton code source de manière à remplacer les anciennes par les nouvelles.
 
WRInaute discret
UsagiYojimbo a dit:
En fait ce qu'on essaie de t'expliquer c'est que c'est bien beau d'avoir mis les règles de réécritures en place, il faut aussi changer les url utilisées dans ton code source de manière à remplacer les anciennes par les nouvelles.

pourquoi les changer dans le code? je veux bien une explication... tu me dis si je me trompe, mais dans le code je conserve les urls avec les underscore (dans les liens de menus) il va indexer ces pages avec underscore, mais celle ci sont moins interessantes (en tant que reference)


Bigbangbel a dit:
parce que tu crois que que ça va influencer GG ?
Renseigne-toi un peu sur le fonctionnement d'un moteur de recherche, juste pour voir...

je crois que je me renseigne, c'est un peu le sens de ma question ;-) si tu as une adresse qui explique clairement les arcanes, alors je suis preneur, car ce que je trouve reste très très superficiel....merci

Alors pourquoi ne serait il pas influencé? les urls avec underscore ne sont pas pris en compte comme séparateur... alors que les tirets, oui.
 
Discussions similaires
Haut