Comment éviter les contenus dupliqués (avec/sans le www)
Par Olivier Duffez, mercredi 26 octobre 2005
La plupart des webmasters n'y font pas attention, mais leur site est souvent accessible en tapant le nom de domaine avec ou sans le sous-domaine www. Ceci peut poser des problèmes car les moteurs pourraient indexer un duplicata du site. Explications...
Imaginons que votre site soit www.example.com : savez-vous qu'il y a de fortes chances pour que votre site soit également accessible à l'adresse http://example.com (sans le www) ? Il suffit alors d'un seul lien vers votre site pointant vers cette adresse pour que les moteurs indexent votre site à la fois avec et sans le sous-domaine www. Dans ce cas, vous aurez sans doute de gros problèmes de contenus dupliqués.
La solution est d'utiliser une règle de réécriture sur le serveur, qui redirigera automatiquement vers la bonne version. A vous de choisir si vous préférez exploiter le nom de domaine avec ou sans le sous-domaine www, mais tenez-vous en à ce choix.
Pour forcer le sous-domaine www (et interdire l'indexation du site sans ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]
Selon les cas, vous devrez peut-être retirer le / à la fin du domaine, comme ceci :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]
Au contraire, pour supprimer le sous-domaine www (et interdire l'indexation du site avec ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]
Attention aux cas particuliers, notamment si vous avez des sous-domaines (autres que www). Voyez la discussion dans le forum...
J'ai lu sur des forums que certains pensent que ça peut être une cause des problèmes liés à la dernière mise à jour (Jagger). J'ai du mal à y croire, ce problème existant depuis longtemps...
Si vous avez besoin d'aide, posez votre question dans le forum URL Rewriting et .htaccess, dans la discussion Interdire example.com et obliger www.example.com

Ajoutez ce blog à vos favoris Technorati !




Commentaires
1. Le lundi 31 octobre 2005 à 00:27, par Malin dejour
2. Le mardi 1 novembre 2005 à 03:08, par Matt
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.
A lire aussi dans l'actualité WebRankInfo
Après l'épisode concernant le nom de domaine webrankinfo.com, j'avais indiqué que je ferai un petit retour d'expérience. J'ai enfin eu un peu de temps pour rédiger quelques conseils pour éviter aux webmasters de se faire voler leurs noms de domaine. Je fournis également quelques pistes pour récupérer un nom de domaine qui aurait été volé...
Si vous êtes webmaster ou référenceur, vous avez sans doute déjà essayé de connaître le nombre (et la liste) de pages indexées de votre site avec la commande
site:de Google. Voici une précision à connaître...Google Base est donc officiellement sorti la semaine dernière : comment en profiter ? Certains pensent déjà à importer tout leur blog dans Google Base : réflexions.
Le problème se pose pour tous les sites et tous les moteurs qui doivent les indexer : faut-il indexer un site (en nom de domaine) avec www ou sans ? Dans la plupart des cas, même si le webmaster a prévu que son site devait être consulté sous la forme www.example.com et non example.com, il est possible que quelque part sur le web quelqu'un fasse un lien sans www. Dans ce cas, le robot d'un moteur de recherche qui suit ce lien risque d'indexer tout le site example.com sans www, ce qui crée un doublon puisque le site peut déjà être indexé avec www (problème de duplicate content).
A lire dans le forum WebRankInfo