Résoudre le duplicate content (avec et sans www)
Par Olivier Duffez
, Mardi 1 novembre 2011
La plupart des webmasters n'y font pas attention, mais leur site est souvent accessible en tapant le nom de domaine avec ou sans le sous-domaine www. Ceci peut poser des problèmes car les moteurs pourraient indexer un duplicata du site. Ce dossier donne les solutions pour les serveurs Apache, nginx, lighttpd et IIS. Explications...
Imaginons que votre site soit www.example.com : savez-vous qu'il y a de fortes chances pour que votre site soit également accessible à l'adresse http://example.com (sans le www) ? Il suffit alors d'un seul lien vers votre site pointant vers cette adresse pour que les moteurs indexent votre site à la fois avec et sans le sous-domaine www. Dans ce cas, vous aurez sans doute de gros problèmes de contenus dupliqués (lisez en fin d'article en quoi ça pose problème).
La solution est d'utiliser une règle de réécriture sur le serveur, qui redirigera automatiquement vers la bonne version. A vous de choisir si vous préférez exploiter le nom de domaine avec ou sans le sous-domaine www, mais tenez-vous en à ce choix.
Rediriger son site vers le www (de monsite.com à www.monsite.com)
Pour forcer le sous-domaine www (et interdire l'indexation du site sans ce sous-domaine) :
Sur Apache
Mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site (attention, si votre nom de domaine comporte une extension à plusieurs mots comme co.uk, il faut adapter le code) :
RewriteEngine On
RewriteCond %{HTTP_HOST} ^[^.]+\.[^.]+$
RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
Si le code précédent ne fonctionne pas chez vous, essayez celui-ci (en remplaçant example.com par votre nom de domaine) :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]
Selon les cas, vous devrez peut-être retirer le / à la fin du domaine, comme ceci :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.example\.com [NC]
RewriteRule (.*) http://www.example.com$1 [QSA,R=301,L]
Sur IIS (serveur Microsoft)
Voici le code pour les serveurs IIS :
<rewrite>
<rules>
<rule name="Redirect to WWW" stopprocessing="true">
<match url=".*">
<conditions>
<add input="{HTTP_HOST}" pattern="^example.com$"></add>
</conditions>
<action type="Redirect" url="http://www.example.com/{R:0}" redirecttype="Permanent"></action>
</match>
</rule>
</rules>
</rewrite>
Sur nginx
Voici le code pour les serveurs nginx :
server {
server_name example.com;
rewrite ^ $scheme://www.example$request_uri redirect;
}
Sur lighttpd
Voici le code pour les serveurs lighttpd :
$HTTP["host"] =~ "^example\.com$" {
url.redirect = ( "^/(.*)" => "http://www.example.com/$1" )
}
Supprimer le www de son site (de www.monsite.com à monsite.com)
Au contraire, pour supprimer le sous-domaine www (et interdire l'indexation du site avec ce sous-domaine), mettez le code suivant en haut de votre fichier .htaccess situé à la racine du site (pour un serveur Apache) :
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.([^.]+)\.([^.]+)$
RewriteRule ^(.*)$ http://%1.%2/$1 [R=301,L]
Si le code précédent ne fonctionne pas chez vous, essayez celui-ci (en remplaçant example.com par votre nom de domaine) :
RewriteEngine On
RewriteCond %{HTTP_HOST} !^example\.com [NC]
RewriteRule (.*) http://example.com/$1 [QSA,R=301,L]
Attention aux cas particuliers, notamment si vous avez des sous-domaines (autres que www). Voyez la discussion dans le forum...
Pour en savoir plus...
J'ai lu sur des forums que certains pensent que ça peut être une cause des problèmes liés à la dernière mise à jour (Jagger). J'ai du mal à y croire, ce problème existant depuis longtemps...
Si vous avez besoin d'aide, posez votre question dans le forum URL Rewriting et .htaccess, dans la discussion Interdire example.com et obliger www.example.com
Sachez que depuis la 1ère publication de cette article, j'ai rédigé un article de synthèse sur le duplicate content ainsi qu'un guide donnant des solutions aux contenus dupliqués, et que Google gère désormais l'URL canonique qui peut résoudre aussi les problèmes de duplicate content.
Je vous conseille également de lire mon tutoriel redirections qui explique les différence entre les 301 et 302 et fournit les méthodes pour bien rediriger ses pages.
On a aussi dans le forum WebRankInfo une discussion qui rassemble les bonnes idées pour résoudre les problèmes liés aux contenus dupliqués.
A propos de l'auteur : Olivier Duffez
![]()
Consultant indépendant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo.com qu'il a créé en 2002, devenu la plus grande communauté francophone sur le référencement (+ 200.000 membres et 1,3 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (référencement naturel, AdWords, Analytics, réseaux sociaux).
Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.
10 commentaires
Postez un commentaire !
Les champs marqués du signe * sont obligatoires. L'adresse email ne sera pas affichée.
En postant un commentaire, vous acceptez les CGU du site WebRankInfo.
Formation référencement et webmarketing
Venez chez Ranking Metrics vous former au référencement, à Google Analytics et aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (financement possible par OPCA, DIF...).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation agréé).
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo. Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
Catégories des dossiers
- Actualité
- Android
- Autres produits Google
- Brèves
- Conseils référencement
- Débuter en référencement
- Droit et Internet
- e-marketing
- Ecrire pour le web et le référencement
- Gmail
- Google AdSense
- Google AdWords
- Google Analytics
- Google Chrome
- Google Images
- Google Labs
- Google Maps
- Google Mobile
- Google News
- Google Search
- Google Toolbar
- Google Webmaster Tools
- Google+
- Indexation Google
- L'entreprise Google
- Les API de Google
- Livres sur le référencement et les moteurs de recherche
- Outils
- PageRank
- R&D référencement
- Ranking Metrics
- Référencement Bing
- Référencement des images
- Référencement et PHP
- Référencement local
- Référencement Yahoo
- Référencement Yandex
- Réseaux sociaux
- Sitemaps
- Stratégies de liens
- Stratégies de mots-clés
- Techniques de référencement
- Webmastering
- WebRankInfo
- YouTube



31 octobre 2005 à 0:27
Sa marche bien pour afterbug dot com.
1 novembre 2005 à 3:08
Bof,
Je suis d'avis que si Google ne reconnait pas déjà ça, et bien il n'est pas celui que je croyais qu'il était..
La tweak est bonne(pourquoi pas normaliser ses URLs?) mais je crois fort que Google en a rien a battre.
- Matt
8 février 2009 à 8:08
Quelqu'un saurais t il me donner un lien où je peux apprendre l'utilisation de htaccess parce que j'ai essayé mais ça marche pas.
Merci
8 février 2009 à 15:46
Tu peux par exemple lire les 2 principaux articles sur la réécriture d'URL qui utilise .htaccess : initiation à .htaccess et tutoriel .htaccess
Sinon tu peux poser tes questions dans le forum .htaccess
24 avril 2009 à 17:02
Bonjour,
est il possible de généraliser:
RewriteEngine On RewriteCond %{HTTP_HOST} !^www\.example\.com [NC] RewriteRule (.*) http://www.example.com/$1 [QSA,R=301,L]
pour tous les sites sans avoir à changer l'adresse à chaque fois?
22 juin 2010 à 18:26
Tout cela, c'est bien joli, mais comment fait-on pour un blog hébergé sur la plateforme blogger ?
Mon blog : http://theclassical-guitar.blogspot.com Aurais-je le même problème d'indexation ?
23 juin 2010 à 10:57
Pour travailler son référencement sérieusement, il faut absolument investir dans un nom de domaine (lisez cet article pour savoir pourquoi).
1 novembre 2011 à 14:40
Selon google les contenus dupliqués "tolérés" sont les forums pouvant générer à la fois des pages normales et des pages "raccourcies" destinées aux mobiles, les articles en vente affichés ou liés via plusieurs URL distinctes, les versions imprimables uniquement de pages Web.
Sinon il faut effectivement déjà supprimer la duplication de sous-domaine, faire des redirections 301, des rel="canonical" sur les pages dupliquées ou trop similaires.
1 novembre 2011 à 19:58
Google propose depuis longtemps de choisir via son outils mais (c'est mon avis), mélange les deux pour le reférencement et le contenu sans distinction: un peu trop tard pour cet article même s'il a le mérite de donner les techniques pour éviter les deux en même temps.
1 novembre 2011 à 23:59
Tu fais référence je suppose à l'option "Domaine favori" de Google Webmaster Tools. Nous sommes nombreux je pense à considérer qu'elle ne suffit pas du tout et qu'il faut absolument faire les redirections 301 évoquées ici. D'ailleurs cette option n'existe que chez Google et pas chez les autres moteurs.
Au fait, cet article a été publié en 2005, je n'ai fait que le compléter et le mettre à jour aujourd'hui ;-)