Joomla et le duplicate content

Nouveau WRInaute
Bonjour,

Je cherche à mieux comprendre un sujet qui est traité abondamment sur le net mais qui me semble l'être partiellement.

J'ai un site qui fonctionne sous Joomla et evidemment des urls mutliple pour un même contenu.

Je prends un exemple:

www.exemple.com/mon-exemple/sous-exemple.html (url principal)
www.exemple.com/component/content/article.html?id=35
www.exemple.com/accueil/65-mon-exemple/sous-exemple.html
www.exemple.com/accueil/mon-exemple/35-sous-exemple.html

Deux problème:
1/ Les urls de type: /component/content/ -> Problème de Joomla
2/ Les urls avec des numéros qui semblent être des problèmes d'architecture du menu.

Toutes mes urls principales possèdent la balise canonical, cependant j'ai vu apparaitre 4 url de type /component/content sur Google.
De plus j'ai bien le SEF et reecriture au vol d'activé dans la configuration Joomla.

Je me demande si à part retrouver une à une toutes les urls en double pour mettre en place des redirect 301, il y aurait des choses à faire plus efficaces et plus rapides pour s'assurer que le référencement ne sera pas toucher par ce problème.
Peut être la mise en place du rel=canonical est suffisante ?

Merci d'avance pour vos éclaircissements.
 
WRInaute accro
J'aurai tendance à davantage favoriser la redirection 301 dans ce cas de figure. As-tu par ailleurs bien vérifié qu'il ne subsistait pas, dans la navigation comme dans ton contenu, de liens internes utilisant l'un des schémas que tu ne veux as voir indexer ?
 
WRInaute passionné
hello

la réponse à tes questions sur le duplicate content sur Joomla est :
- utiliser le composant sh404SEF
- les 301 comme te le conseille UsagiYojimbo (si c'est pas automatiquement géré par sh404EF)
- toujours créer un lien dans son contexte (c'est à dire avec le bon itemId)

un petit Seo Screaming Frog pour parser ton site te permettra d'en savoir un peu plus sur les URLs en défaut et où elles sont appelées.
 
Nouveau WRInaute
Bonjour,

Merci pour vos réponses.

La difficulté pour mettre en place des redirections 301 est qu'il y en a beaucoup et probablement certaines que je n'ai pas encore vues. Je me dis qu'il doit y avoir une technique plus efficace que de faire 800 lignes de redirections 301 qui vont alourdir mon chargement.

J'ai essayé d'interdire l'indexation en ajoutant dans mon robot: "Disallow: /component/" et en demandant la désindexation sur Webmaster tool. Cependant, après quelques jours de nouvelles urls comprenant "/component/" sont référencées sur Google.

Je crois qu'en plus la balise canonical est générée dynamiquement donc toutes les urls sont potentiellement des urls canonicals.

loran750, sur Joomla j'ai bien déjà activé:
- Réécriture d'URL en clair (SEF)
- Réécriture au 'vol' des URL
- Ajouter un suffixe aux URL

En utilisant un générateur de sitemap, ces urls ne remontent pas. En revanche, il est vrai que je ne suis pas sûr qu'il n'y ait pas des liens qui appellent ces urls que je veux voir disparaitre.
 
WRInaute accro
Il vaut mieux rediriger que désindexer dans ce cas de figure. Surtout si le site a tourné avec des url non réécrites, en désindexant tu perdrais l'acquis.

Pour ce qui est de mettre en place des redirections, il doit exister des modules Joomla! pour cela (je pense notamment à iJoomlaSEO).
 
Nouveau WRInaute
Merci UsagiYojimbo

Non il a toujours tourné avec les urls réécrites, à la navigation ces urls ne se voient pas. Mais en cherchant avec la requête Google: "site:www.exemple.com" la j'ai vu les urls parasites indexées en plus des urls principales.

Donc selon toi l'unique solution est à chercher du côté des extensions ?

Car sinon ces urls sont de la forme: "www.exemple.com/component/content/article.html?itemid=1"

Peut on automatiser le matching de l'id avec un article pour ne pas avoir une ligne par redirection dans le htaccess ?

Merci
 
Discussions similaires
Haut