Sitemap generator =url démultipliées depuis site joomla!

WRInaute discret
Bonjour,
J'essaie de générer un sitemap.xml (avec auditmypc.com) en ligne pour un site afin de le soumettre à des robots mais j'ai la surprise de voir que ce site generator me génère une quantité d'urls 4 fois supérieure à celle que j'ai sur le site !
En effet, chaque url est multipliée par 4...
J'ai désactivé les composants tierces du cms,un à un, afin de déterminer ce qui pouvait générer cette démultiplication d' urls, mais rien n'y fait.
En observant la syntaxe des urls démultipliées..
http://www.monsite.com/index.php?option=com_content&view=archive&year=2009&month=05&Itemid=100004
..c'est un composant "core" de joomla 1.5 (com_content) qui est à chaque fois concerné. Si je le désactive, bien sûr, le site ne fonctionne plus.
Sujet abordé ici http://www.websecurity.mobi/webmaste...ont-exist.html
Je sèche.
Une piste ? Merci beaucoup..
 
WRInaute passionné
Tu utilises quel outil de SEF (j'espère que c'est sh404SEF) et quel outil de sitemap (j'espère XMap) ?
 
WRInaute discret
Merci à biddybulle et loran750

loran750 a dit:
Tu utilises quel outil de SEF (j'espère que c'est sh404SEF) et quel outil de sitemap (j'espère XMap) ?

Oui, j'utilise sh404SEF et Auditmypc pour le site generator.

biddybulle a dit:
test celui ci http://gsitecrawler.com/

tu peux filtrer les urls.

Avec auditmypc aussi.

Mais le problème, c'est pas le filtrage, mais savoir qu'un robot tombe sur une url qui se démultiplie, je pense que ce n'est pas bon, pour un référencement correct, même si j'ai un sitemap correct, non ? Merci pour vos réponses...
 
WRInaute passionné
en effet, ce n'est pas bon mais parfois la démultiplication des urls dans le sitemap se produit sur une Url paramétrée genre /search.php?keyword=... via le moteur de recherche du site.

C'est ainsi plus simple à filtrer mais bon il nous faudrait un exemple d'url pour comprendre votre cas
 
WRInaute discret
En effet, en examinant les urls , j'ai d'abord la vraie url !:

Code:
http://www.monsite.com/index.php?option=com_content&view=article&id=129:grenelle-des-antennes--la-transparence-des-debats-clamee-par-letat-ne-convainc-pas-les-associations

Puis ensuite, en dessous, 5 Urls supplémentaires (et non 4), avec toujours sur toutes les urls, le même rajut de syntaxe :
(chaque url se termine par les même numéros "itemid=59" "itemid=100010" "itemid=100009" "itemid=100004"
"itemid=100003" "itemid=100001"

Code:
http://www.monsite.com/index.php?option=com_content&view=article&id=129%3Agrenelle-des-antennes--la-transparence-des-debats-clamee-par-letat-ne-convainc-pas-les-associations&Itemid=59

Code:
http://www.monsite.com/index.php?option=com_content&view=article&id=129%3Agrenelle-des-antennes--la-transparence-des-debats-clamee-par-letat-ne-convainc-pas-les-associations&Itemid=100010

Code:
http://www.monsite.com/index.php?option=com_content&view=article&id=129%3Agrenelle-des-antennes--la-transparence-des-debats-clamee-par-letat-ne-convainc-pas-les-associations&Itemid=100009

etc...

En fait, un script me rajoute à 5 reprises , un bout de syntaxe sur toutes les urls..mais je ne sais pas comment!

Merci encore à biddybulle pour tes commentaires..
 
WRInaute discret
En fait, j'avais installé le composant sh404sef sans l'avoir activé ! Depuis son activation, plus d'urls démultipliées.
Cela n'explique cepedant pas pourquoi, sans même ce composant d'url rewriting, le site génère nativement cette démultiplication ..N'est ce pas ?
 
Discussions similaires
Haut