URL en doublon dans le sitemap : pourquoi ? est-ce gênant ?

Nouveau WRInaute
Le problème est que ce n'est pas moi qui l'ai fait. La personne qui m'a "aidé" ne répond plus !
J'ai installé le même module sur d'autres sites et je n'ai pas ce problème ... mais j'en ai d'autres ! voilà pourquoi je n'ose pas le désinstaller et le réinstaller moi même.
C'est le module sitemap XML pour drupal
 
WRInaute accro
Au pire, tu le désinstalles et tu le télécharges à nouveau pour remplacer ton actuel module sitemap XML (fais un backup en local avant au cas où).

+1 avec @UsagiYojimbo :) bizarre d'avoir du mixed php html
 
Nouveau WRInaute
Bein... tu dis que tu utilises un CMS donné, et tes url ne ressemblent pas franchement à celles que génèrent habituellement ce CMS. So...
Le site a été créé en 2001 et je suis passé sur drupal en 2011 / 2012.
J'ai conservé les même urls mon referencement.
Mes pages étaient en htm ou html
Pour ce qui est des.php, là elles sont venues plus tard et j'ai créé des .php sur un conseil que j'avais mal interprété.
C'est gênant d'avoir des .php ?
 
WRInaute accro
Ce n'est pas gênant d'avoir ce genre d'extension, mais ça sous entend qu'il y a eu des ajustements sur le fonctionnement natif du CMS. Et donc que les plugins de base peuvent avoir du mal à fonctionner correctement si le nécessaire n'a pas été fait.
 
WRInaute discret
pour ce qui est de la première question à savoir l'éventuel impact, je pense que c'est sans impact. De toute façon, si le site est bien fait, google n'a pas besoin de sitemap. je pense que ce système va disparaître.
 
WRInaute accro
Le Sitemap ? Etant donné qu'ils se reposent fortement dessus pour la nouvelle Search Console, j'ai de gros doutes qu'il abandonnent ce truc de si tôt. Et non, il y a encore pléthore de cas où Google galère (les sites full JS, notamment).
 
Nouveau WRInaute
Le doublon des urls provenaient du fait que les "menus links" et le "contenu" (seulement les pages) étaient cochés pour être scrutés par le robots.
Depuis que j'ai décoché le contenu (pages), il n'y a plus de doublon.
J'ai relancé le sitemap mais d'environ 1.400 pages indexées je suis passé à environ 1.000.
Cela s'explique que certaines pages ne sont pas présentes dans les menus (choix perso, qu'il faudra peut-être revoir) mais il y quand même BEAUCOUP de pages qui sont dans présentes dans les menus et qui n'ont pas été envoyées.
Pourquoi ?
Il va falloir renvoyer plusieurs fois le sitemap pour qu'il les trouve tous ?
Ça prend du temps ?
 
WRInaute accro
Il faudrait a minima un screenshot de votre interface Search Console pour être sur de comprendre. Le fait de supprimer des doublons dans le sitemap n'a aucune incidence sur le volume de page indexées, uniquement sur le volume de pages envoyées.
 
Discussions similaires
Haut