Google cherche des pages qui ne sont pas dans mon Sitemap

Nouveau WRInaute
Bonjour !

J'ai des soucis avec un sitemap :
Dans Google Webmaster Tools, j'ai une erreur 404 (cf image), alors que cette URL n'est pas dans mon sitemap.xml (elle y est, mais avec "index.html" à la fin)....
Capturer.jpg

Le lien vers mon sitemap
Quelqu'un sait pourquoi GG cherche à indexer des pages qui ne lui sont pas données dans le sitemap ?
En attendant de trouver la solution, je peux rediriger cette page vers la bonne, mais cela ne me semble pas une solution valable à long terme !!!
Merci pour vos éclairages !

Olivier
 
WRInaute occasionnel
Peut être parce qu'elle est liée quelque part sur ton site ?

Le sitemap n'est pas une référence pour google. La véritable référence est la navigation qu'il trouve sur le site.

Regarde sur Webmaster tools quelles sont les pages internes ou externes qui lient cette page.
 
WRInaute discret
envoi un robots.txt sur ton server en y indiquant les liens que tu veux pas indexer sur GG, complement sitemap koi ;)
 
Nouveau WRInaute
Kaliiii a dit:
Peut être parce qu'elle est liée quelque part sur ton site ?

Le sitemap n'est pas une référence pour google. La véritable référence est la navigation qu'il trouve sur le site.

Regarde sur Webmaster tools quelles sont les pages internes ou externes qui lient cette page.

Ben, non justement, j'ai beau fouiner partout, je vois pas d'où viennent ces liens....
J'ai rajouté des alias sur les pages vers lesquelles je veux que ces faux liens pointent.... dans mon composant SEO (sh404sef, sur Joomla).... Mais je sais pas comment GG va interpréter ces redirections....

Par contre, je ne me suis pas encore attaqué au robot.txt pour interdire l'indexation....

A suivre...
 
WRInaute discret
Méfis toi car si tu fais une commande dans le robots.txt genre :

Disallow: /commercial/commercial/

alors tout les pages situées dans le répertoire commercial (pas le 1er, le 2eme) seront désindéxées ou interdites d'indexation.
 
Nouveau WRInaute
En plus, je ne sais pas trop comment interdire ces adresses, car elles sont générées par mon outil SEO.... commercial/commercial n'existe pas dans mes répertoires !
 
Discussions similaires
Haut