Indexation des sitemaps

aCOSwt

WRInaute discret
Bonjour,

J'ai l'impression que Google traite mes sitmaps (.xml, <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> étouétou) comme les pages (normales) de mon site.

1/ D'abord ils sont indexés (ils apparaissent listés dans une requête de search) 8O
Bon, c'est con mais c'est peut-être pas grave...

2/ Mais pire !! (depire) la search console (rubrique "mots clés de contenu" me les prends en compte et forcément... avec plus de 500 pages répertoriées dans le sitemap... j'ai php et html qui architopscorent alors que vraiment... je le jure... je ne cherche pas à me positionner devant php.net... :twisted:

Bon... croyez-vous que cela impacte les résultats de recherche ? que je fais une bourde quelque part ? que je vais être condamné pour suroptimisation sur des mots-clés dont je me tape comme mon premier octet de code ? :evil:

Pour les détails, au cas où ils auraient leur importance, je précise que j'ai 3 sitemaps et qu'ils sont déclarés dans le robots.txt.
Plus précisément :
J'ai 3 sitemaps dans la racine du domaine dont un seul déclaré dans le robots.txt de la racine, les deux autres étants déclarés dans le robots situé dans la racine d'un sous-domaine.
 

indigene

WRInaute accro
non, il ne faut pas faire indexer les sitemaps pas plus que robots.txt
C'est gênant pour le ref car ça noie les mots clés et ce ne sont pas des pages destinées à l'utilisateur
 

aCOSwt

WRInaute discret
indigene a dit:
non, il ne faut pas faire indexer les sitemaps
Certes certes, je me doute bien et n'ai rien du tout fait pour qu'ils le soient.
Il y a un truc à forcer pour qu'ils ne le soient pas ?
 

aCOSwt

WRInaute discret
indigene a dit:
8O
Hein ? Bon... OK... je comprends bien la possibilité de bloquer l'indexation d'un truc avec htaccess.
Maintenant ce qui me surprend dans ce truc c'est qu'il faille faire quelque chose.

Tu veux dire que l'indexation par GG d'un truc qu'il reconnait comme un sitemap est le comportement par défaut ? 8O Il est devenu complètement noix ce truc. :evil:
 

UsagiYojimbo

WRInaute accro
Tu as l'url des fichiers ? Parce que ce peut tout à fait être un souci d'encodage. Auquel cas le corriger, demander la suppression du fichier via GWT devrait suffire à supprimer le souci durablement. Car de base, non, Google n'indexe pas les sitemap xml.
 

aCOSwt

WRInaute discret
Merci UsagiYojimbo. Je me disais aussi. :?

les urls de mes sitemaps sont :

-http://www.0707a.net/MAIN_Sitemap.xml
-http://www.0707a.net/CTL_Sitemap.xml
-http://www.0707a.net/FFRCTL_Sitemap.xml *

En fait je viens d'aller revérifier et il n'y a plus que le dernier qui apparaisse listé par GGSearch : FFRCTL_Sitemap.xml
Les 3 l'étaient pourtant hier. :?

Bon... je reconnais que les urls listées dans ce dernier sitemap sont un peu exotiques maintenant bon... il passe sans pb les validations par validome et GWT
 

UsagiYojimbo

WRInaute accro
Indigene n'avais pas tort pour le .htaccess, tu peux forcer l'envoi d'un noindex pour ces fichiers directement au niveau des entêtes :

Code:
https://www.webmasterworld.com/google/3994307.htm
 

indigene

WRInaute accro
aCOSwt a dit:
Tu veux dire que l'indexation par GG d'un truc qu'il reconnait comme un sitemap est le comportement par défaut ? 8O Il est devenu complètement noix ce truc. :evil:

Le comportement par défaut de google et de tout autre moteur de recherche est d'indexer des documents présents sur le web. Un sitemap est un document.

Aller dans Webmaster Tools ne changera rien par rapport aux autres moteurs de recherche.

Gérer ça par son propre .htaccess correspond à une méthode qui se veut universelle.
Tu lui colle un noindex et tu n'as plus à t'occuper ni de google, ni de bing, ni de yahoo, ni de n'importe qui d'autre. Et en plus c'est toi qui fixe la règle et qui maitrise ce qui doit être indexer ou non. Mais si tu préfères subir....
 

aCOSwt

WRInaute discret
indigene a dit:
Mais si tu préfères subir....
:D
à mon âge... j'accepte de subir... tout ce qui ne me demande aucune charge de travail.
C'est pour cela que j'aime bien les comportements par défaut.
Les comportements par défaut... sans défaut je veux dire.

Cela dit en passant, je crois avoir mis le doigt sur le problème de fond du sujet.

Je crains que la faute soit à mettre sur quelques urls zarbi présentes dans le seul sitemap qui me reste maintenant indexé et fournisseur des php et html vus en tant que mots-clés par GWT :

Il s'agit des pages d'un forum bricolé par mézigue sur base SMF.
Il a une option pour réécrire des urls de type ***/index.php?board=x,y sous la forme ***/index.php/board,1,0.html et d'utiliser cette forme en tant qu'url canonique.

J'avais opté pour cette option et scrupuleusement respecté cette forme dans les sitemaps.

Je reviens à la bonne vieille sauce traditionnelle car c'est peut-être cela qui fout le souk!
 

Discussions similaires

Haut