Indexation des sitemaps

Discussion dans 'Crawl et indexation Google, sitemaps' créé par aCOSwt, 3 Mars 2016.

  1. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    Bonjour,

    J'ai l'impression que Google traite mes sitmaps (.xml, <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> étouétou) comme les pages (normales) de mon site.

    1/ D'abord ils sont indexés (ils apparaissent listés dans une requête de search) 8O
    Bon, c'est con mais c'est peut-être pas grave...

    2/ Mais pire !! (depire) la search console (rubrique "mots clés de contenu" me les prends en compte et forcément... avec plus de 500 pages répertoriées dans le sitemap... j'ai php et html qui architopscorent alors que vraiment... je le jure... je ne cherche pas à me positionner devant php.net... :twisted:

    Bon... croyez-vous que cela impacte les résultats de recherche ? que je fais une bourde quelque part ? que je vais être condamné pour suroptimisation sur des mots-clés dont je me tape comme mon premier octet de code ? :evil:

    Pour les détails, au cas où ils auraient leur importance, je précise que j'ai 3 sitemaps et qu'ils sont déclarés dans le robots.txt.
    Plus précisément :
    J'ai 3 sitemaps dans la racine du domaine dont un seul déclaré dans le robots.txt de la racine, les deux autres étants déclarés dans le robots situé dans la racine d'un sous-domaine.
     
  2. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    PS et HS @WRI : Pourquoi n'ai-je jamais de bouton "EDITER" sur l'OP ?
     
  3. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    4 101
    J'aime reçus:
    176
    non, il ne faut pas faire indexer les sitemaps pas plus que robots.txt
    C'est gênant pour le ref car ça noie les mots clés et ce ne sont pas des pages destinées à l'utilisateur
     
  4. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    Certes certes, je me doute bien et n'ai rien du tout fait pour qu'ils le soient.
    Il y a un truc à forcer pour qu'ils ne le soient pas ?
     
  5. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    4 101
    J'aime reçus:
    176
    .htaccess
     
  6. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    8O
    Hein ? Bon... OK... je comprends bien la possibilité de bloquer l'indexation d'un truc avec htaccess.
    Maintenant ce qui me surprend dans ce truc c'est qu'il faille faire quelque chose.

    Tu veux dire que l'indexation par GG d'un truc qu'il reconnait comme un sitemap est le comportement par défaut ? 8O Il est devenu complètement noix ce truc. :evil:
     
  7. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 973
    J'aime reçus:
    121
    Tu as l'url des fichiers ? Parce que ce peut tout à fait être un souci d'encodage. Auquel cas le corriger, demander la suppression du fichier via GWT devrait suffire à supprimer le souci durablement. Car de base, non, Google n'indexe pas les sitemap XML.
     
  8. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    Merci UsagiYojimbo. Je me disais aussi. :?

    les urls de mes sitemaps sont :

    -http://www.0707a.net/MAIN_Sitemap.xml
    -http://www.0707a.net/CTL_Sitemap.xml
    -http://www.0707a.net/FFRCTL_Sitemap.xml *

    En fait je viens d'aller revérifier et il n'y a plus que le dernier qui apparaisse listé par GGSearch : FFRCTL_Sitemap.xml
    Les 3 l'étaient pourtant hier. :?

    Bon... je reconnais que les urls listées dans ce dernier sitemap sont un peu exotiques maintenant bon... il passe sans pb les validations par validome et GWT
     
  9. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 973
    J'aime reçus:
    121
    Indigene n'avais pas tort pour le .htaccess, tu peux forcer l'envoi d'un noindex pour ces fichiers directement au niveau des entêtes :

    Code:
    https://www.webmasterworld.com/google/3994307.htm
     
  10. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    4 101
    J'aime reçus:
    176
    Le comportement par défaut de google et de tout autre moteur de recherche est d'indexer des documents présents sur le web. Un sitemap est un document.

    Aller dans Webmaster Tools ne changera rien par rapport aux autres moteurs de recherche.

    Gérer ça par son propre .htaccess correspond à une méthode qui se veut universelle.
    Tu lui colle un noindex et tu n'as plus à t'occuper ni de google, ni de bing, ni de yahoo, ni de n'importe qui d'autre. Et en plus c'est toi qui fixe la règle et qui maitrise ce qui doit être indexer ou non. Mais si tu préfères subir....
     
  11. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    156
    J'aime reçus:
    0
    :D
    à mon âge... j'accepte de subir... tout ce qui ne me demande aucune charge de travail.
    C'est pour cela que j'aime bien les comportements par défaut.
    Les comportements par défaut... sans défaut je veux dire.

    Cela dit en passant, je crois avoir mis le doigt sur le problème de fond du sujet.

    Je crains que la faute soit à mettre sur quelques urls zarbi présentes dans le seul sitemap qui me reste maintenant indexé et fournisseur des php et html vus en tant que mots-clés par GWT :

    Il s'agit des pages d'un forum bricolé par mézigue sur base SMF.
    Il a une option pour réécrire des urls de type ***/index.php?board=x,y sous la forme ***/index.php/board,1,0.html et d'utiliser cette forme en tant qu'url canonique.

    J'avais opté pour cette option et scrupuleusement respecté cette forme dans les sitemaps.

    Je reviens à la bonne vieille sauce traditionnelle car c'est peut-être cela qui fout le souk!
     
Chargement...
Similar Threads - Indexation sitemaps Forum Date
Problème d'indexation, Sitemaps non lus et baisse drastique du référencement/trafic Débuter en référencement 22 Mars 2019
Sitemaps et état de l'indexation : chiffres différents Crawl et indexation Google, sitemaps 9 Août 2018
[Chute indexation sitemaps] Bug Search Console ? Crawl et indexation Google, sitemaps 12 Mai 2016
Indexation et Sitemaps Crawl et indexation Google, sitemaps 3 Juillet 2009
Probléme indexation sitemaps GG Crawl et indexation Google, sitemaps 30 Octobre 2006
Sitemaps Temps d'indexation Crawl et indexation Google, sitemaps 27 Avril 2006
référencement site en anglais : indexation plus longue Référencement international (langues, pays) 13 Mai 2022
Problème d'indexation Produits Prestashop Crawl et indexation Google, sitemaps 28 Avril 2022
Problème indexation pages précises en React.js Débuter en référencement 19 Avril 2022
Pourquoi ne pas utiliser le robots.txt pour interdire l'indexation ? Débuter en référencement 14 Avril 2022
Conseil pour accélérer l'indexation de mon nouveau site Problèmes de référencement spécifiques à vos sites 9 Avril 2022
Comment puis-je obtenir l'indexation instantanée de Google ? Débuter en référencement 28 Mars 2022
Questions URL canonique, crawl et indexation Débuter en référencement 25 Mars 2022
Indexation de mon site dans Google Problèmes de référencement spécifiques à vos sites 13 Mars 2022
Search Console Problème d'indexation Crawl et indexation Google, sitemaps 24 Février 2022
Indexation d'urls en caractères russes Crawl et indexation Google, sitemaps 16 Février 2022
Search Console Impossible de demander une indexation manuelle, état exclut Problèmes de référencement spécifiques à vos sites 12 Février 2022
Problème indexation car élément "url" manquant sur logo Crawl et indexation Google, sitemaps 11 Février 2022
Search Console Indexation Google Search Console Référencement Google 9 Février 2022
Indexation d'un eshop principal FR / EN et de eshops dédiés US / FR Crawl et indexation Google, sitemaps 4 Février 2022