Indexation des sitemaps

Discussion dans 'Crawl et indexation Google, sitemaps' créé par aCOSwt, 3 Mars 2016.

  1. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    Bonjour,

    J'ai l'impression que Google traite mes sitmaps (.xml, <?xml version="1.0" encoding="UTF-8"?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> étouétou) comme les pages (normales) de mon site.

    1/ D'abord ils sont indexés (ils apparaissent listés dans une requête de search) 8O
    Bon, c'est con mais c'est peut-être pas grave...

    2/ Mais pire !! (depire) la search console (rubrique "mots clés de contenu" me les prends en compte et forcément... avec plus de 500 pages répertoriées dans le sitemap... j'ai php et html qui architopscorent alors que vraiment... je le jure... je ne cherche pas à me positionner devant php.net... :twisted:

    Bon... croyez-vous que cela impacte les résultats de recherche ? que je fais une bourde quelque part ? que je vais être condamné pour suroptimisation sur des mots-clés dont je me tape comme mon premier octet de code ? :evil:

    Pour les détails, au cas où ils auraient leur importance, je précise que j'ai 3 sitemaps et qu'ils sont déclarés dans le robots.txt.
    Plus précisément :
    J'ai 3 sitemaps dans la racine du domaine dont un seul déclaré dans le robots.txt de la racine, les deux autres étants déclarés dans le robots situé dans la racine d'un sous-domaine.
     
  2. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    PS et HS @WRI : Pourquoi n'ai-je jamais de bouton "EDITER" sur l'OP ?
     
  3. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 682
    J'aime reçus:
    76
    non, il ne faut pas faire indexer les sitemaps pas plus que robots.txt
    C'est gênant pour le ref car ça noie les mots clés et ce ne sont pas des pages destinées à l'utilisateur
     
  4. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    Certes certes, je me doute bien et n'ai rien du tout fait pour qu'ils le soient.
    Il y a un truc à forcer pour qu'ils ne le soient pas ?
     
  5. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 682
    J'aime reçus:
    76
    .htaccess
     
  6. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    8O
    Hein ? Bon... OK... je comprends bien la possibilité de bloquer l'indexation d'un truc avec htaccess.
    Maintenant ce qui me surprend dans ce truc c'est qu'il faille faire quelque chose.

    Tu veux dire que l'indexation par GG d'un truc qu'il reconnait comme un sitemap est le comportement par défaut ? 8O Il est devenu complètement noix ce truc. :evil:
     
  7. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 874
    J'aime reçus:
    71
    Tu as l'url des fichiers ? Parce que ce peut tout à fait être un souci d'encodage. Auquel cas le corriger, demander la suppression du fichier via GWT devrait suffire à supprimer le souci durablement. Car de base, non, Google n'indexe pas les sitemap XML.
     
  8. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    Merci UsagiYojimbo. Je me disais aussi. :?

    les urls de mes sitemaps sont :

    -http://www.0707a.net/MAIN_Sitemap.xml
    -http://www.0707a.net/CTL_Sitemap.xml
    -http://www.0707a.net/FFRCTL_Sitemap.xml *

    En fait je viens d'aller revérifier et il n'y a plus que le dernier qui apparaisse listé par GGSearch : FFRCTL_Sitemap.xml
    Les 3 l'étaient pourtant hier. :?

    Bon... je reconnais que les urls listées dans ce dernier sitemap sont un peu exotiques maintenant bon... il passe sans pb les validations par validome et GWT
     
  9. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 874
    J'aime reçus:
    71
    Indigene n'avais pas tort pour le .htaccess, tu peux forcer l'envoi d'un noindex pour ces fichiers directement au niveau des entêtes :

    Code:
    https://www.webmasterworld.com/google/3994307.htm
     
  10. indigene
    indigene WRInaute accro
    Inscrit:
    7 Septembre 2003
    Messages:
    3 682
    J'aime reçus:
    76
    Le comportement par défaut de google et de tout autre moteur de recherche est d'indexer des documents présents sur le web. Un sitemap est un document.

    Aller dans Webmaster Tools ne changera rien par rapport aux autres moteurs de recherche.

    Gérer ça par son propre .htaccess correspond à une méthode qui se veut universelle.
    Tu lui colle un noindex et tu n'as plus à t'occuper ni de google, ni de bing, ni de yahoo, ni de n'importe qui d'autre. Et en plus c'est toi qui fixe la règle et qui maitrise ce qui doit être indexer ou non. Mais si tu préfères subir....
     
  11. aCOSwt
    aCOSwt WRInaute discret
    Inscrit:
    16 Mars 2007
    Messages:
    157
    J'aime reçus:
    0
    :D
    à mon âge... j'accepte de subir... tout ce qui ne me demande aucune charge de travail.
    C'est pour cela que j'aime bien les comportements par défaut.
    Les comportements par défaut... sans défaut je veux dire.

    Cela dit en passant, je crois avoir mis le doigt sur le problème de fond du sujet.

    Je crains que la faute soit à mettre sur quelques urls zarbi présentes dans le seul sitemap qui me reste maintenant indexé et fournisseur des php et html vus en tant que mots-clés par GWT :

    Il s'agit des pages d'un forum bricolé par mézigue sur base SMF.
    Il a une option pour réécrire des urls de type ***/index.php?board=x,y sous la forme ***/index.php/board,1,0.html et d'utiliser cette forme en tant qu'url canonique.

    J'avais opté pour cette option et scrupuleusement respecté cette forme dans les sitemaps.

    Je reviens à la bonne vieille sauce traditionnelle car c'est peut-être cela qui fout le souk!
     
Chargement...
Similar Threads - Indexation sitemaps Forum Date
Problème d'indexation, Sitemaps non lus et baisse drastique du référencement/trafic Débuter en référencement 22 Mars 2019
Sitemaps et état de l'indexation : chiffres différents Crawl et indexation Google, sitemaps 9 Août 2018
[Chute indexation sitemaps] Bug Search Console ? Crawl et indexation Google, sitemaps 12 Mai 2016
Indexation et Sitemaps Crawl et indexation Google, sitemaps 3 Juillet 2009
Problèmes d'indexation et robots.txt Crawl et indexation Google, sitemaps Lundi à 10:59
Problème d'indexation Débuter en référencement 8 Octobre 2019
Indexation, contenu et saisonnalité Rédaction web et référencement 29 Septembre 2019
Indexation longue / Aucune visibilité Google Actualité Crawl et indexation Google, sitemaps 26 Septembre 2019
Indexation, pagination : comment gérer les URL de tri des colonnes ? Crawl et indexation Google, sitemaps 24 Septembre 2019
Indexation malgré le robots.txt Problèmes de référencement spécifiques à vos sites 23 Septembre 2019
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice