Annonces Google

Vous êtes ici : Dossiers référencement > Sitemaps

Tutoriel sur le fichier sitemap pour un bon référencement Google

Par , le 06 avril 2016

Voici tout ce qu'il faut savoir sur le fameux fichier sitemap et son impact sur le référencement. Ce tuto explique les risques d'une mauvaise compréhension de l'utilité du sitemap et donne de nombreux conseils.

Article mis à jour le 06/04/2016 ("index d'index" de sitemaps), publié initialement le 07/06/2014

Fichier sitemap et SEO

Un fichier sitemap pour Google, utile au SEO ? Ce dossier fournit des explications et des conseils pour exploiter les fichiers sitemaps XML ou TXT pour votre référencement naturel

Qu'est-ce que le fichier sitemap ? A quoi sert-il ?

J'écris "fichier sitemap" pour ne pas confondre avec le plan de site, cette page web destinée aux internautes, leur permettant de se situer dans le site et de comprendre la logique de son arborescence. Au passage, ce plan de site est rarement nécessaire…

Un fichier sitemap est un fichier listant des URL du site que l'on souhaite faire crawler (et donc aussi indexer). Une fois que les moteurs auront consulté le fichier, si tout se passe bien ils iront explorer (crawler) les URL listées. Et donc si tout se passe (encore) bien, ils devraient indexer les fameuses URL.

Fichier sitemap XML

Exemple de fichier sitemap XML (sur elysee.fr). Le format XML n'est pas obligatoire.

Intérêt des sitemaps

Un fichier sitemap favorise-t-il le référencement ?

La réponse rapide est NON !

Il ne faut pas confondre indexation et positionnement. Mieux vaut travailler les liens internes que son fichier sitemap !

En résumé : vous ne devriez PAS avoir besoin d'un fichier sitemap pour faire indexer vos pages. Sinon, ça veut dire que votre site est mal conçu : il manque de liens internes ou bien le nombre de niveaux dans l'arborescence est trop important.

Dit autrement : si certaines pages de votre site sont inaccessibles par le biais de liens (par exemple, la seule façon d'y accéder est de faire une recherche par formulaire), même si vous arrivez à les faire indexer avec le fichier sitemap, elles auront une très faible visibilité dans Google puisqu'elles n'ont pas de backlinks. Si vous êtes dans ce cas, il est bien plus difficile de déterminer si ces pages sont indexées grâce au sitemap ou grâce aux liens internes. C'est pourquoi je conseille souvent de démarrer SANS sitemap (pour valider la conception du site) et d'en ajouter ensuite si cela s'avère nécessaire (cf. mes explications ci-après).

Les sitemaps, utiles uniquement pour les gros sites ?

Oui, c'est à peu près mon point de vue.

Les petits sites de quelques pages n'en ont pas du tout besoin, éventuellement les sites plus gros (quelques centaines de pages). Pour les gros sites qui génèrent chaque jour de nombreuses nouvelles pages, c'est utile pour accélérer l'indexation.

J'explique ci-après (notion de nombre de fichiers sitemaps) de quelle manière ça peut être utile.

Les sitemaps spécialisés : images, actualités, vidéos, mobile

Il existe d'autres cas où les sitemaps peuvent être utiles : il s'agit des contenus spécifiques pour lesquels un dérivé du format XML classique a été mis au point par Google. Il s'agit des images, des actualités, des vidéos et des contenus pour les mobiles.

Dans ces cas-là, le format XML est obligatoire, mais j'y reviens plus loin.

Conseils sur l'utilisation des fichiers sitemaps

Nom du fichier, encodage, nombre max d'URL

Vous pouvez faire autant de fichiers sitemaps que vous voulez (ou presque). Si vous en avez beaucoup, vous pouvez créer un fichier index de sitemaps qui se borne à lister les URL des fichiers sitemaps.

Voici les limitations en termes de volume :

  • un fichier peut lister jusqu'à 50.000 URL
  • un index de sitemaps peut lister jusqu'à 50.000 fichiers sitemaps (mais pas de fichier index de sitemaps)
  • vous pouvez envoyer jusqu'à 500 fichiers d'index de sitemaps pour chaque site

Cette limitation à 1 250 000 000 000 URL devrait convenir à la plupart d'entre vous ;-)

Un fichier d'index de sitemaps ne peut pas répertorier d'autres fichiers d'index de sitemaps. Il doit répertorier des fichiers de sitemaps uniquement.

L'encodage du fichier doit être UTF-8 (attention à bien y penser pour les sitemaps TXT).

Les URL doivent être complètes (absolues) et non pas relatives. En clair, elles doivent commencer par "http" (ou "https" si vous avez un site en HTTPS).

Tous les principaux moteurs de recherche gèrent ces fichiers sitemaps. A condition bien entendu de leur indiquer l'URL de votre fichier. En effet, contrairement au fichier robots.txt dont le nom est fixé et l'emplacement imposé (à la racine du sous-domaine concerné), vous pouvez choisir le nom du fichier sitemap.

Mieux vaut choisir un nom de fichier difficile à deviner, pour éviter de donner des informations à vos concurrents (ils n'ont pas à savoir quelles pages vous souhaiter faire indexer en priorité). Arrêtez donc de le nommer sitemap.xml ou pire, de l'indiquer dans votre fichier robots.txt (allez directement dans Google Search Console).

Sitemap XML ou fichier texte ?

Le fichier peut être au format texte (une ligne = une URL, extension .txt obligatoire) ou XML (standard sitemaps.org que j'ai décrit ici). Je n'ai jamais trouvé utile de s'embêter avec le format XML, le format texte va très biens, sauf dans les cas suivants :

A mon avis, le format XML ne s'impose pas si vous souhaitez seulement fournir un ou plusieurs des éléments ci-dessous :

  • lastmod : aussi étonnant que ça puisse paraître, Google ne tient généralement pas compte de la date de dernière modification ! (source)
  • changefreq : saurez-vous réellement donner une valeur exacte pour la fréquence de changement du contenu de chacune de vos pages ? Si c'est pour mettre une approximation, laissez Google repérer tout seul à quelle fréquence vous mettez à jour vos pages !
  • priority : à moins d'avoir un tout petit site (genre 30 pages maxi), je doute fortement que vous réussirez à trier toutes vos pages de façon stricte et intelligente. Ca ne sert à rien de donner la même priorité à tout un tas de pages ! Par ailleurs, je n'ai jamais entendu parler d'une réelle prise en compte par Google de ce réglage...

Faites des sitemaps selon les types de pages

Pour les gros sites qui ont besoin d'un fichier sitemap, vous pouvez en faire de 2 types :

  • 1 listant les dernières pages créées (pour tenter de gagner en vitesse d'indexation)
  • 1 par type de pages (pour essayer de mesurer le taux d'indexation par types de pages, par exemple fiches produits, catégories, articles éditoriaux, etc.)

Rappelons que pour avoir accès aux statistiques relatives à un fichier sitemap, il faut consulter votre compte Google Search Console.

Voici un exemple avec 3 fichiers sitemaps pour 3 types de pages (catégories, articles et pages dans WordPress)

Sitemaps par types de pages

Exemple avec 3 sitemaps, pour 3 types de pages

En général on met les sitemaps à la racine du sous-domaine concerné, mais vous pouvez vous organiser autrement. Vous pouvez faire référence dans un sitemap à des URL d'autres sous-domaines, mais il faudra que votre même compte Google Search Console soit propriétaire de ces autres sous-domaines.

Qu'est-ce qu'un index de sitemaps ?

Si vous possédez plusieurs sitemaps, vous pouvez utiliser un fichier d'index de sitemaps pour les envoyer en une seule fois. Le format XML d'un fichier d'index de sitemaps est très similaire au format XML d'un fichier sitemap. Le fichier d'index de sitemaps utilise les balises XML suivantes :

  • sitemapindex : balise parent placée au début et à la fin du fichier ;
  • sitemap : balise parent pour chaque sitemap répertorié dans le fichier (noeud enfant de sitemapindex) ;
  • loc : emplacement du sitemap (noeud enfant de sitemap) ;
  • lastmod : date de la dernière modification du sitemap (facultatif).

Pour en savoir plus sur la syntaxe, consultez la page dédiée au protocole Sitemap.

Voici un exemple d'index de sitemaps au format XML. Cet index répertorie 2 sitemaps :

<?xml version="1.0" encoding="UTF-8"?>
   <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
      <loc>http://www.example.com/sitemap-categories.xml.gz</loc>
      <lastmod>2015-01-01T18:23:17+00:00</lastmod>
   </sitemap>
   <sitemap>
      <loc>http://www.example.com/sitemap-produits.xml.gz</loc>
      <lastmod>2015-01-01</lastmod>
   </sitemap>
   </sitemapindex>

Une fois que vous avez créé et enregistré votre fichier d'index, vous pouvez le déclarer à Search Console comme les autres fichiers sitemaps. Si vous déclarez le fichier index, il est inutile de déclarer les fichiers enfants listés dans ce fichier index (d'ailleurs si vous le faites, vous aurez des sitemaps en doublon ce qui ne pose pas de problème à part d'avoir des chiffres faussés dans Search Console).

Vous pouvez envoyer jusqu'à 500 fichiers d'index de sitemaps pour chaque site de votre compte.

Comment créer un fichier sitemap

Vous êtes nombreux à demander quels sont les meilleurs outils gratuits pour créer un sitemap. C'est simple : vous devez créer vous-même un script qui génère le ou les sitemap(s), ou bien utiliser un plugin de sitemap si jamais vous utilisez un CMS. Ce script ressemble fort à celui qui génère un flux RSS d'ailleurs. Vous pouvez faire autant de scripts (ou d'options) qu'il y a de types de pages sur votre site (si jamais vous suivez mon idée de créer un fichier sitemap par type de pages).

Evidemment, vous pouvez utiliser des scripts tout fait adaptés à votre CMS. Par exemple pour WordPress il y en a plein. Consultez dans la FAQ les scripts pour fichiers sitemaps.

Avec cette solution, votre sitemap sera tout le temps à jour. Vous n'aurez jamais besoin de l'uploader quelque part (à part le déclarer à Google, cf. plus bas). Si besoin, gérez un cache afin de ne pas regénérer ce fichier à chaque fois qu'il est consulté par un crawler.

Voici les 3 meilleures raisons pour lesquelles vous ne devez jamais utiliser d'outil de génération de sitemap de type "crawler" (générateur de sitemap / sitemap generator) :

  • pourquoi utiliser un outil de crawl plutôt que de faire confiance à Google dont c'est le métier ? Pensez-vous vraiment que l'outil que vous choisissez sera plus performant que le crawler de Google ? Et d'ailleurs, pourquoi vouloir faire le boulot de Google ?
  • en faisant passer un crawler sur votre site, vous sollicitez votre serveur. Si l'outil que vous utilisez est mal conçu ou mal configuré, il risque de surcharger votre serveur en demandant trop de pages par seconde.
  • cette solution n'est pas automatisée : vous devrez penser à lancer l'outil, exporter le fichier généré et l'uploader sur votre serveur. Alors qu'avec le script que vous aurez fait, le sitemap sera toujours à jour.

Par contre, si vous utilisez un outil de type crawler pour faire d'autres analyses sur votre site, autant en profiter pour exporter un site map, ça peut toujours vous servir.

Les sitemaps dans Google Search Console (GSC)

Comment déclarer un sitemap à Google

L'interface GSC vous permet de déclarer un nouveau sitemap et de consulter les statistiques associées.

Sitemaps dans GWT

GSC liste les sitemaps et leurs statistiques

Pour envoyer un nouveau sitemap, allez dans Optimisation > Sitemaps, puis cliquez sur le bouton rouge "Ajouter/Tester un sitemap". Indiquez le nom du fichier puis validez soit pour tester simplement le fichier, soit directement pour l'envoyer.

Il sera alors immédiatement analysé par Google qui vous indiquera rapidement si le format du fichier est conforme ou pas.

Si vous utilisez un index de sitemaps, il suffit de le déclarer, inutile de déclarer chacun des sitemaps.

Compte-rendu des erreurs des sitemaps

Il faudra ensuite attendre un peu (quelques heures à quelques jours) afin d'avoir des statistiques : Google indique combien il a trouvé d'URL dans votre fichier (c'est ce qui est bizarrement nommé "Date d'envoi") et combien il a "décidé" d'en indexer (nommé "Dans l'index"). Google n'indexe pas forcément toutes les URL présentes dans un fichier sitemap car :

Si Google trouve des erreurs dans votre fichier, il les indique. Essayez de les corriger au plus vite.

En cliquant sur le nom du sitemap, vous obtenez certains détails. En cliquant ensuite sur le type de contenus associés (par défaut "Pages web"), vous obtenez une courbe montrant jour par jour combien Google a trouvé d'URL dans votre fichier ("Date d'envoi") et combien il en a indexées ("Dans l'index") :

Statistiques journalières d'un sitemap

Statistiques journalières d'un fichier sitemap dans GWT

Faut-il renvoyer son sitemap régulièrement ?

Non, en général ce n'est pas nécessaire, je suis sûr que vous trouverez d'autres choses à faire plus utiles pour votre référencement ! Google vient consulter votre sitemap régulièrement, sans qu'il soit nécessaire de l'uploader à nouveau. Consultez la page sommaire des sitemaps dans GSC et vous verrez la date de dernière consultation par Google pour chacun de vos sitemaps.

Evidemment, ceci ne fonctionne que si votre sitemap est dynamique (construction à la volée quand on le consulte) ou très souvent mis à jour (par un processus automatisé chez vous).

Pour obtenir encore plus d'aide

Vous avez plusieurs moyens :

Source de l'image d'entête : Shutterstock (sous license)

A propos de l'auteur : Olivier Duffez Olivier Duffez sur Google+ Olivier Duffez sur Twitter Olivier Duffez sur Facebook Olivier Duffez sur Pinterest Olivier Duffez sur LinkedIn

Consultant en référencement, Olivier Duffez a travaillé pour les plus grands sites (Doctissimo, FNAC, RueDuCommerce...). Il édite le site WebRankInfo qu'il a créé en 2002, devenu la + grande communauté francophone sur le référencement (+290.000 membres, 1,5 million de posts). Il a également créé la société Ranking Metrics, leader des formations emarketing en France (SEO, AdWords, Analytics, réseaux sociaux).

Article (Conseils sur les fichiers sitemaps et le référencement (SEO)) publié par WebRankInfo dans la rubrique Sitemaps. Si vous souhaitez publier un extrait de cet article sur votre site, assurez-vous de respecter les conditions générales d'utilisation de WebRankInfo.

68 commentaires

  • Alexandre a dit le

    Merci pour toutes ces informations sur le sitemap, je pensais qu'il y avait quand même un impact sur le référencement.

  • Fenril a dit le

    Merci Olivier, un petit rappel sur l'importance du Sitemap ne fait jamais de mal ;)
    Pour ma part, j'aime les sites bien structurés comme pourrait l'être un livre :
    - Titres (balise Title)
    - 4eme de couv (meta Description)
    - Chapitre (h1)
    - Sous-chapitres (h2)
    - Table des matières (Sitemap)

    C'est vraiment ainsi que je pense la structure de mon site avant de le proposer à Google.

  • Kielo a dit le

    Tout comme Alexandre je pensais le fichier sitemap indispensable et je l'avais donc mis en place sur tous mes sites, quelque soit leur taille. Bon, je ne pense pas que ça puisse me nuire, donc je vais les laisser.

  • Pépé a dit le

    Pour un débutant comme moi toutes ces informations sont très intéressantes. J'ai fait un dossier sitemap, en pensant que c'était bon pour le référencement.

  • Robin a dit le

    Pour les gros sites l'intérêt est aussi de mesurer son indexation : si on se rend compte que seulement 50% des pages sont indexées, ça permet de détecter un problème.

  • Olivier Duffez a dit le

    @Robin : c'est bien ce qui est écrit dans mon article ;-)

  • Citations célèbres a dit le

    Merci du tuto.
    J'utilise cette fonctionnalité, mais j'aime bien l'idée de créer des sitemap, par categorie,...

  • Luxury Countryside a dit le

    Ajouter une url d'une nouvelle page dans son sitemap aide t'il à faire indexer plus rapidement cette page en général ?

  • Olivier Duffez a dit le

    @Luxury : ça fait peut-être gagner des pouillèmes... Mieux vaut penser à mettre un lien depuis la home et à partager la page sur les réseaux sociaux

  • DestinationNet a dit le

    Je pensais également que le sitemap permettait d'accélérer l'indexation des pages (surtout lors de l'inscription d'un nouveau domaine).

    L'inscription d'un nouveau site dans GWT suffit-il à indexer rapidement la page d'accueil du site internet ?

  • Olivier Duffez a dit le

    Inscrire son site dans GWT ne permet pas de le faire indexer (en tout cas je n'ai jamais testé mais j'espère pour vous que vous avez d'autres sources de liens au moment du lancement d'un site)

  • Julia a dit le

    je savais qu'un sitemap ne changerait rien au référencement, mais je pensais que c'était quand même obligatoire peu importe la taille du site pour que les robots indexent bien tout. Mais j'avoue que je n'en ai pas fait quand même et je pense que j'ai bien fait au final ^^

  • rédaction web a dit le

    Merci pour ce tutoriel bien pratique!
    Idéal pour débutants que pour confirmés en SEO!
    A bientôt!

  • Mango a dit le

    Bonjour et bonne année,

    Il me semble également qu'un site bien structuré n'a en théorie pas besoin de sitemap, tant qu'il n'est pas trop gros. Mais un moment donné, sans sitemap, ne connaissant pas les dates de modifications des pages, les moteurs sont obligés de crawler "à l'aveugle" ( et donc inutilement ) la plupart des pages qu'ils visitent. Depuis que j'ai développé un sitemap automatique, les moteurs voient donc la date de modification de chaque url, et peuvent choisir de visiter, ou non, telle ou telle url, en fonction de l'intérêt qu'ils y portent, et de la date de dernière modification. Cela peut réduire de moitié le trafic robots. Mon site est une base de données dans laquelle google indexe aujourd'hui 3.000.000 de pages, sur un total de 5.000.000 de pages lues [ parfois 80 à 100 pages minutes pour les robots ].

    J'en profite pour poser une question. Environ 280.000 de ces pages sont spécialement destinées aux mobiles, et donc bien rangées dans le sitemap mobile. Google dit bien avoir lu ces pages dans mon compte GWMT, et je les vois effectivement dans l'index web, mais il n'y a toujours pas de barre rouge indiquant l'index "mobile". Et je me demande s'il existe vraiment, cet index mobile ... quelqu'un a-t-il "sa" barre rouge à l'endroit de l'index mobile ?

  • Olivier Duffez a dit le

    @Mango : Googlebot sait parfaitement adapter sa fréquence de crawl en fonction de la fréquence de mise à jour de chaque page. Google savait le faire bien avant d'introduire les sitemaps.

    Je pense qu'il est plus utile d'étudier la façon dont Google crawle un site que de bichonner des super sitemaps XML avec un réglage des fréquences et des priorités (dont on ne sait pas ce qu'il en fait). Mais je peux me tromper, chacun ses petites habitudes !

  • Mango a dit le

    Bonjour Olivier, Je n'utilise pas en effet les expressions fréquence ni priorité. Je parle uniquement de date de dernière modification de chaque url, ou de rafraîchissement. Car si les données d'une page peuvent être inchangées, certains éléments de son code html peuvent l'être [ cosmétiques ou structurels ]. Donc mes sitemaps ont vocation à montrer une simple arborescence d'url, permettant de voir les nouvelles url, puis de constater les dates de rafraîchissement des pages correspondant à des url déjà existantes. Il faut dire aussi que mes pages sont servies par le même logiciel qui gère et pilote la base de données. Ce n'est donc pas un serveur standard, chez un hébergeur de site, qui fait ce travail, mais ce sont mes machines. Et j'ignore si un serveur du marché, comme "Apache" et sûrement bien d'autres, peut renseigner un robot sur la date de fraîcheur d'une page, sans sitemap, et sans servir l'intégralité de cette page au robot, afin qu'il constate qu'elle a ou non changé. Le mode "Head" peut-être.

    Mon logiciel rafraîchit donc 24h/24 environ 25.000 pages/jour, en prenant en priorité les plus anciennes. Et chaque nuit il rafraîchit son sitemap. Étant donné que je travaille en permanence sur la structure des pages, css, microdata, cosmétique, le robot ne peut que constater un changement de chaque page par rapport à son archive précédente.

    Ce qui me taquine beaucoup, c'est de savoir si l'index "mobile" existe dans google.

  • Olivier Duffez a dit le

    Oui ça existe, c'est l'entête if-modified-since. Voir aussi le code HTTP 304

  • dgv a dit le

    Merci pour ce récap.
    Je me sens en phase avec certains points : script maison pour construire un sitemap format texte, utilité pour les gros sites.
    Je vais vérifier l'utf8 ...

  • Mango a dit le

    Olivier écrit
    >Oui ça existe, c'est l'entête if-modified-since. Voir aussi le code HTTP 304

    Effectivement, mais sauf si je me trompe, ce n'est qu'en sollicitant l'url que le robot saura si la page correspondante est changée ou non. Et ce que je crois utile d'épargner au robot, et à la bande passante, c'est justement de charger tout ou partie d'une page pour constater que ce chargement était inutile.

    Et il me semble que le robot peut décider d'y aller (ou non) en lisant dans une liste d'url toutes ces dates, sans en charger une seule, puis faire ses courses ...

  • Olivier Duffez a dit le

    Non Mango, avec le code 304 la page n'est pas téléchargée, seul l'entête. Par ailleurs, ce n'est pas parce que tu mets certaines URL dans un sitemap que Google s'interdit d'aller voir les autres...

  • JobProd a dit le

    Merci pour cet article. Avez-vous un plugin wordpress à conseiller pour générer automatiquement un sitemap ?

    Merci beaucoup,
    Romain

  • Olivier Duffez a dit le

    @JobProd : à moins de produire un nombre incalculable de pages par jour, sinon c'est rarement nécessaire pour un site sous WordPress. Mais le bon WordPress SEO de yoast fait ça très bien.

  • Mango a dit le

    Olivier écrit

    >Non Mango, avec le code 304 la page n'est pas téléchargée, seul l'entête

    Je vais regarder ça. Il y a certainement des choses à y apprendre. Et je confirme que google charge parfois des pages qui n'existent plus depuis plusieurs années, malgré un code 301 basique, et qui ne sont donc plus dans le sitemap.

    Si je peux revenir sur l'index "mobile", le sitemap xml a en revanche la vertu de pouvoir dire très clairement à google si une url est ou pas . Or toutes ces url sont placées dans l'index "web" de google et non l'index "mobile". Et ça c'est un mystère pour moi. Il est logique qu'un site avec une version ordinateur et une version mobile présente un même article avec une mise en page standard d'un côté, puis une autre très allégée pour les mobiles. Et si google met ces deux pages dans le même index, il serait compréhensible qu'il considère cela comme du contenu dupliqué. Cela m'éclairerait beaucoup de savoir si quelqu'un a concrètement des url "mobile" effectivement retenues dans un index "mobile" de google.

    Merci en tout cas à webrankinfo, à Olivier donc, pour ces articles toujours très bien écrits.

  • slhuilli a dit le

    Bonjour,

    Vous parlez du protocole sitemap (et oui certains voient ceci comme un protocole) qui a été mis en place par google. Est-on sûr que les autres sites qui exploitent les sitemaps s'appuient sur le même protocole ou existe-t-il des variantes telles qu'il en existe avec html et internet explorer ?

  • Olivier Duffez a dit le

    @ slhuilli : tu écris "les autres sites" mais tu voulais dire "les autres moteurs" je suppose. Bing (et Yahoo à l'époque) le supportent également, je ne sais plus trop pour les autres. Tu penses à quels autres moteurs ?

  • maloc a dit le

    Ça peut donc être utile pour une partie de site qui a du mal à se référencer, histoire de voir ce que fait google dessus ? Sans que pour autant, il soit nécessaire d'être exhaustif sur les autres pages du site (sur lequel je ne veux pas faire de sitemap étant donné qu'elles se placent comme il faut) ?

    Est-ce qu'il n'a jamais été remonté de soucis suite à la mise en place d'un sitemap (notamment un sitemap mal fait par erreur ...) ? Perso j'hésite fortement à le faire parce que le reste du site se référence bien tout seul, sauf une catégorie qui malgré un contenu de bien meilleur qualité que la concurrence ne donne aucun résultat satisfaisant.

  • Olivier Duffez a dit le

    @maloc : le sitemap ne doit pas lister des URL qui répondent en erreur, mais à part ça, et même avec ça, ça ne va pas casser ton référencement.

  • David Vietnam a dit le

    J'ai remarqué qu'un sitemap ne donnant pas d'erreurs sur Google WT du type "url exclue par le fichier robots.txt", lorsqu'il était uploadé chez Bing WT, certaines urls ressortaient comme exclues par le fichier robots.txt Très bizarre car je parle du même site, même fichier sitemap et robots.txt L'outil de vérification des urls bloquées par robots.txt dans GWT donne le feu vert également.
    Quelqu'un a-t'il rencontré ce problème?

  • Yves de Top Sites Infos a dit le

    Article intéressant...c'est vrai qu'en matière de sitemap on entend tout et son contraire quant à la nécessité d'en avoir un ou pas pour son site...Dans mon cas, je crois pas que c'est nécessaire.

  • franz a dit le

    Les sitemaps sont indispensables dans l'utilisation de pages construites dynamiquement (par exemple les pages *.awp de Webdev de PC Soft).

    Ce que je ne comprends pas, dans mes sites de présentations d'entreprises, c'est qu'un petit nombre de pages soient indexées par Google (par exemple 2 sur 18). Mais je n'ai pas de balises h1 h2.

    Une explication?

  • Olivier Duffez a dit le

    qu'est-ce que ça change que les pages soient générées dynamiquement ou pas ? si un sitemap est indispensable pour les faire indexer, c'est que le site est mal conçu, et le sitemap n'est qu'une mauvaise solution (une rustine).

  • saadaoui a dit le

    J'ai installé le plugin xml-sitemap j'ai deux fichiers sitemap
    /sitemap.xml ET /sitemap.xml.gz avec des Pages Web (539 Date d'envoi - 462 Dans l'index) mais pas pour les images , catégories, pages et posts comme montrés en haut . Je ne sais pas si je dois ajouter d'autres sitemap ?

  • carabde a dit le

    Très intéressant.... J'ai toujours cru qu'un sitemap était nécessaire voir prémordial! Maintenant et avec cet article c'est différent.

  • franz a dit le

    WEBDEV génère des pages dynamiques sur le serveur de déploiement sous Windows : elles ne peuvent être appelées par une adresse URL.

    Les pages awp sont aussi des pages dynamiques mais elles ont une adresse URL en dur et peuvent donc être référencées.

  • Olivier Duffez a dit le

    @franz : ok merci je comprends mieux. Pourquoi faire simple quand on peut faire compliqué ?

  • Guillaume Chéruy a dit le

    Merci pour cet article très instructif.
    Je pensais que le sitemap aidait au référencement. J'ai du mal du coup à comprendre pourquoi un nombre incalculable de blogs, sites et articles assurent que le sitemap améliore le référencement de manière quasi indispensable...?

  • Olivier Duffez a dit le

    Guillaume, tu ne sembles pas te rendre compte du nombre d'idées reçues qui circulent dans le référencement...

  • OlivierA a dit le

    Quelle peut être la raison d'une indexation partielle (50/54) par Google d'un petit site (avec sitemap) ? Il n'y a pas d'erreur d'exploration mentionnée dans GWT... Merci de vos lumières !

  • Olivier Duffez a dit le

    @OlivierA : merci de poser la question dans le forum en précisant l'URL du site, ça sera bien plus facile d'avoir des réponses

  • slhuilli a dit le

    @Olivier Bonsoir Olivier et désolé de répondre si loin dans le flux. Je pensais à tous les petits moteurs, y compris ceux installé sur des sites (comme phpDig, écrit en PHP mais qui n'a pas pignon sur rue).
    Ma question peut aussi se reformuler ainsi : toutes les balises du protocole sitemap sont-elle *toutes* exploitées dès qu'un moteur sait "ingérer" le protocole sitemap ? Je pense notamment aux balises , est-elle vraiment toujours bien gérée ?
    Merci

  • Olivier Duffez a dit le

    @ slhuilli : désolé je ne comprends pas de quels moteurs tu parles. Les "moteurs installés sur des sites" se sont des moteurs de recherche interne ? Ils ne fonctionnent pas avec les sitemaps je pense, mais c'est au cas par cas. Tu penses à quels autres moteurs ? Et à quelles "balises" ?

  • Bonjour 404 a dit le

    Petit retour d'expérience, ayant eu le cas à traiter très récemment.

    Dans le cas d'un sitemap dynamique en PHP, le format de date des balises doit impérativement être au format 2013-02-01 (pour le 1er Février par exemple), le format 2013-2-1 ne marchera pas. Il faudra donc préférer en PHP la fonction date('Y-m-d') plutôt que getdate() qui posera problème avec les 0 manquants.

    Pour le réécrire ensuite en xml, un simple
    RewriteRule ^sitemap\.xml$ /sitemap.php [QSA,L]
    en htacces devrait suffire.

  • Olivier Duffez a dit le

    @Bonjour404 : le nom du fichier n'a pas besoin d'être sitemap.xml (au contraire, cf. mon article). La règle de réécriture n'a donc pas d'intérêt, on peut fournir directement le nom du fichier PHP à GWT.

  • Olivier a dit le

    @Olivier Duffez : Oops... Le site est acumeo.fr (je sais qu'il faut sérieusement le réformer et m'y prépare)... Merci pour l'aide et les suggestions !

  • Olivier Duffez a dit le

    @acumeo : dans le forum SVP...

  • webgenery a dit le

    Très bon article sur les sitemaps.
    Pour ma part j'ai toujours un avertissement pour les sitemap images à propos de l'urlset dans googlewebmastertools.
    Pourtant j'ai prix exemple sur le site de google, allez comprendre.
    Et vous ça vous arrive aussi?

  • jacques66 a dit le

    Merci pour cet article. Je doit avouer que je galere un peu car j'ai un site statique, dans lequel j'ai un dossier comprenant une boutique prestashop. J'espère que cette structure ne nuiera pas a mon referencement... Si vous avez des conseils, je suis preneur...

  • janolapin a dit le

    Olivier,

    j'aimerai ton avis sur l'outil de sitemap inclus dans WordPress SEO: est-il optimiser en terme de ressources ou pas? Est-ce sinon paramétrable?

    Par ailleurs, une fois un sitemap déposé puis reconnu, lors d'un nouveau site ou de changement sur un site, peut-on ensuite le supprimer et désactiver le script qui le produit sans conséquence négative vis-à-vis des moteurs?

  • Olivier Duffez a dit le

    @janolapin : je ne connais pas les performances en termes de ressources, désolé. Je sais qu'il est pas mal dans la mesure où il fait un index de sitemaps et un sitemap par type de contenu. Il faudrait vérifier s'il y a une gestion du cache.
    Cependant je ne vois pas pourquoi ce serait gênant de supprimer un sitemap après que Google l'a connu et exploité pendant un moment.
    Ce qui peut gêner c'est de conserver un vieux sitemap qui n'est plus à jour et qui liste des URL qui ne doivent pas être crawlées.

  • Dos a dit le

    D'après mon expérience, un site map a l'avantage d'aide un indexer des pages web plus rapidement (on peut soumettre autant de fois qu'on veut son site map à google, alors qu'on est limité en nouveau url auprès de google). Sur un site nouveau, ou traitant d'un sujet à effet de buzz, cela permet dans certains cas d'avoir ses url référencés plus rapidement

  • Monica@Animation Commerciale a dit le

    Alors pour résumer, Maître Olivier, le sitemap est donc une rustine tout de même utile pour les gros sites souhaitant accélérer l'indexation d'une flopée de pages, nouvelles ou réactualisées.
    Dans le cas d'une migration pour un gros site à partir de 1000 pages, un nouveau sitemap reste-t-il tout autant souhaitable?
    Pour une nouvelle page, poster son lien sur un réseau ou la plusser, twitter ou liker, est-ce plus rapide qu'un nouveau sitemap en terme d'indexation?
    Dernière question: indexer des pages c'est bien, mais quand-est il de la démarcation entre index primaire et secondaire dont l'un comptant juste pour le décorum?
    Merci Mister (bravo pour ces vrais articles et conseils en béton)

  • Olivier Duffez a dit le

    Oui pour une migration d'un gros site, faire un sitemap fait partie des nombreuses choses à faire.
    Plusser une nouvelle page est sans doute très rapide, tout comme le sitemap. C'est mieux car on fait d'une pierre deux coups.
    Il n'est pas simple à mon avis de connaître de façon certaine si une page est dans l'index primaire ou secondaire (si ce dernier existe encore vraiment).

  • Khalan a dit le

    Bonjour j'ai une question . Est ce que le fait d'ajouter une url à son sitemap lui permet de se faire indexer plus rapidement ?

  • William a dit le

    Merci beaucoup pour ces informations, en tant que débutant je découvre l'intérêt des fichiers htacces, robots, et sitemap et je pensais vraiment que ce dernier devait d'une part s'appeler "sitemap.xml" et d'autre part qu'il était indispensable au référencement. Je vais pas le supprimer mais pour la prochaine fois, je ferais sûrement les choses un peu différemment; encore merci. :)

  • Jmleclercq a dit le

    Merci pour cet article... très clair !

  • Olivier – 1zeste2web a dit le

    Article intéressant même si effectivement on peut se demander si le sitemap a encore un réel intérêt. On peut imaginer que dans quelques années, on en parlera plus...

  • Detectimmobilier a dit le

    GG semble capable de trouver l'architecture d'un site sans sitemap

  • Julien a dit le

    J'ai enfin compris qu'on peut 'forcer' Google à prendre en compte un nouveau sitemap plutôt que d'attendre qu'il le fasse tout seul. D'ailleurs, y a-t-il une fréquence minimum à laquelle le bot check ça ? Est-ce fait en même temps que le crawl des nouvelles pages ?

  • Olivier Duffez a dit le

    @Julien : si tu lis bien l'ensemble de l'article, tu comprendras que le mieux est de se passer de sitemaps et qu'il ne faut pas s'embêter avec ce genre de questions...

  • FemmeTaureau a dit le

    Merci pour tout éclaircissement. J'ai une question à poser et j'espère avoir une réponse. J'ai lu l'article et aussi les commentaires. Il existe pas mal des personnes qui ont notifié que l'ajout d'un sitemap permet d'indexer les pages plus rapidement. Pouvez-vous nous donner des statistiques(des tests faits ou des sources à méfier) pour nous rassurer.

  • Anthony a dit le

    Bonjour et merci pour cet article détaillé.

    J'ai J'ai une question concernant les sitemaps mis à jour régulièrement pour référencer les nouveaux éléments du site.

    Est-ce que google va consulter régulièrement les sitemaps qu'on lui à donné via GWT ? Ainsi prend t-il les mise à jour en compte fréquemment.

  • Olivier Duffez a dit le

    Oui Anthony, Google consulte régulièrement les sitemaps qu'on lui fournit

  • Anthony a dit le

    Merci !
    Je suis dans une situation ou google refuse d'indexer une nouvelle partie d'un de mes sites je tente donc le site map pour voir si c'est un blocage volontaire de google ou bien si j'ai raté mon linking sur la nouvelle partie

  • Oncle Jesse a dit le

    Bonjour à tous et encore merci pour tous ces articles Olivier !

    Une petite question :
    Savez-vous si la mise en place d'un sitemap "grossier" (qui ne présenterait que les catégories par exemple) peut être mal perçu ou mal compris par nos amis moteurs de recherche ?
    En l’occurrence ce serait pour un site bilingue, et l'idée serait de faire comprendre que la home et chaque catégorie existe dans deux versions (une par langue) en utilisant les balises rel="alternate" hreflang.
    Pour les articles et autres pages de moindre importance l'idée serait de laisser les bots faire comme bon leur semble.

    Un avis la dessus ?
    Bonne journée à tous !

  • Olivier Duffez a dit le

    Il n'y pas d'histoire de "mal perçu" ! Le sitemap est un outil permettant d'inciter Google à crawler certaines URL.

  • chris a dit le

    Merci pour l'article. Moi qui suis blogueuse j'ai rarement vu un article qui soit aussi utilement long!!

  • Boni a dit le

    Bonjour,
    Je ne suis pas satisfaite du module qui gère mon sitemap, car je n'ai pas accès au priorités des pages ni de mentions de date de creation et de modification.
    J'envisage de prendre un autre module (Prestashop) qui me permet plus de souplesse etc...
    Ma question est:
    Si je change mes sitemaps, je vais changer de nom de sitemap et de stucture.
    Est-ce que cela va plomber mon site durant un certains temps et me refaire partir depuis le début ou est-ce que cela aura aucune implication sur mon référencement?
    Merci!

    Boniface

  • Olivier Duffez a dit le

    @Boni : à mon avis, les priorités (et même les indications de fréquence de mise à jour et de dates) n'ont pas d'intérêt.
    Cela dit, ça ne présente aucun risque de changer les sitemaps, y compris le nom du ou des fichiers sitemaps. Ce qui compte, ce sont les URL présentes dans ces sitemaps.
    Est-il possible de connaître l'URL du site ?

Annonces Google

Catégories des dossiers

Consultez les dossiers par thématiques :

Annonces Google

Formation référencement et webmarketing

Venez chez Ranking Metrics vous former au référencement, à Google AdWords et Analytics ainsi qu'aux réseaux sociaux ! Plus de 4000 entreprises sont déjà venues (Dossier possible OPCA, DIF...).

Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans le domaine, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.

Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, consultez le site de Ranking Metrics (organisme de formation).

Hébergement web

Hébergement web mutualisé et dédié

Pour un bon référencement, il faut un bon hébergeur. Testez Sivit by Nerim, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo.

A partir de 3€ HT/mois.