Quelques questions sur le sitemap

Nouveau WRInaute
Bonjour,
Je me pose quelques questions à propos du sitemap :
- dois-je lister toutes les pages accessibles ?
- quelle date mettre pour les plus anciennes ? les infos qui y figurent restent valables et toujours d'actualité :
Option 1 : mettre la date de création du premier site map
Option 2 : ne pas mettre de date => donc surement retrouver ces pages dans les profondeurs de GG
Option 3 : avoir un script qui met la date à date_du_nouveau_xml - 6 mois => dans ce cas, toutes les pages qui n'ont pas bougé depuis des mois vont quand mm changer de dates de modification à chaque crawl, ej je vois pas l'interet dans ce cas de mettre une date
- dans quel ordre mettre les pages ? est ce que cet ordre a de l'importance ?
- faut-il hierarchiser le plan en fonction des "rubriques" ?

Je ne comprend pas vraiment l'interet de cette date d'ailleurs, parce qu'il va forcément y avoir des webmasters qui vont faire des sitemaps avec toutes les dates à J ou J-1 donc comment GG va savoir si la page a été réellement modifiée dans ce cas ?

D'autre part, avec l'url rewriting, il est facile d'avoir la page 'ma_page1.html' et 'un_autre_nom_pour_la_mm_page.html", voire 3, 4, 5 noms pointant sur la meme page. Comment GG peut-il savoir que c'est bien la mm page au bout du compte. Dans ce cas, il sera facile d'avoir des centaines de milliers de pages ....
D'autant que d'une visite à l'autre de GG, si l'un des alias de cette meme page disparait, GG ne va pas directement l'effacer de sa base. Donc si à chaque visite de GG le nom dans le sitemap change ... on va multiplier le nombre de pages indexées.

Merci d'avance de vos lumières et éclaircissements !!

Ova
 
Nouveau WRInaute
Bonjour,
Oui, ça je sais mais justement : comment GG utilise-t-il le site map ? Se contente-t-il de prendre la liste telle qu'elle où vérifie-t-il toutes les pages ?
Et pour cette histoire de date ? quelqu'un a une idée ?

D'avance merci

Ova
 
WRInaute discret
Je me pose la même question pour la date, et je pense opter pour mettre par défaut la date de création du premier sitmap pour toutes les pages déja en places. Ensuite, en fonction des modifs, un petit update sur cette valeur par défaut, et zou ! (je compte utiliser une table MySQL pour la génération du Sitemap)

Maintenant, quant à savoir comment GG exploite réellement ces dates, et surtout l'importance qu'il leur accorde, je doute que quelqu'un le sache.

En tout cas, il doit déja y avoir un petit mix entre cette date et la priorité de la page, pour savoir quelle page le robot va décider d'aller crawler en premier.

Ensuite, pour le coup de mettre systématiquement la même date pour toutes les pages (ou une grande partie) ça nuira forcément, à long terme en tout cas.

C'est tout bête pour Google de poser un filtre si jamais les dates changent pratiquement toutes simultanément d'une sitmap à l'autre.
 
Discussions similaires
Haut