Sitemap et exalead

WRInaute discret
Coucou,

Je profite qu'il y ai des développeurs d'Exalead sur le forum pour demander s'il y a une option pour déposer un sitemap pour ce moteur de recherche.
Si on pourrait avoir un menu comme dans google, pour gérer ces sitemaps. Un truc pour nous, les webmasters.

Je vous remercie pour le super moteur que vous developpez et toutes les fonctionnalités que vous ajoutez.
Bon courage les gars !

Kéké.
 
WRInaute discret
Non pas de possibilité de prise en compte du site maps pour le moment mais ce sont des choses qui pourraient se faire dans les mois qui viennent

Ca reste un sujet à l'etude. Notamment quelle est la partie des webmasters qui jouent le jeu et n'indique pas des frequences de renouvellement totalement fantaisiste.
 
Nouveau WRInaute
ExaleadGuy a dit:
Ca reste un sujet à l'etude. Notamment quelle est la partie des webmasters qui jouent le jeu et n'indique pas des frequences de renouvellement totalement fantaisiste.

a mon avis, pas beaucoup ;-)
 
WRInaute impliqué
lol

ExaleadGuy a dit:
Ca reste un sujet à l'etude. Notamment quelle est la partie des webmasters qui jouent le jeu et n'indique pas des frequences de renouvellement totalement fantaisiste.
qu'elle espèce d'importance est ce que ça peut avoir ?
G00gle arive parfaitement à s'en accommoder, pourquoi pas vous ?
 
WRInaute discret
Pour simplifier sitemap m'apporte la liste des urls a crawler pour un site et la frequence de rafraichissement d'icelles.

Par ailleurs, nous devons faire des choix sur l'ordre dans lequel on code les fonctionalités qu'on veut, la gestion du sitemap en etant une parmi d'autres.

Si la frequence de rafraichissement est globalement irrealiste/fausse, j'ai perdu moitié du gain à coder un module qui gere les site map et celui ci devient moins attractif et descend dans ma liste de priorité.

Sachant que la liste des urls est assez facile a connaitre uniquement en suivant les liens, l'interet du sitemap parait plus limité. Y en a t il parmi vous qui ont observé une reelle meilleure prise en compte par Google de leur site depuis cette annonce sur le sitemap ?

Dans quelle mesure ce sitemap n'est pas uniquement une annonce purement marketing pour donner l'impression aux webmasters que Google se soucie d'eux ? C'est ce genre de questions que nous nous posons avant de developper cet outil

En esperant avoir repondu a vos interrogations
 
WRInaute accro
Bonjour,
Je n'ai personnellement jamais constaté sur mes sites une meilleure indexation après apposition d'un ou plusieurs "google sitemap" puisque c'est de lui dont s'agit.
A mon avis de néophytes peut-être serait-il plus intéressant pour exalead, qui semble avoir des difficultés à indexer de nouvelles pages actuellement, de récupérer et d'exploiter une base de flux RSS.
 
Nouveau WRInaute
Je suis bien d'accord avec ExaGuy, je ne saisi pas très bien l'intérêt de ces Sitemap, surtout qu'ils sont générés automatiquement par des Sitemap generator (je vais pas coder manuellement les 1000 pages de mon site.)
Dès lors je ne comprend quelle différence cela fait avec un crawler qui va générer à peu près le même contenu.
La seule différence c'est que je peux prioriser moi même mes pages et définir la fréquence de retour du moteur, mais ça m'étonnerait que Google en tienne compte (vu qu'on voudra tous contraindre le moteur à venir le plsu souvent possible. moi j'ai joué le jeu pour voir, avec des pages archivées en "never" et d'autres en daily, mais je ne vois aucune différence, j'ai même peur qu'il zappe des pages qui n'ont pas été trouvées par le sitempa générator utilisé)

Mais si ce n'est que du Marketing, ce serait dommage de ne pas se jeter dans le filon.
J'aime bien Exalead, j'aimerais qu'on en parle plus, et donc ce serait bien de développer le SiteMap, même si c'est du flan, juste pour entrer dans la danse !

Le Marketing aussi fait partie de votre métier j'espère.
 
Nouveau WRInaute
Je ne sais pas si Google utilise ou non la fréquence qui est spécifiée, mais ce qui est sûr c'est que depuis que j'ai ajouté mon sitemap sur Googlle, toutes les pages de mon site sont référencées, sans exception. Alors qu'auparavant un bon nombre d'entre elles passaient à la trappe.

Je pense que c'est un bon moyen d'indiquer à un moteur de recherche ce que l'on a comme pages, sans l'obliger à faire des suivis de lien. Ceci étant, ce n'est pas moi qui programme, même si ça me plairait beaucoup de le faire, tant j'adoooooore Exalead !

Je me dis que cela peut également être une solution pour remplacer le fichier robot.txt ou pour indiquer au moteur qu'une page n'existe plus. Je m'explique. Si on crée ce fichier, Exalead pourrait considérer qu'il ne doit pas indexer d'autres pages du même site par exemple. Je ne sais pas si c'est pertinent, mais cela pourrait être envisagé.
En revanche ce qui est plus pertinent de mon point de vue, c'est qu'une page qui apparaissait dans le sitemap qui un jour n'y apparait plus devrait être considérée par le moteur comme supprimée, donc à retirer. C'est ce qui me barbe le plus avec Google. J'ai beau renvoyer des erreurs 404 lorsqu'une page n'existe plus, certaines supprimées il y a plus d'un an sont toujours là...

@+
Rémi
 
WRInaute discret
Déjà bravo Exalead, et, si à l'avenir vous devenez important et célèbre évitez de vous faire racheter par une entreprise americaine les bons site français sont tous tombés dans ce piège...enfin...

Ce serait intéressant de voir un sitemap pour Exalead voir un Exalead Webmasters Tools :D
 
WRInaute discret
C'est interressant que ce thread revive car justement nous avons mis en prod depuis la semaine derniere la gestion de sitemaps desormais devenu un standard (http://www.sitemaps.org)
Donc si vous incluez dans votre robots.txt une ligne indiquant l'adresse de votre sitemaps celui sera crawlé régulierement.

Neanmoins pour éviter le spam, les urls presentes dans le sitemap restent soumises aux memes tests que les autres et peuvent ne pas etre crawlées en cas de doute.
 
WRInaute discret
Ah justement comment fait t-on pour indiquer à son robots.txt l'emplacement de son sitemap... enfin quel est la ligne de "code" à ajouter ???
 
Nouveau WRInaute
Même question !

Car le fichier robots.txt ne doit contenir que des lignes
User-agent:
ou
Disallow:

alors, où mettre et comment le lien vers le sitemap ?
 
WRInaute discret
Bonjour,

pour ce qui est de la norme pour lire le sitemap, lorsque l'ont peut lire sur le site :

You can specify the location of the Sitemap using a robots.txt file. To do this, simply add the following line:

Sitemap: <sitemap_location>

The <sitemap_location> should be the complete URL to the Sitemap, such as: http://www.example.com/sitemap.xml

Je pense qu'il faut remplacer "<sitemap_location>" par l'url du Sitemap, et qu'il ne faut pas laisser les "<" et ">".

*Si je ne me trompe pas c'est ce qu'ils disent en anglais aussi.*

Personnellement j'ai marqué ça de cette manière dans mon sitemap depuis quelque temps, et lorsque j'avais fais des recherches j'avais vu que c'était avec ma manière que beaucoup de gens faisais.


De plus, de manière théorique sachant que pour exclure des URL au robot des moteurs de recherche à l'aide du robots.txt, il faut écrire :
Disallow: /administration
(par exemple)
Dans cet exemple il n'y a pas de "<" ou de ">", je pense donc que pour ajouter un sitemap il faut utiliser :

Sitemap: http://www.example.com/sitemap.xml

Si quelqu'un a de plus ample information, je suis preneur ...
 
WRInaute discret
Bonjour,
Si quelqu'un a de plus ample information, je suis preneur ...
Ayant recherché sur le web pour faire mon sitemap, je peux vous confirmer qu'il n'existe apparemment qu'une seule syntaxe:
Code:
Sitemap: http://www.example.com/sitemap.xml
Je n'ai pas encore vu de syntaxe de ce type :
Code:
sitemap: <http://www.example.com/sitemap.xml>
 
WRInaute discret
Okay, c'est bien ce qu'il me semblais.

Espérons que exalead se soit adapté, et qu'il n'ai pas confondus.
D'autant plus que le précédent post de "ExaleadGuy" date du 18 Juin
 
WRInaute discret
Pour clarifier et rassurer ceux qui s'inquietent le robot exalead va prendre en compte les lignes
Sitemap: http://www.toto.com/sitemap.xml
sans <>
J'avais mis les <> dans mes messages parceque c'est la facon dont c'est présenté sur sitemaps.org mais bien sur ceux ci ne sont pas ecrits dans le fichier robots.txt
 
WRInaute discret
et moi j'ai fais la confusion ... je corrige ce soir sur mon site ^^. Merci Exalead Guy ! Encore bravo pour votre moteur qui satisfait toutes les personnes à qui je l'installe. On devrait avoir des versions Firefox déjà préinstallé avec Exalead !

kéké.
 
Discussions similaires
Haut