les robots suivent les liens dans les xml ?

WRInaute discret
je voulais savoir si les robots (en particulier google) suivent les urls contenu dans les fichiers xml comme par exemple https://www.webrankinfo.net/rss-5124.xml

on voit tres bien dans le cache que GG lit le contenu http://209.85.129.104/search?q=cache:s- ... =clnk&cd=2

mais indexe t'il les urls dans ce fichier ? j'ai testé avec un outil classique qui est spider simulator mais apparament ca indique que les robots n'indexent ni le contenu ni les lien des fichiers xml .... -http://www.spider-simulator.com/cgi-bin/simulator.cgi?url=http%3A%2F%2Fwww.webrankinfo.com%2Fannuaire%2Frss-5124.xml
donc c pas une reference ;)

merci pour vos reponses ;)
 
WRInaute discret
la réponse est oui !

mes arguments :

- les fichiers Sitemap destinés aux moteurs de recherche, sont en xml,
- les flux RSS, très appréciés des moteurs de recherche, sont en xml,

donc pour moi, oui les moteurs suivent ces liens :wink:


bon ap !! :wink:
 
WRInaute discret
merci gabriel26

gabriel26 a dit:
- les fichiers Sitemap destinés aux moteurs de recherche, sont en xml,
- les flux RSS, très appréciés des moteurs de recherche, sont en xml,

pour le fichier sitemap: peut etre qu'il n'est interpreté (les liens) que s'il passe par le service GG sitemap ;)

tous les outils qui simulent le comportement des robots ne suivent pas les liens ds les fichiers xml ;) c pour ca que j'ai posé cette question en esperant que qq'un l'a deja testé ;)
 
WRInaute discret
C'est une bonne question...

Et moi je pense que non, ils ne les suivent pas pour la simple raison qu'il n'y a pas de lien dans un fichier xml!
A moins que le robot ne soit étudié pour parser un xml, et en supposant que le nom du noeud du lien lui soit connu (hou c'est chaud c'que j'viens de dire là), et bien il ne peut pas savoir qu'il y a un lien dans ce fichier.
Google et Yahoo se sont mis d'accord sur un protocole pour lire de la même manière le sitemap, mais si vous changez le nom du noeud où se trouve l'url, ben ils ne le trouveront plus.
 
WRInaute accro
Je suis plutot d'accors avec domicile pc. Faut pas confondre l'ffichage sur un site d'un flux rss et le fichier xml qui nourrit ce flux. Les moteurs suivent les liens qui apparaissent sur les pages affichant ces flux, avec des liens a href classiques. Mettez un lien vers un fichier xml directement, pas sur du tout que les moteurs iront les interpréter
 
Discussions similaires
Haut