Robots.txt : Yahoo supporte les options avancées
Yahoo vient d'annoncer que son robot allait désormais gérer les options avancées du fichier robots.txt qui permet aux webmasters d'indiquer quels fichiers ou répertoires doivent être exclus du crawl.
Priyank Garg l'a annoncé dans le blog officiel de Yahoo : les caractères spéciaux $ et * sont désormais supportés par Slurp, le robot de Yahoo, dans les directives Disallow du fichier robots.txt.
Dans les directives, le caractère * représente n'importe quelle séquence de caractères, et $ marque la fin d'une URL.
Par exemple si vous avez récemment appliqué la réécriture d'URL à votre forum phpBB, pour éviter que Yahoo crawle les anciennes URL, vous pouvez mettre ces lignes dans votre fichier robots.txt :
User-Agent: Yahoo! Slurp Disallow: /forum/viewtopic.php*
Cela dit dans le cas de Yahoo, on aurait pu écrire aussi :
User-Agent: Yahoo! Slurp Disallow: /forum/viewtopic.php
puisque Yahoo Slurp n'indexera pas toutes les URL qui commencent par /forum/viewtopic.php
Yahoo rajoute aussi une directive Allow qui permet comme son nom l'indique de préciser des zones du site ou des URL que le robot peut indexer. A mon avis on ne devrait pas en avoir besoin sauf peut-être dans des cas particuliers.
Rappelons que ces caractères spéciaux ne font pas partie du format initial du fichier robots.txt, mais qu'ils sont déjà pris en compte par Googlebot et MSNbot.
Rappelons enfin que le fichier robots.txt n'est pas prévu pour assurer la sécurité d'un site (il est accessible à tous) mais uniquement pour éviter aux robots de crawler les parties de votre site que vous ne souhaitez pas voir indexées.
On en discute dans le forum : Yahoo et les caractères spéciaux dans le fichier robots.txt
Olivier Duffez, Samedi 4 novembre 2006
Formation référencement et webmarketing
Vous souhaitez sans doute améliorer votre référencement, avez-vous pensé à suivre une formation spécialisée sur le référencement naturel ? En 2008, plus de 700 entreprises ont assisté à nos différentes sessions, la plupart faisant financer ces journées par la formation professionnelle (OPCA). Orange Labs nous a décerné un taux de satisfaction des participants de 90% (octobre 2008).
Préparés et animés par Olivier Duffez (WebRankInfo) et Fabien Faceries (AgentWebRanking), 2 professionnels reconnus dans la profession, nos modules sur le référencement naturel sont très complets tout en laissant une grande place à l'interactivité pour répondre à toutes les questions des participants.
Pour connaître le plan détaillé de chaque module, le prix, les dates et les lieux, cliquez ici pour consulter le site de Ranking Metrics (organisme de formation agréé).
Lectures recommandées sur ce thème :
- Petit changement pour Slurp (le robot de Yahoo)
- Les crawlers de Yahoo!
- Yahoo Slurp et autres robots d'indexation de Yahoo
- La balise meta NOYDIR de Yahoo
- Les robots MSNbot de Live Search
- Exalead rejoint le protocole Sitemaps.org
- Déclarer son fichier sitemap dans le fichier robots.txt
- Sortie de GoogleStats v2.01
- Référencement : le problème des sessions des pages PHP
- Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)
- Yahoo Slurp et mon robots.txt
- Passage du robot Inktomi Slurp mais pas de Yahoo Slurp
- Yahoo!Slurp 68.142.251.14 : un nouveau spider de Yahoo ?
- Yahoo! Slurp 3.0 le nouveau robot de Yahoo
- Yahoo slurp FR vs US ?
- yahoo Slurp crawle que /
- Slurp Yahoo et Inktomi
- Yahoo Slurp et les redirections
- yahoo slurp comment faire?
- Erreur %E2%8C%A9=en avec Yahoo-slurp
- gros crawl yahoo slurp
- Semi full crawl de Yahoo Slurp
- Yahoo slurp est un vrai bourrin
- Comment détecter le robot Yahoo! Slurp
- Yahoo Slurp devient fou sur mon site !!!!
Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps, Googlebot, Google Feed Fetcher
- Trouver la position de son site dans Yahoo
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés. - Logiciel d'analyse du positionnement
AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.
Un commentaire sur “Robots.txt : Yahoo supporte les options avancées”
Laisser une réponse
Hébergement web
Pour un bon référencement, il faut un bon hébergeur. Testez Sivit, l'hébergeur choisi par Olivier Duffez pour son site WebRankInfo (+ de 3 millions de visites/mois). Vous bénéficiez d'une garantie 30 jours satisfait ou remboursé.
A partir de 1,90 EUR HT/mois.
A la une sur WebRankInfo
Formation au référencement
Découvrez le programme de formation au référencement le plus complet : méthodologie d'optimisation du référencement Google, sites dynamiques, stratégies de liens, blogs, formation juridique Internet, Google Analytics, taux de transformation, ROI, etc.
Ce cycle de formation peut être pris en compte par votre budget formation... profitez-en !
Cette formation est assurée notamment par Olivier Duffez, créateur du site WebRankInfo et consultant indépendant en référencement.
Logiciel de pro
Vous cherchez un bon logiciel pour effectuer le suivi du référencement ? Je vous conseille AgentWebRanking, le logiciel leader sur le marché, développé par une entreprise française et vendu dans le monde entier depuis 1998.
En tant que consultant en référencement, je l'utilise pour mes prestations de conseil en référencement professionnel.
Derniers sites inscrits
- L'Ile verte, agence immobilière en Haute Saône et Franche-Comté
- CV Chef de Produit Tourisme Anne marie Enguix
- Nos plus belles randonnées en Alsace
- Jardin Couvert : serre de jardin et accessoires pour serres
- Serre Val de Loire - Spécialiste des serres de jardins et abris
- Matériels de pesage MP Pesage
- Agence de Voyage Bali Alpes
- FinanceUtile : Le financement de projets à portée de tous
- Véronique Pistorius Enginger - Dermatologue Machecoul, Nantes, Challans
- Le voyage en images
- Stylo antibactérien publicitaire nouvelle génération
- Les manifestations artistiques de Brin de Zinc Café à Faux la Montagne
- Annuaire généraliste et thématique Cadalla
- Site de contenu culturel et touristique sur l'Inde : Un jour en Inde
- I44 agence immobilière en ligne à Nantes - Agence low cost



comment insert t’on un fichier "robots.txt. merci et ou?