Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

Fichiers robots.txt

Poster un nouveau sujet Imprimer cette discussion    Forum -> Débuter en référencement   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 10:45    Sujet du message: Fichiers robots.txt

Pour vous ce fichier robots.txt veux dire quoi :
Code:

User-agent: *

User-agent: Alexibot
User-agent: asterias
User-agent: BackDoorBot/1.0
User-agent: Black Hole
User-agent: BlowFish/1.0
User-agent: BotALot
User-agent: BuiltBotTough
User-agent: Bullseye/1.0
User-agent: BunnySlippers
User-agent: Cegbfeieh
User-agent: CheeseBot
User-agent: CherryPicker
User-agent: CherryPickerElite/1.0
User-agent: CherryPickerSE/1.0
User-agent: CopyRightCheck
User-agent: cosmos
User-agent: Crescent
User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0
User-agent: DISCo Pump 3.1
User-agent: DittoSpyder
User-agent: EmailCollector
User-agent: EmailSiphon
User-agent: EmailWolf
User-agent: EroCrawler
User-agent: ExtractorPro
User-agent: Foobot
User-agent: Harvest/1.5
User-agent: hloader
User-agent: httplib
User-agent: humanlinks
User-agent: InfoNaviRobot
User-agent: JennyBot
User-agent: Kenjin Spider
User-agent: LexiBot
User-agent: libWeb/clsHTTP
User-agent: LinkextractorPro
User-agent: LinkScan/8.1a Unix
User-agent: LinkWalker
User-agent: lwp-trivial
User-agent: lwp-trivial/1.34
User-agent: Mata Hari
User-agent: Microsoft URL Control - 5.01.4511
User-agent: Microsoft URL Control - 6.00.8169
User-agent: MIIxpc
User-agent: MIIxpc/4.2
User-agent: Mister PiX
User-agent: moget
User-agent: moget/2.1
User-agent: NetAnts
User-agent: NetAttache
User-agent: NetAttache Light 1.1
User-agent: NetMechanic
User-agent: NICErsPRO
User-agent: Offline Explorer
User-agent: Openfind
User-agent: Openfind data gathere
User-agent: ProPowerBot/2.14
User-agent: ProWebWalker
User-agent: psbot
User-agent: QueryN Metasearch
User-agent: RepoMonkey
User-agent: RepoMonkey Bait & Tackle/v1.01
User-agent: RMA
User-agent: SiteSnagger
User-agent: SpankBot
User-agent: spanner
User-agent: SuperBot
User-agent: SuperBot/2.6
User-agent: suzuran
User-agent: Szukacz/1.4
User-agent: Teleport
User-agent: Telesoft
User-agent: The Intraformant
User-agent: TheNomad
User-agent: TightTwatBot
User-agent: Titan
User-agent: toCrawl/UrlDispatcher
User-agent: True_Robot
User-agent: True_Robot/1.0
User-agent: turingos
User-agent: URLy Warning
User-agent: VCI
User-agent: VCI WebViewer VCI WebViewer Win32
User-agent: Web Image Collector
User-agent: WebAuto
User-agent: WebBandit
User-agent: WebBandit/3.50
User-agent: WebCopier
User-agent: webcopy
User-agent: WebEnhancer
User-agent: WebmasterWorldForumBot
User-agent: webmirror
User-agent: WebReaper
User-agent: WebSauger
User-agent: website extractor
User-agent: Website Quester
User-agent: Webster Pro
User-agent: WebStripper
User-agent: WebStripper/2.02
User-agent: WebZip
User-agent: WebZip/4.0
User-agent: Wget
User-agent: Wget/1.5.3
User-agent: Wget/1.6
User-agent: WinHTTrack
User-agent: WWW-Collector-E
User-agent: Xenu's
User-agent: Xenu's Link Sleuth 1.1c
User-agent: Zeus
User-agent: Zeus 32297 Webster Pro V2.9 Win32
User-Agent: MJ12bot
User-agent: HTTrack
User-agent: HTTrack 3.0
User-agent: TurnitinBot
User-agent: QuepasaCreep
Disallow: /


Merci d'avance.
 
benjouke
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 10:50    Sujet du message: Fichiers robots.txt

Salut,
Que tous les robots sont interdits et certains plus que d'autres. Wink
 
serval2a Visiter le site web du posteur
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 10:52    Sujet du message: Fichiers robots.txt

J'ai trouvé ce fichier sur http://www.webrankinfo.com/robots.txt

C'est normale ?
 
benjouke
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:03    Sujet du message: Fichiers robots.txt

Ce n'est pas tout à fait le robots.txt de WRI car sur ton code il manque la partie suivant immédiatement :
Code:
User-agent: *

la partie manquante interdit la visite de certaines pages du forum pour éviter le duplicate content suite à l'adoption d'une technique d'URL rewriting.
@+
 
serval2a Visiter le site web du posteur
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:07    Sujet du message: Fichiers robots.txt

Ci j'enlève : User-agent: *
Mon fichier sera bon ?
Merci d'avance.
 
benjouke
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:10    Sujet du message: Fichiers robots.txt

Si tu enlèves les 3 première lignes tu interdira aux robots mentionnés de visiter toutes les pages de ton site.
 
serval2a Visiter le site web du posteur
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:11    Sujet du message: Fichiers robots.txt

serval2a a écrit:
Si tu enlèves les 3 première lignes tu interdira aux robots mentionnés de visiter toutes les pages de ton site.


Si j'enlève celle-ci c'est bon ?
Code:
User-agent: *

User-agent: Alexibot
User-agent: asterias
 

Merci d'avance.


Dernière édition par benjouke le Lun Déc 11, 2006 11:14; édité 1 fois
 
benjouke
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:14    Sujet du message: Fichiers robots.txt

Pardon, je me suis mal exprimé en fait tout ce qui est au dessus de la ligne : User-agent: Alexibot
 
serval2a Visiter le site web du posteur
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:15    Sujet du message: Fichiers robots.txt

Donc un bon fichier robots.txt c'est ceci :
Code:

User-agent: Alexibot
User-agent: asterias
User-agent: BackDoorBot/1.0
User-agent: Black Hole
User-agent: BlowFish/1.0
User-agent: BotALot
User-agent: BuiltBotTough
User-agent: Bullseye/1.0
User-agent: BunnySlippers
User-agent: Cegbfeieh
User-agent: CheeseBot
User-agent: CherryPicker
User-agent: CherryPickerElite/1.0
User-agent: CherryPickerSE/1.0
User-agent: CopyRightCheck
User-agent: cosmos
User-agent: Crescent
User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0
User-agent: DISCo Pump 3.1
User-agent: DittoSpyder
User-agent: EmailCollector
User-agent: EmailSiphon
User-agent: EmailWolf
User-agent: EroCrawler
User-agent: ExtractorPro
User-agent: Foobot
User-agent: Harvest/1.5
User-agent: hloader
User-agent: httplib
User-agent: humanlinks
User-agent: InfoNaviRobot
User-agent: JennyBot
User-agent: Kenjin Spider
User-agent: LexiBot
User-agent: libWeb/clsHTTP
User-agent: LinkextractorPro
User-agent: LinkScan/8.1a Unix
User-agent: LinkWalker
User-agent: lwp-trivial
User-agent: lwp-trivial/1.34
User-agent: Mata Hari
User-agent: Microsoft URL Control - 5.01.4511
User-agent: Microsoft URL Control - 6.00.8169
User-agent: MIIxpc
User-agent: MIIxpc/4.2
User-agent: Mister PiX
User-agent: moget
User-agent: moget/2.1
User-agent: NetAnts
User-agent: NetAttache
User-agent: NetAttache Light 1.1
User-agent: NetMechanic
User-agent: NICErsPRO
User-agent: Offline Explorer
User-agent: Openfind
User-agent: Openfind data gathere
User-agent: ProPowerBot/2.14
User-agent: ProWebWalker
User-agent: psbot
User-agent: QueryN Metasearch
User-agent: RepoMonkey
User-agent: RepoMonkey Bait & Tackle/v1.01
User-agent: RMA
User-agent: SiteSnagger
User-agent: SpankBot
User-agent: spanner
User-agent: SuperBot
User-agent: SuperBot/2.6
User-agent: suzuran
User-agent: Szukacz/1.4
User-agent: Teleport
User-agent: Telesoft
User-agent: The Intraformant
User-agent: TheNomad
User-agent: TightTwatBot
User-agent: Titan
User-agent: toCrawl/UrlDispatcher
User-agent: True_Robot
User-agent: True_Robot/1.0
User-agent: turingos
User-agent: URLy Warning
User-agent: VCI
User-agent: VCI WebViewer VCI WebViewer Win32
User-agent: Web Image Collector
User-agent: WebAuto
User-agent: WebBandit
User-agent: WebBandit/3.50
User-agent: WebCopier
User-agent: webcopy
User-agent: WebEnhancer
User-agent: WebmasterWorldForumBot
User-agent: webmirror
User-agent: WebReaper
User-agent: WebSauger
User-agent: website extractor
User-agent: Website Quester
User-agent: Webster Pro
User-agent: WebStripper
User-agent: WebStripper/2.02
User-agent: WebZip
User-agent: WebZip/4.0
User-agent: Wget
User-agent: Wget/1.5.3
User-agent: Wget/1.6
User-agent: WinHTTrack
User-agent: WWW-Collector-E
User-agent: Xenu's
User-agent: Xenu's Link Sleuth 1.1c
User-agent: Zeus
User-agent: Zeus 32297 Webster Pro V2.9 Win32
User-Agent: MJ12bot
User-agent: HTTrack
User-agent: HTTrack 3.0
User-agent: TurnitinBot
User-agent: QuepasaCreep
Disallow: /


Merci d'avance.
 
benjouke
benjouke
Nouveau WRInaute

Inscrit le: 12 Oct 2006
Messages: 16

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:36    Sujet du message: Fichiers robots.txt

Au faite, à quoi sert le Disallow: / à la fin du fichier ?
 
benjouke
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 11:42    Sujet du message: Fichiers robots.txt

Re, pour être parfait il faut enlever la ligne vide du début.
La mention Disallow: / sert à informer les robots mentionnés dans le fichier qu'il ne peuvent visiter aucune page du site.
 
serval2a Visiter le site web du posteur
Serious
WRInaute accro
WRInaute accro

Inscrit le: 21 Nov 2005
Messages: 2437

URL permanente de ce messagePosté le : Lun Déc 11, 2006 12:00    Sujet du message: Fichiers robots.txt

Certains de ces bots sont tout a fait legitimes.
 
Serious Visiter le site web du posteur
serval2a
WRInaute accro
WRInaute accro

Inscrit le: 21 Mar 2005
Messages: 3209
Localisation: A la poursuite de Googlebot.

URL permanente de ce messagePosté le : Lun Déc 11, 2006 12:34    Sujet du message: Fichiers robots.txt

Oui d'autant que ceux qui ne le sont pas ne respectent pas les instructions du fichier. Wink
 
serval2a Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Débuter en référencement Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort