Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

Troncature pour un fichier robots.txt

Poster un nouveau sujet Imprimer cette discussion    Forum -> Indexation dans Google   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
luxe-campagne
WRInaute passionné
WRInaute passionné

Inscrit le: 08 Oct 2005
Messages: 982
Localisation: en ville ;-)

URL permanente de ce messagePosté le : Ven Jan 18, 2008 19:15    Sujet du message: Troncature pour un fichier robots.txt

Peut on avoir opérateur de troncature pour un fichier robots.txt ?

Par exemple, après avoir fait une réécriture d'urls, on veut interdire aux robots de visiter les pages commençant par un point d'interrogation.
 
luxe-campagne Visiter le site web du posteur
jeanluc
WRInaute accro
WRInaute accro

Inscrit le: 03 Mai 2004
Messages: 2362
Localisation: Bruxelles

URL permanente de ce messagePosté le : Ven Jan 18, 2008 21:05    Sujet du message: Troncature pour un fichier robots.txt

La syntaxe standard du fichier robots.txt est un peu particulière. Elle ne connaît pas d'opérateur de troncature, mais elle interprète toute commande "Disallow:" comme étant une interdiction de lire les pages dont l'URL commence par les caractères spécifiés.

Donc :
Code:
User-agent: *
Disallow: /secret

Ce fichier interdit l'accès à /secret, à /secret/golf.html, à /secret2/chut.php?bof=123, à /secretement,...

Et :
Code:
User-agent: *
Disallow: /?

Ce fichier interdit l'accès à toute URL commençant par un point d'interrogation.

Jean-Luc
 
jeanluc Visiter le site web du posteur
Bubber
WRInaute discret
WRInaute discret

Inscrit le: 03 Avr 2007
Messages: 78
Localisation: Toulouse

URL permanente de ce messagePosté le : Ven Jan 18, 2008 21:07    Sujet du message: Troncature pour un fichier robots.txt

Je suppose que tu parlais d'une restriction d'URL du type :

Disallow: www.domaine.fr/index.php?

Oui tu peux tout à fait interdire l'accès à ce genre d'URL.
Google et les autres comprendront très bien que tu veux interdire l'indexation des URL contenant "www.domaine.fr/index.php?"

Ceci dit, pour tester ton robots.txt, il existe la solution de la section Outils pour Webmasters de Google

EDIT : bon bin j'ai été devancé Rolling Eyes Laughing
 
Bubber Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Indexation dans Google Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort