Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

robot.txt

Poster un nouveau sujet Imprimer cette discussion    Forum -> PageRank, liens et redirections   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
benlargo
Nouveau WRInaute

Inscrit le: 27 Juil 2007
Messages: 12

URL permanente de ce messagePosté le : Mer Aoû 08, 2007 17:21    Sujet du message: robot.txt

Salut,

j'aimerai désindexer toutes les pages de mon site finissant par .php

Est-ce qu'un fichier robot.txt contenant...

User-Agent: *
Disallow: /*.php

... vous semble correct ?

Sinon, quelle est la bonne écriture ?

Merci d'avance Smile
 
benlargo Visiter le site web du posteur
BadProcESs
WRInaute accro
WRInaute accro

Inscrit le: 28 Juil 2003
Messages: 2280
Localisation: Partout ("clusterisé") ;)

URL permanente de ce messagePosté le : Mer Aoû 08, 2007 18:52    Sujet du message: robot.txt

Attention par contre, c'est robots.txt.
 
BadProcESs Visiter le site web du posteur
Jeviensderio
WRInaute accro
WRInaute accro

Inscrit le: 29 Sep 2006
Messages: 1261

URL permanente de ce messagePosté le : Mer Aoû 08, 2007 20:15    Sujet du message: robot.txt

Selon robotstxt.org:
Citation:
Note also that regular expression are not supported in either the User-agent or Disallow lines. The '*' in the User-agent field is a special value meaning "any robot". Specifically, you cannot have lines like "Disallow: /tmp/*" or "Disallow: *.gif".

En français, c'est non.
 
Jeviensderio Visiter le site web du posteur
benlargo
Nouveau WRInaute

Inscrit le: 27 Juil 2007
Messages: 12

URL permanente de ce messagePosté le : Jeu Aoû 09, 2007 11:37    Sujet du message: robot.txt

En gros l'url rewriting a été mit en place pour un site ancien et déjà indexé dont toutes les url ne commencent pas par ../index.php?variable=xxx mais directement par ?variable=xxx

Du coup vu qu'il est impossible d'interdire un certain type de fichier, est-il possible de supprimer toutes les url contenant une variable précise, du style :

User-Agent: *
Disallow: /?variable=*

... ou alors il faut préciser à chaque fois la valeur de la variable et donc l'url précise ?

User-Agent: *
Disallow: /?variable=xxx
Disallow: /?variable=yyy
 
benlargo Visiter le site web du posteur
FloBaoti
WRInaute passionné
WRInaute passionné

Inscrit le: 30 Avr 2006
Messages: 579
Localisation: Montpellier

URL permanente de ce messagePosté le : Jeu Aoû 09, 2007 12:39    Sujet du message: robot.txt

Code:
User-Agent: *
Disallow: /?variable=

suffit
 
FloBaoti Visiter le site web du posteur
benlargo
Nouveau WRInaute

Inscrit le: 27 Juil 2007
Messages: 12

URL permanente de ce messagePosté le : Jeu Aoû 09, 2007 17:07    Sujet du message: robot.txt

merci Smile
 
benlargo Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> PageRank, liens et redirections Toutes les heures sont au format GMT + 2 Heures
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

Autres sujets de discussion :

Définitions :

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort