Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

A propos des fichiers robots.txt ...

Poster un nouveau sujet Imprimer cette discussion    Forum -> Tests et études de cas   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
bipbip
WRInaute occasionnel
WRInaute occasionnel

Inscrit le: 19 Déc 2002
Messages: 107

URL permanente de ce messagePosté le : Jeu Déc 19, 2002 10:52    Sujet du message: A propos des fichiers robots.txt ...

Bonjour Smile

Est-il vraiment indispensable de déposer un fichier robots.txt du genre:
Code:

# Allow all
User-agent: *
Disallow:

si l' on veut que le bot indexe toutes les pages d' un site ?

Mon site (dont je tairais l' url) n' en avait point et était bien référencé par voila (par google aussi mais çà n' a pas changé). Je me renseigne au sujet de Pompos et vois qu' ils conseillent vivement de mettre un fichier robots.txt pour permettre une bonne indexation d' un site.
Du coup j' en met un, celui cité plus haut.
Je passe sur voila et constate que le moteur a sacqué toutes mes pages (mais a laissé curieusement l' unique page d' accueil de mon site il y a plusieurs mois alors que celui-ci était en totale construction et qu' il n' y avait rien).
Je vais sur leur FAQ et lis ceci:
Citation:

Le fichier robots.txt interdit aux moteurs de recherche d'indexer vos pages web
Si vous ne voulez pas que les robots visitent votre site, ou bien si vous désirez que votre site soit retiré de la base, il vous suffit de placer un fichier /robots.txt à la racine de votre site.
Le fichier /robots.txt vous permet de spécifier par qui et comment vous autorisez l'indexation de votre page.

à cette adresse: http://www.voila.fr/Informations/Recherche/?Robots

Il y a t' il un lien de cause à effet ?
Je n' ai par ailleur pas constaté d' amélioration dans le référencement de google lié à ce fameux robots.txt, dans quels cas est-ce important de l' inclure ?

Merci d' avance pour vos indications Very Happy
 
bipbip
hetzeld
WRInaute accro
WRInaute accro

Inscrit le: 02 Déc 2002
Messages: 2205
Localisation: France - Angleterre

URL permanente de ce messagePosté le : Jeu Déc 19, 2002 11:27    Sujet du message: A propos des fichiers robots.txt ...

Bonjour,

Il semble que voila n'aime pas la ligne "Disallow:" quand il n'y a pas de répertoire mentionné.
J'ai changé récemment, en mettant la même chose que toi et cela m'a valu d'être purement et simplement retiré de voila Twisted Evil

Le mieux est encore un fichier robots.txt avec 2 lignes:
User-agent: *
Disallow: /prive/

si tu veux interdire l'accès au répertoire /prive
Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.

Dan
 
bipbip
melmoth
WRInaute discret
WRInaute discret

Inscrit le: 11 Déc 2002
Messages: 73

URL permanente de ce messagePosté le : Jeu Déc 19, 2002 12:26    Sujet du message: A propos des fichiers robots.txt ...

hetzeld a écrit:

Le seul problème, à mon avis, c'est qu'il donne aux hackers une indication quant à l'emplacement de certaines données perso... d'où cible privilégiée.


Argh, un abus de langage.
Hop, j'y vais de mon petit commentaire.
Le terme correct pour désigner les délinquants dont tu parles est 'cracker' .

"Hacker" est un terme qui désigne les codeurs fous qui font ce qu'est internet, les systèmes d'exploitation etc... Un hacker construit, un cracker détruit.

Utiliser un terme à la place de l'autre est néfaste pour la communauté hacker qui à force se trimbale une image de hors la loi alors qu'il ne s'agit que de passionnés.

Plus d'information par la:

http://www.tuxedo.org/~esr/jargon/html/entry/hacker.html

Pour en revenir au problème du répertoire privés.

SI il s'agit d'informations vraiment sensibles, ne pas les mettre sur le web du tout Smile

Sinon, interdire aux robots d'y aller, restreindre l'acces par un .htaccess et surtout, ne permettre l'acces que par ssl.

Baser sa sécurité uniquement sur la discretion n'est pas une bonne idée.

Hop.
 
melmoth Visiter le site web du posteur
hetzeld
WRInaute accro
WRInaute accro

Inscrit le: 02 Déc 2002
Messages: 2205
Localisation: France - Angleterre

URL permanente de ce messagePosté le : Jeu Déc 19, 2002 12:32    Sujet du message: A propos des fichiers robots.txt ...

Bonjour,

Tu as raison, c'est un abus de langage ! Confused
C'est d'autant plus c*n que je connais parfaitement la différence entre les deux...

Merci pour ce correctif!

Quand je parle de "données perso", ce n'est bien sûr rien de confidentiel mais des éléments qui ne devraient pas être indexés. J'ai eu le cas avec des "templates" qui, à l'état brut' n'étaient pas vraiment parlants pour l'internaute moyen. Wink
Depuis, j'ai modifié cela.

Tu as tout à fait raison en insistant sur le fait que "cacher n'est pas protéger".

Cordialement,

Dan
 
melmoth Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Tests et études de cas Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort