Formation par Olivier Duffez

Formation au référencement par Olivier Duffez, créateur de WebRankInfo !
Une formule efficace alliant théorie et pratique, avec une haute disponibilité des intervenants
Cette formule a déjà convaincu plusieurs centaines d'entreprises, pourquoi pas vous ?
Réservez vite votre place en ligne (convention possible pour imputer sur le budget formation)

Formation référencement Marseille

Utilisation du fichier robots.txt

Poster un nouveau sujet Imprimer cette discussion    Forum -> Débuter en référencement   Les dernières discussions de ce forum sont disponibles au format RSS
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
 
tibashoult
Nouveau WRInaute

Inscrit le: 16 Juin 2008
Messages: 5
Localisation: France

URL permanente de ce messagePosté le : Mar Aoû 05, 2008 14:44    Sujet du message: Utilisation du fichier robots.txt

Bonjour tous le monde

J'ai une question pour les fortiches du site !

Sur mon site, Google m'a indexé des pages html que je ne désire pas plus que ça... je voulais savoir si avec mon fichier robots.txt je pouvais exclure un répertoire, mais que Google continue d'indexer des pages qui sont dans ce répertoire (inscritent dans mon sitemap.xml).

En fait, je ne développe quand html, et pour afficher des images, j'utilise des petits fichier html, qui ne servent qu'à cela. Il n'y a donc pas d'intérêt de les indexer.

Dans mon fichier robots.txt j'ai ces 2 lignes :
Disallow: /Rep1/
Sitemap: http://mon site/Sitemap.xml

dans le fichier Sitemap.xml; j'ai cette ligne
<url>
<loc>http://mon site/Rep1/page.html</loc>
<lastmod>2008-07-07</lastmod>
<priority>0.5</priority>
<changefreq>monthly</changefreq>
</url>

Malgré l'interdiction du répertoire, est ce que ma page sera quand même indexée dans Google (sans erreur ou avertissement d'URL bloqué par exemple).

Merci pour vos réponse ! Wink
 
tibashoult Visiter le site web du posteur
HawkEye
Modérateur
Modérateur

Inscrit le: 23 Fév 2004
Messages: 13131
Localisation: Bah: First! C'te question...!?

URL permanente de ce messagePosté le : Mar Aoû 05, 2008 23:48    Sujet du message: Utilisation du fichier robots.txt

Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*").
 
HawkEye Visiter le site web du posteur
jeanluc
WRInaute accro
WRInaute accro

Inscrit le: 03 Mai 2004
Messages: 2363
Localisation: Bruxelles

URL permanente de ce messagePosté le : Mer Aoû 06, 2008 6:42    Sujet du message: Utilisation du fichier robots.txt

D'accord avec HawkEye, mais ces pages n'ont rien à faire dans ton sitemap. Déjà qu'un sitemap exact n'a pas beaucoup d'intérêt, je ne vois pas ce que tu espères d'un sitemap incorrect.

Jean-Luc
 
jeanluc Visiter le site web du posteur
tibashoult
Nouveau WRInaute

Inscrit le: 16 Juin 2008
Messages: 5
Localisation: France

URL permanente de ce messagePosté le : Mer Aoû 06, 2008 8:09    Sujet du message: Utilisation du fichier robots.txt

HawkEye a écrit:
Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*").


Merci HawkEye

En fouillant un peu partout j'arrive à la même conclusion. Je vais plutôt utiliser la fonction meta pour indiquer de ne pas suivre les liens ! Je pense que se sera plus efficace.

La balise <META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW"> est elle respectée par les robots (google et yahoo...)

Merci
 
tibashoult Visiter le site web du posteur
 
Montrer les messages depuis:   
Revenir en haut    Forum -> Débuter en référencement Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1 - 
Connexion
Nom d'utilisateur:    Mot de passe:      Se connecter automatiquement à chaque visite    

CLIQUEZ ICI pour vous inscrire à WebRankInfo (forum, annuaire, outils...)

Connexion

© 2001-2005 phpBB Group, support français
Personnalisation : WebRankInfo ™


 ODP  Firefox  Alsacreations  annuaire webmaster Yagoort