| |
|
Voir le sujet précédent :: Voir le sujet suivant
|
| Auteur |
Message |
| |
|
tibashoult Nouveau WRInaute
Inscrit le: 16 Juin 2008 Messages: 5 Localisation: France
|
Posté le : Mar Aoû 05, 2008 14:44 Sujet du message: Utilisation du fichier robots.txt |
|
|
Bonjour tous le monde
J'ai une question pour les fortiches du site !
Sur mon site, Google m'a indexé des pages html que je ne désire pas plus que ça... je voulais savoir si avec mon fichier robots.txt je pouvais exclure un répertoire, mais que Google continue d'indexer des pages qui sont dans ce répertoire (inscritent dans mon sitemap.xml).
En fait, je ne développe quand html, et pour afficher des images, j'utilise des petits fichier html, qui ne servent qu'à cela. Il n'y a donc pas d'intérêt de les indexer.
Dans mon fichier robots.txt j'ai ces 2 lignes :
Disallow: /Rep1/
Sitemap: http://mon site/Sitemap.xml
dans le fichier Sitemap.xml; j'ai cette ligne
<url>
<loc>http://mon site/Rep1/page.html</loc>
<lastmod>2008-07-07</lastmod>
<priority>0.5</priority>
<changefreq>monthly</changefreq>
</url>
Malgré l'interdiction du répertoire, est ce que ma page sera quand même indexée dans Google (sans erreur ou avertissement d'URL bloqué par exemple).
Merci pour vos réponse !  |
|
| |
|
 |
HawkEye Modérateur

Inscrit le: 23 Fév 2004 Messages: 13131 Localisation: Bah: First! C'te question...!?
|
Posté le : Mar Aoû 05, 2008 23:48 Sujet du message: Utilisation du fichier robots.txt |
|
|
| Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*"). |
|
| |
|
 |
jeanluc WRInaute accro

Inscrit le: 03 Mai 2004 Messages: 2363 Localisation: Bruxelles
|
Posté le : Mer Aoû 06, 2008 6:42 Sujet du message: Utilisation du fichier robots.txt |
|
|
D'accord avec HawkEye, mais ces pages n'ont rien à faire dans ton sitemap. Déjà qu'un sitemap exact n'a pas beaucoup d'intérêt, je ne vois pas ce que tu espères d'un sitemap incorrect.
Jean-Luc |
|
| |
|
 |
tibashoult Nouveau WRInaute
Inscrit le: 16 Juin 2008 Messages: 5 Localisation: France
|
Posté le : Mer Aoû 06, 2008 8:09 Sujet du message: Utilisation du fichier robots.txt |
|
|
| HawkEye a écrit: |
| Non, si tu Disallow: /Rep1/, tous les documents situés sous ./Rep1/ sont rendus non-indexables (y-compris "Rep1/Rep2/*"). |
Merci HawkEye
En fouillant un peu partout j'arrive à la même conclusion. Je vais plutôt utiliser la fonction meta pour indiquer de ne pas suivre les liens ! Je pense que se sera plus efficace.
La balise <META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW"> est elle respectée par les robots (google et yahoo...)
Merci |
|
| |
|
 |
| |
|
|
|
|
Autres sujets de discussion :
|
|