Bonjour
je débute en référencement.
J'ai un site avec plusieurs pages php. L'une d'elle contient un lien vers une page php située dans un répertoire /admin/
Ce répertoire est protégé par un .htaccess car la page qu'il contient sert à gérer certains contenus des autres pages du site.
Google a voulu indexer cette page, n'a pas pu (normal), et m'indique désormais dans mon compte webmaster que cette page est en "erreur http" (401, non autorisée). Le dernier calcul de cette page est notifiée au 02 novembre.
Depuis, pour éviter que Google tente de réindexer cette page, j'ai créé avant le 05 novembre un fichier sitemap.xml qui ne contient pas cette URL et un fichier robot.txt (EDIT : "robots.txt" pardon) qui contient :
user-agent: *
disallow: /admin/
De plus j'ai indiqué y'a quelques jours à Google de retirer cette URL de son index.
Pourtant, elle reste indiquée comme erreur HTTP et dans mes logs apache, entre les accès de google à mes pages, je retrouve constamment cela :
66.102.6.136 - - [17/Nov/2006:12:24:43 +0100] "GET /admin/admin.php HTTP/1.0" 401 511 "-" "Java/1.5.0_04"
Pourquoi Google tente t'il encore et encore d'accéder à cette page malgré mon robot.txt ?
Comment y remedier ?
Merci
je débute en référencement.
J'ai un site avec plusieurs pages php. L'une d'elle contient un lien vers une page php située dans un répertoire /admin/
Ce répertoire est protégé par un .htaccess car la page qu'il contient sert à gérer certains contenus des autres pages du site.
Google a voulu indexer cette page, n'a pas pu (normal), et m'indique désormais dans mon compte webmaster que cette page est en "erreur http" (401, non autorisée). Le dernier calcul de cette page est notifiée au 02 novembre.
Depuis, pour éviter que Google tente de réindexer cette page, j'ai créé avant le 05 novembre un fichier sitemap.xml qui ne contient pas cette URL et un fichier robot.txt (EDIT : "robots.txt" pardon) qui contient :
user-agent: *
disallow: /admin/
De plus j'ai indiqué y'a quelques jours à Google de retirer cette URL de son index.
Pourtant, elle reste indiquée comme erreur HTTP et dans mes logs apache, entre les accès de google à mes pages, je retrouve constamment cela :
66.102.6.136 - - [17/Nov/2006:12:24:43 +0100] "GET /admin/admin.php HTTP/1.0" 401 511 "-" "Java/1.5.0_04"
Pourquoi Google tente t'il encore et encore d'accéder à cette page malgré mon robot.txt ?
Comment y remedier ?
Merci