Problème pour NE PAS référencer un site

Nouveau WRInaute
Bonjour à tous,

Mon problème n'est peut-être pas commun alors voilà :

J'ai fait un site pour un ami. Afin qu'il puisse tester les nouvelles fonctionnalités que je développe, j'ai créé un site de recette. J'ai donc deux domaines :

- mondomaine.com
- recette.mondomaine.com

Mon but est tout simplement que google ne référence pas le site recette.mondomaine.com.

J'ai mis un fichier robots.txt à la racine (dans le même répertoire que index.php) contenant :

User-Agent: *
Disallow: /

Malheureusement je constate après quelques jours que mon site est tout de même trouvable en tappant le nom du site sur google :(

Donc deux questions :

- Comment supprimer mon site de la base de données de google ?
- Comment faire en sorte qu'il ne le scan plus par la suite ?

Merci.
 
WRInaute accro
en rajoutant dans tes pages la metas suivante :

<meta name=”robots” content=”noindex, nofollow, noarchive”>


Mais pour que cette balise puisse fonctionner, il ne faut pas interdire l’accès à la/aux page(s) au moyen du fichier robots.txt. Donc, corrige ton fichier.

User-agent: *
Disallow:
 
WRInaute accro
Tu protèges l'accès au site de test par un mot de passe et tu peux oublier les moteurs et les curieux. C'est très simple avec .htaccess et .htpasswd.

Jean-Luc
 
WRInaute passionné
jeanluc a dit:
Tu protèges l'accès au site de test par un mot de passe et tu peux oublier les moteurs et les curieux. C'est très simple avec .htaccess et .htpasswd.

Jean-Luc

C'est incontestablement la meilleure solution.
 
WRInaute accro
Furtif a dit:
en rajoutant dans tes pages la metas suivante :

<meta name=”robots” content=”noindex, nofollow, noarchive”>


Mais pour que cette balise puisse fonctionner, il ne faut pas interdire l’accès à la/aux page(s) au moyen du fichier robots.txt. Donc, corrige ton fichier.

User-agent: *
Disallow:
Sachant que de nombreux moteur se moque de restriction par meta et robots.txt...
Suivre le conseil de jeanluc
 
Membre Honoré
SolMJ a dit:
Donc deux questions :
- Comment supprimer mon site de la base de données de google ?
- Comment faire en sorte qu'il ne le scan plus par la suite ?

Bienvenue SolMJ sur le forum de WebRankInfo.

+1 avec JeanLuc, Bee_Human, Rod la Kox et Studio-Fotofil.

Complément Officiel de Google :
https://www.google.com/support/webmaster ... swer=35302

Les membres (qui le souhaitent) se présentent.

N’hésitez pas SolMJ à participer sur le forum, pour partager vos connaissances, donnez votre avis sur d'autres topics,
vous aurez alors un rôle constructif dans notre communauté et chacun pourra ainsi évoluer dans le référencement.


tuisp a dit:
Il existe des URL prévues pour donner des exemples: "example.com", "example.net" et "example.org" (avec un "a"), voir http://www.rfc-editor.org/rfc/rfc2606.txt , section 3. :)
 
WRInaute passionné
Comment supprimer mon site de la base de données de google ?
Pour supprimer ce qui existe déjà ds l'index de ggle:
https://www.google.com/support/webmaster ... swer=35301

Le faire surtout si après la mise en ligne effective, les pages concernées n'ont pas les mêmes urls que les pages en test (risque de duplicate content, ggle gardant longtemps les pages qu'il a trouvées)



Comment faire en sorte qu'il ne le scan plus par la suite ?

en plus des réponses ci-dessus, éviter d'utiliser les pages en test sur un PC avec la ggle barre active.
 
Nouveau WRInaute
Merci pour vos réponses.

J'ai protégé mon site avec un .htaccess, reste maintenant la question de supprimer le site de la base de google. Sur l'un des liens que vous m'avez fourni j'ai pu lire :

To remove your site from Google only and prevent just Googlebot from crawling your site in the future, place the following robots.txt file in your server root:

User-agent: Googlebot
Disallow: /

Question : si je mets un .htaccess, google n'aura plus accès à mon robots.txt si ?
 
WRInaute accro
Si tu mets un htaccess, tes pages disparaitront de google. et de toute facon...elles ne seront plus accessibles aux visiteurs même si ils y accèdent par google.

Tu n´auras plus besoin du fichier robots en question avec un htacess/htpasswd.
 
Nouveau WRInaute
herveG a dit:
Si tu mets un htaccess, tes pages disparaitront de google.

Certes mais au bout de combien de temps ?

Autre exemple de "déréférencement" difficile : J'ai parlé de mon site sur un forum il y a un mois environ suite à un problème technique. Une fois le problème résolu j'ai édité mon post en enlevant le nom de mon site dans le but qu'une recherche sur google avec le nom de mon site ne mène pas à cette page. Un mois plus tard c'est pourtant encore le cas, et le résumé du lien sur google correspond à l'ancienne version de mon post (avec le nom de mon site...).

Si je ne suis pas clair dites le moi j'essaierai d'expliquer plus en détail.
 
WRInaute accro
SolMJ a dit:
Si je ne suis pas clair dites le moi j'essaierai d'expliquer plus en détail.

Tu es très clair, mais c´est un manque d´expérience que de laisser des infos sur le net et de s´étonner de la difficulté de retomber dans l´anonymat.

Comme je te le disais plus haut, meme si tes pages sont encore un certains temps dans google, personne ne pourra y accéder avec un htacess et htpasswd.

Maintenant, suit les conseils qui te sont donnés ici (donc celui juste au dessus) car on ne pourra pas te conseiller plus.

Donc la prochaine fois, pense bien avant de poster sur le net... :)
 
Nouveau WRInaute
herveG a dit:
SolMJ a dit:
Si je ne suis pas clair dites le moi j'essaierai d'expliquer plus en détail.

Tu es très clair, mais c´est un manque d´expérience que de laisser des infos sur le net et de s´étonner de la difficulté de retomber dans l´anonymat.

Sans doute, et c'est bien pourquoi je me suis inscrit sur ce forum. J'avoue que tout ce qui tourne autour du référencement est encore un peu nébuleux dans ma tête et j'espère bien éclaircir tout ça ;)

Merci UsagiYojimbo pour le lien, j'irai faire un tour.
 
WRInaute accro
Ok, mais ce que je veux dire, c est que ça n´a rien à voir avec le référencement. C´est une règle d'or qui vaut pour internet de manière générale.

Donc résumons-nous :

- mise en place d´un htacess/htpasswd
- passage par la console des outils webmasters pour demander la désindexation des pages en question

Bon courage !
 
WRInaute passionné
Certes mais au bout de combien de temps ?

Si tu veux accélérer les choses, mets un meta nofollow noindex sur des pages déjà indexées et qui ne devaient pas l'être (c'est d'ailleurs une possibilité suggérée ds les liens ggle webmasters précités).
 
Discussions similaires
Haut