robot.txt

WRInaute occasionnel
Bonjour,
je suis en train de créer un nouveau site et comme je ne suis pas encore content des url, j'aimerais que google ne le référence pas. J'ai donc placé un fichier robot.txt à la racine du site avec ceci à l'intérieur.

Code:
User-agent: *
Disallow: /

mais je constate ce matin que GG a déjà réusi a entrer sur le site et à référencer 40 url. ai-je une erreur dans mon robot.txt ?
Merci
 
WRInaute impliqué
P.S: une fois le fichier robots.txt est visité par google-bot, ton site ne pourra etre indexé que 6 mois aprés...
 
WRInaute accro
Khal3d a dit:
P.S: une fois le fichier robots.txt est visité par google-bot, ton site ne pourra etre indexé que 6 mois aprés...

ca sort d'où ca ?

A chaque fois que GG Bot vient il regarde le robots.txt ... c quoi ce truc de 6 mois ?
 
WRInaute impliqué
ça m'est arrivée une fois, le site a disparu de google pendant 6 mois...et je l'ai lu quelques part dans les pages 'webmasters' de google...
 
WRInaute accro
Khal3d a dit:
ça m'est arrivée une fois, le site a disparu de google pendant 6 mois...et je l'ai lu quelques part dans les pages 'webmasters' de google...

c'est uniquement si tu interdis l'accès à GG... pas si tu l'autorises :)
 
WRInaute discret
Code:
User-agent: *
Disallow: /

Je veux que les pages d'un de mes anciens sites ne soient plus référencées, il suffit que je mette ça à la racine de mon ftp pour résoudre le problème?
 
Nouveau WRInaute
Je crois que le probleme que j'ai (pas d'indexation des pages par google) est liee avec ce meme fichier robots.txt
J'ai ce truc
User-agent: *
Disallow: /
Comment je peux changer ?
Remplacer Disallow par Allow ?
 
WRInaute discret
Code:
User-agent: *
Disallow: /

Je veux que les pages d'un de mes anciens sites ne soient plus référencées, il suffit que je mette ça à la racine de mon ftp pour résoudre le problème?
 
WRInaute accro
Si les pages du site n'existent plus, il ne faut pas mettre ce robots.txt parce qu'il interdit à Google de venir voir ce qui se passe dans le site, donc Google ne peut pas constater que les pages ont disparu.

Voir aussi la procédure accélérée de suppression d'URL si tu es certain de ne plus utiliser ces adresses pendant au moins 6 mois : Comment supprimer un lien désactivé des résultats de recherche ? et suivre le lien système de suppression automatique d'URL.

Jean-Luc
 
WRInaute accro
Retourner un code d'erreur 410 ("Gone") sur ces pages permet à Google de comprendre que cette page n'existe plus.

Ca peut paraître contradictoire, mais: pour qu'il aille choper ce code 410, il faut qu'il visite les pages, et s'il ne les a visitées initialement que sur base de quelques maigres liens sur un domaine tout neuf, il ne viendra pas avant 6 mois (façon de parler...), donc...

...pour les faire disparaître de l'index, il faut

1. Mettre un code d'erreur 410
2. Faire des liens vers ces pages (eh oui :D)
 
WRInaute discret
jeanluc a dit:
Si les pages du site n'existent plus, il ne faut pas mettre ce robots.txt parce qu'il interdit à Google de venir voir ce qui se passe dans le site, donc Google ne peut pas constater que les pages ont disparu.

Voir aussi la procédure accélérée de suppression d'URL si tu es certain de ne plus utiliser ces adresses pendant au moins 6 mois : Comment supprimer un lien désactivé des résultats de recherche ? et suivre le lien système de suppression automatique d'URL.

Jean-Luc
Merci ta technique a marché et en 24 heures toutes les pages se sont supprimées comme m'avait promis google!
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut