Supprimer définitivement une page de son site

WRInaute discret
Bonjour

J'aimerais supprimer définitivement une page de mon site qui est indexée par google.

Cette page est un formulaire php lié au template (page d'accueil) et seul le plan de site fait un lien sur elle.

Si je décide de la supprimer, comment l'indiquer aux robots ?
Est ce important pour le référencement ?

Faut-il faire une redirection quelconque vers une autre page ou dois je signaler cette suppression dans mon fichier htaccess ?


Merci d'avance pour vos réponses
 
WRInaute accro
Dans ton fichier robots.txt pour indiquer aux robots de ne plus indexer cette page.

Code:
Disallow: /formulaire.php

Mais comme les robots sont capricieux et ne prennent pas tous en compte le fichier robots.txt, dans ton .htaccess, tu peux rediriger la page, par exemple sur la racine de ton site:

Code:
RedirectPermanent /formulaire.php  http://www.tonsite.com/

Avec ca, ta page ne sera plus indexée ni suivie par les crawlers, ce qui est toujours preferable pour un bon référencement et le suivi de tes visiteurs.
 
WRInaute accro
Normalement quand une page a disparu, ceux qui essaient d'y accéder reçoivent un code 404 (page inexistante). Tous les moteurs de recherche savent interpréter ce code. Il ne faut donc rien faire de spécial, mais cela leur prend parfois pas mal de temps avant qu'ils ne suppriment une ancienne page de leur index.

Il ne faut surtout pas empêcher les robots de voir la page avec robots.txt: comment les robots pourraient-ils savoir qu'une page a disparu, s'ils n'essaient plus d'y accéder?

La deuxième proposition de KOogar (avec .htaccess) est optimale si tu veux aiguiller les visiteurs et les robots des moteurs vers une nouvelle page de ton choix.

Jean-Luc
 
WRInaute accro
donc laisser le robot prendre un 404 sur la page c'est mieux que d'indiquer aux robots de ne plus la crawler ?
 
WRInaute discret
Salut !

et merci de vos réponses ;)

Je me demandais pourquoi le fichier robots.txt intervenait ici vu que ce fichier n'indique que les autorisations et/ou les refus du crawle (c'est bien ca ?)
En effet, si la page est supprimée, à quoi sert d'autoriser ou pas les robots de la crawler vu qu'elle n'existe plus ? :roll:

OK pour indiquer dans le fichier htaccess la redirection vers la page d'acceuil.
Et d'après vous, combien de temps devrais je garder ce code dans le fichier ?

Normalement si les robots la désindexe, plus besoin de l'indiquer ?
Y a t-il un délai ?

Encore merci

Ouaich
 
WRInaute accro
>> En effet, si la page est supprimée, à quoi sert d'autoriser ou pas les robots de la crawler vu qu'elle n'existe plus ?

Et dans l'ordre, ca serait pas plutot:
la page est crawlée, je veux l'enlever, je met donc disallow et les robots arretent de la crawler. Puis pour les visiteurs et les moteurs qui ne tiennent pas compte du fichier robots.txt j'ajoute une redirection. je peux ensuite enlever ma page définivement du ftp et les liens qui pointent dessus.

>> Et d'après vous, combien de temps devrais je garder ce code dans le fichier ?

Entre quelque jours et plusieurs mois. Perso j'utilise les headers, ca va plus vite. Les moteurs sont toujours long a dexindexer des vielles pages.
 
WRInaute accro
ouaich_01 a dit:
En effet, si la page est supprimée, à quoi sert d'autoriser ou pas les robots de la crawler vu qu'elle n'existe plus ? :roll:
C'est ce que j'ai essayé d'expliquer plus haut. Si la page est supprimée, les robots sont assez intelligents pour comprendre le code 404.

Il ne faut pas utiliser robots.txt, sauf si on veut utiliser la technique de suppression urgente indiquée par Leonick (mais elle ne marche qu'avec Google).

Jean-Luc
 
WRInaute accro
Donc a ma question + haut
>> laisser le robot prendre un 404 sur la page c'est mieux que d'indiquer aux robots de ne plus la crawler ? T'a réponse est oui et ca se discute.
 
WRInaute discret
HawkEye a dit:
D'expérience, le code d'état 410 ("Gone") (= cette ressource n'est plus disponible) est bien plus rapide que 404 ;)

Pourtant la signification du code 410 est :
La ressource est indisponible et aucune adresse de redirection n'est connue.

Si j'indique une redirection dans mon htaccess, ce n'est plus le cas ?
 
WRInaute accro
HawkEye a dit:
D'expérience, le code d'état 410 ("Gone") (= cette ressource n'est plus disponible) est bien plus rapide que 404 ;)

encore plus rapide, une 301 vers la page d'accueil, et tu laisse la page. Et en plus tu récupères visiteurs et BL éventuels.
 
WRInaute discret
KOogar a dit:
Donc a ma question + haut
>> laisser le robot prendre un 404 sur la page c'est mieux que d'indiquer aux robots de ne plus la crawler ? T'a réponse est oui et ca se discute.

Mais si je la supprime cette page, l'indication dans le fichier robots devient obsolète car même si je leur demande le la crawler, ils peuvent pas si elle n'existe plus ?
 
Discussions similaires
Haut