Empêcher le référencement d'une page dans un site référencé

Rookie

Nouveau WRInaute
Bonjour,

Je me suis créé un site avec une partie admin (l'accès est protégé par un mot de passe contrôlé par un script en php).

La page d'accueil est référencée par Google mais je me retrouve aussi avec des pages admin accessibles par Google (mon sytème de protection est certes rudimentaire ...)

Est-il possible dans les META d'interdire à Google (et à tout autre moteur) de référencer une page ? Et une fois la page référencé comment la déréférencer ?
J'avais essayé l'option nofollow mais là ça marche pas puisque Google a apparemment trouvé tout seul la page.

Merci d'avance !
 

zehunter

WRInaute occasionnel
pour interdire google d'indexé certaine page tu peux :

* le plus simple : utiliser un robots.txt => https://www.webrankinfo.com/dossiers/indexation/20-ans-robots-txt
* faire un melleur systeme d'acces au systeme d'admin
* faire de l'UR (tu n'autorise a acceder a ces pages que pour une IP donné par exemple)


par contre laisse moi te poser une question .. comment google a t-il pu acceder a la partie admin de ton site? tu as un lien "partie admin" sur ta home ou quoi?
 

Mirgolth

WRInaute occasionnel
Re: Empêcher le référencement d'une page dans un site référe

Rookie a dit:
J'avais essayé l'option nofollow mais là ça marche pas puisque Google a apparemment trouvé tout seul la page.
Si tu peux utilise le robots.txt proposr par Zehunter qui est plus simple à administrer, mais si tu ne peusx le faire que via les META alors regarde ici : FAQ META robots, c'est 'noindex' plus que 'nofollow' qu'il te faut.

La Faq sur Google : Remove a Site from Google

Mirgolth
 

Kmacleod

WRInaute passionné
Il vaudrait peut-être mieux corriger le problème a sa source et renforcé la protection par mot de passe.
Sinon si google a reussi a entrer, et que tu décides de ne pas être indexé, celà signifie que le moindre petit rigolo entre aussi (et là tu ne l'empecheras pas par robot.txt)

kmacleod
 

Rookie

Nouveau WRInaute
Ref zehunter

En fait après acceptation du mot de passe on arrive à ce que j'appelle ma page admin (elle inaccessible par google) : mais c'est juste une page de liens vers des options du style purger une table, consulter les IP de mes visiteurs, etc ...
Et comme j'avais appelé la page de log "Connexion nom_de_mon_site", Google a trouvé le nom de mon site et a référencé la page.

Je suis pas un pro en php et c'est pas non plus un site confidentiel donc j'ai pas envie de me lancer dans des trucs compliqué de sécurité. D'où l'idée d'empêcher juste à Google l'accès aux pages que je souhaite garder perso.
 

Rookie

Nouveau WRInaute
Questions subsidiaires :)

Petites questions complémentaires :

J'ai purgé mes logs, mais Google permet d'accéder au Cache !
Peut-on empêcher Google de garder un cache des pages d'un site ?
Le cache est-il mis à jour à la même fréquence que la page ?
Si dans les META on ne précise pas la fréquence de visite du robot, quelle est la valeur par défaut ?

Merci pour vos réponses !
 

George Abitbol

WRInaute passionné
Re: Ref zehunter

Rookie a dit:
Et comme j'avais appelé la page de log "Connexion nom_de_mon_site", Google a trouvé le nom de mon site et a référencé la page.

A priori Google ne peut pas trouver une page si aucun lien ne pointe dessus... A priori car certains ont avancé l'hypothèse selon laquelle lorsqu'on visite une page avec la GoogleBar, Google s'empresse d'aller la crawler. A démontrer...

Fred
 

Rookie

Nouveau WRInaute
Effectivement en cherchant mieux sous Google je viens de trouver qqn qui a référencer la page de log de mon site. Ce qui expliquerait le référencement Google. Merci pour ce précieux renseignement.
 
J

JPC

Guest
pour empecher la mise en cache d'une page :
<META NAME="robots" CONTENT="noarchive">

quand aux fréquences de mise à jour c'est variable...
(en fonction du Pr et sans doute de la fréquence de tes mises à jour...)
 

Discussions similaires

Haut