Empêcher le référencement d'une page

cacm

Nouveau WRInaute
Bonjour

Et merci d'avoir créé cette rubrique pour les nouveaux et débutants surtout sur ce sujet. Bien que connaissant le site pour y avoir lu quelques articles, je ne le connais pas dans les profondeurs. Mes recherches par mot ou dans la Faq étant restées vaines, je me résouds à poser ma question ici.

Après des mois de mise au point (à temps perdu) d'un site pour le collège de ma fille, j'ai pas mal bataillé pour enfin arriver à quelque chose de présentable et visible ici.
Tout le monde est bien content :) , reste plus qu'à le remplir mais là ce n'est plus mon domaine.

Mais la question qui "tue" m'a été posée rapidement soit "Comment on fait pour trouver le site sur Google ? il n'y a rien !". Les lectures faites ici m'ont permis de leur expliquer qu'il faudrait d'abord mettre du contenu et après on verra.

Toutefois j'avais cherché bien avant et n'avais rien trouvé non plus alors qu'avant sa mise en place officielle il y avait pas mal d'articles qui étaient là pour donner un aspect plus vivant au site. Je précise que ces articles étaient de vrais articles avec du contenu texte en rapport avec la matière traitée (ce n'était donc pas du Lorem ipsum).

Mais à force de chercher, j'ai trouvé un lien en tapant un texte correspondant à une partie de l'adresse soit clg rochefortdugard et sur la page résultat de google, je trouve mon site au 3eme lien. Sur le coup je me suis dit pourquoi pas mais en cliquant sur ce lien je constate que j'arrive sur la page de connexion à l'administration du site.

Ma question est donc : "Comment empêcher que cette page soit référencée par google". J'ai bien lu l'article sur les balises meta à cette adresse https://www.webrankinfo.com/dossiers/techniques/guide-balises-meta et si je comprends bien il faudrait le fichier robot.txt mais les explications données par le lien de cette page et qui renvoie ici sur le dicodunet m'embrouillent plus qu'autre chose surtout quand je lis "Les robots des moteurs de recherche vont lire ce fichier régulièrement. Si les grands robots respectent à la lettre les directives, il faut savoir que d'autres ignorent les interdictions, ou pire encore utilisent ce fichier pour avoir connaissance des zones interdites qu'ils vont fouiller. Ce n'est donc certainement pas une bonne manière d'interdire l'accès à certains robots."

ce qui fait je vous l'avoue que je ne sais pas trop comment m'y prendre.

Si vous aviez une solution (ou explication) a m'apporter ce serait sympa. (voire un lien qui détaille tout ça)

Merci

A l'envoi de mon message, je suis avisé que j'ai oublié de mettre le titre (normal :oops: ) mais une fois ce titre saisi, là il me dit qu'il y a des sujets qui pourraient m'intéresser (j'avais jamais vu ça et c'est pas mal) et effectivement le dernier semble correspondre mais il date de 2003. Etant donné que les techniques évoluent à la vitesse grand V, je vais tout de même poster pour avoir une information plus actuelle (bien que là aussi ils parlent du robot.txt). :?
 

XGilbert

WRInaute discret
Ajoutes un fichier "robots.txt" à la racine de ton site avec a l'intérieur :

User-agent: *
Disallow: /ici-ta-page-a-exclure.html
 

elas

WRInaute impliqué
tout est possible

il y a beaucoup de possibilités.
Le fichier robots.txt
Un meta tag <meta name="robots" content="noindex">
Google webmaster
...
Du javascript, des frames, des noms de pages hétéroclytes...
 

cacm

Nouveau WRInaute
Re

Et merci pour ces quelques réponses.

Apparemment le fichier robots.txt tient la corde, je vais donc m'y atteler en prenant la syntaxe de XGilbert.

Je vois qu'il est également fait mention du meta tag robots par seebz et elas.

Même s'il y a une légère différence entre :
<meta name="robots" content="none" />
et
<meta name="robots" content="noindex">
je suppose que ça signifie la même chose hein ?

J'aurais bien une autre question à poser mais je vais attendre voir ce que ça donne.

Merci encore.
 

ariden

Nouveau WRInaute
Même s'il y a une légère différence entre :
<meta name="robots" content="none" />
et
<meta name="robots" content="noindex">
je suppose que ça signifie la même chose hein ?


Le premier signifie aux robots de ne pas suivre les liens qui sont sur ta page et de ne pas la référencer (utile quand le robot arrive sur l'une des nombreuses pages de ton menu adminsitrateur (si il y a).

Le deuxième stipule simplement aux robots de ne pas indexer la page, par contre, il suivra les liens pour référencer les autres pages de ton site.

Ps: Tous les moteurs de recherche n'obéissent pas à cette règle.

Tu peux aussi mettre ces informations dans des liens, les images... :
ex :<a rel="noIndex" rev="vote-for" class="robots-noIndex" href="http://www.monsite.fr">Cette page</a><br/>
 

carole heinz

WRInaute passionné
cacm a dit:
Les lectures faites ici m'ont permis de leur expliquer qu'il faudrait d'abord mettre du contenu et après on verra.

bonjour, désolée pour le hors-sujet mais ce point de vue est plutôt erroné. Le contenu est certes important, mais c'est une erreur de penser qu'il se suffit à lui-même. Le contenu doit être structuré et organisé, pour une bonne visibilité.

d'autre part, il est toujours mieux de mettre un contenu structuré directement en ligne, plutôt que de le modifier au fur et à mesure, ce qui est, à mon avis, dangereux en termes de positionnement.

bienvenue sur webrankinfo.
 

Discussions similaires

Haut