Comment interdire à google de référencer certaines pages

WRInaute impliqué
Bonjour.

J’ai une petite question.
Je viens de mettre en place un partenariat avec un moteur spécialisé.

Nous allons intégrer les résultats du moteur chez nous en interne.

Pour des besoins techniques, nous avons simulé la navigation en interne, la navigation pour les pages supplémentaires (Du style : Page 1 – 2 – 3 – 4 – etc..)

Toutes ses pages seront chez nous, mais je ne désire pas les faire référencer par google.

Je ne veux pas avoir ce type d’url :
http://www.monsite.com/resultat-recherc ... on-dvd.htm
http://www.monsite.com/resultat-recherc ... -dvd-2.htm
http://www.monsite.com/resultat-recherc ... -dvd-3.htm
http://www.monsite.com/resultat-recherc ... -dvd-4.htm
http://www.monsite.com/resultat-recherc ... -dvd-5.htm
http://www.monsite.com/resultat-recherc ... -dvd-6.htm

Afin de ne pas générer 30 000 pages pour rien dans le moteur… J’aimerai uniquement me limiter à référencer la 1 ere page de résultats,
http://www.monsite.com/resultat-recherc ... on-dvd.htm

Ma question est comment faire. ?

1 ère piste :

Mettre le nouvel attribut rel=nofollow sur le menu Page 1 – 2 – 3 – 4 .. J’ai cru comprendre que cela permet de ne pas transmettre le PR, mais cela n’empêcherai pas google d’indexer les pages.

2 eme piste :
Mettre les liens en javascript, mais il a l’air de les suivre maintenant.

Une idée. ?
 
WRInaute passionné
Salut,

tu peux mettres un truc du genre :

Code:
<?php
if($page) echo '<meta name="robots" content="noindex" />';
?>
 
WRInaute occasionnel
rottman a dit:
Code:
<?php
if($page) echo '<meta name="robots" content="noindex" />';
?>
Je n'y avais pas pensé ;)

Autre solution, lolilol peut créer un fichier http://www.monsite.com/robots.txt et y mettre les lignes suivantes :
Code:
User-agent: *
Disallow: /resultat-recherche/location-dvd-
ce qui devrait interdire à tous les moteurs de recherche (et pas seulement Google) d'indexer les pages dont le chemin commence par :
"/resultat-recherche/location-dvd-"
 
WRInaute impliqué
rottman a dit:
Code:
<?php
if($page) echo '<meta name="robots" content="noindex" />';
?>
Je n'y avais pas pensé non plus :oops:

SuperPJ a dit:
Autre solution, lolilol peut créer un fichier http://www.monsite.com/robots.txt et y mettre les lignes suivantes :
Code:
User-agent: *
Disallow: /resultat-recherche/location-dvd-
ce qui devrait interdire à tous les moteurs de recherche (et pas seulement Google) d'indexer les pages dont le chemin commence par :
"/resultat-recherche/location-dvd-"
Impossible : Car si j'ai :
/resultat-recherche/location-dvd-
/resultat-recherche/location-cd-
/resultat-recherche/location-film-horreur-
/resultat-recherche/location-film-erotique-
/resultat-recherche/location-film-horreur-
etc....

il va faire des millers de lignes le fichier robot.txt

Autres pistes :

1 ere page : /resultat-recherche/location-dvd-
2 eme page : /resultat-recherche-2/location-dvd-
3 eme page : /resultat-recherche-3/location-dvd-

Sachant que le moteur ne va pas plus loin que la 10 eme page.

Je peux ainsi interdire dans le robots.txt les 10 répertoires :
/resultat-recherche-2/
/resultat-recherche-3/
/resultat-recherche-4/

D'autres idées.? Je serai curieux de connaitre les petites ficelles de chacuns sur ce sujet....
 
Discussions similaires
Haut