Comment enlever de l'index de Google les pages avec des paramêtres

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par nemocean, 1 Septembre 2009.

  1. nemocean
    nemocean Nouveau WRInaute
    Inscrit:
    9 Mars 2006
    Messages:
    25
    J'aime reçus:
    0
    Bonjour,

    J'ai un site qui génère de nombreuses pages indexées dans Google (>1 million). J'avais jusqu'à présent un soucis car j'avais des liens qui pointaient vers une même page mais avec des urls différentes ex :

    exemple.com/parametre1/parametre2/tri.php?=l-20
    exemple.com/parametre1/parametre2/tri.php?=l&page=2

    La bonne page étant exemple.com/parametre1/parametre2/l/2

    J'ai donc mis en no-follow les liens que je ne pouvais pas modifier et modifié ceux que je pouvais. Pour m'assurer que Google ne prenne plus jamais en compte les pages avec des parametres du type tri.php?=XXX, etc.

    Pour faire simple j'aimerais que Google n'indexe que les pages en /parametre1/parametre2/parametre3

    je n'ai pas plus de niveau dans mes url.

    Existe-t-il une manip avec le robot.txt ? autre chose ?
    Merci pour vos retours...
     
  2. Sébastien Billard
    Sébastien Billard WRInaute passionné
    Inscrit:
    7 Mai 2003
    Messages:
    1 700
    J'aime reçus:
    1
    Tu peux jouer avec les wildcards dans le robots.txt

    Par exemple j'ai ceci dans le mien qui interdit l'indexation des pages de pagination et des flux RSS :

    Code:
    User-agent: Googlebot
    Disallow: /referencement/rss.php?*
    Disallow: /referencement/?p*
     
  3. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 878
    J'aime reçus:
    73
  4. nemocean
    nemocean Nouveau WRInaute
    Inscrit:
    9 Mars 2006
    Messages:
    25
    J'aime reçus:
    0
    Je pense que l'url canonical est une bonne solution car j'ai des milliers de combinaisons param1/param2/
    le fichier robot.txt serait alors aboslument énorme.

    a moins qu'il existe une manière de dire quels que soient les parametres un truc du genre:

    User-agent: Googlebot
    Disallow: /premierniveau/deuxiemeniveau/?p*
     
  5. cedric_g
    cedric_g WRInaute accro
    Inscrit:
    18 Janvier 2006
    Messages:
    2 961
    J'aime reçus:
    1
    Bonjour

    La balise Canonical semble toute indiquée. Pour ma part, je la couple à un contrôle temps réel de l'URL au chargement de la page (quand je peux évidemment) ; en clair, j'analyse l'URL appelée et selon sa tête, je place un "noindex,follow" en plus de la balise Canonical.

    Ainsi, la boucle est bouclée.
     
Chargement...
Similar Threads - enlever Google paramêtres Forum Date
Enlever rapidement des milliers url spam (erreur 404) de l'index google Crawl et indexation Google, sitemaps 25 Septembre 2019
Enlever nom du site à la fin du titre dans Google Référencement Google 26 Février 2017
google image, enlever mes concurents YouTube, Google Images et Google Maps 23 Janvier 2017
Comment enlever les balises HN qui sont auto-générées ? Débuter en référencement 10 Juin 2017
Comment enlever toutes traces d'un site web? Développement d'un site Web ou d'une appli mobile 27 Janvier 2017
En PHP, comment enlever les ?id=1 aux URL pour éviter les duplicat content ? Développement d'un site Web ou d'une appli mobile 27 Février 2015
Enlever nos annonces dans les applications/jeux - mobiles/tablettes AdWords 7 Août 2014
Enlever "Traduire cette page" Crawl et indexation Google, sitemaps 24 Décembre 2013
Juste enlever ou desavouer aussi ? Netlinking, backlinks, liens et redirections 18 Décembre 2013
Enlever les saut de ligne dans la META Description Débuter en référencement 3 Décembre 2013
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice