délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par doncarlos, 26 Septembre 2010.

  1. doncarlos
    doncarlos Nouveau WRInaute
    Inscrit:
    24 Novembre 2006
    Messages:
    24
    J'aime reçus:
    0
    Bonjour,
    cette balise a été ajoutée à de nombreuses pages de mon site il y a 2mois.
    Aujourd'hui, ces pages sont encore trouvées via une recherche google et sont encore indéxées.

    Pour information, j'ai effectué cette action pour lutter contre la duplication de contenu.

    Après avoir lu le forum :
    1/ Certains conseillent d'envoyer un code 404 :
    Dans ce cas, est-ce que ma page s'affiche?
    Comment faire?

    2/ D'autre, propose d'accelérer la désindexation, ajouter un filfrage dans le robots.txt?
    Ok, si je veux désindexer toutes les pages qui commence par produit-catalogue
    comme www.monsite.com/produit-catalogue-xxxxx.html.
    Le code ci-dessous fonctionne t-il dans le robots.txt?
    User-agent: *
    Disallow: /produit-catalogue-*

    Merci.
     
  2. franckM
    franckM WRInaute impliqué
    Inscrit:
    15 Novembre 2007
    Messages:
    808
    J'aime reçus:
    0
    Bonsoir,

    le mieux est d'utiliser le robots.txt

    @ +

    Franck
     
  3. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 883
    J'aime reçus:
    0
  4. doncarlos
    doncarlos Nouveau WRInaute
    Inscrit:
    24 Novembre 2006
    Messages:
    24
    J'aime reçus:
    0
    merci pour vos 2 réponses:

    Remarque aux 2 réponses:
    la première réponse :
    Je ne peux utiliser la balise META "canonical" car je lis un catalogue commerçant et je n'ai pas le lien de la page originale.
    En outre, même si je l'avais, le texte est différent sur le site original mais le catalogue est distribué sur d'autre site.

    la deuxième réponse :
    Est-ce que mon code est correct?
    Code:
    User-agent: *
    Disallow: /produit-catalogue-*
     
  5. doncarlos
    doncarlos Nouveau WRInaute
    Inscrit:
    24 Novembre 2006
    Messages:
    24
    J'aime reçus:
    0
    Après une recherche sur le web, si j'ai bien compris :
    pour filtrer les pages commençant par produit-catalogue-******-.html
    je code ça dans le robots.txt

    Code:
    User-agent: *
    Disallow: /produit-catalogue
     
  6. jeanluc
    jeanluc WRInaute accro
    Inscrit:
    3 Mai 2004
    Messages:
    2 883
    J'aime reçus:
    0
    Oui. Cela va filtrer tout ce qui commence par /produit-catalogue.

    Jean-Luc
     
Chargement...
Similar Threads - délai prise compte Forum Date
Délai de prise en compte changement robots.txt plus long Crawl et indexation Google, sitemaps 18 Mai 2019
Délai de prise en compte des modifs? Référencement Google 20 Mars 2012
Délai de prise en compte des liens par Google Débuter en référencement 5 Novembre 2010
Outils de suppression d'url : delai de prise en compte ? Crawl et indexation Google, sitemaps 1 Octobre 2010
Délai de prise en compte du sitemap Crawl et indexation Google, sitemaps 3 Juin 2010
Délai prise en compte des modifications Référencement Google 15 Mars 2010
Playstore : délai de publication allongé Développement d'un site Web ou d'une appli mobile 29 Août 2019
Délai avant (re)référencement après changements ? Problèmes de référencement spécifiques à vos sites 30 Avril 2019
Optimisation du délai d'indexation de pages Crawl et indexation Google, sitemaps 12 Janvier 2019
Délai rétractation internet Droit du web (juridique, fiscalité...) 4 Septembre 2018
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice