Empêcher Googlebot de crawler/indexer tout un dossier

Discussion dans 'Débuter en référencement' créé par wikao, 19 Avril 2019.

  1. wikao
    wikao Nouveau WRInaute
    Inscrit:
    8 Février 2013
    Messages:
    9
    J'aime reçus:
    0
    Bonjour à tous et à toutes,

    (Je vous la fait courte) On a un site sous Prestashop 1.6 et on souhaiterait passer à la version 1.7.
    Pendant une durée indéterminée, les 2 versions vont cohabiter :

    Étant donné qu'il y aura le même contenu (images, textes, produits ...) dans les 2 versions du site (c'est juste l'aspect du site et la version du CMS qui va changer), on a peur que Google considère la partie du site sous Prestashop 1.7 comme du Duplicate Content et pénalise le référencement naturel du site en entier (version 1.6 ET 1.7 puisque pour Google, c'est un seul et même site)

    Comment faire pour que Googlebot (et autres robots) ne crawle pas et n'indexe pas le contenu du dossier presta1751 où se trouve le site en Prestashop 1.7 ?

    Est-ce qu'il faut :
    • mettre un Disallow /*presta1751/ dans le fichier Robots ?
    • mettre des balises noindex nofollow sur toutes les pages de la nouvelle version ?
    • mettre des balises canoniques sur toutes les pages de la nouvelle version ?
    • faire les 3 (un disallow dans le fichier Robots + des balises noindex nofollow + des balises canoniques) ?
    • ne rien faire ? En partant du principe qu'on n'a pas déclaré la partie du site en Prestashop 1.7 auprès de Google Search et que, du coup, Googlebot n'ira pas sur cette partie du site
    D'avance merci pour vos réponses et vos conseils.

    Bonne journée ;)
     
  2. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    8 841
    J'aime reçus:
    249
    meta robots noindex/nofollow.
     
  3. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    72
    Et en complément, au cas où, mettre en place une protection htaccess à la racine du sous-dossier de dev.
     
  4. WebRankInfo
    WebRankInfo Admin
    Membre du personnel
    Inscrit:
    19 Avril 2002
    Messages:
    19 138
    J'aime reçus:
    350
    je vote pour la seconde réponse : un site en dév/préprod doit toujours être protégé par mot de passe, et les meta robots doivent être identiques à ce que sera le site en prod, donc pas de noindex partout
     
  5. spout
    spout WRInaute accro
    Inscrit:
    14 Mai 2003
    Messages:
    8 841
    J'aime reçus:
    249
    Ah j'avais lu "visible du public", donc protection par htpasswd.
     
  6. UsagiYojimbo
    UsagiYojimbo WRInaute accro
    Inscrit:
    23 Novembre 2005
    Messages:
    11 875
    J'aime reçus:
    72
    En plus, le souci de gérer ça avec la meta robots, c'est que c'est le truc qu'on oublie trop souvent de changer lors de la bascule.

    Je ne compte plus les sites dont je vois la visibilité chuter après une mise en prod... où l'agence / le développeur aura laissé, au choix :
    - le robot.txt avec un disallow:/
    - une meta robot noindex sitewide
     
  7. Johanwri
    Johanwri WRInaute occasionnel
    Inscrit:
    13 Mars 2018
    Messages:
    285
    J'aime reçus:
    59
    Pourquoi ne pas mettre la version test dans un sous domaine plutot que un dossier ? presta1751.nomdedomaine.com ou ce que tu veux a la place de presta1751
    Ca simplifiera la copie du site, le blocage d'acces et aussi la bascule
     
    wabstemer apprécie ceci.
  8. KOogar
    KOogar WRInaute accro
    Inscrit:
    16 Novembre 2004
    Messages:
    4 470
    J'aime reçus:
    48
    Il en manque 1 >> Mode maintenance via le Back Office
     
Chargement...
Similar Threads - Empêcher Googlebot crawler Forum Date
Empecher GoogleBot de suivre une redirection Débuter en référencement 20 Juillet 2010
désindexer et/ou empêcher crawl ? Crawl et indexation Google, sitemaps 4 Janvier 2019
Patron de Qwant : "Google essaye d'empêcher ..." Autres moteurs de recherche connus 1 Novembre 2018
Empêcher les majuscules dans les URL Débuter en référencement 27 Avril 2018
Empécher indexation Crawl et indexation Google, sitemaps 10 Avril 2018
Comment empêcher les gens de faire du copier coller ? Débuter en référencement 21 Janvier 2018
Empêcher des script javascript d'etre indexer Crawl et indexation Google, sitemaps 13 Mars 2017
Comment empêcher le crawl sur les pages "filter" et "order" Débuter en référencement 20 Janvier 2017
empêcher des caractères comme /?longurlwascutoff_0&& derrière l'url d'un site URL Rewriting et .htaccess 30 Avril 2016
Empêcher l'indexation de mon fichier sitemap Débuter en référencement 29 Avril 2016
  1. Ce site utilise des cookies. En continuant à utiliser ce site, vous acceptez l'utilisation des cookies.
    Rejeter la notice