Pb de duplicate content : ?content_only=1" sur Prestashop

Discussion dans 'Problèmes de référencement spécifiques à vos sites' créé par Alexisgdm, 23 Mai 2015.

  1. Alexisgdm

    Alexisgdm Nouveau WRInaute

    Inscrit:
    3 Juin 2009
    Messages:
    4
    J'aime reçus:
    0
    Bonjour à tous et à toutes,

    Je viens de trouver un problème de duplicate content que je n'arrive pas à résoudre sur notre site (Prestashop), et j'aurais aimé avoir votre avis svp:

    Voilà J'ai trouvé dans google webmaster tools> améliorations HTML 5330 balises meta et balises title en double.
    La premiere ligne est le nom du produit et la deuxieme ligne correspond au même produit mais se terminant par "?content_only=1"
    ex :
    site.com/pneus/pneujoli.html
    site.com/pneus/pneujoli.html?content_only=1

    J'ai rajouté un disallow "?content_only=" dans le robots txt avec cette forme ci-dessous :
    User-agent: Googlebot
    Disallow: /*orderby=
    Disallow: /*orderway=
    Disallow: /*tag=
    Disallow: /*id_currency=
    Disallow: /*search_query=
    Disallow: /*id_lang=
    Disallow: /*back=
    Disallow: /*utm_source=
    Disallow: /*utm_medium=
    Disallow: /*utm_campaign=
    Disallow: /*n=
    Disallow: /*content_only=
    Disallow: /*nosto=

    J'ai indiqué à dans GWT de ne pas surveiller les urls ?content_only=1 dans le menu Exploration >parametre d'urls en mettant "aucune"

    Je renvoie le sitemap pour indexation depuis le module "google sitemap"dans prestashop, et ai resoumis le robots.txt depuis GWT pour modification, et depuis rien n'a bougé, environ 2 semaines.
    Avez-vous une idée?

    Dans l'attente de vous lire
    Merci d'avance

    Alex
     
  2. UsagiYojimbo

    UsagiYojimbo WRInaute accro

    Inscrit:
    23 Novembre 2005
    Messages:
    12 380
    J'aime reçus:
    0
    Le problème du disallow, c'est que ce faisant tu empêche le bot d'accéder à la page, et ainsi de la désindexer. Il vaudrait mieux partir sur un système de canonical, voire sur du noindex:.
     
  3. Alexisgdm

    Alexisgdm Nouveau WRInaute

    Inscrit:
    3 Juin 2009
    Messages:
    4
    J'aime reçus:
    0
    Je vais voir pour le Noindex,
    Ca veut dire que je devrai plutôt faire le no index dans le Ht access?
    Merci de ton aide
     
  4. Alexisgdm

    Alexisgdm Nouveau WRInaute

    Inscrit:
    3 Juin 2009
    Messages:
    4
    J'aime reçus:
    0
    Je repensais à comment faire pour retirer ce dual content:

    Estce que le fait le mettre le paramètre "aucune url" dans GWT Exploration>parametre d'url correspond à du "No Index"?

    Paramètre URL surveillées Dernière configuration Effet Exploration
    content_only 4 413 09:23 (Il y a 5 minutes) - Aucune URL

    Si ce n'est pas ça, est-ce que le canonical et le No follow doit être mis sur chacune des 5300 pages ou y'a il une méthode globale?
    Merci de ta réponse
    A bientôt
     
  5. loubet

    loubet WRInaute impliqué

    Inscrit:
    19 Février 2003
    Messages:
    871
    J'aime reçus:
    0
    il y a une différence pour le client avec et sans ce paramètre ?
    si non, alors déjà trouver pourquoi cela apparait et y remédier.

    une canonical url est une solution, et il suffit de toujours la mettre, ce qui peut être plus simple pour un non programmeur de ne faire quelque chose que si ce paramètre est présent.
     
  6. Alexisgdm

    Alexisgdm Nouveau WRInaute

    Inscrit:
    3 Juin 2009
    Messages:
    4
    J'aime reçus:
    0
    Salut Loubet,

    En fait oui il y'a une différence car les pages se terminant par "content_only=1 sont tronquées et apparaissent n'importe comment à l'écran. Ma question si je le modifie le paramètre "aucune url" dans GWT Exploration>parametre d'url ça edvrait suffire non?

    A bientôt