Rewriting, référencement et e-commerce

Discussion dans 'URL Rewriting et .htaccess' créé par blman, 7 Juillet 2009.

  1. blman
    blman WRInaute accro
    Inscrit:
    5 Septembre 2003
    Messages:
    2 719
    J'aime reçus:
    3
    Bonjour,

    suite à quelques posts à ce sujet dernièrement, je voulais faire un point sur le rewriting sur un site de type e-commerce (bien sûr, cette réflexion peut s'adapter à d'autres cas).

    Partie théorie
    Une page est identifiée par les moteurs par son URL : pour optimiser son référencement, il faut toujours vérifier qu'une page n'est accessible que par 1 et 1 seule URL.
    Ce post rappelle bien les bonnes pratiques sur la canonicalisation des URLs qui s'applique d'ailleurs à tous les moteurs. On ne reviendra pas dessus, normalement, c'est quelque chose de connu par les WRInautes assidus.

    La pratique
    Revenons maintenant sur du concret et sur le quotidien d'un site e-commerce. Des "chefs produits" vont gérer leur rayon : Quotidiennement, ils ajoutent/modifient/archivent/suppriment des fiches produit, des rubriques, des marques, etc... Des techniciens, eux, de leur côté, peuvent injecter automatiquement des catalogues entiers de leurs fournisseurs au format XML ou CSV.

    Ce que je vais appeler "rewriting automatique" par la suite de ce post, est le fait de générer une URL à la volée en fonction d'une information contenue en base de données (cette info, n'étant bien sûr pas prévue de prime abord pour cette utilisation).

    Faire du rewriting automatique sur des intitulés de rubriques, de marques ou des désignations de produit peut être une très grosse erreur qui peut avoir de lourdes conséquences sur le référencement. Pourquoi ? Tout simplement, parce qu'en modifiant un intitulé, vous allez aussi changer les URLs qui identifient vos pages dans la base de données des moteurs de recherche.

    Prenons un exemple concret de rewriting automatique :
    - j'ajoute automatiquement un produit via un catalogue XML d'un fournisseur : "Le produit qui est pas mal" est ajouté automatiquement, sans intervention humaine, et donnera une URL : "le-produit-qui-est-pas-mal.html"
    - 1 semaine plus tard, le chef produit corrige la désignation pour une désignation plus vendeuse : "Le produit qui est pas mal" deviendra "Le beau produit" changera l'URL en "le-beau-produit.html" à cause du rewriting automatique
    - 1 mois plus tard, suite à une analyse de référencement, on s'est apercu que "beau produit" était moins recherché que "chouette produit". Re-changement de désignation : "Le chouette produit" changera de nouveau l'URL en "le-chouette-produit.html"
    - etc...
    Vous comprenez bien, avec cet exemple, que les moteurs ne vont pas apprécier puisqu'ils ont connu 3 URLs pour exactement la même page.

    Voici une liste d'effets indésirable qui peuvent arriver selon les cas où le problème est géré :
    - contenu à réindexer par les bots
    - création de contenu dupliqué
    - perte de "juice" (puisque les liens internes et les backlinks pointaient vers l'ancienne URL)
    - perte d'ancienneté
    - clics dans les SERPs qui peuvent conduire vers des 404 (puisque l'ancienne URL reste indexée mais n'existe plus)
    - etc...

    Maintenant, on sait tous que le rewriting est quand même bénéfique au référencement. Historiquement, on sait que les moteurs n'apprécient pas les URLs trop longues.

    Voici donc quelques astuces pour utiliser quand même l'URL rewriting tout en se protégeant de ces erreurs :

    - pour ceux qui n'ont pas la main sur le code source de leur boutique, je leur conseillerais d'éviter au maximum de modifier les désignations et les intitulés de leurs éléments de navigations. Malheureusement, c'est le seul conseil que je pourrais leur faire. Vous pouvez aussi contacter le fournisseur de votre solution e-commerce pour lui faire part de vos remarques.

    Sinon, pour ceux qui peuvent modifier leur code source, je vois 2 solutions :

    - Utiliser des redirections 301 : si vous changez une intitulé, assurez-vous que toutes les anciennes URL redirigent en 301 vers la nouvelle. On le répète suffisamment sur le forum, c'est une solution efficace : Les moteurs feront ainsi automatiquement l'association entre les 2 URLs et répercuterons le référencement des anciennes vers la nouvelle.

    Oui mais comment faire ça ?
    Pour ceux qui passent aussi l'identifiant du produit, de la rubrique, ... par l'URL, vous avez des URL construites ainsi : -monsite.com/produit123456/mon-beau-produit.html où 123456 est l'identifiant (ou la référence) de l'entrée (produit, rubrique, marque, ...) dans votre base de données. Il suffit alors de tester si l'URL est correcte pour le produit 123456 et, si ce n'est pas le cas, de faire une redirection 301 vers la bonne URL (par exemple via un header en PHP).

    Pour ceux qui ne passent pas cet identifiant, l'opération est plus délicate. Personnellement, j'enregistrerais un historique des désignations dans une table de ma base de données. Lorsque une URL est appelée, je consulterais cette table et je regarderais si mon URL correspond à la dernière entrée enregistrée pour un produit. Si ce n'est pas le cas, je ferais une 301 vers la dernière entrée. (Cette solution est un peu bidouille, j'avous).

    - Utiliser des identifiants d'URLs ou des noms d'entrées pour le permalien ( http://fr.wikipedia.org/wiki/Permalien )
    C'est bien sûr la solution que je préfère. Pour cela, il suffit d'ajouter un champs supplémentaire dans votre base de données. Le nom d'entrée n'est enregistré qu'à l'ajout d'une donnée. Il n'est jamais modifié par la suite.

    Revenons à mon exemple :
    - j'ajoute un produit via un catalogue XML d'un fournisseur : "Le produit qui est pas mal" donnera un nom d'entrée : "le-produit-qui-est-pas-mal" et donc une URL : "le-produit-qui-est-pas-mal.htm"
    - 1 semaine plus tard, le chef produit corrige la désignation pour une désignation plus vendeuse : "Le beau produit" ne changera pas le nom d'entrée. L'URL est construite à partir du nom d'entrée et reste "le-produit-qui-est-pas-mal.htm"
    - 1 mois plus tard, suite à une analyse de référencement, on s'est apercu que "beau produit" était moins recherché que "chouette produit". Re-changement de désignation : L'URL reste "le-produit-qui-est-pas-mal.htm"
    - etc...
    L'URL est toujours construite à partir du nom d'entrée, elle ne change donc jamais.

    Voila, en espérant que ce post puisse en aider certains. Le rewriting, c'est très bien, à condition qu'il soit bien utilisé. Si vous n'avez pas la possibilité technique de bien l'utiliser, je vous conseillerais de garder vos URLs avec paramètres, car en voulant améliorer votre référencement, vous pourriez tout simplement faire l'inverse.
     
  2. fabor
    fabor WRInaute discret
    Inscrit:
    17 Mars 2005
    Messages:
    122
    J'aime reçus:
    0
    Intérresant et quid des pages catalogues? si on a plusieurs critères d'affichages quelles pages garder en canonique, y a-t-il risque de duplicate si un produit est dans plusieurs catégories?
     
  3. blman
    blman WRInaute accro
    Inscrit:
    5 Septembre 2003
    Messages:
    2 719
    J'aime reçus:
    3
    Si un produit est dans plusieurs catégories, je vois 2 cas :

    - le produit se trouve dans categ1 et categ2 mais les 2 catégories sont différentes puisqu'elles affichent des produits commun mais pas que ceux là, il y a aussi des produits spécifiques à chaque catégories. Pour moi, il n'y a pas de duplicate content. Chacune des catégories peut avoir sa propre URL rewritée. Par exemple : -site.com/categ1/nom-entree1.html et -site.com/categ2/nom-entree2.html

    - le produit se trouve dans sous-categ1 et sous-categ2 mais ces 2 catégories sont identiques. Ca peut arriver par souci de navigation, par exemple les accessoires qui peuvent se retrouver dans 2 catégories principales différentes.
    Categ1 > sous-categ1
    Categ2 > sous-categ2
    sous-categ1 et sous-categ2 listent les mêmes produits. Dans ce cas, il s'agit clairement de contenu dupliqué puisque le même contenu se trouve à 2 URLs différentes. Par exemple : -site.com/categ1/ss-categ1.html aurait exactement le même contenu que -site.com/categ2/ss-categ2.html
    Dans ce cas, à mon avis, il faudrait intégrer la notion de raccourci. Même si une rubrique est classé dans categ2, son lien peut être un raccourci vers categ1. On a ainsi 1 et 1 seule URL pour le même contenu.
     
  4. cedric_g
    cedric_g WRInaute accro
    Inscrit:
    18 Janvier 2006
    Messages:
    2 930
    J'aime reçus:
    2
    Bonjour

    Pour ma part, je gère cela comme suit (au niveau des catégories, pages fabricants, etc.) :
    - une catégorie = une URL unique (la règle de base)
    - deux catégories ne peuvent (ne doivent) pas afficher la même liste de produits (sur ce point c'est un choix organisationnel ; s'il y a utilisation de synonymes potentiellement à forte valeur ajoutée, on joue sur des sous-catégories le cas échéant, ou via un système de tags pour proposer un classement transversal si j'ose dire)
    - si nécessité de classement ou de pagination, les pages avec tris et/ou pagination sont affichées en "noindex,follow" + balise Rel Canonical renvoyant vers la première page de catégorie sans variables d'URL

    Les résultats sont excellents sur les boutiques que je gère.

    Par ailleurs, puisque très souvent des produits peuvent faire parti de plusieurs catégories, j'ai fait le choix de ne PAS indiquer la catégorie ni dans l'URL, ni sur les fiches produit. Sinon c'est duplicate content assuré... et prise de tête en plus !

    Au-delà des solutions techniques, je préfère les solutions organisationnelles et rédactionnelles : une bonne hiérarchie de catégories, une bonne répartition des produits, et une approche générale au niveau du champs lexical pour "spécialiser" les pages sur telle ou telle expression clé "majeure".
     
  5. ysimon
    ysimon WRInaute discret
    Inscrit:
    24 Février 2004
    Messages:
    121
    J'aime reçus:
    0
    Salut

    j'hesite vraiment à faire ca ... cad, si tu mets un canonical sur la page 2 vers la page 1 (sans variables d'URL)

    parce que du coup, je me disais que ca ne distribuerait pas de page rank aux articles listés dans les pages 2,3,4 ...

    qu'as tu constaté à ce sujet stp ?

    merci ;)
     
  6. cedric_g
    cedric_g WRInaute accro
    Inscrit:
    18 Janvier 2006
    Messages:
    2 930
    J'aime reçus:
    2
    Je n'ai pas constaté ce phénomène. Quoi qu'il en soit, au-delà du PR (dont je n'ai franchement que faire :mrgreen: ) tous mes produits sont indexés, et la plupart sont en 1ère page Google sur leur nom et très souvent sur les expressions dérivées.

    C'est là l'essentiel !

    Non ?

    Par ailleurs, l'URL canonique n'influe pas me semble-t-il sur le link juice transmis des pages dites secondaires. Je n'ai en tout cas rien lu ni entendu de tel ;)
     
  7. milkiway
    milkiway WRInaute accro
    Inscrit:
    3 Février 2004
    Messages:
    4 196
    J'aime reçus:
    0
    Désolé pour le déterrage.
    Avec le recul, conseillerais tu toujours la même technique ?
    Pourquoi ajouter la balise rel canonical ? Ne pas l'ajouter est il préjudiciable ? Les pages en noindex follow présentant donc une liste de produit dont le lien ne se retrouve sur aucune page indexée (?) sont elles toujours bien positionnées dans les serps ?
    merci
     
Chargement...
Similar Threads - Rewriting référencement commerce Forum Date
Le rewriting dangereux pour le référencement ? URL Rewriting et .htaccess 27 Décembre 2010
Url rewriting, fichier XML, avis pour le référencement sur Google Problèmes de référencement spécifiques à vos sites 28 Juillet 2010
URL rewriting, referencement et prestashop URL Rewriting et .htaccess 29 Juin 2010
Modification d'url rewriting pour optimiser son référencement Développement d'un site Web ou d'une appli mobile 11 Mai 2010
Changer d'url rewriting sans perdre son référencement Débuter en référencement 10 Février 2010
URL rewriting et referencement URL Rewriting et .htaccess 7 Septembre 2009
L'url rewriting et le référencement URL Rewriting et .htaccess 17 Août 2009
Problème référencement après url rewriting wordpress URL Rewriting et .htaccess 10 Juin 2009
Référencement et rewriting Netlinking, backlinks, liens et redirections 7 Novembre 2007
Rewriting pour referencement URL Rewriting et .htaccess 8 Juin 2007
Système URL-rewriting pour le référencement URL Rewriting et .htaccess 5 Juin 2007
Rewriting sans dossier : néfaste pour le référencement ? URL Rewriting et .htaccess 1 Juin 2007
Profondeur d'un rewriting pénalisant pour le référencement ? URL Rewriting et .htaccess 31 Mai 2007
Meilleur Formalisme URL Rewriting pour le Référencement URL Rewriting et .htaccess 7 Mai 2007
Url_rewriting couplé à des Redirections 301 et référencement Débuter en référencement 26 Février 2007
URL Rewriting, mots vides et référencement URL Rewriting et .htaccess 11 Février 2007
Problème de référencement : ASP.NET 2 + url rewriting URL Rewriting et .htaccess 6 Juillet 2006
Url rewriting et référencement URL Rewriting et .htaccess 10 Juin 2006
URL rewriting et référencement Débuter en référencement 28 Avril 2006
Référencement et URL rewriting Débuter en référencement 3 Avril 2006