Génération d'url automatique - duplicate content

Nouveau WRInaute
Bonjour à tous !

Je boss sur la mise en place d'un site qui a pour objectif de vendre des croisières et je vais rencontrer un petit problème qui me titille l'esprit depuis quelques jours.

Pour résumer la situation et je pense que cela est assez simple à comprendre. Le site à donc pour vocation de vendre des croisières et cela se traduit par le choix d'une destination et/ou d’un circuit.

Il existe donc une page : /destination/croisiere/ref-az210419

Cette page est composé de toutes les informations nécessaires comme le prix, la date, les horaires, le nombre de jours, la description du jour / jour etc.

Le problème que je vais rencontrer se positionne au niveau de l’url et en particulier la fin de cette url comme par exemple : /ref-az210419

La fin de cette URL est générer automatiquement en fonction du bateau choisi, des dates etc. Un nombre incalculable d’url peux être alors généré.

La page en sois aura sensiblement les mêmes descriptions du jour par jour seulement les dates et le nom du bateau changerons.

Je pense immédiatement au duplicate content.

Je ne pense pas que mettre en « no index » ces pages soit de bonne augure car je souhaite optimiser ces pages pour des recherches SEO du style croisière + destination etc.

J’ai pensé au canonical mais je vous avoue que je manque de connaissance sur ce point.
  • Est-ce la bonne option ?
  • Si oui, comment mettre en place ce proces ?
  • Si non, quelle est l’option à mettre en place ?
Ps je ne peux pas transmettre l’adresse du site pour des raisons de confidentialité. Le site n’est pas encore en ligne mais je pense que je ne suis pas le seul à rencontrer ce problème ! Les gros sites e-commerce ont surement ce souci de page dupliqué.

J’espère avoir été assez précis sur ma demande d’aide.

Dans l’attente de vous lire avec impatience

Fabien,
 
Nouveau WRInaute
Ok merci !

Donc si j'ai bien compris, disons que je veux indexer la page /destination/croisiere/ref-az210419

Je mets cette balise :
Code:
<link rel="canonical" href="/destination/croisiere/ref-az210419">

dans le head de toutes mes pages du type :
/destination/croisiere/ref-az0001
/destination/croisiere/ref-az2895

etc..
 
Olivier Duffez (admin)
Membre du personnel
si tu mets une canonique sur tout ça, tu ne sortiras pas dans Google sur les variantes. donc ça ne répond pas à ton besoin initial.
en plus ça fait crawler pour des prunes (perte considérable de crawl budget)

pourquoi tu ne trouves pas de solution satisfaisante ? car le besoin n'est pas bon ! il ne faut surtout pas laisser Google indexer et même crawler toutes ces variantes (dates, horaires, nb de jours...)

PS : j'ai corrigé dans tes posts, mais c'est inutile de mettre des URL entières avec un nom de domaine fictif, ça génère des liens vers des 404. Mets simplement la partie de l'URL qui commence par le /
 
Olivier Duffez (admin)
Membre du personnel
crawler et indexer une seule URL
le but est d'avoir uniquement une forte valeur ajoutée sur chaque page indexable, sans pb de contenus dupliqués
 
Nouveau WRInaute
Merci,

Je ne suis pas un as dans le domaine, je ne veux pas me planter :) donc je demande confirmation.

Le mieux serai d'indexer cette page par exemple : /destination/croisiere/ref-az210419"
et que toutes les autres URL qui seront généré automatiquement par x ou y raison avec un contenu très similaire tel que :

/destination/croisiere/ref-az0001
/destination/croisiere/ref-az2895
etc..

En no index ?
 
Olivier Duffez (admin)
Membre du personnel
je ne vois pas comment je peux répondre sans savoir ce qui se cache derrière toutes les autres URL
par ailleurs, j'ai précisé "crawler et indexer une seule URL", pas seulement du noindex

pour chaque croisière, il faut regrouper toutes les infos utiles sur une seule page et la faire indexer. ensuite, les variantes sans intérêt SEO ne doivent pas être crawlées
 
Nouveau WRInaute
Ok merci !

Je commence a comprendre la différence entre "crawler et indexer"

Il faut donc que je donne des directives grâce au fichier "robots.txt"
 
WRInaute discret
Au lieu d'utiliser des urls du style ref-az210419, pourquoi ne pas utiliser des parametres du style ?bateau=12&date=2017&...
Tu peux ensuite utiliser search console pour specifier quel type de parametre c'est, et ainsi aider google a s'y retrouver.
(et regarde a partir de 15min)
 
Dernière édition:
Olivier Duffez (admin)
Membre du personnel
c'est pas si efficace que ça... mieux vaut régler le pb en amont qu'en aval (en plus uniquement pour Google)
 
Discussions similaires
Haut