URL indexées: l'URL de la Title et du breadcrumbs differentes

Nouveau WRInaute
Bonjour!

Etant toujours en cours d'optimisation de mes pages indexées, j'ai voulu analyser plus finement l'état de l'indexation et avec la commande site: et quelques manips j'ai pu télécharger 1200 de mes 4500 URLs dans Excel. Je remarque avec surprise de nombreuses répétitions. Par exemple ma catégorie http://www.legrenierdejuliette.com/146-marques se répète 125 fois dans la liste.
Je pense que c'est un problème mais ne suis pas sûr a 100%.
L'origine de ce comportement semble venir des breadcrumbs (fil d'ariane) qui s'arrête toujours a la catégorie même si le SERP snippet est sur une fiche produit. La baliste titre pointe bien vers le produit mais le breadcrumbs sur la catégorie, donc sur une URL différente. Résultat tous les produits sont bien indexées mais avec une URL incorrecte (pour la partie breadcrumbs).

Sur un exemple concret:
Si vous tapez dans google : meuble console amadeus
On apparaît normalement en #1: le Title (qui demande a être optimisé, je sais!) pointe bien vers le bon produit mais l'URL indexée par Google vers la catégorie de ce produit

Ce n'est pas du duplicate content mais j'ai du mal à imaginer ce que Google "en pense" quand il voit des centaines d'URLs avec des contenus différents... ?
 
WRInaute impliqué
si google a choisi d'afficher le chemin vers la page, c'est qu'il aime bien. pas de souci selon moi.
 
WRInaute accro
Je doute de ta façon de récupérer les urls si tu as effectivement 125 fois une url IDENTIQUE dans ta liste
N'as tu pas confondu entre l'url indexée (celle qui sur le title de la page) et l'url du breadcrumb qui apparait ? Celle ci n'est là qu'à titre indicatif, si tu as 150 sous catégories et qu'elles sont toutes indexées, tu verras 150 le même breadcrumb, mais la page de la catégorie mère sera indexée une seule fois

tes urls de "fournisseurs" sont plus problématiques,
-http://www.legrenierdejuliette.com/10_amadeus et -http://www.legrenierdejuliette.com/113__amadeus sont du vrai DC
comme
et du "quasi" DC avec -http://www.legrenierdejuliette.com/120__amadeus
(contenu pauvre, pas de description des produits, etc)
 
Nouveau WRInaute
Ah donc l'URL indexée est celle du Title (en bleue) et non celle qui apparaît en vert (généralement en format breadcrumb)?
Si c'est le cas effectivement ma méthode de recuperation des URLs n'est pas bonne!

Oui j'ai remarqué aussi ces URLs fournisseurs pas clean...je viens de mettre une balise noindex sur mes pages fournisseurs pour ne garder que les pages fabricants car effectivement c'est du DC et pas d’intérêt...je devrais les faire desindexer manuellement dans GWT aussi?

Merci
 
WRInaute accro
Ben oui l'url indexée c'est celle sur laquelle l'internaute clique :) donc la bleue
Sinon tu as des tas de sites sans breadcrumbs qui n'auraient aucune url indexée
 
Discussions similaires
Haut