indexations limitées

Nouveau WRInaute
Bonjour,

Je m'occupe d'une librairie en ligne ouverte depuis 6 mois. Il y a un peu plus de 3 mois, nous avons mis un lien sur la page d'acceuil pour accéder à toutes les fiches produits (un peu plus de 5000) afin qu'elles soient plus accessibles par google. Une fois référencées par google, les fiches produits sortent 7 fois sur 10 en tête si l'on tape le titre de livre dans google. Le problème, c'est d'arriver à l'être (référencé). Après plusieurs google dance et maints passages de bots, j'ai toujours un peu prés le même résultat à chaque fois : Seulement 500 fiches de trouvées par google, et pas plus de 100 indéxées ...
Quelqu'un peut-il me faire profiter de ses lumières ? Quelqu'un sait-il ou le problème se situe ?
Je sais que google n'en fait souvent qu'à sa tête, mais si vous avez le moindre indice je suis preneur.
Merci d'avance

le site -> http://www.gaia-store.com le lien sur les fiches produits se situe en bas à gauche de la page d'acceuil : "voir tous nos produits classés par ordre alphabétique"
 
WRInaute occasionnel
Cela doit être à cause du Sid dans les URLs ; exemples de l'URL de la MEME page vue par 2 visiteurs différents (en fait moi à 3 minutes d'intervalle)

h--p://www.gaia-store.com/catalog/liste_produit.php?lettre_debut=A&osCsid=e5c94c62cb7ebc1ae07f63fc523e86ac

h--p://www.gaia-store.com/catalog/liste_produit.php?lettre_debut=A&osCsid=081238b8c6e193386ab130e5982d6345

Ce Sid (Identifiant de session) est nécessaire pour suivre le visiteur qui remplit son panier ; une solution pourrait être de donner un SID que lorsque le visiteur s'est loggé et avoir un Sid fixe pour les visiteurs qui ne se logueraient pas (dont les bots).

Attention donc car il ne faudrait pas détraquer le fonctionnement de la commande

Un autre problème est que la page qui a toujours un Sid est la page des livres commençant par A qui va finir par être ignorée par GG à force d'exister sous plusieurs dénominations, donc les livres qu'elle féfére aussi...

Bref il y a pas mal de choses à revoir, bon courage :)
 
Nouveau WRInaute
J'y aurais jamais pensé ...
Merci en tout cas, car pour la première fois j'ai une piste qui me parait pas farfelue.
C'est un problème que tu as déjà rencontré, ou c'est une simple déduction suite a ton passage sur mon site ?
On va travailler sur ces sid dés demain...


Si vous avez d'autres suggestions n'hésitez pas
 
WRInaute impliqué
+1 avec au dessus

De même PR pas assez élevé, j'ai pu constaté qu'au plus un site avait de PR au plus Google lui indexait de pages et que très peu tombaient dans l'oubli contrairement aux sites de PR plus faibles.
 
WRInaute discret
rituel a dit:
+1 avec au dessus

De même PR pas assez élevé, j'ai pu constaté qu'au plus un site avait de PR au plus Google lui indexait de pages et que très peu tombaient dans l'oubli contrairement aux sites de PR plus faibles.
Voilà la réponse à l'une de mes questions. :)

Quant à savoir pourquoi google indexera cette page plutôt qu'une autre, ça reste un mystère. D'autant plus que me concernant, il ignore certaines des pages les plus importantes.
 
Nouveau WRInaute
Je suis pas trop callé en "qualification" du PR (bein / pas bien), mais mon site affiche un PRde 5 en 6 mois. J'avais cru comprendre que c'était pas mal. Ils serait donc pas assez sufisant pour un crawl en profondeur ?
 
WRInaute accro
J'ai un site en ligne depuis quelques mois 6 mois avec mon nouveau domaine, un PR4 à la limite du 5 je pense. Et je subit souvent des crawls moyens et maintenant quelques full crawl (8000 visites gg par jours pour les fulls)


Donc avec un PR 5 tu devrais y avoir le droit aussi ;-)
 
WRInaute accro
Ce sont le sessions qui déconnent comme pr´cisé uau début. ton PR est suffisant pour "encourager" gogole a indexer rapidement toute tes pages. je crois que tu peux supprimmer tes sessions ID par l´URL-Rewriting mais comme je ne m´y connais pas ... je ne peux pas te le garantir (tu peux chercher des infos dans le forum correspondant sur WRI). a+
 
Discussions similaires
Haut