les sessions dans l'url et google

WRInaute impliqué
Salut
Je n'ai pas trouvé d'info la dessus, mais je voulais revenir sur les sessions visibles dans les urls. Lorsqu'on y réfléchit un peu, il semble logique que google n'indexe pas les url avec les numéro de sessions, car sinon il trouverait, à chaque visite sur le site, de nouvelles url.
-www.azerty.com/index.php?phpsessionid=12345788
est bien exactement la même page que
-www.azerty.com/index.php?phpsessionid=12345789

Certains ont contourner le problème en rewritant leurs url (remplacement de la chaine id par une autre chaine). La question que je me pose, c'est Google ne voit-il pas là un duplicate content?
Les personnes qui utilisent cette technique doivent voir leur nombre de pages référencées par google augmenter de façon incroyable non?
 
WRInaute occasionnel
le mieux quand tu fait de l'url rewriting c'est de bloquer les pages non rewritées dans le robots.txt de manière a ce que google ne les crawle pas
 
WRInaute impliqué
mmmm...????
Justement je parle des pages rewrittées....

(ça me fait toujours bizarre de mettre "ées" après rewrite :wink: )
 
WRInaute occasionnel
oui oui j'ai bien compris de quoi tu parlais :)

seulement si google s'amuse a suivre aussi les memes pages sans le rewriting, il va voir du duplicate, d'ou la nécéssité de lui bloquer l'accés sur les pages sans le rewriting en rajoutant une ligne pour les .php dans robots.txt
 
WRInaute impliqué
Arf.... mon message peut être mal compris. Effectivement en le relisant on peut le comprendre comme tu l'as compris.
Pour le duplicate content, je parlais des personnes qui ont rewritté les id dans les url
exemple:
-www.azerty.com/index.php?var=12345700
si google repasse, il va avoir un nouveau numéro de session
par exemple:
-www.azerty.com/index.php?var=12345701
si il repasse sur cette page il va avoir encore un nouveau numéro de session
-www.azerty.com/index.php?var=12345702

pour google , ce sont des urls différentes, donc des pages différentes. Pourtant l'interieur des pages ne changera pas, d'où duplicate content.
Je me demandais donc si les personnes qui ont rewrité les idsession ont observé ce cas là...
 
WRInaute impliqué
WebRankInfo a dit:
ça n'a pas de rapport avec l'URL Rewriting... Il faut désactiver les sessions c'est tout.
cela veut dire cloaking puisque tu ne les active que pour les non-robots (c'est pas méchant d'accord, mais bon...).
C'est ce que je fais en ce moment, mais je me dis que ce n'est pas terrible... :wink:
mais le cas que je suis en train de tenter d'expliquer, c'est qu'il y a quand même des personnes qui rewritent les id

D'ailleurs, pourquoi ne peut-on pas activer les sessions pour les robots???
Si on met tous les liens en adresse absolue, ça devrait marcher non?
 
Olivier Duffez (admin)
Membre du personnel
non je ne suis pas vraiment d'accord
sur ce forum, Google n'est pas considéré comme un membre, il voit donc la meme chose que les autres internautes qui ne sont pas encore inscrits au forum (ils ne savent pas ce qu'ils ratent...).
la seule différence de contenu est qu'il ne peut pas poster de réponse ou de nouveau sujet...
 
Discussions similaires
Haut