SID

WRInaute accro
Yo,

J'ai trouvé ca dans mes logs ce matin

32 /modules.php?name=Your_Account&redirect=viewforum&f=16&start=0&sid=0c555f0659c36d03b95761602a424c78 04:29:44 1 64.68.88.163 crawl35.googlebot.com

interessant non ? :twisted:
 
Olivier Duffez (admin)
Membre du personnel
le plus intéressant serait de savoir si cette page apparaitra dans les prochains jours dans Google ?
 
WRInaute accro
affaire a suivre..

mais je vous avouerai que tout cela m'inquiète un peu néanmoins !

sans vouloir la jouer parano, et si c'était une nouvelle "arme" anti- URL rewriting ?

genre "je t'aspire tout ton site et apres je t'analyse tout ton contenu"

zen zen
 
WRInaute passionné
mahefarivony a dit:
sans vouloir la jouer parano, et si c'était une nouvelle "arme" anti- URL rewriting ?
Invraisemblable, vu la puissance et le temps de calcul nécessaire pour "éplucher" 4 milliards de pages.

Dan

PS: le jour où on voit webmasterworld.com revenir aux URLs non réécrites, l sera toujours temps de réagir. :lol:
 
WRInaute passionné
Salut à tous,

Pour revenir sur ce fameux paramètre SID, ou plus génériquement ID, voici un post de GoogleGuy sur WebMasterWorld (daté d'aujourd'hui)

http://www.webmasterworld.com/forum3/15437.htm

googleguy a dit:
Tip #4: Avoid session ID's. If you can, use fewer dynamic parameters and stay away from the parameter "id=" in urls--Googlebot tries to stay away from things that might be session ID's.

Il ne faut donc pas trop espérer voir ces URLs indexées... :cry:

Dan
 
WRInaute passionné
Salut à tous,
D'accord à 300%. Eviter à tout prix les id sessions dans les urls.
Je recite une anecdote récente :
- un site avec +de 150 pages dans google. Bon ranking sur un grand nombre de requêtes.
- L'agence web en charge du dev à rajouter la gestion d'une session PHP dans l'url, un bô : PHPSESSID.
Résultat des courses : il ne reste plus qu'une page dans l'index de Google (la page d'accueil). Pour info le site à un PR de 6.
a+,
--
philippe
 
WRInaute passionné
Je parle de ça :
index.php?PHPSESSID=ac8a3b86f9f25d28d73c37d0b3187f02

PHPSESSID : c'est pas le nom par défaut de la variable de session dans PHP ? Donc très facile à détecter pour Google, et choisir de ne pas les indexer.
Donc il faut gérer les sessions par cookies et pas par url.
Un robot doit pouvoir naviguer sur le site sans ouvrir de session.
Je connais pas bc de robot qui remplissent un caddie et qui passent commande en filant leur n° de CB :lol:
a+
--
Philippe
 
WRInaute passionné
Mies Van der Rohe a dit:
google indexe les url avec PHPSESSID dans l'url

D'accord avec toi. Une simple requête avec le mot PHPSESSID, va nous donner des urls indexés dans Google.
Mais c'est quand même, selon moi, une technique à bannir :

- Comment il calcule le PR de l'url ?
- A chaque crawl l'url est différente.
- autres ?

Je préfère et de loin la gestion des sessions par cookie.
a+,
--
philippe
 
WRInaute occasionnel
les sessions sont d'un gout assez douteux pour un crawler car on peut facilement tomber dans des boucles infernales... A éviter ... maintenant on peut se passer des SID passées en URL, soit par le biais de cookies, mais il me semble que les serveurs savent le gérer aussi seuls
 
Discussions similaires
Haut