Discussion sur la comptabilisation des visites et visiteurs

Nouveau WRInaute
Bonjour,

Je sais, ce sujet a probablement été pas mal abordé et certaines pseudo normes existent, mais je n'ai pour l'instant pas trouvé grand chose de concret sur l'aspect technique.

Ca fait un moment que j'hésite sur la méthode à employer pour comptabiliser les visites et les visiteurs ("visiteurs uniques"). En attendant je me suis contenté, mon site n'étant pas encore officiellement ouvert, de compter 1 visite par session, ce qui bien sur ne va pas.

------------------------------------------------------

Tout d'abord les visites (si trop long à lire, passez directement aux visiteurs plus bas, question plus délicate) :

D'apres ce que jai pu lire, on concidère comme fin de visite une période d'inactivité de 30 minutes. Ce qui suppose qu'a chaque page visitée, on remet le compteur des 30 mins à 0. En pratique, cela pose plusieurs questions :

- Si un visiteur, durant une meme session, laisse s'écouler 30 mins entre l'ouverture de 2 pages, et si l'on détecte qu'on est bien dans la meme session (variable de session initialisée lors de l'ouverture de la première page par exemple), doit on comptabiliser 2 visites ?
- Si une meme IP ouvre le site sous plusieurs navigateurs (useragents différents), la convension considérant le couple ip/useragent comme identifiant, doit on concidérer une visite par navigateur ou une seule visite ? De plus, dans ce cas, doit on concidérer uniquement le premier navigateur pour les stats sur les navigateurs, ou tous les prendre en compte ?

Sur le plan technique, pour détecter ces visites au plus juste, je pencherais pour la méthodologie suivante :
- Lors de l'ouverture de la première page, stocker une variable en session mise à jour à chaque page ouverte avec l'heure, variable permettant de détecter si la visite doit etre comptabilisé ou pas (comptabilisée si la variable n'est pas définie ou si l'heure qu'elle contient date de plus de 30 minutes)
- En cas d'absence de la variable de session, faire la meme chose avec un cookie, permettant de faire la même chose dans le cas d'une fermeture de navigateur (et donc effacement de la session) entre 2 pages
- En cas de refus des cookies, prévoir une alternative sur l'IP, en stockant la aussi l'heure d'ouverture de la page pour chaque IP (chose déja en place dans mon cas pour le calcul du nombre de connectés)

Il reste dans ce cas quelques inconnues, comme le cas du visiteur AOL qui change constamant d'IP, refuse les cookies et ferme son navigateur tout le temps :)

------------------------------------------------------

Maintenant passons au comptage des visiteurs :

Apparemment, il n'y a pas de réelle convention sur l'intervale séparant 2 visites, et j'ai beaucoup de mal à me décider sur la meilleure méthode :

1er cas : Comptabiliser chaque visiteur une seule fois par jour, de 00:00:00 à 23:59:59 :
Inconvénients :
- Un visiteur qui se connecte à 23h50 et revient à 00H10 sera comptabilisé 2 fois en 20 mins. Ca peut être contourné en ne comptabilisant les visiteurs que si on comptabilise une nouvelle visite (donc 30 mins d'écart) mais le problème reste entier pour une visite à 23H40 puis une à 00H20
- Cela pose un problème avec les visiteurs ayant un décalage horraire par rapport au serveur. Un visiteur ayant -2h de décalage sera comptabilisé 2 fois si il vient à 21H40 et à 22H20 (heure locale, 23h40-00h20 coté serveur), alors qu'il ne sera comptabilisé qu'une fois s'il passe à 23h40 et 00h20
- Quelqu'un qui passe à 8h00 est à 23h00 comptera pour une seule visite alors que cet écart suppose clairement 2 visites bien distincte de son coté, alors qu'un visiteur passant à 23H40 et à 00h20 comptera pour 2 visites la ou ca peut être vu comme une seule visite de son coté.


2e cas : comptabiliser une visite par tranche de 24h :
Dans ce cas, lors de la comptabilisation d'une visite, on stocke l'heure de cette visite, et ne compte la visite suivante qu'au bout de 24h minimum. Ca permet de ne pas comptabiliser 2 visites lorsqu'il y en a une avant et une après minuit (ce qui est assez fréquent pour certains types de sites)
Inconvénients :
- Quelqu'un qui passe faire son tour sur le site tous les soir, passe un soir à 23h, visite comptabilisée, et repasse le landemain à 22h, visite non comptabilisée
- Quelqu'un qui passe en soirée, puis le landemain matin, ne sera comptabilisé qu'une fois, bien que cela constitue 2 visites distinctes de son coté, et ce même si ce visiteur ne repasse pas de la journée (donc pas de visite comptabilisée ce jour la malgrès un passage sur le site)


3e cas : comptabiliser une visite par tranche inférieure à 24h, en réfléchissant sur la meilleure solution entre 10, 12, 16 et 20h par exemple. Ca permet de comptabiliser 2 fois quelqu'un qui passe à 23h un soir et 22h le soir suivant, tout comme quelqu'un qui passe un soir et le landemain matin (tout en ne le comptabilisant pas le soir si il est passé le matin) mais en ne comptabilisant pas quelqu'un qui passe avant et après minuit..
Une périodicité de 12h permet de comptabiliser 2 fois quelqu'un qui passe à 22h et repasse à 10h, mais comptabilise 2 fois quelqu'un passant à 8-9h puis à 23h (ce qui est cohérent en pratique, mais contraire à la pseudo normalisation qui suppose une visite par jour).
Une périodicité de 16h résout ce problème, mais ne comptabilisera pas 2 fois quelqu'un qui passe à 22h puis le landemain à 10h.
Cette solution pourrait en pratique être la plus juste mais est celle qui répond, a priori, le moins à une pseudo normalisation.

C'est pour cela que je serais plutot content de voir l'avis de webmasteurs expérimentés sur ce sujet, et de savoir la solution retenue par les organisme ou les tiers comme xiti

d'un point de vue technique, tout comme pour les visites, pour un minimum de fiabilité, je pencherais pour une gestion à la fois par session, cookie et adresse IP, avec vérification dans cet ordre, le cumul des 3 ne laissant plus passer trop de doublons

-------------------------------------------

Voila, désolé pour ce topic trés long, surtout si ca a déja été abordé, mais je pense qu'il serait bon que ce sujet soit traité en profondeur une bonne fois pour toute (encore une fois, si ca n'a pas déja été fait)
 
WRInaute discret
C'est pour cela que je serais plutot content de voir l'avis de webmasteurs expérimentés sur ce sujet, et de savoir la solution retenue par les organisme ou les tiers comme xiti

C'est ca la question :wink:
 
Nouveau WRInaute
En général, quand on expose plusieurs facons de gérer quelque chose, avec un titre évocateur, ca parait assez évident que la question porte sur la solution à retenir
 
Discussions similaires
Haut