Grosses différences entre stats Google analytics et nos stats serveur

Nouveau WRInaute
Bonjour à tous.

Nous gérons un site qui a à peu près 15000-20000 visites/jours, et nous venons de nous rendre compte que les stats fournies par Google Analytics (GA) s'éloignent de plus en plus des stats fournies par le Webaliser (v 2.01) de notre serveur.
Après avoir été presque identiques, les deux stats s'éloignent l'une de l'autre pour atteindre une différence de 35% sur dec 2013-jan 2014 : Les stats GA étant systématiquement inférieures aux stats serveur depuis mai 2012.

C'est un gros problème pour nous parce que si l'on suit les stats GA on est en train de perdre de plus en plus d'internautes, et si on regarde les stats serveur, on en gagne un peu.

Voilà un graphique qui devrait en dire plus long que tout mon petit discours :

graph_03.jpg


J'ajoute deux choses :
- notre tag Google Analytics est placé en début de page et non à la fin. Il est donc chargé à tous les coups.
- Avec ce genre de différence (197 000 sur déc 2013) il ne semble pas que ce soit une question de comptage ou pas de robots...

Mes questions sont les suivantes :
- A quelles stats faut-il se fier, les stats serveur ou les stats GA ?
- Qu'est-ce qui peut entraîner de telles différences entre les deux ?

Si vous avez des réponses, ce sera un plaisir de vous lire !

Merci beaucoup.
 
Olivier Duffez (admin)
Membre du personnel
Bienvenue sur WRI !

Je n'ai pas la réponse, mais :
- as-tu validé que ton code GA s'exécute bien sur 100% des pages ? je ne parle pas simplement de savoir s'il est présent, mais s'il s'exécute réellement bien (d'autres scripts JS peuvent par exemple le bloquer, s'ils ont un gros bug). Si tu n'as pas d'outil capable de le faire, contacte-moi ;-)
- as-tu analysé les visites comptées par webaliser pour t'assurer qu'il n'y a pas de bots ?

Je laisse les pros d'analytics donner leurs idées !
 
Nouveau WRInaute
Merci pour cette première réponse !

Je t'ai donc contacté par message privé au sujet des outils de vérification d'exécution JS.

Sinon, on n'a rien trouvé sur notre Webalizer qui nous permette d'afficher les filtres bots / pas bots. Ca ne veut pas dire qu'il ne le fasse pas, mais qu'on ne sait pas où chercher.
Sur la première période 2010-2012, on voit que les stats Webalizer étaient souvent inférieures aux stats Google. Ce qui me fait penser que les bots étaient (et sont) bel et bien filtrés. Depuis lors on n'a rien changé, ni au serveur ni au réglages de Webalizer (en fait on découvre un peu ces stats dont on ne faisait pas grand cas jusque là.)
Et puis on parle d'une différence de près de 6000 visites/jour. Est-ce qu'il pourrait y avoir autant de bots que ça filtrés dans un cas et pas dans l'autre ?

J'ajoute un détail : notre site étant un site de jeux gratuits, on a une stat interne "nombre de parties/jour" qui semble donner plutôt raison à nos stats serveur. Mais on n'en sait pas plus.

Merci beaucoup en tout cas pour ce début de réponse !
 
WRInaute passionné
Le script Analytics est-il posé sur toutes les pages ? N'y a t'il pas eu début 2012 des rajouts de pages sur lesquelles le script ne serait pas présent ?
 
Nouveau WRInaute
Thiery31 a dit:
Le script Analytics est-il posé sur toutes les pages ? N'y a t'il pas eu début 2012 des rajouts de pages sur lesquelles le script ne serait pas présent ?

Oui, le script est toujours présent. L'architecture de nos pages fait qu'il ne peut pas ne pas y être.
 
WRInaute discret
Quelques remarques qui pourraient expliquer les différences:
- depuis 2-3 ans, il existe de plus en plus de plugin visant à bloquer les pubs et les appels JS,
pour s'en rendre compte, tu peux ajouter une balise <noscript> vers une image ou une URL particulière et comptabiliser les appels bloqués.

- les logs Apache sont à privilégier puisque chaque requête du serveur y est enregistré, contrairement à Analytics où une erreur peut survenir dans l'appel JS, dans la communication vers les serveurs ou encore dans le traitement par Google.
Si vous touchez un peu en Dev, un idée est d'analyser soi-même les logs Apache pour extraire le trafic réel à partir des UserAgent, des langues et d'une base de localisation d'IP.

Tiens nous au courant, je trouve intéressant de savoir ce que vaut réellement Analytics :wink:
 
Nouveau WRInaute
Le problème c'est que j'ai noté exactement la même tendance et à pâtir du même moment, mais dans l'autre sens...
Ce sont les stats fournies par mon serveur que déclinent fortement alors que celles d'analytics semblent plus réalistes est sont en ligne avec celles d'adsense et les revenus correspondants.
 
Nouveau WRInaute
olivier_jeuxgeo a dit:
J'ajoute deux choses :
- notre tag Google Analytics est placé en début de page et non à la fin. Il est donc chargé à tous les coups.
-

Merci beaucoup.

Selon que ton code analytics est synchrone ou asynchrone le moment de son chargement est différent.
En asynchrone il attend le chargement complet de la page pour envoyer les infos à google. En synchrone il envoie les infos même si le visiteur quitte la page avant la fin de son chargement. Cela peut fortement impacter les résultats.

Pour ma part j'ai changé le code synchrone pour l'asynchrone mais je ne me rappelle pas exactement à quel moment (je pense en juin/juillet) et c'est à partir de là que j'ai aussi noté du changement
 
Nouveau WRInaute
Il me semble que notamment la différence entre des states de ton serveur et GOOGLE Analytics viennent de :
- Les robots de GOOGLE et autres
- Google Analytics est un service qui fonctionne avec un code Javascript, si je javascript n'est pas activé sur le navigateur la visite ne sera pas comptabilisée.
 
Discussions similaires
Haut