Vérification chiffres de consultation awstats

Emmaline

Nouveau WRInaute
Bonjour à tous,
Je suis nouvelle.

J'administre depuis peu de temps un site français destiné à un public de professionnels.

Pour son suivi statistique, on a mis à ma disposition Awstats qui est fourni par l'hébergeur OVH.

Dans les statistiques de consultations, la première adresse IP renvoie, après lookup, justement sur OVH.

Le traffic enregistré pour cette IP (OVH) est de 26 1359 (pages) 26 1360 (hits) 13.93 Go (bande passante).

J'ai ensuite 7 déclinaison de la même racine d'IP qui me renvoient sur un site de "managed hosting, cloud computing and IT security" avec comme "Geo IP country" Norway, Oslo.

Le traffic enregistrés pour la première de ces sept IP est de 8 4052 (pages) 8 4052 (hits) 6.55 Go (bande passante).

J'ai enfin en 9ème position une IP qui me renvoie sur France-Telecom avec comme "Geo IP country" France, Paris.
Le traffic enregistré pour cette IP est de 5 1046 (pages) 26 1360 (hits) 1.07 Go (bande passante).

Mes interrogations :

Il y a un énorme différentiel entre les chiffres de consultations de la 1ère IP et ceux de la 2ème (pages et bande passante). Cela me fait fortement douter du caractère "humain" de ces chiffres. Y aurait-il un lien avec le fait que l'outil soit fourni et hébérgé par OVH ? Serait-ce des consultations techniques (routines) liées au fonctionnement d'Awstats ?

Les 7 déclinaisons de la même racine IP ont toutes un nombre de pages vues et de hits exactement identiques. Alors que cette singularité ne se retrouvent pas avec les adresses IP qui arrivent plus tard dans la liste et pour lesquelles on observe un nombre de hits plus élevé que le nombre de pages. Je doute ici aussi du caractère "humains" de ces consultations. Un lookup sur ces adresses IP renvoyant à une société de services web, mais qui ne semble pas être fournisseur d'accès. Qu'en pensez-vous ? Ces chiffres peuvent-ils être pertinents ?

Enfin, l'IP France Telecom me semble elle être la première IP à pouvoir être réellement considérée pour analyser la consultation de ce site.

Quelqu'un pourrait-il m'aider à y voir plus clair ? J'ai de sérieux doute sur le fait que les consultations comptabilisées qui apparaissent en tête de liste soient vraiment des visites d'internautes ? Surtout au regard de l'importance du traffic de bande passante enregistré ?

PS : j'ai parcouru plusieurs sujets avant de poster. Ce forum est une vraie base de connaissance ! Du coup, merci à tout ceux qui ont contribué à la constituer. J'y apprend énormément 8O

Voilà, merci. Même si longue, j'espère avoir été suffisamment claire dans mes explications :oops: .
 

zeb

WRInaute accro
Dans les statistiques de consultations, la première adresse IP renvoie, après lookup, justement sur OVH.
Le traffic enregistré pour cette IP (OVH) est de 26 1359 (pages) 26 1360 (hits) 13.93 Go (bande passante).
Si je comprend bien tu parle de trafic interne sur le réseau OVH qui est comptabilisé dans ton trafic "site".
1/ OVH a aucune raison de faire ça
2/ je voie vraiment pas ce qui justifie ce traf a mois que ton site héberge un webservice utilisé par d'autres chez OVH. (Attention un "webservice" peut aussi être non voulu)

Après en me perdant un peu dans la suite les autres IP relevées comme "gourmandes" sont peut être a analyser de la même manière (soit un service légitime, soit un service "non légitime")
Dans tous les cas c'est pas des humains ça me semble certains en première lecture (pour en être tout a fait certains perso je regarde pour une ip donnée, les hash de session qu'elle a engendré si c'est jamais le même, c'est que c'est une machine (pas de coockies)).

Faudrait en savoir plus sur ce que tu as en ligne et a quoi c'est destiné pour comprendre ton "log" car c'est très atypique ce qui m'a fait parler de webservice.

Après analyser le trafic avec ce genre de service de stat est vraiment pas évident car c'est les datas serveurs qui sont compilés et pas les datas utilisateur au travers de leur surf .

PS : en première lecture j'ai aussi pensé a un site codé avec les pieds qui ferait par exemple des include a travers http mais la diversité des ip hors OVH m'a laissé penser que c'était pas ça.
 

Emmaline

Nouveau WRInaute
Merci Zeb de ta réponse

zeb a dit:
1/ OVH a aucune raison de faire ça
Je n'avais pas interpréter cela comme une action voulue par OVH. Je me demandais si ce n'était pas le fonctionnement même d'Awstats qui est chez OVH qui générait ce traffic.
zeb a dit:
2/ je voie vraiment pas ce qui justifie ce traf a mois que ton site héberge un webservice utilisé par d'autres chez OVH. (Attention un "webservice" peut aussi être non voulu)
Désolé, j'ai pas tout compris.

zeb a dit:
Dans tous les cas c'est pas des humains ça me semble certains en première lecture (pour en être tout a fait certains perso je regarde pour une ip donnée, les hash de session qu'elle a engendré si c'est jamais le même, c'est que c'est une machine (pas de coockies)).
Pourrais-tu m'indiquer comment on procède ? Me mettre sur une piste ?

zeb a dit:
Faudrait en savoir plus sur ce que tu as en ligne et a quoi c'est destiné pour comprendre ton "log" car c'est très atypique ce qui m'a fait parler de webservice.
Site de contenu rédactionnel. Pas de services ou de fonctionnalités particulière (moteur de recherche, paiement en ligne via paybox). Je peux t'envoyer l'url en mp si souhaité.

zeb a dit:
PS : en première lecture j'ai aussi pensé a un site codé avec les pieds qui ferait par exemple des include a travers http mais la diversité des ip hors OVH m'a laissé penser que c'était pas ça.
ça reste quand même possible. Comment je repère un include à travers du http ?

Merci encore de l'intérêt témoigné à mes questions.
 

zeb

WRInaute accro
Emmaline a dit:
Je me demandais si ce n'était pas le fonctionnement même d'Awstats qui est chez OVH qui générait ce traffic.
Si les systèmes de stat engendrent du trafic au point de passer par dessus l'utilisateur c'est la fin des haricots :wink:

Désolé, j'ai pas tout compris.
webservice -> code d'un script ou groupe de script qui rend un "service" a l'utilisateur donc qui est appelé comme une page web et qui répond en fournissant des données (comme un script qui te renvoie la météo pour une vile par exemple)
webservice non voulu -> humour -> code viral qui est implanté sur un serveur a l'insu de son proprio pour rendre un service (comme relayer du spam par exemple)

Pourrais-tu m'indiquer comment on procède ? Me mettre sur une piste ?
Voir ma remarque sur ganalytics en mp , perso j'ai un système qui me permet d'enregistrer les sessions utilisateur ce qui n'est pas fourni en standard par les système classiques comme les stats externe (normal elles ne doivent pas avoir accès a ça) et pas pris en compte par les système internes côté serveur comme ton système. donc c'est délicat car faut faire ça a la main "sur mesure"

zeb a dit:
Site de contenu rédactionnel. Pas de services ou de fonctionnalités particulière (moteur de recherche, paiement en ligne via paybox). Je peux t'envoyer l'url en mp si souhaité.
Connais pas paybox et sont fonctionnement donc je ne peux pas en parler mais faut creuser pour voir si c'est pas lié car les systèmes de paiement en ligne engendre une suite de transactions entre le serveur de paiement (disons la banque) et le site qui héberge le système de paiement (ça peut être ton site mais c'est pas courant car généralement c'est mis en place directement par l'hébergeur). Dans tous les cas ce type de transactions se fait en sécurisé (donc voir si c'est le cas du traf que tu cherche a identifier) et c'est très "restraint" car les deux machine font pas dans la littérature ... (généralement des échanges XML avec des script sollicités en POST (pas de data dans les urls))

ça reste quand même possible. Comment je repère un include à travers du http ?
bah là tu n'as pas 100 000 choix faut ouvrir la boite et regarder toutes les lignes de code. Ça peut se faire avec une IDE et un "chercher" > "include" qui te sort tous les scripts avec cette instructions et les lignes correspondantes. et çane concerne pas que include car j'ai vue des gens faire des fopen ou curl sur leur propre nom de domaine pour choper un truc a porté de main ...
Si c'est ça faut poster dans le top 10 du site dans la rubrique "boulettes".

Merci encore de l'intérêt témoigné à mes questions.
C'est que des idées du soir (en plus) donc faut pas hésiter a investiguer d'autres pistes ... :wink:

Si vraiment tu trouve pas tu bloque les ip sur le serveur (mode humour) et t'attend que le téléphone sonne, tu devrais vite savoir qui est moins content et d'où ça viens :lol:
 

Emmaline

Nouveau WRInaute
Pour information le traffic du site est aussi suivi par Google Analytics. Mais les écarts enregistrés sont conséquents.

Période 1er janvier - 7 mai 2013 :

GA : 280 002 visites et 710 962 pages vues.
Awstats : 473 658 visites pour 2 801 756 pages vues (OMG).

Je cherchais donc à investiguer pour bien comprendre ce que Awstats pouvait comptabiliser comme connexions. Ma première piste a été d'aller regarder si certaines IP trustait le traffic avec des chiffres singuliers. Et cela semble être le cas. Mais je souhaite comprendre si une configuration pourrait permettre à Awstats de bien comptabiliser des visites d'internautes.
 

UsagiYojimbo

WRInaute accro
La différence vient essentiellement du fait qu'Awstats enregistre tous les hits, pas uniquement ceux effectués par des visiteurs humains. Donc les robots, crawlers divers et variés (sollicités ou non) viennent gonfler les chiffres. La vérité se situe donc davantage du côté des chiffres avancés par Analytics. Mais en même temps, la finalité de ce type d'outil (Awstats) n'est pas de faire du suivi SEO.
 

Emmaline

Nouveau WRInaute
UsagiYojimbo a dit:
Donc les robots, crawlers divers et variés (sollicités ou non) viennent gonfler les chiffres.
Oui, bien sûr. Mais il est possible de les repérer par leur adresse IP et de les exclure. Dans la situation que j'ai décrit plus haut, comment interpréter ces chiffres générés par une IP qui me renvoie sur ovh. Le mieux serait peut être de les contacter.
 

UsagiYojimbo

WRInaute accro
Tu peux exclure les plus connues (du moins, celles qui sont connues), mais il y aura toujours de nouveaux crawlers, des scripts, des aspirateurs, etc qui viendront brouiller les pistes. D'où l'intérêt de passer par un vrai outil de statistiques que par un analyseur de log, dont ce n'est pas la finalité.

Pour ce qui est des IP tu as une liste ici, mais je ne sais pas si elle est régulièrement mise à jour http://www.iplists.com/. Tu peux aussi ouvrir le vendre du script Crawltrack, qui en contient un certain nombre.
 

zeb

WRInaute accro
UsagiYojimbo a dit:
La différence vient essentiellement du fait qu'Awstats enregistre tous les hits, pas uniquement ceux effectués par des visiteurs humains.
De mémoire les système de stat serveurs ne font pas non plus la distinction entre une image appartenant à un page et la page elle même (2 hits) Donc une page demandant X ressources engendre X hits.

Ensuite ça explique pas le "trafic interne" OVH ...
 

Discussions similaires

Haut