Quelle formule pour optimiser le niveau de certitude ?

WRInaute accro
Bonjour

Voilà, je souhaite optimiser le niveau de certitude de l'évaluation des coefficients hippodromes.

Ces coefficients sont calculés d'après les moyennes des rangs d'arrivée des chevaux, sur des hippodromes identiques ou différents de celui de la course à prévoir.

Le problème consiste à affecter un niveau de certitude à ces calculs de coefficients hippodromes, en tenant compte du nombre de courses courues dans les deux cas.

Donc : SELECT COUNT(NUMCH) FROM COURSES WHERE ID<$id AND NUMH=$numh AND NUMCH IN ( $array_numch) GROUP BY NUMCH;

SELECT COUNT(NUMCH) FROM COURSES WHERE ID<$id AND NUMH!=$numh AND NUMCH IN ( $array_numch) GROUP BY NUMCH;

Pour chaque cheval celà me donne ces nbres de courses courues.

Je cherche à affecter pour chaque cheval, un coefficient qui représente le degré de certitude des coefficients hippodromes ( même formule, AVG au lieu de COUNT ).

Quelle formule utiliser pour celà ?

Le degré de certitude ne semble pas évident d'après ces données.

Merci beaucoup de votre aide
 
WRInaute accro
Dur, dur...

Par rapport au lien entre les nombre de courses courues et le degré de certitude :

- Faible nombre de courses => niveau certitude bas.

- Nbre courses même hippodrome élevé et nbre courses différents faible => niveau certitude moyen-faible.

- Nbre courses hippodromes différents élevé et nbre courses identiques faible => niveau certitude faible.

- Nbre courses hippodromes identiques et différents élevé => niveau certitude haut.


Il semblerait que l''optimum soit atteint quand ces deux nombres sont équivalents approximativement.

Donc quelle formule de calcul/évaluation du niveau de certitude ?

Merci beaucoup de votre aide.
 
WRInaute impliqué
Je ne saurais le dire, mais j'ai dans l'idée que faire une approche intellectuelle par requête SQL n'est pas la bonne.
Il faudrait davantage raisonner au niveau mathématique et revenir aux basiques des probabilités non ?
Les requêtes SQL découleront de la formule mathématique retenue.
 
WRInaute accro
Bonjour pomination

J'ai homogénéisé tous mes hippodromes.

Il n'y a plus d'hippodrome avec brackets ( [ ] ) ni traits d'union.

Sur mon ordinateur, la bdd est impec, avec seulement 12 hippodromes résiduels à corriger à la main.

Par rapport aux probabilités versus requêtes SQL, je ne peux pas faire de formules mathématiques sans data.

Les data sont données par les requêtes SQL.

Merci beaucoup de ton aide.
 
Nouveau WRInaute
Bonjour pomination

J'ai homogénéisé tous mes hippodromes.

Il n'y a plus d'hippodrome avec brackets ( [ ] ) ni traits d'union.

Sur mon ordinateur, la bdd est impec, avec seulement 12 hippodromes résiduels à corriger à la main.

Par rapport aux probabilités versus requêtes SQL, je ne peux pas faire de formules mathématiques sans data.

Les data sont données par les requêtes SQL.

Merci beaucoup de ton aide.
Juste une remarque côté perf : tes deux requêtes COUNT sont très proches, donc tu peux les combiner avec une condition CASE dans la même requête, ça te fera gagner pas mal de temps si ta base est lourde.
Je l’avais fait sur un dataset d’environ 2 millions de lignes et j’ai divisé le temps de réponse par 3.
 

➡️ Offre MyRankingMetrics ⬅️

pré-audit SEO gratuit avec RM Tech (+ avis d'expert)
coaching offert aux clients (avec Olivier Duffez ou Fabien Faceries)

Voir les détails ici

coaching SEO
Discussions similaires
Haut