Blog

86 % de réussite au galop

Nous avons cherché à optimiser nos paris sur les courses de galop afin d’augmenter notre réussite et également de trouver des sélections rentables à masse égale. Dans un premier temps nous avons analysé les arrivées en fonction des cotes de Epmu. Nous avons retenu toutes les cotes en dessous de 2,6.   Dans ce tableau

Read More »

AutoEncodeur sur un événement rare

Qu’est-ce qu’un événement rare, extrêmement rare ? Dans un problème d’événement rare, nous avons un ensemble de données déséquilibré. Cela signifie que nous avons moins d’échantillons étiquetés positivement que d’échantillons étiquetés négativement. Dans un problème typique d’événement rare, les données étiquetées positivement représentent environ 5 à 10 % du total. Dans un problème d’événement rare

Read More »

Discrétisation plus encodage

Que faisons-nous de la variable après discrétisation ? Devons-nous les utiliser lcomme variable numérique ? ou devons-nous utiliser les intervalles comme variable catégorielle ? La réponse est : vous pouvez faire l’un ou l’autre. Si vous construisez des algorithmes basés sur des arbres de décision et que les résultats de la discrétisation sont des entiers

Read More »

Discrétisation

La discrétisation est le processus qui consiste à transformer des variables continues en variables discrètes en créant un ensemble d’intervalles contigus qui couvrent la gamme des valeurs de la variable. La discrétisation est également appelée binning, où bin est un nom alternatif pour l’intervalle. La discrétisation permet de traiter les valeurs aberrantes et peut améliorer la

Read More »

Codages guidés par la cible

Dans les cahier précédents, nous avons appris comment convertir une étiquette en un nombre, en utilisant un codage à chaud, en remplaçant par un chiffre ou en remplaçant par la fréquence ou le nombre d’observations. Ces méthodes sont simples, ne font (presque) pas d’hypothèses et fonctionnent généralement bien dans différents scénarios. Il existe cependant des

Read More »

Comptage ou codage de la fréquence

Dans le codage du comptage, nous remplaçons les catégories par le comptage des observations qui montrent cette catégorie dans l’ensemble de données. De même, nous pouvons remplacer la catégorie par la fréquence – ou le pourcentage – des observations dans l’ensemble de données. C’est-à-dire que si 10 de nos 100 observations montrent la couleur bleue,

Read More »