Encodage des nombres entiers

Le codage des nombres entiers consiste à remplacer les catégories par des chiffres de 1 à n (ou de 0 à n-1, selon la mise en œuvre), où n est le nombre de catégories distinctes de la variable.

Les numéros sont attribués de manière arbitraire. Cette méthode d’encodage permet de comparer rapidement les modèles d’apprentissage des machines.

Avantages

Simple à mettre en œuvre
N’élargit pas l’espace de présentation

Limitations

Ne saisit aucune information sur les labels des catégories
Ne convient pas aux modèles linéaires.

L’encodage des nombres entiers est mieux adapté aux méthodes non linéaires qui sont capables de naviguer parmi les chiffres attribués arbitrairement pour essayer de trouver des modèles qui les relient à la cible.

Dans cette démo :

Nous allons voir comment effectuer un encodage à chaud avec :

Feature-Engine