Encodage des nombres entiers

Encodage des nombres entiers

Le codage des nombres entiers consiste à remplacer les catégories par des chiffres de 1 à n (ou de 0 à n-1, selon la mise en œuvre), où n est le nombre de catégories distinctes de la variable.

Les numéros sont attribués de manière arbitraire. Cette méthode d’encodage permet de comparer rapidement les modèles d’apprentissage des machines.

Avantages

  • Simple à mettre en œuvre
  • N’élargit pas l’espace de présentation

Limitations

  • Ne saisit aucune information sur les labels des catégories
  • Ne convient pas aux modèles linéaires.

L’encodage des nombres entiers est mieux adapté aux méthodes non linéaires qui sont capables de naviguer parmi les chiffres attribués arbitrairement pour essayer de trouver des modèles qui les relient à la cible.

Dans cette démo :

Nous allons voir comment effectuer un encodage à chaud avec :

  • Feature-Engine

Encodage des nombres entiers avec Feature-Engine

Note

Notez que s’il y a une variable dans le jeu de test, pour laquelle l’encodeur n’a pas de numéro à attribuer (la catégorie n’a pas été vue dans le jeu de train), l’encodeur retournera une erreur.

GCH anime

Je télécharge mon guide gratuit

.

Vous recevrez votre guide par email sans aucun engagement de votre part.

Si vous voulez découvrir comment fonctionne la librairie pandas ou bien l’environnement Jupyter, n’hésitez pas à consulter les cours ci-dessous.

1 réflexion au sujet de « Encodage des nombres entiers »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.