AgroParisTech, 12 et 13 juillet 2021
Clustering sparse des données mixtes avec le package R vimpclust
Alex Mourer  1@  , Marie Chavent  2, *@  , Madalina Olteanu  3, *@  , Jérôme Lacaille  4, *@  
1 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)
Université Paris 1 Panthéon-Sorbonne : EA4543
2 : CQFD  (INRIA Bordeaux - Sud-Ouest)
CNRS : UMR5251, INRIA
3 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)
Université Panthéon-Sorbonne : EA4543
4 : Safran Aircraft Engines
Safran Aircraft Engines
* : Auteur correspondant

Cette présentation s'intéresse à la sélection de variables dans le contexte du clustering et plus précisément au clustering sparse des données mixtes (mélange de variables numériques et catégorielles). Nous illustrons une méthode que nous avons déjà introduite dans une publication, qui combine un pré-traitement des variables catégorielles et une extension de l'algorithme des K-means sparse au cas group-sparse. Cette méthode est implémentée dans le package R vimpclust disponible sur le CRAN vimpclust.



  • Poster
Personnes connectées : 1 Vie privée
Chargement...