Clustering sparse des données mixtes avec le package R vimpclust
1 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)
Université Paris 1 Panthéon-Sorbonne : EA4543
2 : CQFD
(INRIA Bordeaux - Sud-Ouest)
CNRS : UMR5251, INRIA
3 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)
Université Panthéon-Sorbonne : EA4543
4 : Safran Aircraft Engines
* : Corresponding author
Safran Aircraft Engines
Cette présentation s'intéresse à la sélection de variables dans le contexte du clustering et plus précisément au clustering sparse des données mixtes (mélange de variables numériques et catégorielles). Nous illustrons une méthode que nous avons déjà introduite dans une publication, qui combine un pré-traitement des variables catégorielles et une extension de l'algorithme des K-means sparse au cas group-sparse. Cette méthode est implémentée dans le package R vimpclust disponible sur le CRAN vimpclust.
- Poster