Rencontres R 2021 - Sciencesconf.org

Rencontres R 2021

AgroParisTech, 12 et 13 juillet 2021

FR EN

sciencesconf.org:rr2021:354669

Clustering sparse des données mixtes avec le package R vimpclust

Alex Mourer 1, @ , Marie Chavent 2, *, @ , Madalina Olteanu 3, *, @ , Jérôme Lacaille 4, *, @

1 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)

Université Paris 1 Panthéon-Sorbonne : EA4543

2 : CQFD (INRIA Bordeaux - Sud-Ouest)

CNRS : UMR5251, INRIA

3 : Statistique, Analyse et Modélisation Multidisciplinaire (SAmos-Marin Mersenne)

Université Panthéon-Sorbonne : EA4543

4 : Safran Aircraft Engines

Safran Aircraft Engines

* : Auteur correspondant

Cette présentation s'intéresse à la sélection de variables dans le contexte du clustering et plus précisément au clustering sparse des données mixtes (mélange de variables numériques et catégorielles). Nous illustrons une méthode que nous avons déjà introduite dans une publication, qui combine un pré-traitement des variables catégorielles et une extension de l'algorithme des K-means sparse au cas group-sparse. Cette méthode est implémentée dans le package R vimpclust disponible sur le CRAN vimpclust.

Type :	:	Présentation orale
Langue du texte intégral	:	français
Thématiques	:	Statistique, Machine Learning, IA
Mots-Clés	:	clustering sparse ; $K$ ; means pondéré ; données mixtes

Poster

Personnes connectées : 1

Vie privée