* Bertrand Michel (LSTA, Université Pierre et Marie Curie) - MAP5-UMR 8145

Bertrand Michel (LSTA, Université Pierre et Marie Curie)

Méthode bayesienne parcimonieuse pour la classification non supervisée

vendredi 29 juin 2012, 9h45 - 11h00

Salle de réunion, espace Turing


Nous utilisons les modèles de mélanges gaussiens pour construire une classification non supervisée des observations. Dans le contexte de la grande dimension, appuyer la structure de mélange sur un sous ensemble de variable pertinentes permet d’améliorer la qualité de la classification des données. Pour choisir le nombre de composantes du mélange K et le sous ensemble de variables pertinentes S , nous utilisons une procédure par agrégation avec poids exponentiels, ce qui revient à considérer la distribution du postérieur de Gibbs sur les couples (K,S). Cette méthode nécessite de choisir une distribution a priori sur ces couples (K,S), distribution que nous supposons parcimonieuse.

Nous établissons une inégalité oracle-sparse pour le choix de K et S et nous implémentons la procédure en utilisant un algorithme de Metropolis-Hastings. Pour accélérer la procédure, nous appuyons la dynamique de la chaîne sur une proposition influencée par notre objectif de classification non supervisée.