Jean-Patrick Baudry (Département de Mathématiques d’Orsay, Université Paris-Sud ; IUT Département STID et MAP5, Université Paris Descartes)

Critères de sélection de modèles consistants pour la classification non supervisée

vendredi 23 octobre 2009, 9h30 - 10h45

Salle de réunion, espace Turing


Nous rappelons les bases de l’approche de la classification non supervisée par les modèles de mélange. La méthode usuelle repose sur le maximum de vraisemblance et le choix du nombre de classes à former se fait par des critères pénalisés. Nous nous intéressons particulièrement au critère ICL (Biernacki, Celeux et Govaert, 2000), mis au point pour tenir compte de l’objectif de classification et pertinent en pratique. L’étude que nous proposons de ce critère et de la notion de classe sous-jacente repose sur l’introduction d’un cadre de minimisation d’un contraste adapté à ce contexte. Ce faisant nous définissons un nouvel estimateur et une nouvelle famille de critères de sélection de modèles dont nous étudions les propriétés — notamment la consistance. La calibration de ces critères peut se faire par l’heuristique de pente (Birgé et Massart, 2006). Divers aspects pratiques de leur mise en oeuvre sont discutés et leur comportement pratique illustré par des simulations.