Julien Jacques (Université Lille1)

Modèle génératif pour données de rang avec application en clustering.

vendredi 5 avril 2013, 9h30 - 10h30

Salle de réunion, espace Turing


Les données de rang, résultant d’un classement d’objets selon un ordre de préférence, sont très fréquentes dans la pratique mais rarement traitées comme telles du fait du manque de modèles et méthodes statistiques dédiés. Nous présentons un nouveau modèle probabiliste paramétrique génératif pour ce type de variables, ayant des propriétés intéressantes d’un point de vue interprétation des paramètres. Ce modèle est construit en modélisant le processus de génération des données, supposés être un algorithme de tri. Nous utiliserons ensuite ce modèle pour des applications en clustering par le biais de modèles de mélange.