Nicolas Vayatis (ENS Cachan)

La courbe ROC – du critère d’évaluation au critère d’optimisation

vendredi 26 octobre 2012, 11h00 - 12h00

Salle de réunion, espace Turing


{{Résumé}}

Le scoring est un sujet majeur des statistiques décisionnelles
appliquées car il traite de la question aux nombreux enjeux économiques et
sanitaires d’ordonner une population par niveau de risque. Les méthodes
classiquement utilisées dans le problème du scoring reposent amplement sur
le modèle de régression logistique. Les estimateurs découlant de ces
approches sont ensuite évalués (a posteriori !) grâce à la courbe ROC et
ses critères dérivés (AUC, AUC partiel, …). Dans une série de travaux
initiés il y a quelques années en collaboration avec Stéphan Clémençon
(Telecom ParisTech), nous nous sommes intéressés à la courbe ROC comme
critère à optimiser dans l’esprit des approches de type apprentissage
statistique (ou M-estimation). Cette étude commence par l’identification
des éléments optimaux et de leurs propriétés, explore les propriétés
statistiques des stratégies inspirées par cette approche (consistance,
vitesses) et se poursuit à travers l’élaboration d’algorithmes concrets
(de type CART) et méta-algorithmes (agrégation) permettant d’appréhender
les données réelles pour le scoring en grande dimension. Enfin, parmi les
produits dérivés de nos travaux, on trouve notamment la possibilité de
réaliser des tests non-paramétriques pour la comparaison d’échantillons
multivariés (two-sample problem).