* Benjamin Guedj (LSTA, Université Pierre et Marie Curie) - MAP5-UMR 8145

Benjamin Guedj (LSTA, Université Pierre et Marie Curie)

COBRA : agrégation non-linéaire de prédicteurs

mardi 19 mars 2013, 13h45 - 14h45

Salle de réunion, espace Turing


{{Abstract :}}

L’agrégation d’estimateurs et de prédicteurs a motivé de nombreux travaux depuis le début des années 2000. Le praticien voit son activité profondément modifiée par deux mouvements conjoints : nous entrons chaque jour un peu plus dans l’ère du « big data », les volumes et dimensions des données augmentent avec les progrès constants de l’outil informatique ; parallèlement, le nombre de méthodes d’estimation et de prédiction disponibles a accompagné cette inflation impressionnante, abordant tant en classification qu’en régression une variété croissante de modèles et de contextes statistiques (estimation de probabilités, modèles additifs, modèles parcimonieux…).
Il est dès lors naturel d’étudier des procédures d’agrégation de techniques existantes, afin de tirer le meilleur de chacune d’elles et d’éliminer la phase—par essence subjective—de spécification d’un modèle. La littérature est riche de nombreuses méthodes d’agrégation linéaire ou convexe de prédicteurs. Nous proposons dans cet exposé une approche nouvelle, non-linéaire en les prédicteurs, reposant sur un principe de moyenne locale. Le prédicteur résultant présente d’excellentes garanties théoriques. Notre méthode est disponible sous la forme du package R COBRA, dont les performances brutes sur données simulées et réelles seront commentées.