Co-clustering de données fonctionnelles
vendredi 23 mars 2018, 9h30 - 10h30
Salle du conseil, espace Turing
Suite au développement récent des compteurs intelligents, les opérateurs d’électricité sont aujourd’hui en mesure de collecter des données sur la consommation électrique de manière large et fréquente. C’est notamment le cas en France où EDF pourra bientôt enregistrer à distance la consommation de ses 27 millions de clients toutes les 30 minutes. Nous proposons dans ce travail une nouvelle méthodologie de co-clustering, basée sur le modèle de bloc latent fonctionnel (funLBM), qui permet de construire des « résumés » de ces données de grande consommation par co-clustering. Le modèle funLBM étend le modèle de bloc latent habituel au cas fonctionnel en supposant que les courbes d’un bloc vivent dans un sous espace fonctionnel de faible dimension. Ainsi, funLBM est capable de modéliser et de regrouper un grand ensemble de données avec des courbes à haute fréquence. Un algorithme SEM-Gibbs est proposé pour l’inférence de modèle. Un critère ICL est également dérivé pour résoudre le problème du choix du nombre de groupes de lignes et de colonnes. Des expériences numériques sur des données Linky simulées et originales montrent l’utilité de la méthodologie proposée.