Emilie Chautru (Laboratoire AGM, Université de Cergy Pontoise)

Estimation de l’indice de valeurs extr »mes à partir de données de sondage

vendredi 7 mars 2014, 9h30 - 10h30

Salle de réunion, espace Turing


En sciences de la vie comme dans beaucoup d’autres domaines, il peut arriver que les données disponibles ne soient pas indépendantes et identiquement distribuées, mais issues d’un plan de sondage plus ou moins complexe. A l’ère des Big Data, échantillonner peut aussi être perçu comme une solution naturelle aux problèmes computationnels induits par les quantités phénoménales de données. Comme ignorer le processus de collecte des données peut conduire à un biais non-négligeable des estimateurs considérés, une solution classique en théorie des sondages consiste à pondérer les observations par l’inverse de leur probabilité d’inclusion dans l’échantillon. Si de nombreux travaux ont d’ores et déjà été réalisés pour estimer sans biais et le plus efficacement possible des quantités moyennes, à notre connaissance tel n’est pas le cas des objets impliquant les queues de distribution au sens de la théorie des valeurs extr »mes. Or l’étude de phénomènes extr »mes s’avère d’un intér »t tout particulier en gestion des risques, qu’ils soient de nature biologique, économique, climatologique, etc. Tentant de faire le pont entre ces deux pans de théorie statistique, nous proposons ici une version Horvitz-Thompson du classique estimateur de Hill, qui évalue l’indice de valeurs extr »mes dans le cadre de plans de sondage de type Poisson. Après avoir démontré sa consistance et sa normalité asymptotique, nous illustrons nos résultats théoriques à l’aide de données simulées et discutons en détail l’impact du plan de sondage sur l’efficacité de notre estimateur.