Pierre Neuvial (Laboratoire Statistique et Génome, Évry, UMR CNRS 8071/Université d’Evry/INRA)

Tests de comparaison de moyennes sur des graphes

vendredi 18 mars 2011, 9h30 - 10h45

Salle de réunion, espace Turing


On considère le problème consistant à tester la nullité de la
différence des moyennes entre deux groupes d’observations
multivariées. On se place dans un cadre où l’on dispose
d’informations a priori sur les relations entre ces variables, sous la
forme d’un graphe. On fait l’hypothèse que la différence des moyennes
entre les deux groupes est en partie cohérente avec le graphe, au sens
où cette différence a une faible énergie sur le graphe. Un exemple
d’application est la recherche de gènes dont le niveau d’expression
diffère significativement entre deux groupes de patients atteints de
cancers. L’information a priori dont on dispose alors est la
topologie du réseau de régulation entre gènes.

Pour un graphe fixé, nous montrons que la prise en compte de la
structure du graphe conduit à des gains de puissance. Nous proposons
également un algorithme de recherche de sous-graphes significatifs
d’un grand graphe initial qui permet de faire une recherche exhaustive
sans avoir à énumérer le très grand nombre de sous-graphes possibles.
Nous illustrons l’application de cette méthode à l’identification de
réseaux de régulation impliqués dans la résistance au Tamoxifen, un
médicament couramment utilisé pour le traitement des cancers du sein,
à partir de données d’expression de gènes.

Ce travail a été réalisé en collaboration avec Laurent Jacob et
Sandrine Dudoit (UC Berkeley)

Preprint: http://hal.archives-ouvertes.fr/hal-00521097/fr/