* Yann Ollivier (CNRS-Orsay) - MAP5-UMR 8145

Yann Ollivier (CNRS-Orsay)

Intelligence artificielle : des réseaux de neurones à l’inférence statistique en passant par la théorie de l’information

vendredi 20 novembre 2015, 11h00 - 12h00

Salle de réunion, espace Turing


Les problèmes centraux de l’intelligence artificielle (extrapolation,
généralisation…) sont, contrairement à l’intuition, mathématiquement
bien posés : il s’agit, étant donné des observations passées, d’en
chercher des modèles probabilistes les plus « simples » possibles, en un
sens précis, puis d’utiliser ces modèles simples pour la prédiction.

La construction d’un modèle statistique ne doit donc pas être considérée
comme un problème extra-mathématique. Mais construire explicitement de
tels modèles simples est une tâche compliquée, pour laquelle seules des
heuristiques existent.

Les réseaux de neurones en sont une. Les algorithmes associés évoluent
très rapidement, pour incorporer des idées de théorie de l’information
ainsi que de statistiques bayésiennes. Ces techniques peuvent réduire
considérablement le nombre d’exemple nécessaires à l’apprentissage, et
permettent de détecter des structures riches, par exemple des dépendances
temporelles complexes dans des données.

Nous donnerons un panorama de ces idées. L’exposé ne supposera aucune
familiarité avec les réseaux de neurones ou l’apprentissage statistique.