* Robin Ryder (Paris Dauphine) - MAP5-UMR 8145

Robin Ryder (Paris Dauphine)

Méthodes bayésiennes pour la Linguistique historique

vendredi 5 juin 2015, 11h00 - 12h00

Salle de réunion, espace Turing


Les langues changent dans le temps selon un processus semblable à l’évolution des espèces biologiques. Des modèles ont été développés pour de nombreux aspects des langues humaines, notamment le vocabulaire, la syntaxe et la phonologie. La complexité de ces modèles, ainsi que la nature des questions posées, rendent la méthodologie bayésienne naturelle dans ce domaine, ce qui explique qu’une grande partie de la recherche en statistique appliquée à la la linguistique historique fasse appel aux méthodes bayésiennes. Après un rappel du paradigme bayésien, je présenterai une vue d’ensemble de divers modèles, en commençant avec les essais infructueux de glottochronologie de Morris Swadesh dans les années 1950, puis en examinant des modèles développés ces dernières années. Je m’attarderai un modèle du vocabulaire dit « de base », qui emploie un processus stochastique sur un arbre phylétique, en me concentrant initialement sur la famille des langues Indo-Européennes et la question de la datation du dernier ancêtre commun à ces langues. Cela me permettra d’illustrer les problématiques de robustesse des modèles et de validation, avant de présenter des applications sur plusieurs jeux de données. Si le temps le permet, je conclurai par un travail en cours sur les tendances à long terme du changement de caractéristiques syntactiques, principalement sur l’ordre des mots. Les travaux sur les données lexicales ont été effectués avec Geoff Nicholls ; ceux sur l’ordre des mots sont effectués avec Isabelle Charnavel, Hilda Koopman et Dominique Sportiche.