Activités scientifiques

Benjamin Martin Leon (boursier de doctorat, projet Ramsès)

Projet de thèse : Traitement automatique de la langue néo-égyptienne

Cette thèse est réalisée dans le cadre du projet Ramsès, qui a pour objectif de rassembler la totalité des textes écrits en néo-égyptien en un corpus électronique richement annoté. L'objet de la thèse est plus spécifiquement de développer une approche automatisée de l'analyse syntaxique du néo-égyptien (du syntagme au texte) en combinant les techniques d'apprentissage et les méthodes propres au traitement automatique des langues.

Deux travaux introduisant le sujet ont déjà été réalisés. Le premier portait sur l'utilisation d'automates finis pour subvenir aux besoins de l'analyse syntaxique. Le second s'attelait à la classification des textes néo-égyptiens en fonction de leur genre littéraire au moyen de méthodes d'apprentissage automatique.

Actuellement, les premiers travaux de la thèse portent sur l'utilisation combinée de machines à états finis et de méthodes d'apprentissage automatique afin de formaliser au mieux la notion de syntagme nominal en néo-égyptien, en tenant compte de l'influence des genres littéraires et de la diachronie sur les différents types possibles. C'est dans un second temps que sera envisagée la syntaxe de la proposition.

Bibliographie :

À paraître :