Date :
Thomas Constum soutiendra sa thèse jeudi 28 novembre à 10h30, dans l’amphithéâtre C de l’UFR Sciences et Techniques (Site du Madrillet, Av. de l'Université, 76800 Saint-Étienne-du-Rouvray).
Cette thèse a été réalisée au laboratoire LITIS de l’Université de Rouen Normandie dans le cadre du programme HAISCODE (financement conjoint ANR et région Normandie)
Elle s'intitule :
“Extractiοn d'infοrmatiοn dans des dοcuments histοriques à l'aide de grands mοdèles multimοdaux”
La soutenance sera retransmise sur Zoom via ce lien et sur Youtube via ce lien.
La soutenance aura lieu devant le jury composé de :
- Mme Aurélie Lemaitre, Professeur des Universités - Université de Haute Bretagne Rennes 2, Rapporteur du jury
- Mme Laurence Likforman-Sulem, Professeur Associé - ENST PARIS, Rapporteur du jury
- M. Patrice Bellot, Professeur des Universités - Aix-Marseille université, Membre du jury
- Mme Sandra Brée, Chargé de Recherche - Université Lumière Lyon 2, Membre du jury
- Pierrick Tranouez, Ingénieur de Recherche - Université de Rouen Normandie, Co-encadrant de thèse
- Thierry Paquet, Professeur des Universités - Université de Rouen Normandie, Directeur de thèse
Résumé
Cette thèse porte sur l'extraction automatique d'informations à partir de documents manuscrits historiques, dans le cadre des projets POPP et EXO-POPP. Le projet POPP se concentre sur les tableaux de recensement manuscrits de Paris (1921-1946), tandis qu'EXO-POPP traite des actes de mariage du département de la Seine (1880-1940). L’objectif principal est de développer une architecture de bout en bout pour l’extraction d’information à partir de documents complets, évitant les étapes explicites de segmentation. Dans un premier temps, une chaîne de traitement séquentielle a été développée pour le projet POPP, permettant l’extraction automatique des informations de 9 millions d’individus sur 300 000 pages. Ensuite, une architecture de bout en bout pour l'extraction d'information a été mise en place pour EXO-POPP, s’appuyant sur un encodeur convolutif et un décodeur Transformer, avec insertion de symboles spéciaux encodant les informations à extraire. Par la suite, l’intégration de grands modèles de langue basés sur l’architecture Transformer a conduit à la création du modèle DANIEL, qui a atteint un nouvel état de l’art sur plusieurs jeux de données publics (RIMES 2009 et M-POPP pour la reconnaissance d'écriture, IAM NER pour l'extraction d'information) tout en présentant une vitesse d'inférence supérieure aux approches existantes. Enfin, deux jeux de données publics issus des projets POPP et EXO-POPP ont été mis à disposition, ainsi que le code et les poids du modèle DANIEL.