Safaa MENAD soutiendra sa thèse intitulée “Enrichissement et alignement sémantique d’ontologies biomédicales par modèle de langue”, le vendredi 06 décembre à 14h30, dans l’amphithéâtre du bâtiment CURIB (Campus de Mont Saint Aignan, 25 Rue Lucien Tesnière UFR Sciences et Techniques - 76130 Mont Saint Aignan).
La soutenance aura lieu devant le jury composé de :- M. THIERRY LECROQ PR, Université de Rouen Normandie, Membre du jury
- Mme LYLIA ABROUk MCF HDR, Université de Bourgogne, Membre du jury
- M. XAVIER TANNIER PR, Sorbonne Université, Rapporteur du jury
- Mme CASSIA TROJAHN MCF HDR, Université de Toulouse 2 Jean Jaures, Rapporteur du jury
- Mme LINA FATIMA SOUALMIA PR, Université de Rouen Normandie, Directrice de thèse
- M. SAID ABDEDDAIM MCF, Université de Rouen Normandie, Co-encadrant de thèse
Voici un court résumé de ses travaux :La première partie de cette thèse traite de la conception de modèles neuronaux siamois entraînés pour la similarité sémantique entre textes biomédicaux et de leur application à des tâches de TAL sur des documents biomédicaux. L’entraînement de ces modèles a été réalisé en plongeant les titres et les résumés du corpus PubMed avec le thésaurus MeSH dans un même espace de représentation. Dans la seconde partie nous utilisons ces modèles pour aligner et enrichir les terminologies de l’UMLS (Unified Medical Language System) et automatiser l’intégration de nouvelles relations entre concepts similaires provenant notamment de maladies (DOID), de médicaments (DRON) et de symptômes. Ces relations enrichies permettent d’améliorer l’exploitation de ces ontologies, facilitant ainsi leur utilisation dans diverses applications cliniques et scientifiques. Nous proposons de plus des approches de validation à l’aide des ressources telles que les LLMs, l’OpenFDA, le Métathésaurus et le réseau sémantique de l’UMLS que nous complétons par la validation manuelle d’experts du domaine.