Date :
Hugo Lerogeron soutiendra sa thèse jeudi 21 décembre à 10h00 dans l'amphi D de l'UFR sciences et techniques du Madrillet.
Cette thèse CIFRE, réalisée avec le LITIS et Saagie s'intitule: "Approximation de Dynamic Time Warping par réseaux de neurones pour la compression de signaux EEG et l'analyse de l'insomnie induite par le COVID Long"
Le jury sera composé de :
Rapporteurs du jury :
M. OUDRE LAURENT – Professeur des Universités – Ecole Normale Supérieure Paris-Saclay
M. TAVENARD ROMAIN – Professeur des Universités – UNIVERSITE DE HAUTE BRETAGNE RENNES 2
Membres du jury:
Mme CAPPONI CÉCILE – Professeur des Universités – Aix-Marseille Université
Mme OUKHELLOU LATIFA – Directeur de Recherche – UNIVERSITE MARNE LA VALLEE
M. RAKOTOMAMONJY ALAIN – Professeur des Universités – Université de Rouen Normandie
Encadrement de la thèse :
M. HEUTTE LAURENT – Professeur des Universités – Université de Rouen Normandie Directeur de thèse
M. PICOT-CLEMENTE ROMAIN – Docteur - MATMUT Encadrant de thèse
La soutenance pourra aussi être suivie à distance via : https://webconf.univ-rouen.fr/greenlight/heu-txm-vng-hdl
Résumé :
Les signaux EEG sont utiles pour aider les experts à identifier diverses anomalies comme les troubles du sommeil. En particulier dernièrement, la communauté s'est beaucoup intéressée au COVID long et à ses divers impacts sur le sommeil. Ces signaux sont cependant volumineux : la compression permet de réduire les coûts de stockage et de transfert. Les approches récentes de compression se basent sur des autoencodeurs qui utilisent une fonction de coût pour apprendre. Celle-ci est usuellement la MSE, mais il existe des métriques plus adaptées aux séries temporelles, en particulier DTW. DTW n'est toutefois pas différentiable et ne peut donc être utilisée pour un apprentissage de bout-en-bout.
Pour résoudre ce problème, nous proposons dans cette thèse deux approches d'approximation de DTW basées sur des réseaux de neurones. La première approche utilise un réseau siamois pour projeter les signaux de sorte que la distance euclidienne des signaux projetés soit la plus proche possible de la DTW des signaux originaux. La deuxième approche tente de directement prédire la valeur de DTW. Nous montrons que ces approches sont plus rapides que les autres approximations différentiables de DTW tout en obtenant des résultats similaires à l'utilisation de DTW dans des tâches de requêtage ou de classification de signaux du sommeil.
Nous montrons ensuite que l'approximation siamoise peut être utilisée comme fonction de coût pour apprendre un système de compression des signaux de sommeil basé sur un autoencodeur. Nous évaluons ce système de compression par la classification sur les signaux compressés puis reconstruits, et montrons que nos approximations de DTW permettent d'obtenir de meilleures performances sur les données reconstruites que des algorithmes de compression usuels et que d'autres fonctions de coût de reconstruction.
Enfin, pour étudier l'impact du COVID long sur l'insomnie, nous collectons et mettons à disposition de la communauté un jeu de données nommé COVISLEEP, constitué de polysomnographies de personnes ayant développé une insomnie chronique après infection du COVID, et de personnes souffrant d'insomnie chronique mais n'ayant pas été infectées par le virus. Nous montrons la difficulté de la détection de COVID long, notamment due à la forte variabilité entre les patients.