Soutenance de thèse de Guillaume MAHEY mercredi 13 novembre 2024 à l'INSA Rouen Normandie

Date :

...
Guillaume MAHEY soutiendra sa thèse le mercredi 13 Novembre à 10h00 dans la salle BO A RC 02 (au RdC du bâtiment Bougainville, INSA Rouen, site du Madrillet, Av. de l’Université, 76800 Saint-Étienne-du-Rouvray).

Cette thèse a été réalisée à l’Université de Rouen Normandie, dans le cadre d’une collaboration entre le laboratoire LITIS, et le laboratoire IRISA de l'Université Bretagne Sud.

Elle s’intitule :
“Unbalanced and Linear Optimal Transport for Reliable Estimation of the Wasserstein Distance"

La soutenance aura lieu devant le jury composé de :
Mme Julie DELON, Professeur des universités, Université Paris Cité
Mr Nicolas BONNEL, Directeur de recherche, CNRS Lyon 1
Mme Elsa CAZELLES, Chargée de recherche, Institut de Recherche en informatique de Toulouse
Mme Kimia NADJAHI, Chargée de recherche, ENS Ulm
Mr Alain RAKOTOMAMONJY, Criteo AI Lab
Mr Felipe TOBAR, Senior Lecturer, Imperial College London

Ainsi que mes directeurs de thèse:
Mr Gilles GASSO, Professeur des universités, INSA Rouen Normandie
Mme Laetitia CHAPEL, Professeur, Institut Agro Rennes-Angers

La soutenance sera également transmise sur zoom via le lien suivant:

Résumé (FR):
Dans le contexte de l’apprentissage automatique, plusieurs problèmes peuvent se formuler comme des problèmes de comparaison entre distributions. La théorie mathématique du transport optimal permet une comparaison entre deux mesures de probabilité. Bien que très élégante en théorie, le transport optimal (TO) souffre de plusieurs inconvénients en pratique, notamment la charge de calcul, le risque de surapprentissage (overfitting) et sa sensibilité aux artéfacts d’échantillonnage. Tout cela a motivé l’introduction de variantes à la fonction de perte associée au TO dans la communauté du machine learning. Dans cette thèse, nous proposons de nouvelles variantes afin, d’une part, de réduire la charge computationnelle et
statistique et, d’autre part, la sensibilité aux artefacts d’échantillonnage de la perte TO. Pour ce faire, nous nous sommes appuyés sur les distributions intermédiaires introduites à la fois par les variantes de TO linéaire et de TO déséquilibré.