Soutenance de thèse de Thibaut Pressat-Laffouilhère, mardi 19 décembre 2023 à 10H

Date :

...

La soutenance de thèse de Thibaut Pressat Laffouilhère aura lieu le mardi 19 décembre à 10h00 dans la salle de thèse du bâtiment Stewart de l’UFR santé

Cette thèse a été réalisée à l’université de Rouen, au sein de l'équipe TIBS du LITIS et s'intitule: 

 

"Modèle ontologique formel, un appui à la sélection des variables pour la construction des modèles multivariés" 

 

La soutenance aura lieu devant le jury composé de: 

 

MME KAREN LEFFONDRE Professeur des Universités, UNIVERSITE BORDEAUX Rapporteur du jury MME FLEUR MOUGIN Professeur des Universités, UNIVERSITE BORDEAUX Rapporteur du jury  

M. JEAN CHARLET Chargé de Recherche, SORBONNE UNIVERSITE Membre du jury  

MME CATHERINE DUCLOS Professeur des Univ - Prat Hospitalier, UNIVERSITE SORBONNE PARIS-NORD Membre du jury  

M. JULIEN GROSJEAN , Université de Rouen Normandie Membre du jury  

MME LINA SOUALMIA Professeur des Universités, Université de Rouen Normandie Directeur de thèse  

M. JACQUES BENICHOU Professeur des Univ - Prat Hospitalier, Université de Rouen Normandie Co-directeur de thèse 

 

Résumé 

 

Répondre à une question de recherche causale dans un contexte d’étude observationnelle nécessite de sélectionner des variables de confusion. Leur intégration dans un modèle multivarié en tant que co-variables permet de diminuer le biais dans l’estimation de l'effet causal de l'exposition sur le critère de jugement. Leur identification est réalisée grâce à des diagrammes causaux (DCs) ou des graphes orientés acycliques. Ces représentations, composées de nœuds et d'arcs orientés, permettent d’éviter la sélection de variables qui augmenteraient le biais, comme les variables de médiation et de collision. Les méthodes existantes de construction de DCs manquent cependant de systématisme et leur représentation de formalisme, d’expressivité et de complétude.  

 

Afin de proposer un cadre de construction formel et complet capable de représenter toutes les informations nécessaires à la sélection des variables sur un DC enrichi, d’analyser ce DC et surtout d’expliquer les résultats de cette analyse, nous avons proposé d'utiliser un modèle ontologique enrichi de règles d'inférences.  

 

Un modèle ontologique permet notamment de représenter les connaissances sous la forme de graphe expressif et formel composé de classes et de relations similaires aux nœuds et arcs des DCs. Nous avons développé l’ontologie OntoBioStat (OBS) à partir d’une liste de questions de compétence liée à la sélection des variables et de l'analyse de la littérature scientifique relative aux DCs et aux ontologies.  

Le cadre de construction d’OBS est plus riche que celui d’un DC, intégrant des éléments implicites tels que les causes nécessaires, contextuels d’une étude, sur l’incertitude de la connaissance et sur la qualité du jeu de données correspondant.  

 

Afin d’évaluer l’apport d’OBS, nous l’avons utilisée pour représenter les variables d’une étude observationnelle publiée et avons confronté ses conclusions à celle d’un DC. OBS a permis d'identifier de nouvelles variables de confusion grâce au cadre de construction différent des DCs et aux axiomes et règles d'inférence. OBS a également été utilisée pour représenter une étude rétrospective en cours d’analyse : le modèle a permis d’expliquer dans un premier temps les corrélations statistiques retrouvées entre les variables de l’étude puis de mettre en évidence les potentielles variables de confusion et leurs éventuels substituts ("proxys"). Les informations sur la qualité des données et l’incertitude des relations causales ont quant à elles facilité la proposition des analyses de sensibilité, augmentant la robustesse de la conclusion de l’étude. Enfin, les inférences ont été expliquées grâce aux capacités de raisonnement offertes par le formalisme de représentation d'OBS. À terme OBS sera intégrée dans des outils d’analyse statistique afin de bénéficier des bibliothèques existantes pour la sélection des variables et de permettre son utilisation par les épidémiologistes et les biostatisticiens.