Ingénieur de recherche junior - Problématiques de machine learning pour l'aide au développement informatique
Contexte du poste
Dans le cadre du laboratoire commun « Labcom LiSa » entre le laboratoire LITIS et l’entreprise Saagie financé par l'ANR, nous recherchons un ingénieur de recherche junior destiné à travailler sur des problématiques de machine learning pour l'aide au développement informatique. Pour cela, nous mettrons en oeuvre des techniques modernes de NLP (Natural Language Processing) à base de deep learning tels que BERT, les transformer, etc. qui ont montrés des résultats prometteurs sur du code informatique, et pour lesquels il existe des modèles préappris [CodeT5, Code2vec].
Description
Profil recherché Ingénieur avec un profil Machine learning, connaissant les modèles deep et les outils associés. Connaissance du NLP est un plus. Débutants acceptés. Les tâches concerneront l’apprentissage de représentation (Deep Learning) de codes et de textes pour : • La génération de commentaires/résumés à partir d'un bloc de code. • La génération de codes à partir de commentaires (similaire à github copilot). • La recherche sémantique de blocs de code au sein d'une base de scripts (on cible python dans un premier temps). Un utilisateur écrit un texte en langage naturel et l'algorithme lui renvoie une liste de bloc de codes parmi l'ensemble des scripts de l'utilisateur. Bien que très orienté recherche, ce sujet demandera d'aller jusqu'à la conception d'un prototype, notamment pour le dernier point. PyTorch sera le framework de Deep Learning privilégié pour réaliser ces travaux.
Conditions CDD d'une durée de trois ans, salaire ~2300€ net/mois (à discuter selon profil et expérience). 9 semaines de vacances + RTT. Lieu : INSA Rouen Normandie + journées de travail chez Saagie. Collaborateurs : C.Chatelain (LITIS), R. Picot Clement (Saagie), et d’autres chercheurs/ingénieurs participant au projet. Contact : merci d’envoyer votre candidature à clement [point] chatelain [at] insarouen [point] fr