Informations générales
Intitulé de l'offre : Développement d'architectures ML/MM pour la réactivité enzymatique et applications à rubisco (H/F)
Référence : UMR8228-NICCHE-001
Nombre de Postes : 1
Lieu de travail : PARIS 05
Date de publication : vendredi 9 janvier 2026
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 18 mois
Date d'embauche prévue : 1 avril 2026
Quotité de travail : Complet
Rémunération : 3131 à 4807€ euros bruts, selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
Section(s) CN : 16 - Chimie du vivant et pour le vivant : conception et propriétés de molécules d'intérêt biologique
Missions
L'étude des petits systèmes chimiques a été révolutionnée ces dernières années par le développement des MLIP, permettant d'aborder des questions restées sans réponse il y a encore cinq ans. L'état de l'art pour les MLIP appliqués à la réactivité chimique implique d'effectuer des calculs quantiques sur l'ensemble de la boîte de simulation, ce qui pose deux problèmes : (i) les MLIP sont spécifiques à un système donné et ne peuvent être facilement extrapolés à un système proche, (ii) le coût de calcul est prohibitif pour les enzymes. Ainsi, les réactions enzymatiques sont encore principalement étudiées par des calculs QM/MM ou des simulations QM/MM-MD. Ces approches ne peuvent être utilisées à grande échelle en raison de leur coût, mais aussi de leur incapacité à capturer les mouvements globaux.
Activités
L'objectif de ce projet est de développer des MLIP destinés à remplacer la QM/MM, menant ainsi à des simulations ML/MM utilisables pour les réactions enzymatiques. Une étape clé dans l'utilisation des MLIP pour la réactivité est de disposer d'un ensemble d'entraînement incluant les structures du réactif, du produit et de l'état de transition : cette construction peut être réalisée via une procédure d'apprentissage actif telle que celle incluse dans le logiciel ArcaNN, développé dans notre laboratoire. Ce projet fusionnera une architecture axée sur le ML/MM pour la spectroscopie avec ArcaNN, dans le but de faciliter la création d'un ensemble d'entraînement diversifié grâce à des simulations d'échantillonnage enrichi et biaisé.
À titre de preuve de concept, nous étudierons l'étape de carboxylation catalysée par la rubisco, qui se trouve être la protéine la plus abondante sur Terre. Notre objectif sera de calculer la barrière d'énergie libre pour la protéine sauvage et pour des mutants obtenus par évolution dirigée, afin d'apporter un éclairage chimique à ces résultats récents. Nous élargirons ensuite l'étude au calcul des profils complets d'énergie libre pour les réactions de carboxylation et d'oxydation. Enfin, nous comparerons les orthologues et expliquerons pourquoi différentes espèces peuvent présenter des caractéristiques cinétiques très différentes pour la rubisco.
Compétences
Le candidat ou la candidate doit être titulaire d'un doctorat en (bio)chimie computationnelle et posséder une expertise en simulations MD, en chimie quantique ou en machine learning. Des connaissances sur les biosystèmes, des compétences en analyse (Python), en scripting (bash et/ou Python) et en machine learning sont des atouts.
Contexte de travail
Le projet se déroulera au sein du laboratoire CPCV (ENS-PSL, SU, CNRS), hébergé par l'École Normale Supérieure dans le Quartier Latin à Paris. Le groupe de chimie théorique de CPCV est multidisciplinaire tant au niveau des méthodes que des applications, et bénéficie d'une large reconnaissance pour ses activités. Le groupe accueille 15 à 20 stagiaires, doctorant(e)s et post-doctorant(e)s. Au cours du projet, nous collaborerons avec Guillaume Stirnemann et Damien Laage, qui apporteront leur expertise en ML, ainsi qu'avec Julien Henri pour son expertise sur la photosynthèse.