En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Prédiction et Réactivité avec Exploration Dynamique et Innovation par la Chimie Théorique (PREDICT) (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : mardi 17 juin 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Prédiction et Réactivité avec Exploration Dynamique et Innovation par la Chimie Théorique (PREDICT) (H/F)
Référence : UMR6064-LAUJOU-001
Nombre de Postes : 1
Lieu de travail : MONT ST AIGNAN
Date de publication : mardi 27 mai 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 13 - Chimie physique, théorique et analytique

Description du sujet de thèse

Ce projet multidisciplinaire (chimie théorique et informatique) se concentre sur les interactions non-covalentes appelées ” trous sigma”. Elles se produisent lorsqu’un atome, comme un halogène ou un chalcogène, présente une région appauvrie en densité électronique, appelée ”trou sigma”. Cette région peut interagir avec des espèces riches en électrons, influençant ainsi la stabilisation des structures moléculaires et cristallines. Ces interactions sont cruciales en biochimie, en ingénierie des matériaux et en catalyse. Prédire la stabilité du complexe ainsi formé entre une espèce déficiente en électrons (dite ”électrophile”) et une autre riche en électrons (le ”nucléophile”) est donc un enjeu majeur dans l’optimisation de structures supramoléculaires. L’approche généralement employée repose sur l'étude des propriétés intrinsèques de chacun des réactifs. En effet, il a été montré expérimentalement (échelle de Mayr-Patz) que les vitesses de réaction peuvent s’exprimer en fonction de paramètres caractéristiques de chaque entité indépendante. En général, ceux-ci sont calculés sur les structures de plus basse énergie. Cependant, cela ne prend pas en compte la dynamique de chacun des partenaires, induite par la température, et qui ne peut nullement être négligée. Celle-ci peut être simulée à partir de calculs de chimie quantique, malheureusement très coûteux en termes de ressources computationnelles, limitant son application à des jeux réduits de petites molécules. Un mouvement relativement récent (2017) consiste à utiliser des méthodes de machine learning et plus précisément de Deep learning pour approximer efficacement le calcul de l’énergie afin d’en déduire (rapidement) la dynamique de la molécule. Cette thèse se propose d’adresser cette problématique et se situe donc à l’intersection entre la chimie théorique et le machine learning. Une approche classique de l’apprentissage profond à la chimie consiste à utiliser un graphe moléculaire où les sommets correspondent aux atomes et les arêtes aux liaisons (simple, double, triple, aromatiques) entre atomes. Les atomes sont généralement décrits par leur type sans utiliser de coordonnées. Ce type d’utilisation de l’apprentissage ne peut intrinsèquement pas prendre en compte l’évolution de la position des atomes et donc la dynamique de la molécule. L’utilisation de l’apprentissage profond pour le calcul dynamique de propriétés moléculaires doit également adresser un certain nombre de contraintes : Il se doit d’être équivariant aux rotations et invariant aux translations qui définissent les coordonnées des molécules. L’application d’une symétrie sur la molécule doit également produire un résultat équivariant. Enfin, l’ordre des sommets étant arbitraire, le réseau doit être équivariant à ce dernier. Notons également qu’un calcul de dynamique moléculaire s’effectue à l’aide des dérivées de l’énergie moléculaire. Un réseau calculant cette énergie doit donc fournir un résultat deux fois différentiable ce qui interdit l’utilisation de fonctions non C1 comme la fonction RELU. Cet ensemble de contraintes a induit des réseaux convolutifs très différents de ceux habituellement utilisés en chémoinformatique. L’opération de convolution consiste à considérer à chaque itération un graphe dynamique reliant chaque atome à tous ces voisins situés à une distance inférieure à un seuil (entre 10 et 30 A). Ces interactions entre atomes devant être invariantes aux rotations, de nombreux auteurs ont dans un premier temps utilisé uniquement la distance (réelle) entre atomes. On obtient ainsi un schéma général où après un plongement des atomes (codant le type et les coordonnées de chaque atome) un ensemble de modules d’interactions est appliqué avec des connections résiduelles. Les matrices de poids permettent de pondérer les mises à jour en fonction de ces distances. L’énergie de chaque atome est ensuite estimée avant de sommer les contributions de tous les atomes pour avoir une estimation de l’énergie globale de la molécule. Ce schéma est réducteur pour plusieurs raisons : 1. La simple utilisation d’une distance (donc d’une valeur réelle) ne permet pas de prendre en compte la position relative des atomes. Ce point a été partiellement corrigé par DimNet puis par GemNet. 2. La restriction des interactions à un certain seuil est une simplification. Ce point a été noté assez tôt, puisque par exemple, PhysNET propose une correction de l’estimation de l’énergie à partir d’interactions non locales entre les atomes. Cette correction est toutefois appliquée a posteriori. Une approche plus intéressante est proposée par SpookyNet qui introduit des interactions non locales dans le module d’interaction. 3. L’initialisation du plongement des atomes avec leurs types et leur positions, ne prend pas en compte les propriétés électroniques des atomes. Cette limitation est importante dans notre cas pour la prédiction des propriétés électroniques de la molécule telles que les trous sigma.

Contexte de travail

Le travail que nous allons entreprendre débutera par un benchmarking des modèles existants en privilégiant les approches utilisant les fonctions angulaires au moins au premier ordre (voir DimNet) car elles paraissent fondamentales pour une prédiction efficace des descripteurs de réactivité. En outre, les modèles incorporeront nécessairement, dans les données d’entrée, les propriétés électroniques des atomes, à la suite des travaux de l´équipe de chimie théorique qui ont identifié de manière précise les descripteurs quantiques pertinents pour l’étude de ce type d’interactions et qui ont été implémentés dans le logiciel de référence AMS par cette même équipe. Ces modifications s’accompagneront de l’évaluation de la complexité du modèle obtenu afin de garantir une des principales qualités de l’approche par apprentissage machine, à savoir un temps de calcul compatible avec le traitement de grandes bases. Enfin, afin d’atteindre les applications pratiques, une collaboration avec l’équipe du Dr. Robin Weiss (Chaire Professeur Junior, intégrant la nouvelle UMR CARMeN en janvier 2025 à Caen), spécialiste de la synthèse et de la caractérisation physicochimique des trous sigma, est prévue et devrait permettre la mise au point de nouveaux systèmes d’intérêt sociétal. Cette synergie s’appuiera également sur le fait que les deux équipes de Rouen et de Caen sont toutes deux membres du GDR sigma-hole.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.