Informations générales
Intitulé de l'offre : H/F Chercheur post-doctoral dans le cadre du projet ANR Deep Pep
Référence : UMR5149-NATCOL-019
Nombre de Postes : 1
Lieu de travail : MONTPELLIER
Date de publication : mercredi 2 octobre 2024
Type de contrat : CDD Scientifique
Durée du contrat : 24 mois
Date d'embauche prévue : 2 décembre 2024
Quotité de travail : Temps complet
Rémunération : A partir de 3021 euros brut par mois selon expérience professionnelle
Niveau d'études souhaité : Niveau 8 - (Doctorat)
Expérience souhaitée : 1 à 4 années
Section(s) CN : Mathématiques et interactions des mathématiques
Missions
La mission principale de la personne recrutée sera de développer un modèle d'apprentissage profond ayant pour ambition de prédire des peptides synthétiques capables d'interagir avec une protéine cible donnée. Ces peptides naturels et synthétiques seront ensuite appliqués aux plantes afin d'enregistrer leurs effets sur les réponses développementales et transcriptomiques. Pour les plus prometteurs, une génomique fonctionnelle approfondie sera engagée. L'équipe DeepPep proprement dite, composée de 5 laboratoires très complémentaires fournira une caractérisation et une compréhension approfondies des peptides régulateurs en jeu dans les plantes, ouvrant des perspectives directes d'applications biotechnologiques dans le domaine des biostimulants et de la conception de molécules synthétiques par IA.
Le WP associé à ce post-doc s’inscrit plus précisément dans une lignée qui commence avec Alpha-Fold et Rosetta Fold, réseaux désormais capables de prédire le repliement de protéines à partir de leur séquence primaire avec une précision importante. Dans ce contexte, on peut penser que les règles apprises par ces algorithmes d’IA pour replier les protéines résument probablement les forces en jeu dans la formation de l’interaction protéine-protéine et de la formation de complexes protéiques. Ainsi certains partenaires du projet DeepPep ont déjà développé un algorithme nommé PetriBert, entraîné à apprendre précisément de telles règles en s’inspirant des techniques du NLP, notamment des Transformers et du célèbre modèle Bert. L’idée est en fait de faire le chemin inverse d’Alpha-Fold par exemple (en injectant dans l’apprentissage les règles déjà apprises in silico) et de prédire une séquence d’acides aminés associés à une protéine à partir d’une forme ou structure 3D.
Ainsi, à partir de ces travaux l’objectif ultime sera le développement par Transfer Learning d’une version PPI (Protein-Protein Interaction) de PetriBert en faisant la connection entre la structure, et donc la fonction, de peptides et certaines portions de leur séquence ADN.
Activités
• Recherche bibliographique
• Mise en œuvre/Implémentation de méthodes existantes de Machine/Deep Learning
• Production et documentation de code
• Rédaction d’articles de recherche
• Participation à des séminaires/conférences de recherche
Compétences
Le/le candidate devra être titulaire d’un doctorat en Informatique/statistiques/machine learning.
Compétences techniques :
-Maîtrise des aspects théorique du ML/DL (Compréhension des algorithmes d'apprentissage supervisé et non supervisé, familiarité avec les concepts de réseaux de neurones et d’apprentissage profond)
-Maîtrise de langages comme Python, C++, R, de Slurm et de Cuda.
- Connaissance et pratique de bibliothèques comme Pandas, NumPy, Scikit-learn, TensorFlow, etc
-Compétences avancées en NLP, Bert, Transformers et toutes techniques de Deep Learning spécifiques au design de molécules
Compétences non techniques :
- Capacité à analyser des problèmes complexes et à évaluer des solutions
- Travailler efficacement en équipe multidisciplinaire, notamment avec des développeurs, des statisticiens et des biologistes.
- Être motivé à se tenir à jour avec les dernières tendances et technologies en data science
-Sensibilité aux enjeux éthiques liés à l’utilisation des données, y compris la confidentialité et la protection des données.
Contexte de travail
Le chercheur recruté mènera ses recherches à l’IMAG, au sein de l’équipe EPS sous la supervision d’André Mas et François-David Collin. Il travaillera en étroite collaboration avec Gabriel Krouk (IPSIM et PI du projet) et son équipe ainsi qu’avec tous les partenaires du projet ANR Deep Pep au LIRMM à Montpellier et au LRSV à Toulouse
Situé sur le Campus Triolet de l’Université de Montpellier, l’IMAG est un des portails vers les mathématiques en Occitanie. Il comprend 170 membres et est composé en 4 équipes de recherche : Analyse, Calcul Scientifique et Optimisation de Montpellier (ACSIOM), Didactique et Epistémologie des Mathématiques (DEMA), Equipe de Probabilité et Statistique (EPS), Géométrie, Topologie et Algèbre (GTA).