Postdoctorat en deep learning et modèles de langage sur ADN pour la bioinformatique (H/F)

Nouveau

Institut de génétique moléculaire de Montpellier

MONTPELLIER • Hérault

  • Chercheur en contrat CDD
  • 12 mois
  • Doctorat

This offer is available in English version

Cette offre est ouverte aux personnes disposant d’un titre leur reconnaissant la qualité de travailleur handicapé ou travailleuse handicapée.

L'offre en un coup d'oeil

L'unité

Institut de génétique moléculaire de Montpellier

Type de Contrat

Chercheur en contrat CDD

Temps de Travail

Complet

Lieu de Travail

34293 MONTPELLIER

Durée du contrat

12 mois

Date d'Embauche

01/06/2026

Rémuneration

A partir de 3071€ brut ajustable selon expérience

Postuler Date limite de candidature : vendredi 20 mars 2026 23:59

Description du Poste

Les Missions

Ce projet développe un nouveau paradigme de modèles d’Interprétation Générale du Génome (GenGI) en combinant des modèles de langage ADN (DLLMs) avec des réseaux de neurones profonds afin de prédire des phénotypes humains directement à partir de données de séquençage d’exome complet issues de la UK Biobank. L’objectif est la prédiction à large spectre de phénotypes humains, ouvrant de nouvelles perspectives en génétique clinique, médecine de précision, prédiction du risque de maladie et IA explicable appliquée aux données génomiques.

L'Activité

La personne devra :
– Se familiariser avec les recherches et méthodes existantes en interprétation du génome
– Se familiariser avec les données de séquençage et leur prétraitement
– Étudier le fonctionnement des modèles de langage ADN et développer des solutions pour les intégrer aux architectures de réseaux de neurones du laboratoire
– Développer des solutions pour améliorer la scalabilité des réseaux de neurones et des grands modèles de langage aux données de séquençage du génome entier
– Développer des algorithmes et architectures pour la prédiction de sorties structurées (arbres, graphes)
– Mettre en œuvre des méthodes d’interprétation des prédictions des réseaux de neurones, incluant des activations basées sur des concepts et des analyses contrefactuelles

Votre Profil

Compétences

Nous recherchons une personne motivée et curieuse, avec une solide expérience dans le développement de méthodes d’apprentissage automatique pour la bioinformatique. Le projet porte sur le développement de nouvelles architectures de réseaux de neurones pour l’inférence à partir de données de séquençage.
La personne devra être désireuse d’apprendre continuellement de nouvelles compétences, méthodes et concepts, et apprécier la recherche de solutions face à des difficultés nouvelles et imprévues.
Compétences techniques :
- Programmation Python avancée et expérience en calcul scientifique (PyTorch, scikit-learn, NumPy, etc.)
- Réseaux de neurones et apprentissage automatique : solide compréhension des concepts et des fondements mathématiques, y compris l’algèbre linéaire (opérations vectorielles et matricielles) et l’optimisation
- Familiarité avec GNU/Linux et les environnements de développement associés
- Compétences en traitement de données génomiques (séquençage d’exome ou de génome complet) et pipelines de bioinformatique sont un plus
- Connaissances en GWAS, génétique des populations ou concepts de base en génétique et biologie sont appréciées mais non obligatoires
Compétences générales :
-Capacité de résolution de problèmes complexes
- Bonnes compétences en communication et aptitude au travail en équipe
- Niveau d’anglais minimum B2 requis

Votre Environnement de Travail

La candidate ou le candidat rejoindra la nouvelle équipe de recherche en IA dirigée par Daniele Raimondi au sein de l’Institut de Génétique Moléculaire de Montpellier (IGMM, UMR5535 CNRS/Université de Montpellier) pour une durée de 12 mois, renouvelable sous certaines conditions pour jusqu’à 36 mois supplémentaires si les résultats permettent d’obtenir des financements complémentaires.
Le poste est basé à l’IGMM (www.igmm.cnrs.fr), dans un environnement de recherche hautement international et interdisciplinaire. Montpellier est une ville méditerranéenne dynamique, offrant un cadre de vie agréable, une riche culture et un environnement scientifique exceptionnel. La ville accueille de nombreux instituts de recherche de haut niveau ainsi que l’Université de Montpellier, forte de 70 000 étudiants et abritant l’une des plus anciennes facultés de médecine au monde.
L’institut rassemble plus de 200 personnes (chercheurs, ingénieurs, techniciens et étudiants), organisées en 18 équipes de recherche, et bénéficie de services communs mutualisés, ainsi que de plateformes technologiques et scientifiques performantes.
L'agent travaillera au sein du groupe AI4GI, dirigé par le Dr Daniele Raimondi. Le groupe développe des méthodes avancées d’intelligence artificielle et d’apprentissage automatique pour l’interprétation du génome, avec un accent particulier sur la modélisation des relations entre variation génétique et phénotypes.
AI4GI développe des architectures de réseaux de neurones sur mesure, incluant des modèles parcimonieux et biologiquement informés, afin de prédire le risque de maladie et des traits quantitatifs complexes à partir de données génomiques à grande échelle (séquençage du génome entier et de l’exome). Le groupe intègre également des données multi-omiques via des approches de fusion non linéaire et exploite des modèles de langage ADN pré-entraînés comme extracteurs de caractéristiques non supervisés afin d’améliorer la performance prédictive et l’interprétabilité.
En combinant innovation méthodologique en IA et applications en génétique humaine, génomique du cancer et génomique végétale, AI4GI vise à faire progresser la compréhension des relations génotype–phénotype et à contribuer à la médecine de précision..

Rémunération et avantages

Rémunération

A partir de 3071€ brut ajustable selon expérience

Congés et RTT annuels

44 jours

Pratique et Indemnisation du TT

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

À propos de l’offre

Référence de l’offre UMR5535-SARADE-104
Section(s) CN / Domaine de recherche Sciences et données

À propos du CNRS

Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.

Le CNRS

Les métiers de la recherche

Créer une alerte

Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.

Créer une alerte

Postdoctorat en deep learning et modèles de langage sur ADN pour la bioinformatique (H/F)

Chercheur en contrat CDD • 12 mois • Doctorat • MONTPELLIER

Ces offres pourraient aussi vous intéresser !

    Toutes les offres