Informations générales
Intitulé de l'offre : Doctorat (H/F) en développement de méthodes d’apprentissage automatique pour l’intégration de données omiques unicellulaires
Référence : UMR3738-DEBPHI-006
Nombre de Postes : 1
Lieu de travail : PARIS 15
Date de publication : vendredi 30 janvier 2026
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 mai 2026
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2300,00 € mensuel
Section(s) CN : 01 - Mathématiques et interactions des mathématiques
Description du sujet de thèse
Le séquençage haut débit à cellule unique, qui extrait d’énormes quantités de données moléculaires d’une cellule, crée des opportunités passionnantes pour l’apprentissage automatique afin de répondre aux questions biologiques en suspens. Le doctorant (H/F), qui sera recruté dans le cadre de l’ERC StG MULTI-viewCELL, travaillera sur le développement d’une nouvelle méthode combinant l’apprentissage automatique et la modélisation biophysique pour modéliser le développement de l’embryon à partir de données transcriptomiques spatiales.
Activités principales :
- conception d'une nouvelle méthode mathématique
- veille documentaire de publications pertinentes pour le domaine
- programmation/codage en Python (Pytorch)
- présentation des résultats obtenus en conférence
- interaction avec les membres de l’équipe et les collaborateurs internationaux
Diplôme : Master en sciences des données ; informatique ; mathématiques appliquées
Nous attendons d'un candidat qu'il dispose d'une solide expérience en apprentissage automatique ou en statistiques. Le candidat doit également maîtriser des langages de programmation comme Python. La familiarité avec les données unicellulaires et l'expérience avec les méthodes et les logiciels existants pour les cellules uniques représenteraient un fort avantage. D'excellentes compétences en communication et un esprit d'équipe, ainsi qu'une capacité à travailler en autonomie sont essentiels. Un anglais courant, tant à l'oral qu'à l'écrit, est requis.
Contexte de travail
L'équipe Machine Learning for Integrative Genomics (https://research.pasteur.fr/en/team/machine-learning-for-integrative- genomics/) de l'Institut Pasteur, dirigée par Laura Cantini, travaille à l'interface de l'apprentissage automatique et de la biologie (outils développés par l'équipe : https://github.com/cantinilab). L’équipe est composée de 9 personnes : 4 doctorants, 3 post-doctorant, 1 Ingénieur de recherche et 1 assistante.
L’équipe est associée au département de biologie computationnelle de l'Institut Pasteur, à l'UMR3738 et à l'Institut d'intelligence artificielle PRAIRIE. L’équipe a récemment remporté un financement ERC StG qui fait l'objet de ce recrutement.
MULTIview-CELL ERC StG :
https://www.ins2i.cnrs.fr/fr/cnrsinfo/laura-cantini-un-projet-erc-starting-grant-linterface-entre-apprentissage-automatique-et
https://research.pasteur.fr/en/project/multi-viewcell/
Contraintes et risques
Travail sur ordinateur