Informations générales
Intitulé de l'offre : Doctorant (H/F)
Référence : UMR3738-LAUCAN-002
Nombre de Postes : 1
Lieu de travail : PARIS
Date de publication : mercredi 24 mai 2023
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 septembre 2023
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel
Section(s) CN : Modélisation mathématique, informatique et physique pour les sciences du vivant
Description du sujet de thèse
Le séquençage de l'ARN à cellule unique (scRNAseq) est en train de révolutionner la biologie et la médecine. La possibilité d'évaluer l'hétérogénéité cellulaire à une résolution auparavant inaccessible a profondément influencé notre compréhension du développement, du fonctionnement du système immunitaire et de nombreuses maladies. Alors que le scRNAseq est désormais mature, le développement technologique de la cellule unique s'est déplacé vers d'autres mesures quantitatives à grande échelle, appelées "omiques", et même vers le positionnement spatial. En outre, des mesures omiques combinées profilées à partir de la même cellule unique sont de plus en plus disponibles.
Chaque mesure omique sur une cellule unique présente des limites intrinsèques et fournit des informations différentes et complémentaires sur la même cellule. L'intégration multi-omique unicellulaire, c'est-à-dire l'analyse simultanée de plusieurs mesures omiques unicellulaires, devrait donc compenser les informations manquantes ou peu fiables d'une seule mesure omique et fournir une puissance considérable pour démêler la complexité des cellules humaines.
Cependant, l'intégration multi-omique d'une cellule unique est un défi. Les différentes données omiques unicellulaires varient considérablement en termes de gamme de signaux, de profondeur de couverture et de nombre et de nature des caractéristiques mesurées. Le défi consiste donc à extraire des signaux biologiques partagés par les multiples données omiques et masqués par les grandes variations inter-omiques. En outre, le nombre considérable de cellules profilées, des milliards dans un avenir proche, introduit tous les défis informatiques et statistiques typiques du "Big Data". Il existe donc un besoin impératif de méthodologies puissantes et robustes capables de surmonter ces défis et de produire de nouvelles connaissances biologiques grâce à l'intégration des données omiques des cellules uniques.
Nous recherchons un doctorant (H/F) très motivés pour travailler a l'interface entre apprentissage automatique et génomique des cellules uniques. Le doctorant (H/F) développera des méthodes d'apprentissage automatique pour l'inférence des réseaux des gênes visant à étudier l'hétérogénéité cellulaire et ses mécanismes de régulation sous-jacents.
Contexte de travail
Le laboratoire machine learning for integrative genomics (https://research.pasteur.fr/en/team/machine-learning-for-integrative-genomics/) est une équipe interdisciplinaire composée de 5 chercheurs en science des données, en biologie computationnelle et en bio-informatique. La thèse sera co-supervisé entre Laura Cantini (chef d'équipe machine learning for integrative genomics) et Gabriel Peyré (DR CNRS ENS http://www.gpeyre.com/).
Le doctorant recruté sera basés avec l'ensemble de l'équipe à l'Institut Pasteur, centre d'excellence mondialement reconnu pour la recherche en maladies infectieuses, assurant une collaboration étroite avec les experts en biologie computationnelle et en biologie en laboratoire. En outre, l'affiliation à l'institut PRAIRIE, l'un des quatre instituts interdisciplinaires de recherche en intelligence artificielle mis en place dans le cadre de la stratégie nationale pour l'intelligence artificielle, permet une interaction au niveau de l'IA et de l'apprentissage automatique.
Contraintes et risques
None