En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Bioinformaticien (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : mardi 10 juin 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Bioinformaticien (H/F)
Référence : UMR7280-MARDAL-003
Nombre de Postes : 1
Lieu de travail : MARSEILLE 09
Date de publication : mardi 20 mai 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 51 - Modélisation mathématique, informatique et physique pour les sciences du vivant

Description du sujet de thèse

Titre de la thèse : Décryptage computationnel et modélisation mathématique des réseaux de régulation contrôlant la biologie des cellules dendritiques plasmacytoïdes.

Résumé du projet de thèse : Notre objectif est de développer une nouvelle stratégie interdisciplinaire pour identifier et modéliser les réseaux de régulation moléculaires et les interactions cellulaires contrôlant l'identité et les fonctions physiologiques des types cellulaires. Nous nous focaliserons sur les cellules dendritiques plasmacytoïdes (pDCs), des cellules immunitaires d’intérêt pour le projet car leurs identité et fonctions sont controversées en raison de leur grande plasticité. Sur le plan méthodologique, la plasticité remarquable des pDCs pose un défi computationnel unique : selon leur microenvironnement tissulaire et leur état d’activation, elles expriment différents modules de gènes, certains spécifiques, d’autres partagés avec les cellules dendritiques ou les cellules lymphoïdes innées. Cette complexité soulève des questions fondamentales sur l’identité et les fonctions des pDCs, y compris si elles correspondent à un type cellulaire unique ou appartiennent à la famille des cellules dendritiques versus celle des cellules lymphoïdes innées (1, 2). Les récentes avancées en bioinformatique, notamment dans l’analyse moléculaire en cellules uniques et l’inférence de réseaux de gène, offrent de nouvelles opportunités pour décrypter cette plasticité (3). Ces approches permettent d’identifier de manière non supervisée des modules de gènes corégulés, ouvrant la voie à une meilleure compréhension des mécanismes moléculaires qui définissent et maintiennent l’identité des pDCs malgré leur plasticité, ou qui contrôlent leurs fonctions selon leur état d’activation. Pour résoudre cette controverse, nous unissons les forces de 2 équipes, l’une experte en immunologie et l’autre en sciences informatiques. Grâce à des techniques de caractérisation des cellules individuelles, nous avons établi la trajectoire d'activation des pDCs lors d'une infection virale. L’analyse approfondie de ces données nécessitera que nous développions ensemble une approche algorithmique pour modéliser les mécanismes gouvernant l'identité et la plasticité des pDCs. Les pDCs sont une source majeure d'interférons de type I et III (IFNs), des cytokines clés dans la défense de l’organisme contre les virus (4). Certains mécanismes moléculaires promouvant la production d’IFNs par les pDCs sont connus; cependant, ils ne suffisent pas à comprendre comment cette fonction est contrôlée dans le temps et l'espace. Combler cette lacune est crucial, car la dérégulation du contrôle de la production d’IFNs par les pDCs contribue à diverses maladies, inflammatoires ou auto-immunes tels le psoriasis et le lupus, ou induites par des infections virales respiratoires ou chroniques (4, 5). Le projet pourra donc ouvrir des perspectives thérapeutiques pour promouvoir le rôle antiviral ou inhiber l’activité auto-immune des pDCs.

Objectifs spécifiques :
1. Définir l’identité des pDCs à travers tissus, espèces et conditions, en caractérisant leurs réseaux de régulations, comparativement à ceux des autres types de cellules immunitaires.
2. Comprendre la plasticité fonctionnelle des pDCs, en identifiant et caractérisant les modules de gène variables entre états cellulaires successifs de la trajectoire d’activation des pDCs au cours d’une infection virale, ou selon le tissu ou le microenvironnement anatomique où elles résident.
3. Développer de nouvelles méthodes bioinformatiques permettant de mieux identifier les types cellulaires en caractérisant finement les activités moléculaires et fonctionnelles des cellules en relation avec leur environnement.

Domaines et thématiques scientifiques :
Bio-informatique / biologie computationnelle, modélisation mathématique des processus biologiques, appliqués à l’immunologie.

Méthodologie. Le projet nécessitera la mise en place d’une approche interdisciplinaire combinant analyses expérimentales et computationnelles. L’équipe Dalod a déjà établi un socle robuste de données biologiques, en cartographiant les états d’activation des pDCs dans divers tissus et deux modèles d’infection virale (5, 6, 7 non publié), à l’aide de technologies de pointe (cytométrie de flux à haut contenu, séquençage d’ARN sur cellules uniques, microscopie confocale spectrale quantitative). Nous intégrerons ce socle robuste de données à des jeux de données en cours de génération ou publics, y compris de transcriptomique spatiale pour faciliter la cartographie micro-anatomique des niches des pDCs et leur caractérisation in situ.
Du coté des sciences informatiques, notre approche méthodologique se structure en trois phases complémentaires. 1) A l’aide d’approches algorithmiques (théorie des graphes), nous construirons des réseaux de gènes spécifiques aux pDCs, aux autres cellules dendritiques et aux cellules lymphoïdes innées, et développerons des métriques robustes pour quantifier les similarités et dissimilarités entre ces types cellulaires, à l’état basal et selon leurs états d’activation. 2) Nous exploiterons des approches bioinformatiques d’analyse différentielle sur données massives, développées par M. Richard (8), pour identifier des dérégulations d’expression spécifiques à chaque état d’activation des pDCs, afin d’identifier des modules de gènes variables et d’analyser leur dépendance au contexte tissulaire. 3) Nous validerons et raffinerons nos modèles de façon itérative. Nous évaluerons systématiquement les performances des algorithmes sur des jeux de données de référence, par des protocoles de benchmarking développés par l’équipe de M. Richard (9). Les prédictions de nos modèles seront validées expérimentalement par l’équipe de M. Dalod. Cette approche itérative permettra un ajustement continu des modèles, basé sur les retours expérimentaux, garantissant ainsi la pertinence biologique de nos développements méthodologiques.

Rôle de la doctorante ou du doctorant. Elle ou il devra réaliser des analyses computationnelles pour définir l’identité des types cellulaires à partir de données omiques et mesurer la distance entre eux. Cela nécessitera de construire et analyser un atlas de profilage de l’expression génétique par séquençage de l’ARN sur cellules uniques des différents types cellulaires immunitaires d’intérêt dans la rate des souris. Nous avons déjà identifié des jeux de données publiques complémentaires, vérifié leur compatibilité et amorcé leur analyse. Des données épigénétiques d’intérêt ont également été identifiées. La doctorante ou le doctorant disposera donc de fondations solides pour démarrer cette tâche. La doctorante ou le doctorant devra utiliser différentes stratégies pour définir les identités cellulaires et différentes méthodes de calculs de distance entre types cellulaires.
La doctorante ou le doctorant devra réaliser des analyses computationnelles avancées pour identifier les réseaux de régulation moléculaire et d’interactions cellulaires contrôlant la trajectoire d’activation des pDCs et leur plasticité fonctionnelle, au cours d’une réponse immunitaire et/ou en fonction de leur microenvironnement anatomique. Des jeux de données sont déjà disponibles dans l’équipe de Marc Dalod. Nous avons déterminé par séquençage d’ARN sur cellules uniques la trajectoire d’activation des pDCs in vivo dans la rate au cours d’une analyse cinétique de la réponse immunitaire innée à une infection virale, en lien avec les fonctions exercées par les différents états d’activation des pDCs et leur localisation micro-anatomique (6, 7). Nous avons également caractérisé le profil d’expression génétique des pDCs dans différents tissus à l’état basal (non publié). La doctorante ou le doctorant disposera donc de fondations solides pour identifier et analyser les réseaux de régulation de gènes présentant des variations dynamiques d’activité au cours de la trajectoire d’activation des pDCs ou en fonction de leur localisation tissulaire. Pour cette tâche, la doctorante ou le doctorant devra tester différents algorithmes existants, dont certains ont été développés par l’équipe de M. Richard. La doctorante ou le doctorant devra aussi développer de nouveaux algorithmes, y compris par des méthodes avancées d’analyse par apprentissage computationnel automatique / intelligence artificielle. La doctorante ou le doctorant devra ensuite générer des modèles mathématiques de ces réseaux de régulation et les utiliser pour inférer de nouvelles hypothèses sur les mécanismes contrôlant la biologie des pDCs. Un dialogue itératif avec les chercheurs expérimentalistes et par confrontation des prédictions du modèle avec les nouvelles données expérimentales de vérification des hypothèses permettra de raffiner le modèle.

Références bibliographiques. *Equal contribution. **Co-senior authors.
1. Ziegler-Heitbrock L, Ohteki T, Ginhoux F, Shortman K, Spits H. Reclassifying pDCs as innate lymphocytes. Nat Rev Immunol. 2023. doi: 10.1038/s41577-022-00806-0.
2. Reizis B, Idoyaga J, Dalod M, Barrat F, Naik S, Trinchieri G, Tussiwand R, Cella M, Colonna M. Reclassification of pDCs as innate lymphocytes is premature. Nat Rev Immunol. 2023. doi: 10.1038/s41577-023-00864-y.
3. Badia-i-Monpel P, ..., Saez-Rodriguez J. Gene reulatory network inference in the era of single-cell mutli-omics. Nat Rev Genetics. 2023. doi: 10.1038/s41576-023-00618-5
4. Ngo C*, Garrec C*, Tomasello E*, Dalod M.* The role of plasmacytoid dendritic cells (pDCs) in immunity during viral infections and beyond. Cell Mol Immunol. 2024. doi: 10.1038/s41423-024-01167-5.
5. Ngo C, Rahmani K, Valente M … Zarubica, A**, Dalod M**, Tomasello E**. pDCs are dispensable or detrimental in murine systemic or respiratory viral infections. bioRxiv. doi: 10.1101/2024.05.20.594961
6. Abbas A*, Vu Manh TP*, Valente M … Milpied P, Dalod M**, Tomasello E**. The activation trajectory of pDCs in vivo during a viral infection. Nat Immunol. 2020. doi: 10.1038/s41590-020-0731-4.
7. Valente M, Collinet N, Vu Manh TP … Milpied P, Tomasello E**, Dalod M**. Novel mouse models based on intersectional genetics to identify and characterize pDCs. Nat Immunol. 2023. doi: 10.1038/s41590-023-01454-9.
8. Richard M, Decamps C, Chuffart F, Brambilla E, Rousseaux S, Khochbin S, Jost D. PenDA, a rank-based method for personalized differential analysis: Application to lung cancer. PLoS Comput Biol. 2020. doi: 10.1371/journal.pcbi.1007869.
9. Amblard E, Bertrand V, Martin Pena L, Karkar S, Chuffart F, Ayadi M, Baures A, Armenoult L, Kermezli Y, Cros J, Blum Y**, Richard M**. A robust workflow to benchmark deconvolution of multi-omic data. bioRxiv. doi: 10.1101/2024.11.08.622633

Contexte de travail

Ce poste s'insère dans le cadre de l'action 80PRIME 2025 du CNRS qui soutient des projets interdisciplinaires entre des unités de recherche appartenant à différents instituts du CNRS. Mener à bien ce projet nécessite la synergie interdisciplinaire entre immunologie expérimentale (équipe 1, Marc Dalod, au CIML, à Marseille, Institut CNRS Biologie) et sciences informatiques (équipe 2, Magali Richard, à Grenoble, Institut CNRS Sciences informatiques). Aucun objectif du projet ne pourra être atteint sans ce partenariat. L'interprétation des analyses s'appuiera sur l'expertise complémentaire des 2 équipes. La validation des modèles reposera un processus itératif entre les partenaires.
Le poste est situé Centre d'Immunologie de Marseille-Luminy (CIML), une unité mixte de recherche du CNRS, de l'Inserm et d'Aix Marseille Université, composée d'environ 200 personnes et 16 équipes de recherche, située sur le parc scientifique et technologique de Luminy à Marseille (France).

L'équipe de Marc Dalod apporte son expertise en immunologie antivirale et en biologie des pDCs, des modèles animaux uniques (5, 6, 7) et des données exclusives. Elle est à l'origine de la question biologique et garantie sa pertinence. Elle est essentielle pour fournir les données expérimentales qui alimenteront le travail de modélisation. Elle réalisera les tests expérimentaux des hypothèses tirées des analyses et modèles. Ces tâches seront réalisées en étroite concertation avec l'équipe 2 afin de s'assurer en amont de la meilleure adéquation possible entre la conception des expériences et les besoins pour les analyses computationnelles et la modélisation mathématique.

L'équipe de Magali Richard est spécialisée en analyse computationnelle et modélisation de l'hétérogénéité cellulaire. La question centrale de bioinformatique qu'elle aborde est de comprendre ce qui définit l'identité d'une cellule, tant sur le plan fonctionnel que moléculaire, en lien étroit avec les interactions dynamiques de son environnement. Ce projet permet d'explorer cette question en s'appuyant sur les données générées par l'équipe 1. L'expertise computationnelle de l'équipe 2 est essentielle pour interpréter ces données complexes et générer des hypothèses inédites difficiles à explorer uniquement par des approches expérimentales. L'équipe 2 dirigera la conception et la réalisation des analyses bio-informatiques et des modèles mathématiques, auxquelles l'équipe 1 contribuera. Magali Richard supervisera directement la doctorante ou le doctorant sur les aspects computationnels, avec le soutien de Lucie Lamothe (IR CNRS).

Au CIML, le groupe CB2M (Computational Biology, Biostatistics and Modelling) contribuera à assurer un cadre de travail adapté au doctorant, facilitera la communication entre les équipes 1 et 2 en apportant son expertise à la fois en biologie computationnelle et en immunologie, et apportera ses compétences à l'équipe 2 pour aider au développement des nouvelles méthodes d'analyse. Le CB2M est composé de 4 ingénieurs spécialisés en biologie computationnelle, biostatistique et modélisation mathématique. Ils collaborent avec les équipes de recherche pour fournir un appui aux projets interdisciplinaires et promouvoir les méthodes et technologies les plus avancées. Le CB2M est aussi un écosystème collaboratif, où tous les bio-informaticiens des équipes peuvent travailler dans une communauté au sein des mêmes locaux et offrant des interactions quotidiennes riches et dynamiques. Le CB2M assure au côté des chercheurs le suivi des projets effectués par les bio-informaticiens, en co-encadrant leur activité. Le CB2M est très engagé dans la mise en place des bonnes pratiques concernant la reproductibilité des analyses, l'aspect FAIR des données et la diffusion des résultats (Science Ouverte).

Formation attendue :
1. Master en bio-informatique / biologie computationnelle et/ou mathématiques.
2. Appétence pour la modélisation mathématique des processus biologiques.

Compétences scientifiques attendues :
1. Excellente maîtrise de la programmation en R ou en Python.
2. Connaissance de logiciels requis pour l'analyse de données génomiques (e.g. CellRanger, STAR) et single-cell (e.g. Seurat, Monocle, Velocyto ou Scanpy).
3. Compréhension pratique des méthodes mathématiques d'analyse de données multidimensionnelles (ACP, t-SNE, UMAP, pseudotime, apprentissage statistique, etc.).

Compétences scientifiques souhaitées.
1. Connaissance pratique des outils de conteneurisation (Docker, Singularity), gestionnaires de version (Git) et gestionnaires de workflow (Snakemake) souhaitée.
2. Intérêt pour les aspects méthodologiques de l'analyse de données.

Expériences souhaitées.
Expérience réussie en bio-informatique appliquée aux données génomiques ou transcriptomiques, idéalement à l'échelle single-cell.

Compétences linguistiques.
Bonne communication écrite et orale. Maîtrise de l'anglais scientifique écrit et oral.

Autres qualités attendues.
1. Aptitude à travailler en équipe dans un environnement multidisciplinaire; capacités d'écoute et de proposition.
2. Excellentes capacité d'analyse et de synthèse.
3. Excellente organisation et bonne autonomie dans la gestion des projets.
4. Intérêt pour les questions biologiques et en particulier l'immunologie.

Contraintes et risques

La doctorante ou le doctorant sera co-dirigée ou codirigé par Marc Dalod et Magali Richard, avec le CIML comme affiliation principale.
Lieu secondaire d’exercice : La doctorante ou le doctorant effectuera des séjours longs (2 à 3 mois chacun) dans l’équipe de Magali Richard, pour assimiler l’expertise et la culture scientifique complémentaires des deux laboratoires, et promouvoir la synergie entre eux.
Nécessité de se tenir constamment informé des évolutions technologiques et méthodologiques.