Doctorant / Doctorante en bioinformatique et deep-learning (H/F)

Nouveau

Laboratoire de Recherche en Sciences Végétales

AUZEVILLE TOLOSANE • Haute-Garonne

  • CDD Doctorant
  • 36 mois
  • BAC+5

This offer is available in English version

Cette offre est ouverte aux personnes disposant d’un titre leur reconnaissant la qualité de travailleur handicapé ou travailleuse handicapée.

L'offre en un coup d'oeil

L'unité

Laboratoire de Recherche en Sciences Végétales

Type de Contrat

CDD Doctorant

Temps de Travail

Complet

Lieu de Travail

31326 AUZEVILLE TOLOSANE

Durée du contrat

36 mois

Date d'Embauche

01/10/2026

Rémuneration

La rémunération est d'un minimum de 2300,00 € mensuel

Postuler Date limite de candidature : mardi 23 juin 2026 23:59

Description du Poste

Sujet De Thèse

L’incroyable diversité des eucaryotes est le résultat d’une évolution continue et de l’émergence d’innovations fonctionnelles. L’une des innovations les plus fondamentales pour l’adaptation et la diversification des eucaryotes réside en leur capacité à former des symbioses mutualistes avec des micro-organismes. Ce type d’interactions peut être observé à travers les différentes lignées eucaryotes et a joué un rôle particulièrement important dans la diversification de deux d’entre elles, les plantes et les coléoptères. Jusqu’à présent, la plupart de ces interactions ont été étudiées via le prisme des gènes codants pour des protéines. Cela a permis d’identifier des gènes et des expansions de familles de gènes spécifiquement associés à ces symbioses mutualistes. Toutefois, nous avons récemment démontré que ces interactions ont aussi évolué via des changements transcriptionnels massifs de gènes pré-existants. Ces modifications de régulation peuvent s’expliquer par différents facteurs et notamment par les éléments cis-régulateurs (ECRs). Ces éléments sont des séquences généralement situées dans des zones non-codantes des génomes reconnues par des facteurs de transcription permettant la régulation de gènes cibles. La prédictions des ECRs associés avec des traits fonctionnels représente l’un des défis les plus importants de la biologie. En effet, ces éléments sont généralement de petite taille, inclus dans des zones non-codantes très variables des génomes et peuvent se situer à de grandes distances par rapport aux gènes cibles qu’ils régulent. Les méthodes de prédiction actuelles présentent des limitations importantes telles que la restriction à quelques espèces modèles (ignorant ainsi la diversité des organismes) ou encore nécessitant une phase d’alignement de séquences. Au cours des dernières années, de très nombreux jeux de données OMIQUES (RNA-Seq, ATAC-Seq, Single-Cell Seq, DAP-Seq…) ont été produits pour une vaste diversité d’organismes dont les génomes sont disponibles. Toutefois, ces données n’ont été utilisées que pour répondre à des questions scientifiques spécifiques, et non dans un cadre comparatif.
Au sein du projet INTERSTELLAR (Identification of Eukaryotic cis-regulatory elements through deep-learning approaches), nous proposons de ré-analyser et intégrer ces données afin de développer une approche de deep-learning capable de prédire des ECRs associés à des traits fonctionnels à de grandes échelles évolutives (plusieurs centaines de millions d’années) sans avoir recours à de l’alignement de séquences.
Pour répondre à cet objectif, le projet INTERSTELLAR est divisé en trois grands axes.
1. Développer d’un outil de deep-learning pour prédire des ECRs. Dans ce premier axe, le doctorant ou la doctorante ré-analysera des données omiques pour des espèces modèles couvrant la diversité des plantes et des coléoptères via des méthodes respectant les principes FAIR dont certaines seront à mettre en place. Puis, il ou elle intégrera ces données afin de développer un outil de deep-learning capable de prédire des ECRs dans chaque espèce.
2. Définir la logique d’impact des ECRs sur l’expression des gènes. Le second axe aura pour but de déployer l’approche deep-learning à de multiples espèces couvrant la diversité des plantes et coléoptères via des approches dites de transfer-learning. Cela se basera sur la reconstruction et l’analyse d’orthogroupes afin de définir les relations évolutives entre espèces.
3. Identifier des ECRs candidats associés à des traits fonctionnels. Le dernier objectif de la thèse consistera à corréler la découverte d’ECR avec des traits fonctionnels en déployant des méthodes statistiques. Dans cet axe, le focus sera fait sur les interactions mutualistes car de nombreuses connaissances et notamment des données omiques ont été générées au sein de l’équipe d’accueil.

Profil recherché
Nous sommes à la recherche d’un candidat ou d’une candidate ayant de solides connaissances en bio-informatique et/ou en deep-learning.

Compétences
Les candidat(e)s doivent être titulaires d’un master en bioinformatique, analyse de données, IA ou assimilé. Une expérience préalable dans la manipulation de données omiques (par exemple transcriptomiques), en phylogénétique ou phylogénomique serait bénéfique, et une capacité à coder en Python, R ou bash est requise. Des compétences en deep-learning, ou des connaissances acquises en cours, ou, à tout-le-moins, un fort désir d’apprendre ces techniques sont également nécessaires. Une connaissance des workflow managers tels que Nextflow ou Snakemake sont un plus tout comme la capacité à utiliser un cluster de calcul haute performance (de type SLURM ou SGE). Le ou la candidat(e) recruté(e) devra être également capable de s’exprimer et de rédiger en anglais. Enfin, il ou elle devra faire preuve de curiosité et être capable de mettre en place une veille bibliographique, de travailler en équipe dans un contexte international.

Votre Environnement de Travail

Cette thèse est financée par le programme 80Prime du CNRS et sera conjointement encadrée par Jean Keller (CNRS, UMR5546 LRSV, Toulouse, France) et Bastien Boussau (CNRS, UMR5558 LBBE, Lyon, France). Le/la doctorant(e) recruté(e) sera basé(e) au LRSV de Toulouse et fera des déplacements réguliers au LBBE de Lyon. Au sein du LRSV, le/la doctorant(e) fera partie de l’équipe « évolution des interactions plantes-microorganismes » dirigée par Pierre-Marc Delaux. Dans ce groupe de recherche interdisciplinaire, la personne bénéficiera d’un accès à une plateforme de bioinformatique comprenant un cluster de calcul de haute performance ainsi qu’à des données générés par l’équipe permettant de déployer les approches de deep-learning à des espèces encore peu étudiées. Le LRSV fait partie d’un ensemble de laboratoires couvrant des sujets variés, allant de l’écologie à la biologie mécanistique ainsi que l’analyse in silico de données variées.
Au sein du LBBE, le/la doctorant(e) rejoindra l’équipe Génomique Fonctionnelle et Evolutive, qui étudie l’évolution des génomes en lien avec les phénotypes des espèces. Cette équipe utilise et développe des approches classiques de génomique évolutive, ainsi que des approches de deep learning. Elle est intégrée au laboratoire LBBE, qui rassemble plus de 200 personnes travaillant en génomique, bioinformatique, évolution, écologie, santé animale et santé humaine. Le LBBE entretient un environnement de travail bienveillant, où le/la doctorant(e) pourra bénéficier de l’aide d’une équipe d’ingénieurs de soutien informatique et de l’accès à un cluster de calcul.

Contraintes et risques

Ce projet de doctorat en bio-informatique implique une posture sédentaire, un poste de travail adapté sera par conséquent mis à disposition du/de la candidat(e) recruté(e). Par ailleurs des déplacements réguliers à Lyon seront à prévoir et seront pris en charge par le laboratoire d’accueil.

Rémunération et avantages

Rémunération

La rémunération est d'un minimum de 2300,00 € mensuel

Congés et RTT annuels

44 jours

Pratique et Indemnisation du TT

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

À propos de l’offre

Référence de l’offre UMR5546-JEAKEL-001
Section(s) CN / Domaine de recherche Biologie intégrative des organismes photosynthétiques et des microorganismes associés

À propos du CNRS

Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.

Le CNRS

Les métiers de la recherche

Créer une alerte

Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.

Créer une alerte

Doctorant / Doctorante en bioinformatique et deep-learning (H/F)

CDD Doctorant • 36 mois • BAC+5 • AUZEVILLE TOLOSANE

Ces offres pourraient aussi vous intéresser !

    Toutes les offres