En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

H/F Thèse de Doctorat en statistique/bioinformatique: développements méthodologiques et logiciels pour l'analyse de données de séquençage de l'ARN sur cellule unique

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : vendredi 21 mai 2021

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5219-TAMAZA-008
Lieu de travail : TOULOUSE
Date de publication : vendredi 30 avril 2021
Nom du responsable scientifique : Neuvial Pierre
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2021
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Les techniques de séquençage de l'ARN sur cellule unique (scRNA-seq) donnent accès à des mesures de l'expression de dizaines de milliers de gènes dans chacune des cellules d'un échantillon biologique. Ces données permettent en théorie d'identifier et de caractériser les types cellulaires en présence. L'analyse statistique des données issues d'une expérience scRNA-seq repose généralement sur une classification non supervisée des cellules (étape i), permettant d'identifier les types cellulaires en présence, suivie d'une analyse différentielle (étape ii) entre ces types, permettant d'identifier des gènes marqueurs de chaque type. Cette stratégie “classification + test” induit une forme de biais de sélection car (i) et (ii) sont effectuées sur les mêmes données [1]. En conséquence, elle conduit à un risque accru d'erreurs (faux positifs) et de résultats non reproductibles. L'objectif du projet PoCI-sc est de proposer des développements méthodologiques et applicatifs permettant de résoudre ce problème. Il s'agit d'un projet interdisciplinaire, en collaboration entre l'Institut de Mathématiques de Toulouse et trois laboratoires partenaires qui utilisent les données scRNA-seq dans leurs projets de recherche: Restore (spécialisé dans la régénération tissulaire), le Laboratoire Interactions Plantes-Microorganismes-Environnement (LIPME), et l'unité Génétique Physiologie et Systèmes d'Elevage (GenPhySE) de l'INRAE.
Dans ce contexte, la personne recrutée travaillera principalement sur l'évaluation des performances des méthodes et leur dissémination vers la communauté des biologistes. Dans un premier temps, elle mettra en oeuvre une stratégie d'évaluation des performances des méthodes existantes à l'aide de simulations ainsi que de données réelles à réponse connue (en particulier quantification du biais de sélection). Ensuite, elle contribuera au développement méthodologique, à l'implémentation de ces développements, ainsi qu'à la mise en place d'outils de visualisation dédiés.
La personne recrutée sera amenée à interagir avec des bioinformaticiens et biologistes des trois laboratoires partenaires du projet, qui sont également situés à Toulouse. Elle aura l'opportunité de présenter ses travaux lors de conférences nationales (SMPGD: https://smpgd.fr/, JOBIM: https://jobim2021.sciencesconf.org/) et internationales du domaine.
[1] Lähnemann, D., Köster, J., Szczurek, E., McCarthy, D. J., Hicks, S. C., Robinson, M. D., … & Schönhuth, A. (2020). Eleven grand challenges in single-cell data science. Genome biology, 21(1), 1-35.

Contexte de travail

Le ou la doctorant·e sera accueilli·e dans l'équipe Statistique et Optimisation de l'Institut de Mathématiques de Toulouse (CNRS UMR 5219). L'équipe est composée de chercheurs, enseignants-chercheurs, ingénieurs de recherche, post-doctorants et doctorants dont certains sont spécialistes des développements méthodologiques en statistique pour l'analyse de données biologiques. L'étudiant-e sera également intégré·e au groupe Mathématiques, Biologie et Santé et participera aux séminaires de ce groupe et de l'équipe.
Le ou la doctorant·e sera rattaché·e à l'école doctorale Mathématiques, Informatiques et Télécommunications de Toulouse (EDMITT).

Informations complémentaires

Le ou la candidat·e devra être titulaire d'un diplôme d'ingénieur et/ou d'un master en master en mathématiques appliquées et/ou informatique. Le poste nécessite de solides connaissances programmation en langage R et/ou python. Une expérience de développement d'interfaces de visualisation sera appréciée.
D'excellentes aptitudes de communication orale et écrite (français et anglais nécessaires) seront nécessaires pour communiquer avec les encadrants et collaborateurs, et présenter les travaux aux congrès et rédiger des articles dans des revues scientifiques. Nous recherchons une personne possédant un bon esprit de synthèse, et qui soit capable d'acquérir de l'autonomie. Le ou la candidat·e devra être motivé·e pour le travaill en équipe dans le cadre d'un projet pluridisciplinaire à l'interface entre statistique, bioinformatique et biologie.
Les candidatures devront inclure:
• un CV détaillé
• au moins deux références (personnes susceptibles d'être contactées)
• une lettre de motivation d'une page
• les notes de Master 1 et 2 (ou d'école d'ingénieur)
Les candidatures devront impérativement être déposées sur le Portail Emploi du CNRS. La date limite pour l'envoi des candidatures est le 20/05/2021.

On en parle sur Twitter !