En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Contrat doctoral H/F - Analyse topologique de données en biologie moléculaire et biologie évolutive

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : lundi 9 juin 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Contrat doctoral H/F - Analyse topologique de données en biologie moléculaire et biologie évolutive
Référence : UMR5208-PHIMAL-002
Nombre de Postes : 1
Lieu de travail : VILLEURBANNE
Date de publication : lundi 19 mai 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 01 - Interactions, particules, noyaux du laboratoire au cosmos

Description du sujet de thèse

L’Institut Camille Jordan (ICJ, UMR CNRS 5208, CNRS, Université Claude Bernard Lyon 1) propose une thèse à temps plein sur le thème « Analyse topologique des structures tridimensionnelles de protéines et réseaux de neurones topologiques pour l’analyse des traits d’histoire de vie des organismes ».

Cette thèse de doctorat vise à développer des méthodes à l’interface de la biotopologie moléculaire et de l’apprentissage automatique, afin d’identifier les déterminants moléculaires et structurels de la piézo-résistance.

La biotopologie moléculaire consiste à étudier les macromolécules biologiques, essentiellement les protéines, et leurs propriétés fonctionnelles à l’aide de techniques issues de l’analyse topologique des données (TDA) et de la géométrie spectrale. Dans cette thèse, il s’agira de proposer de nouvelles représentations multi-échelles de ces macromolécules et d’en déterminer les caractéristiques géométriques (marqueurs de courbure) et spectrales (marqueurs spectraux). Ces marqueurs, construits à partir de courbures discrètes (Forman-Ricci, Ollivier-Ricci), du Laplacien persistant et de facteurs structurels, génomiques et environnementaux, constituent des représentations vectorielles des macromolécules.

Des métriques adaptées seront définies afin d’entraîner des modèles prédictifs sur ces représentations, en combinant apprentissage profond et régression statistique, pour mieux comprendre les mécanismes de la piézo-résistance.

La thèse portera également sur la modélisation de l’évolution de ces marqueurs, en prenant en compte les traits d’histoire de vie des organismes, par des méthodes combinant phylogénie moléculaire et reconstruction de séquences ancestrales. L’objectif est de retracer l’évolution conjointe des structures, des séquences protéiques et des marqueurs topologiques le long des arbres phylogénétiques afin de tester les modèles proposés.

Cette thèse combine ainsi modélisation mathématique, biologie évolutive et apprentissage automatique pour explorer les mécanismes de l’adaptation aux hautes pressions.
Les résultats attendus incluent :
- Le développement de modèles d’apprentissage capables de prédire les traits d’histoire de vie à partir de la structure des protéines ;
- L’identification de signatures moléculaires associées à la piézo-résistance ;
- L’intégration des avancées théoriques et logicielles dans l’environnement DeltaFold.

Contexte de travail

Le projet de thèse s’inscrit dans le cadre d’une approche interdisciplinaire permettant de modéliser et prédire les traits d’histoire de vie des organismes à partir des structures tridimensionnelles des protéines. Il est financé dans le cadre d’un projet de la Mission pour les Initiatives Transverses et Interdisciplinaires (MITI) du CNRS.

La thèse se déroulera au sein d’une équipe pluridisciplinaire sur le campus scientifique LyonTech-la Doua, à Lyon. Cette équipe regroupe des mathématiciens et des biologistes issus de trois laboratoires : l’Institut Camille Jordan (ICJ, UMR CNRS 5208, CNRS, Université Claude Bernard Lyon 1), le Laboratoire de Biométrie et Biologie Évolutive (LBBE, UMR CNRS 5558, CNRS, Université Claude Bernard Lyon 1, VetAgro Sup), et le Laboratoire de Microbiologie, Adaptation et Pathogénie (MAP, UMR CNRS 5240, CNRS, Université Claude Bernard Lyon 1, INSA Lyon).

La thèse s’inscrira dans le cadre du projet DeltaFold, qui vise à développer de nouveaux outils mathématiques , algorithmiques et logiciels combinant topologie, apprentissage automatique et biologie moléculaire, afin d’identifier les signatures structurales des protéines associées aux traits d’histoire de vie.

Les méthodes développées dans le cadre de la thèse seront implémentées dans la bibliothèque DeltaFold, développée en Python par une équipe interdisciplinaire de l’ICJ et du LBBE. Cette bibliothèque constitue un environnement de développement pour la programmation de modèles prédictifs en biologie évolutive, fondés sur des vectorisations des structures tridimensionnelles de protéines, via l’homologie persistante.

Les modèles prédictifs piézométriques seront validés par comparaison avec des résultats expérimentaux produits au sein du laboratoire MAP. Ces validations s’appuieront sur deux modèles procaryotes : les Thermococcales (81 espèces, chacune correspondant à environ 2 000 protéines, soit un jeu de données d’environ 162 000 protéines) et les Alteromonadales (1 000 espèces, chacune correspondant à environ 6 000 protéines) pour lesquels il conviendra de sélectionner un sous-ensemble réaliste centré sur les genres présentant des organismes piézophiles, Shewanella et Colwellia.

Contraintes et risques

Nous recherchons un candidat (H/F), disposant d’un solide dossier académique et titulaire d’un Master en mathématiques ou en bioinformatique. Une excellente formation théorique est indispensable. Une expérience préalable en analyse topologique des données (TDA), statistiques ou sciences des données constituera un atout apprécié.

Compétences / Qualifications.
- Master ou équivalent en mathématiques ou bioinformatique.
- Bonne maîtrise de l’anglais écrit et oral.
- Capacités organisationnelles et aptitude à s’investir dans un travail interdisciplinaire et collaboratif.
- Volonté de participer à des séminaires, ateliers et réunions scientifiques.

Les candidats (H/F) seront intégrés dans une équipe pluridiciplinaire. Le candidat (H/F) doit donc posséder d'excellentes compétences personnelles et être capable de travailler en équipe.

Une présélection sera réalisée sur la base du CV, de l’expérience, des compétences et de la lettre de motivation. Les candidats présélectionnés seront convoqués pour une audition devant un comité de sélection.

Les candidatures doivent comprendre les documents suivants :
- Un Curriculum Vitae complet,
- Une lettre de motivation (1 page), exposant les intérêts de recherche du candidat en lien avec le projet,
- Une ou deux lettres de recommandation,
- Les relevés de notes de Master (M1 et M2) ou équivalent, ainsi que tout certificat pertinent.