Informations générales
Intitulé de l'offre : H/F Ingénieur en bio-informatique et intelligence artificielle pour la biologie numérique
Référence : IRL2820-ERILEC-003
Nombre de Postes : 1
Lieu de travail :
Date de publication : mercredi 7 mai 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 20 mois
Date d'embauche prévue : 1 octobre 2025
Quotité de travail : Complet
Rémunération : Entre 2800 et 3300 euros bruts mensuels selon expérience
Niveau d'études souhaité : BAC+5
Expérience souhaitée : Indifférent
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Ingénieur-e en calcul scientifique
Missions
L'Ingénieur de recherche aura la responsabilité de construire un nouveau plateau technologique qui regroupera un ensemble de technologie numériques en lien avec la biologie numérique pour la réalisation des opérations nécessaires aux modélisations et aux simulations. Le contexte d'étude sera les pathologies métaboliques. La responsabilité couvre le maintien opérationnel du parc des outils numériques et logiciels, la formation des utilisateurs (ingénieurs et techniciens, étudiants) et l'évolution des technologies et des procédés. Cette mission intègre aussi une mise en place d'outils d'intelligence artificielle, de bio-informatique nécessaire à l'aide des phases de fouilles de données, d'optimisation des modèles, d'extrapolation et de prédiction afin d'extraire les marqueurs d'intérêt.
Activités
Les activités correspondent à l'entièreté de la mission de la responsabilité opérationnelle d'une plateforme de biologie numérique, de soutien aux équipes pour une recherche pluridisciplinaire biomédicale contre les maladies métaboliques (laboratoire du Prof Sakai, équipe projet international, EPI-TEAMS, entre le LIMMS et BMBI).
Les activités consisteront à:
- Collecter, ordonner et traiter les données issues de la littérature, de bases de données et d'études expérimentales
- Mettre en place des algorithmes d'apprentissage et de classifications des données collectées a base d'intelligence artificielle
- Collecter, nettoyer et mettre à jour des modèles mathématique de biologie systémique en lien avec les équipes de recherche (par exemple métabolisme, pathologie hépatique, etc…)
- Développer de nouveaux modèles intégratifs à des fins de prédiction
- Développer des simulateurs en C++/CUDA pour la résolution d'équations différentielles décrivant les dynamiques multi-espèces (e.g., ROS, TNFa, LPO, etc.).
- Créer des interfaces graphiques interactives (GUI) en Python (CustomTkinter, Plotly) pour le suivi et la visualisation 3D temps-réel des données simulées.
- Intégrer des méthodes d'intelligence artificielle, notamment machine learning supervisé (classification, régression) et deep learning (réseaux de neurones avec TensorFlow et PyTorch) pour la prédiction de l'évolution de biomarqueurs et l'optimisation de traitements numériques.
- Mettre en place un pipeline complet de simulation → visualisation → interprétation pour faciliter la recherche translationnelle.
- Déployer des outils compatibles Linux/Unix, et intégrer dans un environnement scientifique distribué.
- Identifier les outils de biologie numérique, pour le stockage (base de données) et le traitement des données (méthodes statistiques), les mieux adaptés afin de répondre à la problématique posée.
- Traiter et analyser des données avec les outils appropriés utilisés en biologie et toxicologie systémiques (réseaux biologiques), données cliniques (images, dosages etc…), et des données de types omiques (métabolomique, transcriptomique, protéomique, épigénétique, etc…).
- Adapter les outils informatiques aux modèles de biologie numérique (comme des modèles de flux métaboliques-MFA, des modèles pharmacocinétiques de type PK-PD, PBPK, des modèles biologie systémique basé sur la résolution d'équations différentielles et d'optimisation de paramètres), tout en utilisant les nouveaux outils d'analyse de données adaptés selon les besoins, en utilisant des langages de programmation comme R et Python.
- S'informer des progrès scientifiques et technologiques en biologie numérique
- Participer à des réunions et valoriser les résultats d'analyses et le développement de modèles (rapports, publications, présentations)
- Interagir avec les équipes de l'unité et participer à des réunions scientifiques
- Conseiller et orienter les nouveaux arrivant accueillis dans le groupe.
- Assurer et organiser la veille scientifique et technologique, diffuser l'information des nouveaux outils au sein du groupe.
Ces technologies devront être développées localement au LIMMS à Tokyo en lien avec les chercheurs du LIMMS et du laboratoire du Prof Sakai .
Compétences
- Grande maîtrise de la programmation scientifique, en particulier en Python, C++ et CUDA pour le calcul parallèle sur GPU.
- Expertise en intelligence artificielle, incluant machine learning et deep learning, avec une utilisation concrète de PyTorch, TensorFlow et TensorBoard.
- Développement d’interfaces graphiques pour la visualisation scientifique interactive (CustomTkinter, Plotly, 3D sliders pour le suivi spatio-temporel des simulations).
- Capacité à travailler sur des projets interdisciplinaires impliquant la simulation numérique, la visualisation 3D et l’analyse IA.
- En modélisation, biologie numérique et bio-informatique.
- Technologie omique
- Connaissance générale en biologie, biochimie, métabolisme
La personne recrutée doit savoir
- Installer les outils nécessaires sur les machines de calcul
- Programmer
- Maitriser les outils/logiciels nécessaires à la biologie numérique
- S’adapter aux besoins spécifiques des projets de recherche
- Savoir réaliser une analyse d’étude (fouille de données, préparation et intégration des données, analyses statistiques, interprétation, rapport des résultats et échange avec les autres chercheurs non bio-informaticiens)
Motivation pour un travail en équipe, organisation et communication d’information. Contact avec les fournisseurs, prestataires ou collègues extérieurs.
Envie de travailler au Japon dans un contexte internationale
Langues : Français et Anglais: oral et écrit maîtrisés.
Contexte de travail
Ce poste correspond à une nécessité d’évolution des métiers du LIMMS et a une nécessité d’accompagnement des chercheurs dans le domaine des progrès du digital et des jumeaux numériques, ainsi que des technologiques numériques associes. Il s’agit d’une action mise en œuvre dans le cadre de l’ANR Track NAFLD.
Ce poste est au sein du laboratoire LIMMS, Laboratoire de Recherche International (IRL) entre le CNRS (Institut des sciences et de l'ingénierie des systèmes) et l’Université de Tokyo (Institut des sciences industrielles) dont la localisation principale est à Tokyo.
Depuis 2016, Le LIMMS, via le PIA iLite (E Leclerc, Y Sakai, T Fujii) et le Kakenhi B JSPS liver on chip (E Leclerc, Y Sakai), le PEPR Medoc (2024-2030, Sakai, Nishikawa, Leclerc) a établi une politique d’analyse multi-omique, en lien avec le SH Kim lab (S. Poulain), des données biologiques issues des organes sur puces, et des technologies d’organoïdes (de tissus hépatiques, pancréatiques, vasculaire etc…) dans le cadre des études de compréhension des pathologies métaboliques comme le diabète, la stéatose du foie, les inflammations cardio vasculaire etc…. Ainsi, plus de 200 séquençages cellulaires (RNA sequencing, transcriptomiques), plus de 15 000 séquençages sur cellules unique (ScRNA sequencing), plus de 1000 profiles métaboliques (métabolomiques) et 40 profiles protéiques (label free proteomic) ont été obtenus. Ces études in vitro se couplent avec l’intégration de données cliniques (cohortes du Prof Voican) afin de valider la prédictivité des modèles dans le cadre du PEPR Medoc. Des discussions sont actuellement en cours pour étendre les collectes cliniques avec les Prof Duclos Vallée (Centre Hépatobiliaire de Paul Brousse) mais aussi l’hôpital Toranomon de Tokyo (Prof Shindoh). De plus, dans l’ANR Track NAFLD (2024-2028, Sakai, Nishikawa, Leclerc), ces données in vitro et in vivo sont utilisées pour la construction de jumeaux numériques et la construction d’outils de prédiction numériques (en utilisant de l’optimisation Bayésienne, de l’intelligence artificielle).
Enfin, depuis 2019, le laboratoire du Prof Sakai a promu l’intégration des différentes sources de données dans des modèles mathématiques prédictifs afin d’extrapoler les résultats expérimentaux et de proposer des prédictions chez l’homme (maladie du foie, couplage métabolique et pharmacocinétique). Cela se traduit par le recrutement d’un nouveau professeur associé, le professeur Nishikawa, et la construction d’une équipe de modélisation comprenant à ce jour près de 10 étudiants. Le but de cette équipe, travaillant en lien avec E Leclerc, est de :
- Reproduire des jumeaux numériques de cellules, tissus, organes et patients spécifiques
- Prévoir et évaluer le niveau de toxicité des médicaments, de produits chimiques, des polluants et, d'une manière générale, de tous les agents qui agressent un organisme humain
- Proposer des alternatives à l'expérimentation animale in vivo
Il s’agit donc d’une action stratégique de long terme.
Contraintes et risques
- risques géologiques du Japon
- risques de travail sur machine et ordinateur