Informations générales
Intitulé de l'offre : IA en biologie H/F
Acronyme : Omik-IA
Référence : CPJ-2023-012
Nombre de Postes : 1
Site(s) concerné(s) : Montpellier
Région(s) académique(s) : Occitanie
Etablissement(s) partenaire(s) envisagé(s) : Université de Montpellier
Code(s) établissement(s) : UMR5004, UMR5506, UMR5535, UMR9002
Date de publication : jeudi 16 mars 2023
Type de contrat : Chaire de professeur Junior
Durée du contrat : 5 ans
Date d'embauche prévue : 1 juillet 2023
Quotité de travail : Temps complet
Rémunération : Rémunération brute annuelle de 54 600 Euros à 57 800 Euros selon l’expérience professionnelle
Thématique scientifique : Interface entre biologie et intelligence artificielle
Mots clés : Données de séquençage, génome, épigénome, intelligence artificielle, apprentissage automatique
Section(s) CN : Sciences de l'information : fondements de l'informatique, calculs, algorithmes, représentations, exploitations
Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Organisation, expression, évolution des génomes
Modélisation mathématique, informatique et physique pour les sciences du vivant
Profil Recherché
Titulaire d’un doctorat ou diplôme équivalent ou justifiant de titres et travaux scientifiques jugés équivalents par l’instance compétente de l’établissement. Il n’y a aucune condition d’âge ou de nationalité pour candidater. Tous les emplois CNRS sont accessibles aux personnes en situation de handicap en bénéficiant d’aménagement d’épreuves rendus nécessaires par la nature du handicap
Stratégie d'établissement
La multidisciplinarité est l’une des forces du CNRS, capable de mobiliser des chercheurs de haut niveau dans essentiellement tous les domaines de la science expérimentale moderne. Dans le projet proposer pour cette CPJ, il s’agit d’allier sciences biologiques, informatique et mathématiques afin de développer de nouvelles méthodes d’apprentissage automatique pour l’exploration des génomes et des épigénomes. Cette CPJ s’inscrit dans une série plus large d’au moins trois CPJ sur la période 2023 à 2027 visant à développer niveau national notre capacité à traiter des données hétérogènes et multi-échelle au travers d’une application aux données « omiques ». Le CNRS dans son COP promeut l’interdisciplinarité et cette CPJ s’inscrit dans cet objectif.
Stratégie du laboratoire d'accueil
Les unités de recherche concernées ont respectivement une solide expertise soit dans l’exploration des génomes, soit en apprentissage automatique. Il s’agit donc, au travers d’une CPJ d’amener ces laboratoires à travailler ensemble et ainsi améliorer notre savoir-faire dans le traitement de ce type de données. Il aura donc un rôle structurant. Par ailleurs, l’implémentation de cette CPJ aura également pour objectif de renforcer localement la recherche dans ce domaine.
Stratégie Internationale
Le CNRS accueille et recrute largement des chercheuses et chercheurs à l’international. Plus de 30% des personnes recrutées viennent de l’étranger. Ce recrutement aura cette même ambition.
Répertoire national des structures de recherche (RNSR) du laboratoire d'accueil
199111950H, 201722404H, 199111979P, 195817959H
Résumé du projet scientifique
Les technologies de séquençage à haut débit ont donné accès au matériel génétique de nombreux organismes modèles, mais ont aussi permis, pour ces organismes, de documenter à l’échelle du gène jusqu’au génome entier, l’activité de transcription, les sites régulateurs et leur activité, les modifications épigénétiques, les interactions 3D du génomes etc… Ces données biologiques dites « omiques » sont quantitatives mais hétérogènes et multi-échelles. Ainsi, cette masse de données, pour être transformée en informations pertinentes et en savoir, nécessite le développement de nouvelles méthodes en sciences informatiques et mathématiques. Dans ce domaine, les techniques d’apprentissage automatique sont bien adaptées aux gros volumes d’information mais sont encore largement sous-exploitées pour l’intégration des données multi-échelles. Il s’agit donc ici d’associer des centres d’excellence maitrisant respectivement les données omiques et les approches en apprentissage, afin de créer une synergie autour de méthodes innovantes pour l’analyse de données de séquençage de nouvelle génération.
Résumé du projet d'enseignement
Il s’agira de dispenser un enseignement à un public « expert », pour lequel les mathématiques et la biologie représente déjà un choix de cursus (niveau Master 1 ou 2). Dans un tel cadre, il s’agira d’approfondir les outils mathématiques et informatiques nécessaire à la mise en œuvre de techniques d’apprentissage automatique en permettant en parallèle aux étudiant de maitriser les techniques de raisonnement et les problématiques de la biologie.
Environnement Financier
- Total financé (dont package ANR) : 200 k€
- Total du projet : 200 k€
Diffusion scientifique
La diffusion des résultats passera par des productions scientifiques (publications, logiciels, patents…) de niveau mondial. Par ailleurs, le projet mettra en œuvre une communication vers des cibles diverses telles que communautés scientifiques, médias, décideurs, grand public, scolaires, etc., avec un calendrier adapté. Des outils spécifiques pourront être développés comme des sites web, des newsletters ou encore des rencontres, colloques internationaux, écoles d’été et conférences.
Science ouverte
Le CNRS développe une politique forte en faveur de la science ouverte. La science ouverte consiste à rendre « accessibles autant que possible et fermés autant que nécessaire » les résultats de la recherche. À ce titre, le CNRS vise à ce que 100 % des textes des publications issues des travaux de ses unités soient rendues accessibles, notamment grâce au dépôt dans HAL. Les données produites doivent aussi être rendues disponibles et réutilisables, sauf restriction particulière. Par ailleurs, les principes directeurs de l’évaluation individuelle sont revus en conformité avec la déclaration DORA, plus qualitatifs et tenant compte de toutes les facettes du métier de chercheur.
Science et société
La relation science-société est désormais reconnue comme une dimension à part entière de l'activité scientifique. Le projet développera cette dimension en synergie avec tous les partenaires. Les travaux de recherche qui en seront issus contribueront à éclairer la décision publique. Des initiatives de sciences participatives pourront être initiées avec des acteurs de l’écosystème socio-économique et culturel du projet.
Indicateurs
L’activité sera évaluée notamment sur la base de la production scientifique (publications, logiciels, patent, etc.), sur les partenariats institutionnels et privés formalisés par des contrats, sur le rayonnement international, sur la valorisation des travaux vers des communautés scientifiques pluridisciplinaires, sur l’innovation et son transfert vers la société et sur la diffusion scientifique à destination de publics non spécialistes.
Modalités d'organisation des auditions
Seul(e)s seront convoqué(e)s aux auditions les candidat(e)s sélectionné(e)s sur dossier par la commission de sélection