En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5001-ALEVIA-008 - Ingénieur de recherche en modélisation océanique hybride physique / IA (H/F)

Ingénieur de recherche en modélisation océanique hybride physique / IA (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : vendredi 31 mars 2023

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Intitulé de l'offre : Ingénieur de recherche en modélisation océanique hybride physique / IA (H/F)
Référence : UMR5001-ALEVIA-008
Nombre de Postes : 1
Lieu de travail : ST MARTIN D HERES
Date de publication : vendredi 10 mars 2023
Type de contrat : CDD Technique/Administratif
Durée du contrat : 18 mois
Date d'embauche prévue : 1 juin 2023
Quotité de travail : Temps complet
Rémunération : Entre 2583,56 et 2966,57 € bruts mensuels selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
BAP : Informatique, Statistiques et Calcul scientifique
Emploi type : Expert-e en calcul scientifique

Missions

La mission générale est de développer des stratégies de couplage pour interfacer des modèles de circulation océanique avec des composants entraînables basés sur l'IA. La personne sélectionnée contribuera aux projets MEDIATION et M2LINES.
La combinaison de l'apprentissage automatique avec le calcul scientifique est un domaine de recherche très actif qui devrait améliorer les modèles géoscientifiques et leur intégration dans des systèmes numériques plus larges, tels que les modèles climatiques et les systèmes de prévision opérationnelle. L'apprentissage automatique pourrait par exemple être utilisé pour améliorer la représentation des processus non résolus dans les modèles climatiques, pour accélérer l'exécution de composants de code spécifiques ou pour quantifier ou réduire les erreurs des modèles. Jusqu'à présent, la plupart des applications pratiques de l'apprentissage automatique aux modèles géoscientifiques sont basées sur des modèles d'apprentissage automatique pré-entraînés conçus via des tâches d'apprentissage supervisé formulées à partir de bases de données à haute résolution.

Une question pratique pour les modèles géoscientifiques est aujourd'hui de définir comment les composantes d'apprentissage automatique peuvent être encodées et maintenues dans les codes existants, écrits dans des langages d'abstraction de bas niveau (FORTRAN, C). Plusieurs options pratiques existent, chacune présentant des avantages et des inconvénients. Les réseaux neuronaux peuvent par exemple être directement implémentés en FORTRAN, mais on peut aussi utiliser les interfaces C/C++ de bibliothèques d'apprentissage automatique spécifiques ou des interfaces de couplage de haut niveau plus génériques. En fonction des cas d'usage, certaines stratégies sont privilégiées mais rares sont à ce jour les modèles géoscientifiques qui ont défini précisément leur stratégie d'interface IA.

Le modèle d'océan/glace de mer NEMO (https://www.nemo-ocean.eu) et le modèle d'océan CROCO (https://www.croco-ocean.org) sont deux outils importants pour la communauté océanographique, en particulier dans le contexte des systèmes de prévision opérationnels et des modèles européens du système terrestre. Leurs feuilles de route pour le développement impliquent la définition d'interfaces durables pour exploiter des composantes entraînables en cours de simulation. Un groupe de travail dédié aux développements liés à l'apprentissage automatique a ainsi été mis en place au sein de l'équipe de développement NEMO.

Activités

- Fournir des informations quantitatives et développer des solutions pratiques pour une mise en œuvre durable de composants entraînables dans les modèles océaniques NEMO et CROCO. Il s'agira de définir des cas d'utilisation de référence des composants basés sur l'apprentissage automatique dans les modèles océaniques. Ceux-ci seront basés par exemple sur les paramétrisations de sous-mailles déjà développées dans le cadre du projet M2LINES.
- Définir des métriques quantitatives permettant de comparer les différentes options disponibles pour le couplage de composants d'apprentissage basés sur l'IA et de modèles océaniques existants, et mettre en œuvre plusieurs options dans les modèles océaniques NEMO et CROCO. Les options possibles pourront inclure INFERO (https://github.com/ecmwf-projects/infero), ICCS Fortran ML Bridge (https://github.com/Cambridge-ICCS/fortran-ml-bridge), HPE SmartSim (https://github.com/CrayLabs/SmartSim), Melissa (https://gitlab.inria.fr/melissa) ou OASIS (https://oasis.cerfacs.fr/en/).
- Effectuer une intercomparaison systématique basée sur des simulations de modèles réalistes produites sur des ressources HPC.
- Rédiger des rapports sur les résultats et présenter les résultats de ses travaux aux réunions des groupes de travail et des projets concernés.
- Participerer aux discussions et réunions des projets M2LINES et MEDIATION.

Compétences

La personne sélectionnée sera titulaire d'un diplôme d'ingénieur ou d'un doctorat. La sélection sera basée sur les critères scientifiques et techniques suivants :
- expérience dans le domaine du calcul à haute performance ;
- expérience dans le codage Fortran/C/C++ et Python ;
- expérience pratique (d'au moins) l'une des principales bibliothèque d'apprentissage automatique (PyTorch, TensorFlow,... ) ;
- connaissance de base de la dynamique des fluides numérique et des fermetures de sous-grilles pour les flux de fluides ;
- expérience dans l'exécution de modèles atmosphériques, de circulation océanique ou de climat (non obligatoire) ;
- capacité à travailler en équipe.

Ce poste peut vous aider à construire un curriculum dans le domaine très actif de l'hybridation entre la simulation numérique et l'apprentissage profond (ML4Sci).

Contexte de travail

La personne sélectionnée travaillera à l'Institut des Géosciences de l'Environnement (IGE), à Grenoble. Il s'agit d'un institut de recherche public sous la tutelle du CNRS, de l'IRD, de l'Université Grenoble Alpes, de Grenoble-INP et de l'INRAE. Il rassemble environ 330 personnes, dont 190 membres permanents (chercheurs, enseignants-chercheurs, ingénieurs) et une centaine d'agents contractuels (doctorants, post-docs, ingénieurs et techniciens). L'institut accueille également chaque année plusieurs dizaines de stagiaires et de visiteurs scientifiques. Il est réparti sur trois sites du Campus universitaire de Grenoble distants de 5 minutes les uns des autres. L'IGE est l'un des principaux instituts de l'Observatoire des Sciences de l'Univers de Grenoble (OSUG) qui est une structure fédérative de l'INSU.

La personne sélectionnée rejoindra l'équipe MEOM, qui se concentre sur la modélisation et la prévision de l'océan et de la glace de mer (voir https://meom-group.github.io). Les activités seront supervisées par Julien Le Sommer et Aurélie Albert. Ce travail impliquera de fortes interactions avec les participants des projets M2LINES (https://m2lines.github.io) et MEDIATION. Les principaux collaborateurs seront Bruno Raffin (INRIA, équipe Data Move, https://www.inria.fr/fr/datamove) et les développeurs des modèles océaniques NEMO et CROCO.