En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5217-BRURAF-001 - Ingénieur Informatique H/F calcul haute performance, analyse de données et apprentissage

Ingénieur Informatique H/F calcul haute performance, analyse de données et apprentissage


Date Limite Candidature : mardi 1 décembre 2020

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5217-BRURAF-001
Lieu de travail : GRENOBLE
Date de publication : mardi 10 novembre 2020
Type de contrat : CDD Technique/Administratif
Durée du contrat : 18 mois
Date d'embauche prévue : 1 janvier 2021
Quotité de travail : Temps complet
Rémunération : Entre 2088.66€ et 2206.09€ de salaire brut mensuel selon expérience
Niveau d'études souhaité : Bac+5
Expérience souhaitée : Indifférent

Missions

Avec la complexité croissante des codes de simulation numérique, de nouvelles approches sont nécessaires pour extraire de l'information pertinente de la masse de données gigantesque qu'ils génèrent. Des méthodes d'analyse de données avancées, et passant à l'échelle doivent être développées, testées et mises en oeuvre. Les techniques d'analyses statistiques avancées ou d'apprentissage par réseaux de neurones profond issues de l'intelligence artificielle seront tout particulièrement considérées. Cela nécessite de coupler des bibliothèques d'analyse de données à jour avec les codes existants de simulation numérique hautement optimisés dans le monde entier. La bibliothèque de couplage de codes PDI Data Interface a été conçue et sélectionnée dans le centre d'excellence européen EoCoE-II pour rendre cela possible pour 5 des principaux codes de simulation haute performance européens.
Dans ce cadre, vous intégrerez l'équipe de développement PDI et dirigerez l'intégration de PDI dans le code de physique des plasmas de Gysela. Vous travaillerez en étroite collaboration avec l'équipe de développement de Gysela, pour identifier les besoins et valider vos développements. Vous travaillerez avec l'équipe PDI pour introduire de nouvelles fonctionnalités dans PDI car elles sont requises pour ce cas d'utilisation spécifique. Pour valider vos développements, vous aurez accès aux meilleurs supercalculateurs européens et mondiaux, dont la machine japonaise Fugaku (machine la plus rapide du dernier top 500 mondial).

Activités

Dans un premier temps, vous acquerrez une expertise sur l'interface de la bibliothèque PDI et les internes en travaillant sur des cas d'utilisation simplifiés et sur de petites améliorations de bibliothèque. Une fois familiarisé avec la bibliothèque, vous passerez à son intégration dans le code Gysela.
Dans un second temps, vous intégrerez PDI dans le code Gysela. Vous en profiterez pour refactoriser le code et améliorer sa modularité. Vous utiliserez le plug-in PDI d'entrée / sortie de fichier HDF5 existant pour stocker les résultats du code sur le disque. L'objectif global de cette étape est de remplacer l'utilisation directe existante de HDF5 dans le code et d'améliorer sa modularité tout en conservant les fonctionnalités existantes.
Dans un troisième temps, vous utiliserez le plugin PDI Python (pycall) pour coupler directement Gysela avec les outils d'analyse de données Python existants. Cette approche doit prendre en charge l'exécution de l'analyse en python
directement à partir du code parallèle au lieu de s'appuyer sur une exécution séquentielle sur les fichiers générés après l'exécution du code.
Enfin, vous collaborerez avec l'équipe Gysela pour développer et intégrer de nouvelles analyses rendues possibles par cette approche. L'apprentissage automatique et l'analyse statistique actuellement impossibles à exécuter séquentiellement en raison de la taille des données et du temps d'exécution seront conçus pour s'exécuter en parallèle, directement intégrés dans le code. Vous apporterez votre expertise informatique à la conception de ces nouvelles analyses en collaboration avec des mathématiciens appliqués et des physiciens experts du domaine et vous intégrerez ces contributions dans le code.
Pour chaque étape, vous validerez vos développements sur des machines parallèles et des super-ordinateurs avant d'intégrer vos contributions à la branche principale du code utilisé en production par les physiciens.

Compétences

Le candidat justifiera d'au moins un master ou diplôme d'ingénieur en informatique et/ou mathématiques appliquées avec si possible une spécialisation ou expérience
en calcul scientifique et analyse de données. Une expérience dans le domaine de la recherche sera un plus indéniable.

Le candidat retenu maîtrisera les compétences et connaissances suivantes:
• travail en équipe et intégration dans une équipe internationale (interactions en anglais)
• capacités de management car vous aurez à gérer d'autres personnes, à coordonner des développements logiciels et des expérimentations.
• ingénierie logicielle et conception de bibliothèques,
• maîtrise du C ++ - 11+ et connaissance de Fortran,
• calcul parallèle (y compris la bibliothèque MPI).
De plus, les compétences et connaissances suivantes seront considérées comme un plus:
• compétences en analyse de données et apprentissage
• langages de programmation: C & Python,
• des bibliothèques d'analyse de données telles que Dask, Sensei, etc.
• bibliothèques d'apprentissage automatique et de réseaux neuronaux telles que scikit-learn, pytorch, tensorflow, etc. • bibliothèques d'E / S parallèles HPC telles que HDF5 ou NetCDF
• expérience avec les outils de création et de packaging de bibliothèques (CMake, spack, etc.).

Contexte de travail

Vous rejoindrez l'équipe Datamove du LIG (https://team.inria.fr/datamove/) et vous serez impliquerez dans tous les aspects de la vie d'équipe. Pour les expérimentations, vous aurez accès à différents supercalculateurs français, européens et japonais. Vous travaillerez activement avec d'autres équipes distantes: l'équipe PDI de la Maison de la Simulation et PSNC, l'équipe Gysela du CEA et potentiellement d'autres partenaires du projet EoCoe-II. Vous devrez probablement vous déplacer pour des rencontres en face à face, principalement en France et en Europe, dans la limite de ce que permettra la situation sanitaire.

Contraintes et risques

Pas de contraintes ou risques spécifiques.

Informations complémentaires

Projet Européen EoCOe-II: https://www.eocoe.eu

On en parle sur Twitter !