En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Ingénieur (H/F). Développement d’un code de deep learning pour une cartographie à haute résolution des variables biophysiques des forêts


Date Limite Candidature : samedi 26 juillet 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Ingénieur (H/F). Développement d’un code de deep learning pour une cartographie à haute résolution des variables biophysiques des forêts
Référence : UMR8212-FATHAN-001
Nombre de Postes : 1
Lieu de travail : ST AUBIN
Date de publication : samedi 5 juillet 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 23 mois
Date d'embauche prévue : 1 septembre 2025
Quotité de travail : Complet
Rémunération : Entre 3237,95€ et 3505,53€ brut mensuel selon expérience
Niveau d'études souhaité : BAC+5
Expérience souhaitée : 1 à 4 années
BAP : A - Sciences du vivant, de la terre et de l'environnement
Emploi type : Ingenieure ou ingenieur de recherche en environnements geo-naturels et anthropises

Missions

Nous recherchons un ingénieur de recherche créatif pour rejoindre l'équipe du LSCE-CNRS qui développe des méthodes avancées de suivi des forêts avec des données d’images satellites et des modèles de deep learning qui sont basés sur de très gros volumes de données. Depuis plus de trois ans, le groupe a développé de nouveaux modèles de fusion de données de télédétection spatiale optique, radar et LiDAR pour permettre un suivi des paramètres biophysiques des forêts dans le monde à haute résolution spatiale et temporelle [1,2]. Nous pouvons désormais faire fonctionner avec succès des modèles pour cartographier la hauteur et la biomasse des forêts. Nos travaux récents ont montré que des cartes précises de ces paramètres apportent des informations cruciales pour mesurer la croissance et la mortalité, et les changements de stocks de carbone des arbres. Nous souhaitons poursuivre ces développements et améliorer fortement les codes de recherche existants afin de disposer de modèles utilisable par tous les membres de l’équipe et des collaborateurs extérieurs pour le pré-traitement des données brutes à partir de plateformes comme Google Earth Engine, et l’apprentissage et validation de modèles de deep learning d’architectures différentes (Unet, Vision Transformers, Modèles de Fondation)

Une partie des tâches du candidat retenu consistera à accompagner les développeurs des éléments logiciels GEEFetch et SPOUT au LSCE sur le serveur national Jean Zay qui dispose de nombreux GPU et stockage, pour y intégrer de nouvelles fonctions comme l’intégration de données de nouveaux capteurs spatiaux ALOS PALSAR, BIOMASS et NISAR. Le candidat participera à l’avancée des connaissances en améliorant les taches de pre-processing et d’optimisation de stockage des données ( jusqu’à 2 PB) et participera à des Hackatons organisés par Jean Zay et NVIDIA pur optimiser notre stack de développement sur des GPU récents en travaillant notamment sur des méthodes avancées de compression de données pour réduire la mémoire utilisées et le stockage des images à très haute résolution spatiale.

Le candidat retenu contribuera aussi à l’optimisation des codes de deep learning et au support des membres de l’équipe qui l’utilisent. Il sera associé et contribuera à des publications de recherche pour des conférences de Machine Learning ICML, NEURILPS. Co-supervision de stagiaires est envisagée

[1] Fayad, I., Ciais, P., Schwartz, M., Wigneron, J.P., Baghdadi, N., de Truchis, A., d’Aspremont, A., Frappart, F., Saatchi, S., Pellissier-Tanon, A., Bazzi, H., 2023. Vision Transformers, a new approach for high-resolution an of canopy heights. URL: http://arxi664v.org/abs/2304.11487, doi:10.48550/arXiv.2304.11487. arXiv:2304.11487 [cs, eess].

[2] Schwartz, M., Ciais, P., De Truchis, A., Chave, J., Ottlé, C., Vega, C., Wigneron, J.-P., Nicolas, M., Jouaber, S., Liu, S., Brandt, M., and Fayad, I.: FORMS: Forest Multiple Source height, wood volume, and biomass maps in France at 10 to 30 m resolution based on Sentinel-1, Sentinel-2, and Global Ecosystem Dynamics Investigation (GEDI) data with a deep learning approach, Earth Syst. Sci. Data, 15, 4927–4945, https://doi.org/10.5194/essd-15-4927-2023, 2023.

Activités

Les principales activités seront les suivantes:
• Concevoir et encadrer le développement de chaînes de traitement basées sur le deep learning pour la cartographie des forêts à partir d’images satellitaires multi-capteurs (optique, radar, LiDAR) ;
• Piloter l’intégration de nouveaux capteurs spatiaux (ex. ALOS PALSAR, BIOMASS, NISAR) dans les pipelines existants, en étroite collaboration avec les chercheurs et partenaires techniques ;
• Définir et mettre en œuvre des protocoles de validation et d’évaluation des modèles développés sur des bases de données de référence, en lien avec les objectifs scientifiques du laboratoire ;
• Superviser le déploiement des outils sur des plateformes de calcul intensif (HPC) comme Jean Zay, en optimisant les performances (temps de calcul, mémoire, parallélisation) ;
• Coordonner le travail d’ingénierie logicielle autour des outils GEEFetch et SPROUT, en garantissant leur robustesse, leur documentation et leur maintenance dans le temps ;
• Assurer une veille scientifique et technologique dans les domaines du deep learning appliqué à la télédétection et participer à la diffusion des résultats (publications, communications, outils partagés) ;
• Accompagner les utilisateurs internes et externes dans l’appropriation des outils développés (supports, formations, rédaction de guides).

Compétences

• Expertise en développement d’algorithmes de deep learning, appliqués à l’analyse de données d’observation de la Terre : architectures de type Unet, Vision Transformers, ou modèles fondation (foundation models) ;
• Très bonne maîtrise du langage Python, ainsi que des principales bibliothèques de calcul scientifique et de machine learning (PyTorch, NumPy, scikit-learn, etc.) ;
• Solide connaissance en télédétection spatiale, notamment des données optiques, radar et LiDAR, et de leur prétraitement pour des applications biophysiques (hauteur, biomasse, etc.) ;
• Capacité à concevoir, organiser et structurer des chaînes de traitement complexes, de l’acquisition des données à la production de cartes validées ;
• Expérience du calcul haute performance (HPC), du déploiement de pipelines sur des infrastructures de type Jean Zay (cluster GPU), et de l’optimisation des performances ;
• Compétence en gestion de projets ou de lots techniques, incluant le suivi de planning, la coordination d’équipe technique, la rédaction de documentation technique claire et durable ;
• Capacité à collaborer avec des équipes pluridisciplinaires et internationales, et à interagir avec des partenaires extérieurs (CNES, INRAE, universités, etc.) ;
• Maîtrise de l’anglais scientifique, à l’oral comme à l’écrit, pour interagir avec les partenaires et contribuer à des publications ou présentations ;
• Sens de l’autonomie, de la rigueur scientifique, de l’organisation et goût pour le travail en équipe.

Contexte de travail

Le LSCE CNRS est un laboratoire reconnu internationalement dans les études du climat et de traitement des données spatiales, ainsi que dans les développements méthodologiques. Le laboratoire a de nombreuses collaborations internationales et travaille sur projet avec le CNES qui apporte le financement via le CNRS.
Les développements de modèles seront réalisée le serveur Jean Zay avec la possibilité d’un portage sur d’autres plateformes. Les codes GEEFetch et SPROUT sont développés en Python (PYTORCH). Une équipe de dix personnes utilise ces codes.