General information
Offer title : Post-doctorant (H/F) en sciences des données - Machine learning pour l'identification des matériaux dans les manuscrits enluminés
Reference : UAR3224-ANNMIC-008
Number of position : 1
Workplace : PARIS 05
Date of publication : 11 November 2024
Type of Contract : Researcher in FTC
Contract Period : 12 months
Expected date of employment : 1 January 2025
Proportion of work : Full Time
Remuneration : Entre 3081 et 4757 euros bruts par mois
Desired level of education : Doctorate
Experience required : 1 to 4 years
Section(s) CN : 1 - Interactions, particles, nuclei, from laboratory to cosmos
Missions
Le but de ce projet est d'utiliser des algorithmes d'apprentissage automatique (ML) pour modéliser comment les spectres de réflectance de mélanges complexes de matériaux colorés provenant d'œuvres d'art historiques, en particulier des enluminures et/ou des lettres décorées de manuscrits anciens, dépendent de leur composition chimique. Couvrant une large gamme spectrale allant du visible (VIS) à l'infrarouge moyen (mid-IR) couplé à la spectroscopie de fluorescence X (XRF), une base de données spectrale de matériaux inorganiques et organiques de référence sera construite. Ensuite, un algorithme de ML supervisé sera entraîné sur la base de données, et le modèle de ML obtenu sera capable de prédire simultanément la composition de la couche colorée et l'abondance des matériaux présents dans le mélange. Par la suite, nous utiliserons le modèle de ML entraîné pour générer une plus grande variété de spectres de réflectance artificiels, élargissant ainsi l'ensemble des données existantes. Un deuxième modèle de ML sera alors entraîné sur l'ensemble des données étendues pour comprendre comment le spectre de réflectance est corrélé à la composition du mélange pictural. Ce deuxième modèle sera appliqué à l'analyse de manuscrits historiques. Le candidat développera une approche qui offrira une méthode efficace et générale pour la détermination sur site de la composition des enluminures historiques basée sur leur réponse spectrale.
Activities
• Réalisation de palettes de références pour les mélanges de matériaux colorés en acquisition des spectres de réflectance dans la gamme visible et proche infrarouge ainsi que des spectres XRF
• Augmentation des données: Au cours de ce processus, un modèle basé sur un réseau neuronal codeur-décodeur apprendra à générer des spectres synthétiques basés sur les concentrations de pigments. Il sera ensuite utilisé pour créer un ensemble de données artificielles qui complétera l'ensemble de données existant.
• Applications: le jeu de données créé combinant à la fois des spectres réels et artificiels sera utilisé pour entraîner un modèle de réseau neuronaux capable d'identifier les pigments dans des mélanges.
Ce modèle sera testé sur des jeux de données (imagerie hyperspectrale VIS, NIR et XRF) acquis sur des manuscrits médiévaux. Dans le cadre de projets antérieurs, le CRC a en effet étudié différents manuscrits pour lesquels plusieurs dizaines d’enluminures ou de lettres ornées ont été analysées. Ces données ont auparavant été traitées par des techniques de démélange spectral et pourront servir de comparaison pour le traitement par ces nouveaux modèles.
Skills
• Programmation en Python
• Connaissance des algorithmes d'apprentissage automatique (en particulier les réseaux neuronaux encodeurs-décodeurs et l'apprentissage par transfert seraient appréciés)
• Expertise en imagerie par réflectance et spectroscopie de fluorescence X (optionnel)
• Expérience avec les analyses de jeux de données multispectraux (optionnel)
Work Context
Le/la postdoctorant(e) travaillera essentiellement au CRC (Centre de Recherche sur la Conservation) sur le site du Museum National d'Histoire Naturelle, Paris 5ème ainsi qu'au Laboratoire de Chimie Physique – Matière et Rayonnement (LCPMR) à Sorbonne Université, Paris 5ème.
Il sera encadré par Tsveta Miteva, spécialiste en apprentissage automatique et en particulier en apprentissage profond ainsi qu'Emeline Pouyet et Anne Michelin, physico-chimiste, spécialiste en caractérisation des matériaux du patrimoine par des techniques non-invasives.