Thèse de doctorat H/F : Jumeaux numériques patrimoniaux et IA générative : nouvelles architectures pour les industries culturelles et créatives

Nouveau

Laboratoire des sciences du numérique à Nantes

NANTES • Loire-Atlantique

  • CDD Doctorant
  • 36 mois
  • Doctorat

This offer is available in English version

Cette offre est ouverte aux personnes disposant d’un titre leur reconnaissant la qualité de travailleur handicapé ou travailleuse handicapée.

L'offre en un coup d'oeil

L'unité

Laboratoire des sciences du numérique à Nantes

Type de Contrat

CDD Doctorant

Temps de Travail

Complet

Lieu de Travail

44321 NANTES

Durée du contrat

36 mois

Date d'Embauche

01/09/2026

Rémuneration

La rémunération est de 2300,00 € brut mensuel

Postuler Date limite de candidature : mardi 14 juillet 2026 23:59

Description du Poste

Sujet De Thèse

1. Contexte des travaux de recherche
Les industries culturelles et créatives (ICC) sont aujourd’hui profondément transformées par l’essor de l’intelligence artificielle générative, de la numérisation 3D et des environnements immersifs (XR). Ces technologies permettent de nouveaux modes de production culturelle (reconstitution patrimoniale, narration interactive, muséographie numérique, création de contenus 3D), mais soulèvent également des défis scientifiques et sociétaux majeurs : fiabilité des reconstructions, traçabilité des sources, transparence des traitements algorithmiques, et gestion des biais.
Dans le domaine du patrimoine culturel, la démocratisation rapide des générateurs d’images et de contenus 3D entraîne une circulation massive de reconstitutions « séduisantes » mais non justifiées voir difficilement justifiables scientifiquement, reposant sur des corpus d’entraînement opaques et non maîtrisés. Cette situation est particulièrement problématique pour les ICC : musées, institutions patrimoniales, entreprise de production de contenus virtuels et/ou immersifs voir même les collectivités territoriales doivent désormais arbitrer entre des productions visuelles attractives et la nécessité de garantir une rigueur scientifique et une éthique de diffusion. Avec la démocratisation massive des outils d’IAG (chatbots, générateurs d’images et de vidéos), la thèse contribue également à répondre à des enjeux de déontologie, de responsabilité scientifique et de lutte contre la désinformation visuelle, en proposant des méthodes de production de contenus culturels fondées sur la traçabilité des sources, l’explicitation des hypothèses et la représentation de l’incertitude.
Dans ce contexte, le laboratoire des Sciences du Numérique de Nantes (LS2N, UMR CNRS 6004), et plus particulièrement l’équipe CPS3, développe depuis plusieurs années des travaux avancés en patrimoine numérique et muséographie immersive, combinant numérisation 3D, gestion des connaissances, CAO, réalité virtuelle, archivage et dispositifs de médiation (web, musées...). Ces compétences ont été renforcées récemment par le projet interdisciplinaire PIONNIER, visant à étudier comment l’IA et la XR peuvent enrichir les recherches en sciences humaines et sociales et renouveler les méthodes de reconstitution patrimoniale à travers un cas d’étude mené en collaboration avec un laboratoire de Sciences Humaines et Sociales spécialisés en Archéologie (CReAAH-LARA ).
Une phase exploratoire financée en 2025 a permis de valider la faisabilité d’un pipeline complet combinant base patrimoniale structurée par ontologie (CIDOC-CRM) , annotation human-in-the-loop, fine-tuning de modèles génératifs et protocole d’évaluation expert intégrant des premières expérimentations de RLHF appliquées à l’image. Ces travaux ont déjà donné lieu à des communications nationales et internationales, notamment lors de la conférence internationale Digital Heritage en septembre 2025 en Italie .

Ces travaux ont entre autres été présentés lors de la journée d'accélération de l'ICCARE-LAB en collaboration avec le GdR IASIS sur le thème « IA et Patrimoine » en novembre 2025 .
La thèse proposée s’inscrit dans la continuité directe de ces résultats, avec un objectif de montée en maturité scientifique : dépasser le stade expérimental pour produire une méthodologie reproductible, généralisable et interopérable, au service des ICC.

2. Objectif et problématique scientifiques
Les ICC ont besoin d’outils capables de produire des reconstructions numériques et des contenus immersifs à la fois plausibles, explicitables et scientifiquement évaluables. Ces outils doivent en outre garantir la traçabilité des sources et des hypothèses, ainsi que l’interopérabilité des résultats avec les infrastructures nationales, européennes et internationales.
Or, les modèles génératifs actuels fonctionnent majoritairement comme des boîtes noires : ils génèrent des images ou des environnements sans capacité à justifier les choix, ni à intégrer les contraintes épistémologiques propres aux sciences humaines. Cette limitation freine leur adoption institutionnelle par les experts et leur intégration durable dans les chaînes de production des ICC (par exemple pour les musées, l'édition, l'audiovisuel, la XR ou toute autre forme de médiation patrimoniale).
L’objectif de la thèse proposée consiste donc à concevoir une architecture scientifique hybride combinant IA générative, ontologies patrimoniales, apprentissage par renforcement et modélisation probabiliste, afin de formaliser le raisonnement historico-archéologique permettant de produire des jumeaux numériques patrimoniaux exploitables dans les ICC.
La problématique scientifique qui en découle : peut-on formaliser l’expertise historienne et archéologique sous forme de signaux computationnels (ontologies formelles, règles probabilistes, modèles de récompense et signaux d’apprentissage humain) afin d’entraîner une IA générative capable de produire des reconstructions patrimoniales évaluables, explicables et directement intégrables dans les chaînes de valeur des ICC ?
Les objectifs scientifiques sont structurés en quatre verrous :
1. Formaliser le raisonnement de restitution patrimoniale (comparatisme, chaînes d’indices, hiérarchisation des sources) sous forme de modèles computationnels.
2. Développer des modèles génératifs contrôlés capables d’intégrer des contraintes spatiales, iconographiques et matérielles issues d’ontologies standards du patrimoine et de données 3D.
3. Définir un protocole d’évaluation et de quantification de l’incertitude, afin de produire des résultats probabilistes et non des « vérités visuelles ».
4. Proposer une interopérabilité ICC/Huma-Num, en garantissant des données FAIR , traçables et réutilisables dans des pipelines muséographiques et créatifs.

3. État de l’art et fondements théoriques
Les travaux récents sur l’IA générative (modèles de diffusion, LoRA, ControlNet) ont démontré une capacité à produire des contenus visuels de haute qualité. Cependant, dans les applications patrimoniales, ces approches souffrent d’un manque de contrôle scientifique, entraînant hallucinations, anachronismes et biais médiévalistes.
Parallèlement, les ontologies patrimoniales internationales reconnues (CIDOC- CRM, Dublin Core) constituent un socle reconnu pour structurer les sources, mais elles restent encore peu exploitées comme outils actifs d’apprentissage et de pilotage des modèles génératifs.
Enfin, les méthodes RLHF (Reinforcement Learning from Human Feedback) ont connu un essor considérable dans le domaine des modèles de langage, mais demeurent encore exploratoires pour les modèles de diffusion, notamment dans des contextes patrimoniaux où les critères d’évaluation sont fortement dépendants de l’expertise historienne.
Le principal manque identifié est donc l’absence d’une approche intégrée associant :
• IA générative contrôlée,
• raisonnement ontologique,
• scoring par les experts,
• incertitude probabiliste,
• utilisation/vérification des résultats en immersion.
Au-delà de ce constat, la thèse s’inscrit dans un cadre théorique structurant articulé autour de deux volets complémentaires, relevant respectivement des sciences du numérique et des sciences humaines et sociales. Cette double assise conceptuelle vise précisément à dépasser une simple juxtaposition disciplinaire : l’objectif est de produire une démarche intégrée où les méthodes computationnelles deviennent capables de formaliser des raisonnements propres aux pratiques de l’historien et de l’archéologue.
Le premier volet, en sciences du numérique, mobilise l’ingénierie des connaissances (ontologies et graphes sémantiques) afin de structurer les données patrimoniales et de modéliser des chaînes de preuve, en s’appuyant sur des standards tels que CIDOC-CRM. Il s’appuie également sur les modèles génératifs par diffusion et les techniques de fine-tuning léger (LoRA/DoRA) pour adapter des architectures de fondation à des corpus spécialisés. Dans ce cadre, l’apprentissage par renforcement (RLHF) et les modèles de récompense multimodaux constituent une contribution centrale : ils permettent d’intégrer explicitement le retour expert dans la boucle d’optimisation et de transformer l’évaluation humaine en signal d’apprentissage. Enfin, la modélisation probabiliste et la quantification de l’incertitude fournissent un cadre mathématique permettant de qualifier le degré de confiance associé aux hypothèses générées et de dépasser la logique de production d’images « plausibles » au profit de résultats évaluables et interprétables.
Le second volet, en sciences humaines et sociales, s’inscrit dans les champs de l’histoire, de l’histoire de l’art et de l’archéologie du bâti, en considérant que la restitution patrimoniale est avant tout un processus de construction critique d’hypothèses fondé sur l’analyse de sources primaires et secondaires. La thèse vise ainsi à faire progresser les travaux en histoire et en archéologie en proposant de nouveaux instruments d’exploration et de validation des hypothèses, notamment par la formalisation des raisonnements comparatistes, l’explicitation des biais des sources, et la mise en visibilité des incertitudes. Les environnements immersifs et le concept de jumeau numérique développé par l’équipe de recherche du LS2N deviennent alors des outils de recherche à part entière, permettant la confrontation directe entre traces, archives, hypothèses successives et interprétations scientifiques.
Cette articulation entre les deux volets fonde le caractère profondément interdisciplinaire de la thèse : l’enjeu n’est pas seulement d’appliquer des outils d’IA au patrimoine, mais de produire un cadre où les exigences scientifiques des SHS (preuve, interprétation, critique des sources) deviennent des contraintes formalisées et calculables, capables d’orienter les modèles numériques et de renouveler les pratiques de recherche au service des ICC.

4. Plan de travail et méthodologie
Le plan de travail envisagé s’inscrit dans la continuité directe des premières expérimentations menées en 2025. Celles-ci ont permis de valider la faisabilité du pipeline, la thèse ambitionne désormais de transformer ce prototype expérimental en une architecture scientifique formalisée, robuste et généralisable.
Dans un premier temps, le doctorant consolidera et étendra la structuration des données patrimoniales en développant une ontologie opérationnelle orientée vers le raisonnement de restitution, en veillant à inscrire cette base de connaissances dans l’écosystème de l’infrastructure nationale IR* Huma-Num et de ses consortiums, notamment 3D HN . Il s’agira non seulement d’enrichir les corpus multimodaux existants (archives textuelles, iconographiques, relevés et scans 3D), mais surtout de formaliser les chaînes de preuve, les relations de dépendance et les hiérarchies d’indices mobilisées par les historiens et archéologues. Cette étape vise à transformer une base documentaire descriptive en un véritable modèle de connaissances exploitable computationnellement.
Dans un second temps, les travaux porteront sur le développement d’une IA générative contrôlée capable d’intégrer ces contraintes ontologiques et géométriques. Les modèles de diffusion seront adaptés par fine-tuning léger (LoRA/DoRA) sur des corpus spécialisés, tandis que les contraintes spatiales issues des plans, relevés ou depth maps seront intégrées afin d’assurer la cohérence architecturale. L’enjeu sera d’articuler génération 2D et production de modèles 3D exploitables, en maintenant un lien explicite entre hypothèses visuelles et sources documentaires.
Une troisième phase consistera à formaliser un protocole de scoring scientifique intégrant explicitement le retour expert dans la boucle d’apprentissage. Sur la base de critères historiographiques (iconographie, cohérence stylistique, matérialité, plausibilité architecturale), un modèle de récompense multimodal sera développé afin d’implémenter une stratégie de type RLHF appliquée aux modèles de diffusion. L’objectif est de transformer l’évaluation humaine en signal d’optimisation mesurable et reproductible.
Parallèlement, une attention particulière sera portée à la quantification de l’incertitude et à l’explicabilité des résultats. Des approches probabilistes permettront d’associer à chaque hypothèse générée un degré de confiance, rendant visible la distinction entre reconstruction fortement étayée et proposition spéculative. Cette dimension est essentielle pour éviter toute interprétation déterministe des images produites et garantir leur usage responsable par les ICC.
Enfin, les résultats produits seront intégrés dans un jumeau numérique immersif permettant la mise en situation et la validation des hypothèses en environnement XR. Ce dispositif constituera à la fois un outil de recherche pour les historiens / archéologues et un démonstrateur destiné aux ICC, illustrant la capacité du cadre développé à s’insérer dans des chaînes de production muséographiques et immersives.

Votre Environnement de Travail

Le projet doctoral proposé s’inscrit pleinement dans la stratégie du PEPR ICCARE visant à structurer une recherche ambitieuse au service de la transformation numérique des ICC. Il contribue aux objectifs de souveraineté technologique, d’innovation méthodologique et de structuration des écosystèmes ICC en proposant un cadre scientifique permettant de maîtriser les usages de l’IAG dans la production culturelle et patrimoniale.
En développant des architectures hybrides associant ontologies, modèles génératifs, apprentissage par renforcement et quantification de l’incertitude, la thèse répond aux enjeux identifiés par ICCARE en matière de fiabilité, traçabilité et interopérabilité des contenus numériques. Elle contribue ainsi aux problématiques structurantes du programme, notamment celles portées par le projet Harmonie, en proposant des outils méthodologiques permettant d’articuler production de contenus culturels, données structurées et infrastructures nationales.
À ce titre, le projet participe à la structuration durable de la filière immersive en apportant des méthodes reproductibles susceptibles d’être appropriées par les acteurs économiques, tout en consolidant l’ancrage territorial et national de la recherche à travers les partenariats engagés.
Ce programme de recherche s’inscrit par ailleurs dans les projets stratégiques portés par la Maison des Sciences de l’Homme Ange Guépin de la région Pays de la Loire, dans le cadre de l’axe « Société et numérique », confirmant son rôle structurant à l’interface entre sciences du numérique, sciences humaines et industries culturelles et créatives.

Contraintes et risques

sans

Rémunération et avantages

Rémunération

La rémunération est de 2300,00 € brut mensuel

Congés et RTT annuels

44 jours

Pratique et Indemnisation du TT

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

À propos de l’offre

Référence de l’offre UMR6004-FLOLAR-001
Section(s) CN / Domaine de recherche Sciences et données
Expérience souhaitée 1 à 4 années

À propos du CNRS

Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.

Le CNRS

Les métiers de la recherche

Créer une alerte

Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.

Créer une alerte

Thèse de doctorat H/F : Jumeaux numériques patrimoniaux et IA générative : nouvelles architectures pour les industries culturelles et créatives

CDD Doctorant • 36 mois • Doctorat • NANTES

Ces offres pourraient aussi vous intéresser !

    Toutes les offres