Doctorant en Informatique (H/F) – Extraction, structuration et intégration de données hétérogènes pour la formulation de géopolymères
- CDD Doctorant
- 36 mois
- Doctorat
L'offre en un coup d'oeil
L'unité
Laboratoire d'informatique en image et systèmes d'information
Type de Contrat
CDD Doctorant
Temps de Travail
Complet
Lieu de Travail
VILLEURBANNE ()
Durée du contrat
36 mois
Date d'Embauche
01/06/2026
Rémuneration
La rémunération est d'un minimum de 2300,00 € mensuel
Postuler Date limite de candidature : mercredi 4 mars 2026 23:59
Description du Poste
Sujet De Thèse
La formulation de géopolymères bas-carbone à partir de déchets de chantier nécessite l’exploitation conjointe de nombreuses informations relatives aux propriétés des matières premières, des mélanges et des paramètres de fabrication. Ces informations sont aujourd’hui dispersées dans des sources de données hétérogènes, telles que la littérature scientifique, des rapports techniques au format PDF, des graphiques et des tableaux issus de partenaires industriels et de laboratoires de recherche, limitant leur exploitation systématique.
Cette thèse vise à développer des méthodes pour l’extraction, la structuration et l’intégration de ces données afin de construire une base de connaissances unifiée permettant de guider la synthèse des géopolymères et d’éviter des formulations non performantes. Les travaux s’appuieront sur des techniques d’OCR, de parsing de tableaux et sur des approches basées sur les Large Language Models (LLM) et le Retrieval-Augmented Generation (RAG) pour extraire et structurer l’information à partir de documents hétérogènes, tout en assurant la traçabilité vers les sources originales.
Les données extraites seront organisées au sein d’un graphe de propriétés, en appliquant un schéma et des contraintes d’intégrité rigoureuses (PG-keys, PG-schema), ainsi que des techniques de normalisation et d’analyse sémantique. La thèse abordera enfin les problématiques d’intégration et de rapprochement des données, en étudiant des stratégies de type Global-as-View et Local-as-View, ainsi que des mécanismes de maintenance de vues pour les graphes de propriétés.
Les approches développées s’inscriront dans une démarche homme-machine, combinant automatisation et validation experte, en collaboration étroite avec les partenaires académiques et industriels du projet GEOLIANT.
Votre Environnement de Travail
La thèse s’inscrit dans le cadre du projet GEOLIANT, soutenu par BPI France dans le programme France 2030, visant à développer et industrialiser des liants géopolymères bas-carbone à partir de déchets de chantier, en alternative durable au ciment traditionnel fortement émetteur de CO₂. Le projet repose sur le développement de formulations innovantes et sur la mise en place d’outils numériques et prédictifs basés sur l’intelligence artificielle afin d’accélérer la recherche, l’évaluation et la validation des performances.
Le doctorant ou la doctorante sera rattaché·e au laboratoire LIRIS et travaillera au sein d’un consortium académique et industriel associant des acteurs du génie civil, des matériaux et de l’environnement. Les travaux de thèse s’inscriront dans un environnement pluridisciplinaire, à l’interface entre informatique (extraction et intégration de données, graphes, IA) et ingénierie des matériaux.
La thèse sera menée en interaction étroite avec les partenaires du projet, dans un cadre favorisant la co-conception, la validation experte et le transfert des résultats vers des applications opérationnelles, notamment dans le contexte de chantiers pilotes. Elle offre un environnement de recherche stimulant, combinant contributions méthodologiques et impact industriel et environnemental.
Rémunération et avantages
Rémunération
La rémunération est d'un minimum de 2300,00 € mensuel
Congés et RTT annuels
44 jours
Pratique et Indemnisation du TT
Pratique et indemnisation du TT
Transport
Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€
À propos de l’offre
| Référence de l’offre | UMR5205-ANDMAU-002 |
|---|---|
| Section(s) CN / Domaine de recherche | Sciences informatiques : fondements de l'informatique, calculs, algorithmes, représentations, exploitations |
À propos du CNRS
Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.
Créer une alerte
Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.