Apprentissage de représentations et tokenisation multimodale pour les modèles de fondation en sciences (H/F)
Nouveau
- Chercheur en contrat CDD
- 12 mois
- Doctorat
L'offre en un coup d'oeil
L'unité
Groupe de recherche en Informatique, Image, Automatique et Instrumentation de Caen
Type de Contrat
Chercheur en contrat CDD
Temps de Travail
Complet
Lieu de Travail
14032 CAEN
Durée du contrat
12 mois
Date d'Embauche
01/10/2026
Rémuneration
de 3072€ à 4 439€ brut selon expérience
Postuler Date limite de candidature : jeudi 14 mai 2026 23:59
Description du Poste
Les Missions
Les travaux de recherche se situent dans le domaine de l'intelligence artificielle pour les sciences (AI for Science). La mission principale consiste à lever les verrous technologiques liés à la représentation de données scientifiques complexes (graphes, structures 3D, spectres) au sein de modèles de fondation. Le/la postdoctorant(e) devra concevoir des stratégies de "tokenisation" innovantes permettant d'intégrer ces données non-linguistiques dans des architectures de type Transformer, en garantissant la préservation des propriétés géométriques et topologiques.
L'Activité
Réaliser un état de l'art sur l'apprentissage de représentations (SSL, Geometric DL) appliqué aux sciences.
Développer et implémenter des algorithmes de tokenisation pour les graphes moléculaires, les structures 3D et les signaux spectraux.
Entraîner et évaluer des modèles de fondation multimodaux sur des clusters de calcul (Jean Zay, CRIAN).
Collaborer avec les experts métier (physiciens, chimistes) pour valider la pertinence scientifique des représentations apprises.
Rédiger des articles scientifiques pour les conférences et revues majeures (NeurIPS, ICML, ICLR, ou revues spécialisées en physique/matériaux).
Présenter les avancées du projet lors de séminaires et conférences internationales.
Votre Profil
Compétences
Formation : Doctorat en Informatique, Intelligence Artificielle, Mathématiques Appliquées ou Physique/Chimie numérique avec une forte composante ML.
Technique : Maîtrise approfondie du Deep Learning (Transformers, GNNs, Auto-encodeurs).
Programmation : Excellente maîtrise de Python et des frameworks PyTorch ou TensorFlow/JAX.
Outils : Expérience de l'entraînement sur GPU et de la gestion de données volumineuses.
Soft skills : Forte autonomie, curiosité intellectuelle et capacité à communiquer dans un environnement interdisciplinaire.
Langues : Anglais scientifique courant (écrit et oral).
Votre Environnement de Travail
Le projet s'inscrit dans une collaboration unique entre trois laboratoires de l'Université de Caen / CNRS / ENSICAEN : le GREYC (Sciences du numérique), le CRISMAT (Science des matériaux) et le LPC (Physique subatomique). Le candidat bénéficiera d'un environnement de recherche interdisciplinaire stimulant et d'un accès privilégié à des ressources de calcul intensif locales et nationales (Jean Zay). Le poste est basé à Caen, ville dynamique située à 2h de Paris.
Rémunération et avantages
Rémunération
de 3072€ à 4 439€ brut selon expérience
Congés et RTT annuels
44 jours
Pratique et Indemnisation du TT
Pratique et indemnisation du TT
Transport
Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€
À propos de l’offre
| Référence de l’offre | UMR6072-FREJUR0-014 |
|---|---|
| Section(s) CN / Domaine de recherche | Mathématiques et interactions des mathématiques |
À propos du CNRS
Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.
Créer une alerte
Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.