Informations générales
Intitulé de l'offre : Post-doctorant(e) (H/F) : Apprentissage non supervisé de politiques de manipulation d'objets pour l'apprentissage efficace de représentations sensorimotrices
Référence : UMR6602-CELTEU-001
Nombre de Postes : 1
Lieu de travail : AUBIERE
Date de publication : vendredi 6 juin 2025
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 18 mois
Date d'embauche prévue : 1 octobre 2025
Quotité de travail : Complet
Rémunération : à partir de 2991€ bruts mensuels selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
Section(s) CN : 07 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Missions
Une première partie du projet MeSMRise se concentrera sur l'apprentissage de représentations (multimodales) et de graphes d'interactions structurés par des actions. Alors que des politiques d'action aléatoires ou naïves peuvent être utilisées pour cela, des manipulations dirigées devraient être plus efficaces pour l'apprentissage de représentations d'objets.
Le/la candidat(e) se concentrera donc sur l'apprentissage de politiques d'action et abordera les principales questions suivantes : - Comment apprendre de manière non supervisée à sélectionner des actions qui conduiront à de meilleures représentations ? Nous considérerons le cadre de l'apprentissage de la manipulation active d'objets et explorerons l'utilisation d'impulsions intrinsèques dérivées des pertes SSL pour apprendre des politiques de manipulation. - Comment apprendre des politiques hiérarchiques pour la manipulation d'objets en utilisant les pertes SSL comme moteurs d'apprentissage actif ? Nous étudierons l'impact de l'accès à ces différents niveaux d'actions dans un cas de politique hiérarchique - Comment exploiter les graphes d'anticipations appris pour guider l'apprentissage de politiques efficaces ? Nous étudierons également comment exploiter au mieux les informations d'inférence fournies par les anticipations apprises d'autres WP pour guider davantage l'apprentissage de l'agent. En effet, les représentations abstraites (par exemple, les primitives sensorimotrices) et les inférences de plus haut niveau dans les environnements non markoviens peuvent être utilisées pour une planification optimale des actions (par exemple, en utilisant l'algorithme de recherche heuristique informée D*), des augmentations de structure (par exemple, pour lier plusieurs petites rotations comme une manipulation à plus grande échelle d'un seul objet). Ceci peut être utilisé pour sélectionner le meilleur plan d'action, afin d'optimiser l'exploitation (par exemple pour la distinguabilité) ou l'exploration (par exemple en biaisant les mécanismes de curiosité). Enfin, le/la candidat'e) devra contribuer à la coordination avec les autres tâches et partenaires du projet.
Activités
- Proposer différentes stratégies et architectures d'apprentissage de politique
- Évaluer ces stratégies en utilisant un environnement robotique 3D simulant la manipulation d'objets 3D
- Rédiger des articles scientifiques
- Coordonner avec les autres partenaires du projet et contribuer à l'intégration.
Compétences
Le/la candidat(e) idéal(e) est titulaire d'un doctorat dans un domaine pertinent et a :
- une solide expérience et des publications dans le domaine de l'apprentissage automatique, en particulier l'apprentissage profond et l'apprentissage par renforcement pour la manipulation et la perception d'objets.
- Une expérience de l'apprentissage actif, des motivations intrinsèques et/ou de l'apprentissage auto-supervisé est fortement souhaitée.
- Expérience avec des simulateurs de robotique 3D
- Capacité à interagir de manière fluide avec les différents membres du consortium ;
- Autonomie et proactivité dans les activités de recherche et les rapports d'activité
Contexte de travail
Ce poste postdoctoral s'inscrit dans le projet ANR MeSMRise (Multimodal deep SensoriMotor Representation learning) (https://projet.liris.cnrs.fr/mesmrise/index.html).
Le projet MeSMRise propose de s'inspirer de la façon dont les bébés humains apprennent à explorer leur environnement à travers des actions qui façonnent leur expérience multimodale. Inspiré par la théorie des contingences sensorimotrices (SMC), l'objectif principal du projet est d'étudier comment l'action peut structurer les représentations multimodales, apprises avec des méthodes d'apprentissage auto-supervisé (SSL). Ceci sera appliqué à des objets 3D, perçus par vision et nuage de points, et manipulés dans des environnements virtuels.
Ce post-doctorat s'inscrit dans le troisième workpackage du projet relatif à l'apprentissage actif, se concentrant sur l'apprentissage de politiques d'action qui permettent un apprentissage efficace des représentations d'objets.
Le/la candidat(e) travaillera à l'Institut Pascal, à proximité de Clermont-Ferrand, et interagira avec d'autres partenaires du projet à Lyon et à Grenoble.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
RAS