En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

PhD student in robotics M/F

This offer is available in the following languages:
- Français-- Anglais

Date Limite Candidature : lundi 5 mai 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : PhD student in robotics M/F (H/F)
Référence : UPR8001-NICMAN-021
Nombre de Postes : 1
Lieu de travail : TOULOUSE
Date de publication : lundi 14 avril 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 juin 2025
Quotité de travail : Complet
Rémunération : 2200 gross monthly
Section(s) CN : 01 - Interactions, particules, noyaux du laboratoire au cosmos

Description du sujet de thèse

Study of algorithms of reinforcement learning for robotics

Reinforcement learning (RL) has demonstrated significant potential for robotic
applications, particularly in legged locomotion. However, the efficiency of RL
solvers still falls short of practical requirements. Building on insights from
trajectory optimization, this project proposes using standard optimization
solvers as alternatives to popular RL algorithms like PPO or SAC. We will focus
initially on evolutionary strategies (ES), leveraging their competitiveness on
CPU architectures and exploring their scalability on GPU architectures for
substantial performance gains. Building on this foundation, we aim to refine
the problem formulation, including investigating multiple shooting methods to
enhance exploration in state space rather than control space. We will exhibit
the property and importance of this formulation, called transcription in
trajectory optimization and rarely consider in RL. Additionally, we will explore
incorporating gradients from the simulator or neural networks where feasible.
The ultimate goal is to apply these methods to real-world quadruped
locomotion tasks.

Contexte de travail

Team Gepetto

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Contraintes et risques

Nothing