Informations générales
Intitulé de l'offre : Doctorant en théorie de l'apprentissage automatique "Analyse exacte des modèles de données structurées" (H/F)
Référence : UMR8548-BRULOU-001
Nombre de Postes : 1
Lieu de travail : PARIS
Date de publication : lundi 22 mai 2023
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 15 septembre 2023
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel
Section(s) CN : Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Description du sujet de thèse
Les dernières années ont été témoins de percées majeures dans le domaine de l'intelligence artificielle (IA). Les ordinateurs peuvent désormais comprendre le langage humain, transcrire des textes, reconnaître des motifs et même conduire des voitures. Le fondement de ces développements est l'apprentissage automatique, le domaine qui traite de la façon dont les machines apprennent à partir de données. Malgré les avancées technologiques impressionnantes, la compréhension théorique des modèles d'apprentissage automatique modernes est insuffisante. L'analyse statistique traditionnelle développée au début du XXe siècle peine à faire face au régime moderne dans lequel le nombre de paramètres de modèle est du même ordre que la quantité de données - un problème connu sous le nom de malédiction de la dimensionnalité (MdD). Comprendre pourquoi les algorithmes utilisés dans la pratique quotidienne de l'apprentissage automatique fonctionnent si bien malgré la MdD est donc un défi théorique majeur, et est essentiel pour une acceptation plus large de ces méthodes dans des applications sensibles, telles que la médecine et les soins de santé. Ce projet concerne un aspect clé de ce problème : le rôle joué par la structure des données dans le succès des algorithmes d'apprentissage automatique.
Le/la candidat(e) étudiera la structure dans ses différentes formes, de la parcimonie aux modèles génératifs, dans le contexte de modèles simples qui sont mathématiquement abordables. Pour cela, il/elle utilisera une combinaison d'outils classiques tels que la probabilité en haute dimension et la théorie des matrices aléatoires, avec des outils issus de la physique statistique des systèmes désordonnés. À la fin de la thèse, nous espérons avoir une meilleure compréhension théorique de l'interaction entre l'apprentissage des features et l'apprentissage de la structure dans des problèmes d'apprentissage automatique.
Contexte de travail
Le/la candidat(e) fera partie du Centre Science des Données à l'École Normale Supérieure de Paris, une initiative pluridisciplinaire regroupant des chercheurs des départements d'Informatique, de Mathématiques, de Sciences Cognitives et de Physique de l'ENS.