En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Thèse en apprentissage automatique et traitement du signal (H/F) : Approximations de rang faible semi-supervisées

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR6074-JERCOH-001
Lieu de travail : RENNES,RENNES
Date de publication : vendredi 2 octobre 2020
Nom du responsable scientifique : Nicolas Courty
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 décembre 2020
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Sujet: Approximations de rang faible semi-supervisées et transport optimal

Les Approximations de Rang Faible (ARF) sont des techniques puissantes pour l'apprentissage machine non supervisé. L'analyse en composantes principales, la factorisation en matrices non négatives et les décompositions tensorielles sont autant d'exemples d'ARF. Ces techniques sont principalement utilisées pour extraire quelques composantes d'intérêt à partir de données multidimensionelles. Ces composantes peuvent souvent être interprétées physiquement, comme des spectres, des concentrations relatives ou bien des images partielles. Mais elles peuvent aussi être purement considérées comme des coefficients décrivant les données dans un espace de dimensions réduites.

Néanmoins, de nos jours, les données sont souvent collectées avec des informations secondaires supplémentaires. En particulier, les données sont souvent partiellement étiquetées. Mais les informations secondaires peuvent également prendre la forme d'autres ensembles de données liées au même phénomène, ou d'un dictionnaire rassemblant des exemples de solutions souhaitées. Dans l'exemple de la transcription automatique de la musique, les étiquettes pourraient être quelques notes isolées spécifiées par l'utilisateur dans un enregistrement, les données secondaires peuvent être une partition partiellement connue, et un dictionnaire peut par exemple contenir des peignes de dirac qui, une fois combinés, donnent naissance à des modèles de spectres fréquentiels de notes pour divers instruments.

Le traitement de ces informations secondaires dans le contexte des ARF constitue les approximations de rang faible semi-supervisées. En plus des problèmes de modélisation pure que pose la semi-supervision, des difficultés supplémentaires proviennent de l'inadéquation des données secondaires, par exemple l'ensemble des données d'entraînement, à une donnée spécifique à étudier, par exemple l'ensemble des données d'essai.

Le but de cette thèse sera d'étudier les ARF semi-supervisées dans leur ensemble, en approfondissant les différents sous-problèmes décrits ci-dessus. En particulier, la thèse s'appuiera sur l'utilisation du transport optimal, un outil important pour l'adaptation de domaine. Un premier travail consistera à utiliser le transport optimal comme terme de régularisation pour relier plusieurs ensembles de données entre eux dans le problème de la fusion de données de rangs faibles. D'autres contributions, liées par exemple à des données partiellement étiquetées ou à l'apprentissage de dictionnaires et des décompositions tensorielles, devraient suivre ultérieurement.

Contexte de travail

Le doctorant ou la doctorante recruté.e sera membre de l'équipe de Panama, qui fait partie du laboratoire IRISA à Rennes. Le directeur de thèse sera Nicolas Courty, professeur à l'Université Bretagne Sud et chef de l'équipe Obélix de l'IRISA située à Vannes. De plus, la supervision quotidienne sera assurée par Jeremy Cohen, membre de l'équipe Panama et co-superviseur de la thèse. Le doctorat est financé par l'ANR LoRAiA, qui fournira également les fonds nécessaires pour se rendre de Rennes à Vannes quelques fois par an, assister à des conférences internationales et publier dans des revues internationales à comité de lecture, et organiser des réunions de petite ou moyenne envergure avec d'autres experts du domaine.

Contraintes et risques

Pas de risque particulier.

On en parle sur Twitter !