En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

H/F Thèse sur l'Apprentissage profond pour l'Astrophysique

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : jeudi 6 octobre 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR7326-ANAMEK-047
Lieu de travail : MARSEILLE 13
Date de publication : jeudi 15 septembre 2022
Nom du responsable scientifique : ZAVAGNO Annie (LAM) – ARTIÈRES Thierry (LIS)
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2022
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

La formation des étoiles est un processus multi échelle qui contrôle l'évolution des galaxies. Dans notre Galaxie, les données disponibles révèlent ce processus sur des échelles spatiales et temporelles couvrant plus de 6 ordres de grandeur. Cette grande masse de données, combinée à des informations disponibles sur les conditions physiques du milieu (densité, température, turbulence, champ magnétique) et à des simulations numériques, offre l'opportunité d'établir le lien entre les propriétés de la formation stellaire et celles du milieu qui l'héberge.
Plus précisément, la formation des étoiles dans les galaxies se déroule dans des structures filamentaires composées de gaz (principalement de l'hydrogène) et de poussières (petites particules solides carbonées).
Ces filaments se forment dans le milieu interstellaire (milieu situé entre les étoiles) et évoluent jusqu'à se fragmenter pour former des cœurs pré-stellaires qui hébergeront les futures étoiles. Bien que ces filaments aient été très largement étudiés, leur formation et leur évolution sont encore très mal comprises, en partie parce qu'une étude globale à tous leurs stades d'évolution n'a pas encore été réalisée. Une telle étude nécessite de combiner la connaissance disponible sur ces filaments (données et modèles). Or, le volume et la complexité des données disponibles (notamment la disposition de multiples vues des données) rendent cette combinaison inaccessible à une recherche humaine « classique ».

Les approches actuelles, qu'elles soient basées sur la morphologie mathématique, le traitement d'images, les réseaux de neurones, n'intègrent pas de connaissances physiques et sont mises au point ou apprises à partir de données seules. Or, des modèles physiques existent et peuvent être intégrés de différentes façons dans la construction d'une méthode de détection des filaments, que ce soit pour la construction de jeux de données artificielles par la simulation, par l'intégration directe de connaissances dans une architecture neuronale (un enjeu majeur aujourd'hui) ou encore dans la définition d'une fonction de coût adéquate pour favoriser des inférences plus fidèles à la réalité (via des stratégies adversariales par exemple). L'objectif de cette thèse est de développer des méthodes d'apprentissage automatique innovantes pour la détection de filaments.
Une des premières étapes visera à évaluer l'efficacité de méthodes état de l'art sur les grandes masses de données en faible nombre de vues (deux ou trois longueurs d'onde). Les pistes envisagées pour dépasser l'état de l'art consistent notamment en l'hybridation de réseaux de neurones profonds et d'opérateurs de morphologie mathématique ou le développement de modèles neuronaux originaux opérant sur graphes. Pour aller plus loin, nous étudierons des méthodes d'acquisition séquentielle pour permettre un passage à l'échelle du nombre de vues utilisées pour prendre une décision. Des algorithmes de renforcement ou des formalisations optimisables de bout en bout peuvent être envisagés pour cela. Ces approches ont en particulier l'avantage de pouvoir s'adapter au cas de vues manquantes.

Le/la doctorant/e se concentrera sur les aspects méthodologiques de l'apprentissage automatique développés pour les données astrophysiques étudiées. La préparation des jeux de données et la connaissance astrophysique seront apportées par les différents acteurs d'un projet plus large dans lequel cette thèse est financée. L'étudiant/e sera bien sûr associé/e étroitement à ces développements.

Contexte de travail

Cette thèse interdisciplinaire sera réalisée en collaboration entre les laboratoires du LAM et du LIS situés à proximité l'un de l'autre (distance < 100 m) sur le site de Château-Gombert.
En plus du financement du contrat doctoral pour une durée de 3 ans, un financement dédié (matériel et missions) accompagne ce projet, permettant à l'étudiant/e recruté/e d'effectuer des déplacements (missions de collaborations, conférences, colloques).
La thèse se déroule dans un contexte international avec des collaborations scientifiques en Italie (Rome, Naples).

Informations complémentaires

Important : Une expérience reconnue (projet, stage) en Machine Learning / Deep Learning et/ou en Astrophysique est nécessaire pour postuler à ce poste. Les candidatures ne présentant aucune expérience dans l'un de ces domaines ne seront pas retenues.

On en parle sur Twitter !