Informations générales
Intitulé de l'offre : H/F Exploration de l'Espace de Conception et Génération Automatique de Code pour l'Exécution Hétérogène HPC en Radioastronomie
Référence : UMR6164-JEANEZ-001
Nombre de Postes : 1
Lieu de travail : RENNES
Date de publication : mercredi 14 mai 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 septembre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 07 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Description du sujet de thèse
L’objectif est d’améliorer le cycle de développement HW/SW des systèmes de calcul couvrant le continuum de calcul sous contrainte énergétique. Les résultats seront illustrés par le déploiement CPUs, GPUs et FPGAs des algorithmes d’imagerie et de calibration dans le cadre du projet de radioastronomie SKA.
Les objectifs principaux de cette thèse sont de :
1) Modéliser les nouveaux pipelines de radioastronomie pour le projet SKA avec des modèles de calcul orientés flux de données agnostiques du matériel,
2) Proposer des modèles de performance multicritères CPU/GPU permettant un passage à l’échelle aux niveaux matériel et logiciel,
3) Proposer de nouveaux outils d'automatisation de la conception pour les systèmes de calcul HPC multinœuds hétérogènes intégrant un ou plusieurs GPU.
Contexte de travail
Mots clés : Modèles de calcul, Radioastronomie, High Performance Computing
La nouvelle génération d'interféromètres, comme le Square Kilometer Array (SKA) et ses précurseurs (NenuFAR/LOFAR/MeerKAT/ASKAP), se caractérise par des champs de vue très larges, une grande bande passante, une haute sensibilité et une haute résolution. Plusieurs algorithmes et pipelines de traitement de données sont conçus pour transformer les voltages mesurés par les antennes en images multidimensionnelles de haute-fidélité du ciel utilisables par les astronomes. Les traitements incluent des algorithmes complexes de traitement du signal pour résoudre un grand problème de déconvolution.
Les systèmes de traitement de données exascale du radiotélescope SKA devra exécuter en temps réel plusieurs pipelines de calcul sur des données provenant de télescopes à un rythme de plusieurs Tb/s, avec une capacité de stockage limité et dans un budget énergétique de seulement 1,5 MWatt pour 250 Petaflops. De telles exigences énergétiques et de calcul impliquent que les pipelines de calcul puissent être déployés sur une architecture innovante orientée flux de données et hétérogène. Ces supercalculateurs, chargés de l'exécution de ces pipelines, seront basés sur des systèmes HPC standards combinés à des architectures spécifiques à l'application, comme les FPGA (Field Programmable Gate Array) ou les GPU (Graphical Processing Unit). Un défi crucial est d'évaluer les performances, à la fois en temps et en énergie, de nouveaux algorithmes scientifiques complexes orientés flux de données sur des infrastructures de calcul complexes non encore existantes, ce qui est difficilement possible sans des méthodes de co-conception efficaces et des outils de prototypage rapide.
PREESM est un outil de prototypage rapide open-source basé sur des modèles flot de données. Initialement développé pour des systèmes embarqués complexes, il a prouvé son intérêt dans le cadre du projet SKA. PREESM fournit un placement et un ordonnancement rapides et précis des calculs de traitement du signal sur des systèmes de calcul hétérogènes spécifiques. Il peut être utilisé pour l'Exploration de l'Espace de Conception (Design Space Exploration - DSE) afin de dimensionner le système de calcul dès le début du processus de développement. L'outil génère également un code parallèle optimisé pour des systèmes de calcul multi-nœuds et multicœurs hétérogènes, incluant automatiquement les synchronisations et les transferts de données entre les éléments de calcul. Son modèle de calcul orienté flot de données (Model of Computation - MoC) facilite la description des applications de traitement du signal parallèle comme les pipelines de calcul SKA.
Les radioastronomes prototypent aujourd’hui leurs algorithmes en utilisant des langages de programmation généralistes, tels que Python, fonctionnant sur des CPU à usage général. Ces algorithmes doivent ensuite être déployés sur des infrastructures de calcul haute performance par des spécialistes chargés de la parallélisation à plusieurs niveaux : multi-nœuds HPC, multicœur CPU, GPU ou FPGA. L'automatisation de ce déploiement est un défi clé pour le projet SKA afin de définir, de programmer et de mettre à jour le système de calcul tout au long de son exploitation prévue sur plus d’une cinquantaine d’années.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
La thèse sera dirigée par jean-François NEZAN et réalisée à l'INSA Rennes. Elle sera co-encadrée par Cyril TASSE de l'Observatoire de paris et Karol Desnos à l'INSA Rennes. Elle sera financée par le CNRS dans le cadre des projets 80Prime.