Informations générales
Intitulé de l'offre : H/F Doctorant Résilience dans le cloud
Référence : UPR8001-PASBER-003
Nombre de Postes : 1
Lieu de travail : TOULOUSE
Date de publication : jeudi 23 janvier 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 17 mars 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 7 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Description du sujet de thèse
Le Cloud Computing a bouleversé la façon dont nous développons et déployons les logiciels. De nos jours, les applications Cloud sont conçues comme des systèmes distribués en permanente évolution, hébergés dans des data-centers, et potentiellement même dispersés dans le monde entier. Ce changement de paradigme augmente de facto les risques de dysfonctionnement de ces applications dont le contrôle à l’échelle planétaire est forcément plus difficile. La protection des systèmes cloud est d’autant plus difficile que ce même changement de paradigme a également eu un impact considérable sur la façon dont les logiciels sont monitorés : les applications Cloud peuvent se composer de plusieurs centaines de services, et les outils de monitoring ont rapidement rencontré des problèmes de passage à l’échelle. De plus, il faudrait que ces outils de monitoring soient désormais également capables de traiter les défaillances et les pannes inhérentes aux systèmes distribués, comme par exemple, les pannes partielles, les configurations incohérentes, les goulots d'étranglement ou même la vampirisation de ressources, qu’ils soient inhérents au comportement d’un ordonnanceur cloud comme Kubernetes ou la conséquence d’actions malveillantes provenant de l’intérieur ou de l’extérieur du cloud.
Cette thèse a donc pour objectif de concevoir de nouvelles méthodes de tracing distribué pour la détection et la remédiation des dysfonctionnements dans le cloud. Le tracing distribué (via OpenTelemetry par exemple) devra permettre de collecter les événements se produisant à tous les niveaux du cloud (containers, machines virtuelles, zones, clusters). L'objectif sera alors d'exploiter ces événements grâce à des modèles d'analyse de séries temporelles, de graphes, de logiques, etc. afin de représenter le fonctionnement du cloud. Par des techniques d'apprentissage automatique (par exemple), des déviations suspectes pourront être détectées et analysées afin d'identifier des erreurs de configuration, de conception, de routage, … et y remédier.
Contexte de travail
Le laboratoire d'analyse et d'architecture des systèmes (LAAS) est une unité propre de recherche (UPR) du Centre national de la recherche scientifique (CNRS) située sur le complexe spatial de Lespinet, à Toulouse. Au 1er janvier 2019, le LAAS est constitué de 577 personnes (chercheurs, ITA et doctorants) et de 26 groupes de recherche répartis dans 8 départements scientifiques. Créé en 1968 en association avec l'Université de Toulouse, il mène des recherches en informatique, robotique, automatique et micro et nano systèmes.
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
Sans objet