Informations générales
Intitulé de l'offre : Doctorant (H/F) GAI-enhanced Network Traffic Analysis in Cloud-Edge-IoT Continuum (GeNTAC)
Référence : UMR6004-KANPIA-002
Nombre de Postes : 1
Lieu de travail : NANTES
Date de publication : lundi 2 juin 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 07 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Description du sujet de thèse
Résumé :
La complexité croissante des réseaux informatiques remet en question la gestion traditionnelle du trafic réseau en raison de problèmes de scalabilité, de confidentialité et d’inefficacité des communications. Ce projet de thèese exploite l’apprentissage collaboratif pour le continuum Cloud-Edge-IoT. L’IA générative y sera intégrée afin d’améliorer l’augmentation des données, la détection d’anomalies et la prévision du trafic. Ces avancées permettront une gestion du trafic adaptative, efficace et respectueuse de la vie privée dans des environnements réseau hétérogènes du monde réel.
Mots-clés : Analyse de trafic, Détection d’anomalies, Intelligence artificielle générative, Apprentissage fédéré
Contexte :
L’essor des objets connectés (IoT) et du calcul en périphérie (edge computing) entraîne une explosion du trafic réseau dans un continuum hétérogène Cloud-Edge-IoT. Les approches classiques d’analyse de réseau basées sur l’IA centralisée souffrent souvent de limitations en termes de scalabilité, de respect de la vie privée et de surcharge de communication. L’apprentissage fédéré (FL) apparaît comme une solution prometteuse, permettant un entraînement décentralisé des modèles sans transfert des données brutes. Toutefois, les méthodes FL classiques exploitent mal la structure hiérarchique des réseaux modernes, où les couches IoT, edge et cloud présentent des caractéristiques distinctes. L’apprentissage fédéré hiérarchique (HFL) introduit une formation en plusieurs niveaux, permettant une agrégation locale à l’edge avant consolidation au cloud, optimisant la latence et l’efficacité du calcul [1]. L’intégration de l’IA générative renforce ces capacités, en facilitant l’augmentation des données [2], la détection d’anomalies et la prédiction comportementale du réseau.
Objectifs :
Ce projet vise à développer une approche HFL [3] intégré à l’IA générative pour l’analyse des réseaux dans le continuum Cloud-Edge-IoT. Il/elle adoptera une approche multiniveau, avec entraînement collaboratif réparti sur les couches IoT, edge et cloud. Des modèles d’IA générative (GAN, VAE, modèles de diffusion) seront utilisés pour générer des données synthétiques de trafic, favorisant la détection d’anomalies et l’augmentation des données. L’efficacité des communications sera améliorée via la distillation des connaissances et la compression adaptative des modèles, afin de réduire la taille des mises à jour fédérées [4]. Des techniques d’agrégation efficaces [5] garantiront la confidentialité des données. L’évaluation portera sur des jeux de données réels de trafic réseau, mesurant les performances en détection d’anomalies, prévision de trafic et classification, démontrant le potentiel de cette approche pour une analyse réseau sécurisée, scalable et adaptative.
Méthodologie scientifique :
Le projet repose sur trois piliers : l’architecture HFL, l’intégration de l’IA générative et l’optimisation de la surcharge communicationnelle. L'approche s’organise en trois niveaux :
- Niveau IoT : appareils à faible consommation (compteurs intelligents, caméras, objets portables) effectuent un apprentissage local léger.
- Niveau Edge : agrégation et affinement des modèles par les nœuds de bord (passerelles, stations de base).
- Niveau Cloud : consolidation globale, entraînement profond, redistribution des modèles optimisés.
L’IA générative (GAN, VAE, simulateurs de trafic [6]) soutient l’augmentation de données et la détection d’anomalies (VAE, modèles de diffusion), en identifiant les écarts par rapport aux comportements normaux. L’IA explicable (XAI) permettra de mieux comprendre les modèles boîte noire, dans la continuité de travaux existants [7]. Pour la prévision de trafic, des architectures à base de Transformers seront explorées.
La surcharge de communication, enjeu majeur du HFL, sera réduite grâce à la compression adaptative des modèles (pruning, quantization) et à la distillation des connaissances. L’agrégation asynchrone des modèles permettra aux nœuds de s’adapter à des fréquences de mise à jour variables, assurant une efficacité accrue dans des environnements hétérogènes. Cette méthodologie garantit une approche HFL robuste, évolutif et adapté aux réseaux réels.
References:
[1] Wang, K., He, Q., Chen, F., Jin, H., & Yang, Y. (2023). FedEdge: Accelerating Edge-Assisted Federated Learning. The Web Conference.
[2] Li, Z., Chen, Z., Wei, X., Gao, S., Yue, H., Xu, Z., & Quek, T. Q. S. (2024). Exploiting Complex Network-based Clustering for Personalization-Enhanced Hierarchical Federated Edge Learning. IEEE Transactions on Mobile Computing, 1–18.
[3] O. Aouedi and K. Piamrat (2024), Towards a Scalable and Energy-Efficient Framework for Industrial Cloud-Edge-IoT Continuum, IEEE Internet of Things Magazine, 2024
[4] L. Liu, J. Zhang, S. Song and K. B. Letaief, "Hierarchical Federated Learning With Quantization: Convergence Analysis and System Design," in IEEE Transactions on Wireless Communications, vol. 22, no. 1, pp. 2-18, Jan. 2023, doi: 10.1109/TWC.2022.3190512.
[5] Garshasbi, M. (2022). Communication-efficient semi-synchronous hierarchical federated learning with balanced training in heterogeneous IoT edge environments. Internet of Things, 21, 100642.
[6] M. Poisson, R. Carnier, K. Fukuda. (2024). Goth X: a generator of customizable, legitimate and malicious IoT network traffic. Cyber-security Experimentation and Test Workshop, 65-73.
[7] U. Do, L. Lahesoo, R. Carnier, K. Fukuda. (2024). Evaluation of XAI algorithms in IoT traffic anomaly detection. ICAIIC, 669-674.
[8] Petch, L., Moustafa, A., Ma, X. et al. HFL-GAN: scalable hierarchical federated learning GAN for high quantity heterogeneous clients. Appl Intell 55, 170 (2025).
Contexte de travail
Ce projet de thèse est une collaboration entre la France et le Japon. Le ou la doctorant(e) sera co-encadré(e) par Kandaraj Piamrat (équipe STACK, LS2N, France) et Kensuke Fukuda (NII, Japon). Les deux équipes possèdent une expertise hautement complémentaire en analyse de trafic, apprentissage collaboratif et optimisation des réseaux pilotée par l’IA. L’équipe STACK est spécialisée dans la gestion intelligente des réseaux et des services, ce qui en fait un acteur clé pour le développement d’apprentissage fédéré hiérarchique et l’optimisation de l’allocation des ressources dans les environnements edge. De son côté, l’équipe de K. Fukuda se concentre sur la mesure du trafic Internet, la détection d’anomalies et le contrôle intelligent des réseaux, apportant une expertise essentielle en analyse de données réseau à grande échelle et en mécanismes de sécurité. Leur collaboration permet une approche transversale, intégrant la conception de modèles HFL, l’IA générative pour la modélisation du trafic et la validation sur des réseaux réels. Cette synergie garantit que les avancées théoriques comme les stratégies de déploiement pratique sont prises en compte, renforçant la faisabilité du projet de thèse proposé et maximisant son impact sur la gestion des réseaux de nouvelle génération.
Informations complémentaires
Compétences attendues:
Le/la candidat e devra être titulaire d'un Master en informatique, en mathématiques, ou d'un diplôme d'ingénieur équivalent.
Les connaissances attendues incluent :
- Une bonne maîtrise des fondamentaux en intelligence artificielle ;
- Des connaissances solides en réseaux informatiques.
Les savoir-faire techniques recherchés sont :
- La capacité à mettre en œuvre des procédés et techniques liés à l'A et aux réseaux;
- La maîtrise de l'anglais (lu, écrit, parlé) à un niveau professionnel.
Compétences transversales :
- Capacité à formuler et conduire un projet scientifique de manière rigoureuse ;
- Aptitude à communiquer, valoriser et diffuser les résultats de la recherche ;
- Autonomie, sens des responsabilités et capacité à rendre compte de son avancement;
- Aptitude au travail en équipe, en particulier dans un environnement international et dans le cadre de projets collaboratifs.