En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Doctorant (H/F) sur l'apprentissage de répresentations pour des structures relationnelles uncertaines

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : vendredi 1 juillet 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR9015-SILMAN-001
Lieu de travail : ST AUBIN
Date de publication : vendredi 10 juin 2022
Nom du responsable scientifique : Bogdan Cautis
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2022
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Dans le cadre de l'appel "Thèses Internationales" du CNRS, le sujet du projet se situe à l'intersection de la gestion des données et de l'apprentissage automatique, avec des ramifications et un impact potentiel dans de nombreux domaines qui doivent traiter des données structurées et incertaines, qui doivent être utilisées dans les processus d'apprentissage automatique et d'analyse de données. Les représentations vectorielles pour divers types d'information ont été utilisées avec succès ces dernières années, comme moyen de transposer des données discrètes dans un espace différentiable, dans lequel les techniques d'apprentissage automatique peuvent s'appliquer. De telles techniques d'apprentissage de la représentation de l'information, avec des exemples populaires tels que les réseaux de neurones, ont été envisagées pour les données en langage naturel, les graphes, les réseaux d'information et de connaissances, les réseaux de diffusion, etc. Cependant, les aspects théoriques de ces approches ont été la plupart du temps ignorés. Dans ce projet de thèse, nous avons l'intention d'étudier les fondements des techniques de représentation vectorielle des données structurées et incertaines (données relationnelles probabilistes), y compris les données interconnectées (graphes riches), en mettant l'accent non seulement sur les aspects de complexité (et d'efficacité dans le monde réel applications) mais aussi sur l'expressivité/sémantique de celles-ci.
Les représentations vectorielles pour les données relationnelles n'ont été étudiées que récemment et sporadiquement, soit en réduisant le problème à des graphes, soit à des phrases en langage naturel. Par conséquent, un premier objectif de ce projet de thèse est d'étudier des techniques qui peuvent travailler directement avec des relations d'arité arbitraire, étant à la fois intéressantes sur le plan pratique et théorique. Puis, dans un second temps, ces techniques seront reconsidérées dans le cadre des données relationnelles probabilistes. Les notions d'homomorphisme et d'isomorphisme entre structures relationnelles sont bien connues et centrales dans la théorie des bases de données. Nous avons l'intention d'étudier les techniques de représentations vectorielles de structures relationnelles probabilistes qui partent d'elles et de la similarité basée sur l'homomorphisme entre les structures relationnelles.

Cette thèse sera supervisée par Bogdan Cautis (PR U. Paris-Saclay) et Silviu Maniu (MCF, U. Paris-Saclay. Les objectifs fondamentaux de ce projet de doctorat sont étroitement liés au programme de recherche mené par Bogdan Cautis et Silviu Maniu en collaboration avec l'UMI IPAL Singapour, en particulier aux sujets relatifs à la prise de décision basée sur l'IA dans les systèmes urbains critiques. Les techniques de représentation vectorielle des données relationnelles incertaines impacteront directement les recherches qui seront menées par Bogdan Cautis et Silviu Maniu avec leur collaborateurs de l'IPAL et de National University of Singapore.

Contexte de travail

Le laboratoire Interdisciplinaire des Sciences du Numérique (LISN) est une nouvelle unité mixte de recherche (UMR9015) CNRS et Université Paris-Saclay, installée sur le plateau du Moulon à Orsay (91) dans 5 bâtiments (sur 2 sites : 650-660, 507-508-512) issus des ex-laboratoires LIMSI et LRI. Le laboratoire est présent dans de nombreux projets nationaux et internationaux et ses thèmes de recherche couvrent un large spectre scientifique (informatique et mécanique énergétique).

Il compte plus de 400 membres répartis dans 5 départements de recherche et 6 services de support et de soutien. Les locaux du laboratoire sont intégralement en ZRR (zone à régime restrictif).

L'agent travaillera au sein de l'équipe LaHDAK, composée de 12 permanents, qui dépend du département Science de Données.

On en parle sur Twitter !