En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Contributions à la conception de la plate-forme SmartFCA (H/F)

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : vendredi 7 octobre 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR7503-AMENAP-004
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : vendredi 16 septembre 2022
Nom du responsable scientifique : La thèse sera dirigée par Miguel Couceiro (Prof. Université de Lorraine, Nancy) et Mehdi Kaytoue (Chef de projet, Infologic Lyon), tandis que Sergei Kuznetsov (Prof. HSE Moscow) et Amedeo Napoli (DR CNRS, LORIA Nancy) participeront à l'encadrement.
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 décembre 2022
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Conception d'algorithmes opérationnels, génériques et interopérables pour la FCA et les Pattern Structures dans la plate-forme SmartFCA
(sujet de thèse, projet ANR SmartFCA)

Contexte et positionnement de la thèse

Ce sujet de thèse est mené dans le cadre du projet ANR SmartFCA (ANR-21-CE23-0023-01). Les objectifs de SmartFCA sont d'étudier et de concevoir une collection d'algorithmes qui s'appuie sur la FCA (Formal Concept Analysis) pour la découverte de connaissances. Ces algorithmes seront ensuite implantés dans la plate-forme ouverte et opérationnelle SmartFCA. Définir de tels algorithmes pour la fouille de données reste un enjeu majeur, pour découvrir des motifs d'intérêt dans les données, les représenter et raisonner pour résoudre des problèmes ou encore aider à la prise de décision.
Les méthodes de découverte de connaissances qui s'appuient sur la théorie des treillis comme la FCA ont quelques très bonnes propriétés, par exemple celle de construire naturellement un treillis de concepts qui peut être facilement mis en correspondance avec une ontologie, à partir de données binaires ou plus complexes (données numériques et catégorielles notamment). Malgré cela, la FCA et ses variantes sont absentes des plates-formes disponibles en découverte de connaissances.
De fait, la plate-forme SmartFCA va proposer un certain nombre de services pour la fouille de données et la découverte et l'acquisition de connaissances qui s'appuient sur la FCA et les pattern structures (variantes qui traitent les données non binaires). Tout d'abord, la plate-forme SmartFCA sera bien adaptée au traitement de données non volumineuses mais complexes, comme les données de cohortes dans les sciences de la vie où l'on cherche des motifs en petit nombre et faciles à interpréter. Ensuite, la FCA et les pattern structures sont bien adaptées pour traiter des données d'arbres ou de graphes (par exemple les données du langage ou les triplets RDF des données liées). Le processus de construction d'un treillis de concepts, les classes et leurs relations, est explicable et permet de justifier l'existence de certaines règles qui peuvent être extraites du treillis pour la prise de décision. Enfin, la construction du treillis peut être rendue interactive et incrémentale pour autoriser une analyse des données en cours d'étude qui soit aussi bien locale que globale.

Contexte de travail

Le sujet de thèse

La FCA est un formalisme bien fondé mathématiquement qui peut traiter différentes tâches d'analyse de données, de classification et de découverte de connaissances. Dans cette thèse nous nous intéresserons aux algorithmes qui permettent de traiter des données complexes du monde réel. Par exemple nous travaillerons sur la conception d'un code générique pour les pattern structures qui sera adapté aux types de données les plus courants.
La plate-forme SmartFCA permettra de gérer la découverte de connaissances avec la préparation des données, l'application d'algorithmes de fouille de données adaptés en fonction de la tâche requise, et enfin l'interprétation des motifs découverts et leur transformation en unités de connaissances réutilisables pour la résolution de problèmes et la prise de décisions. Il existe déjà des algorithmes dont nous pourrons nous inspirer mais ces algorithmes sont généralement isolés et ne peuvent être utilisés facilement dans un workflow de découverte de connaissances, ce que nous nous attacherons à faire. De fait, la plate-forme SmartFCA sera composée d'algorithmes robustes, interopérables, réutilisables seuls ou de façon combinée, et pouvant servir de modules de base pour concevoir des workflow opérationnels.

Informations complémentaires

Supervision et aspects pratiques de la thèse.

Mots clés:
Formal Concept Analysis, Pattern Structures, fouille de motifs, fouille de données complexes, conception de plate-forme, interopérabilité, algorithmique robuste.

Compétence et profil souhaité du candidat :
le candidat doit avoir une Master en Informatique ou science des données ou encore en mathématiques appliquées.
Des éléments de savoir sur la FCA, la découverte de connaissances et la fouille de données symboliques ou numériques seront très appréciés.

Le candidate (H/F) doit postuler sur le portail emploi du CNRS (https://emploi.cnrs.fr/) et doit fournir un curriculum vitae récent, une lettre de motivation, deux lettres de recommandation ou le noms de deux personnes référentes, ainsi que la copie des notes des trois dernières années académiques (Licence et Masters 1 et 2, ou école d'ingénieurs).

On en parle sur Twitter !