En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5505-CHLBOU-056 - Asistant-e ingénieur-e (H/F) en Intégration de graph embeedings dans un système d'alignement complexe

Asistant-e ingénieur-e (H/F) en Intégration de graph embeedings dans un système d'alignement complexe


Date Limite Candidature : mercredi 29 juin 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR5505-CHLBOU-056
Lieu de travail : TOULOUSE
Date de publication : mercredi 8 juin 2022
Type de contrat : CDD Technique/Administratif
Durée du contrat : 5 mois
Date d'embauche prévue : 1 septembre 2022
Quotité de travail : Temps complet
Rémunération : Entre 1947 et 2078 euros bruts mensuels selon expérience
Niveau d'études souhaité : Bac+4
Expérience souhaitée : 1 à 4 années

Missions

L'alignement d'ontologies vise à permettre l'interopérabilité entre les connaissances exprimées dans différentes ontologies. Malgré la variété des propositions, la plupart des approches sont encore dédiées à la génération de correspondances simples (i.e., celles reliant une seule entité d'une ontologie source à une
seule entité d'une ontologie cible). Ce type de correspondance n'est cependant
pas assez expressif pour couvrir pleinement les différents types d'hétérogénéités de l'ontologie (lexicales, sémantiques, conceptuelles). Des correspondances complexes (c'est-a-dire celles qui impliquent des constructeurs logiques ou des fonctions de transformation) sont plutôt requises.
Nous avons proposé une approche pour générer des correspondances
complexes qui s'appuie sur des questions de compétences pour l'alignement
(CQAs) comme moyen d'exprimer les besoins de connaissances des utilisateurs
en termes d'alignement. L'approche prend en entrée d'un ensemble de CQAs
traduits en requêtes SPARQL sur l'ontologie source. Chaque réponse est un en-
semble d'instances extraites d'une base de connaissances décrite par l'ontologie
source. La génération de la correspondance est effectuée en faisant correspondre le sous-graphe de la CQA source aux environs lexicalement similaires des
instances cibles. L'un des points faibles de cette approche est que la similarité
des graphes est basée sur une stratégie de similarité naïve reposant sur une
mesure de similarité syntactique (distance de Levenshtein). Récemment, les
graph embeddings ont été explorés comme une manière plus sophistiquée de
mesurer la similarité des nœuds d'un graphe, en apprenant une correspondance
d'un réseau à un espace vectoriel.
Les missions dans le cadre de ce projet sont les suivantes :
• tester différents modèles de graph embeddings pour la similarité de graphes;
• intégrer cette approche dans le système de génération de correspondances
complexes;
• intégrer une approche de alignement repair pour garantir la génération de
correspondances consistantes;
• évaluer la performance du système pour les ontologies de grande taille.

Activités

Les activités dans le cadre de ce projet sont les suivantes :
• étudier les différents moèles de graph embeddings pour la similarité de
graphes dans l'état de l'art ;
• rédiger un rapport de recherche décrivant ces modèles ;
• tester les modèles sur les jeux de tests de la campagne internationale
d'évaluation OAEI ;
• intégrer le modèle dans le système CANARD ;
• comparer les résultats du modèle avec la distance d'édition ;
• évaluer la performance en termes de temps d'exécution pour aligner des
grosses ontologies;
• écrire un rapport technique.

Compétences

Les candidats doivent être titulaires d'une Licence et un Master en Informatique,
avoir une solide expérience de développement en Python et une très bonne
connaissances des modèles d'embeddings.

Contexte de travail

Le candidat sera accueilli au sein de l'équipe MELODI https://www.irit.fr/en/departement/dep-artificial-intelligence/melodi-team.

On en parle sur Twitter !