Faites connaître cette offre !
Informations générales
Référence : UMR7030-HAIZAR-001
Lieu de travail : VILLETANEUSE
Date de publication : samedi 23 novembre 2019
Type de contrat : CDD Scientifique
Durée du contrat : 7 mois
Date d'embauche prévue : 1 février 2020
Quotité de travail : Temps complet
Rémunération : 2695 € bruts mensuels
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années
Missions
Les ontologies sont utiles pour résoudre les problèmes d'hétérogéneité et pour garantir l'intéropérabilité entre les différentes sources d'indormations. Néanmoins, les ontologies sont elles mêmes hétérogènes, distribuées et sont décrites en différentes langues. L'alignement d'ontologies consiste à retrouver des correspondances entre des entités sémantqiues (concepts, rôles) et permet donc de s'assurer d'une interoperatbilité sémantique entre les ressources.
Les étiquettes (labels) utilisées pour les entités d'une ontologie peuvent être de différentes langues. La plupart des ontologies accessibles en ligne sont lexicalisées en anglais. Quand une ontologie est publiée, il est néessaire de calculer des correspondances pour pouvoir la lier aux autres ontologies du web. Ces correspondances sont importantes pour la compréhension et la réutilisation des ontologies.
Dans le cadre du projet FUI PCU (Plateforme de Connaissances Unifiées), le LIPN a proposé une ontologie de produits construite à partir de la structure de la base de données produits d'une application e-commerce. Dans ce contexte lier l'ontologie produite aux ontologies du domaine mais lexicalisées en anglais est un problème clè qui permettra à terme de gérer des catalogues multilingues. Cela nécessite de proposer des algorithmes robustes qui dépassent le cadre de la traduction car les étiquettes sont généralement courtes et ambigües.
L'algorithme proposé sera testé sur le banc de test Multifarm dans le cadre de la campagne d'évaluation internationale (OAEI).
Activités
- mise à jour de l'état de l'art en alignement d'ontologies
- proposition et implémentation d'un algorithme d'alignement multilingue
- mise en place et analyse des expériences
Compétences
Compétences recherche :
- expérience en construction et l'alignement d'ontologies et de bases de connaissances ;
- maîtrise des langages, outils et standard du web sémantique.
Compétences techniques :
- programmation Java et/ou Python,
- environnement de développement (type ECLIPSE).
Contexte de travail
L'équipe RCLN (Représentation des Connaissances et Langage Naturel) du LIPN (Laboratoire d'Informatique de Paris Nord) centre ses recherches sur le traitement automatique des langues, la linguistique, la fouille de données textuelles, la recherche d'information sémantique, l'acquisition et la gestion de connaissances hétérogènes. https://lipn.univ-paris13.fr/accueil/equipe/rcln/
On en parle sur Twitter !