En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5505-CHLBOU-044 - Ingénieur.e d'études (H/F) - Gestion de métadonnées sémantiques pour la description et le catalogage de jeux de données scientifiques

Ingénieur.e d'études (H/F) - Gestion de métadonnées sémantiques pour la description et le catalogage de jeux de données scientifiques


Date Limite Candidature : vendredi 29 octobre 2021

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5505-CHLBOU-044
Lieu de travail : TOULOUSE
Date de publication : vendredi 8 octobre 2021
Type de contrat : CDD Technique/Administratif
Durée du contrat : 6 mois
Date d'embauche prévue : 1 décembre 2021
Quotité de travail : Temps complet
Rémunération : Entre 2109 et 2226 euros bruts mensuels selon expérience
Niveau d'études souhaité : Bac+5
Expérience souhaitée : Indifférent

Missions

Le projet ANR Semantics4FAIR , porté par l'équipe MELODI de l'IRIT, a pour but d'améliorer l'accessibilité et la réutilisation des jeux de données produits par MéteoFrance par l'ajout de métadonnées sémantiques. Ainsi, les jeux de données répondent mieux aux principes FAIR, et par la même, les utilisateurs d'autres disciplines les retrouvent et les réutilisent plus facilement. Pour ce faire, nous avons proposé un modèle ontologique (un schéma au sens des BDD) qui combine des standards pour la représentation sémantique des métadonnées comme GeoDCAT-AP et d'autres vocabulaires adaptés aux données météorologiques. Par ailleurs, via le projet DataNooS , qui implique également MELODI, nous disposons d'un logiciel de gestion de jeux de données et de description sémantique de leurs métadonnées selon des vocabulaires standards uniquement (DCAT-AP, OWL-Time, GeoSPARQL, RDF-DataCube, etc). Grâce à de précédents stages, plusieurs services viennent enrichir ce logiciel, dont un permet d'adapter l'ontologie générique pour intégrer des ontologies et des vocabulaires de domaine. D'autres services ont été spécifiés incomplètement et ne sont pas encore opérationnels.
Le but de ce contrat est de faire évoluer cette application web de gestion de métadonnées sémantiques. Deux stages réalisés entre mars et août 2021 ont permis de spécifier trois modules : un premier module permet de créer d'une manière semi-automatique des templates (i.e., des formulaires de saisies) de métadonnées décrivant des jeux de données au sein d'une collection. La création de chaque template est basée sur un ensemble de vocabulaires génériques et d'ontologies de domaine. Un 2ème module sert à décrire des jeux de données à l'aide d'un template défini précédemment, et de garantir la conformité des métadonnées saisies à ce template. Un 3e module propose des fonctions de recherche par facettes pour retrouver des jeux de données au sein d'une collection. Le but de ce contrat est d'implémenter ces modules au sein de la plateforme DataNooS , de décrire plusieurs jeux de données de Météo France et de les rendre accessibles.

Activités

- Etudier le modèle ontologique du projet pour représenter les métadonnées des jeux de données MétéoFrance.
- Prendre en main l'application web de gestion de métadonnées et les services déjà développés
- Spécifier et implémenter un module de définition de templates de saisie de métadonnées à partir d'une ontologie de domaine.
- Proposer un template minimal afin de respecter les principes FAIR
- Implémentation d'un service de saisie des métadonnées d'un jeu de données, conformément au template de saisie, et de vérification de ces métadonnées. Assurer leur sauvegarde dans un entrepôt de données RDF.
- Implémenter une interface de recherche par facettes de jeux de données en exploitant l'ontologie pour guider la formulation de critères de recherche.
- Valider ces services :
o par la création d'un template à base du modèle ontologique développé dans le projet Semantics4FAIR pour décrire des jeux de données météorologiques,
o par la description puis la recherche de plusieurs jeux de données de météoFrance utilisés dans le projet Semantics4FAIR.

Compétences

- Maîtrise des langages de programmation web : JavaScript et Python.
- Connaissance des technologies du web sémantiques (ontologies, RDF, OWL, etc.).
- Connaissance sur les portails de données et les métadonnées associées.

Contexte de travail

La personne recrutée travaillera au sein de l'équipe MELODI, à Institut de Recherche en Informatique de Toulouse (IRIT) – UMR 5505 – campus université Paul Sabatier – 118 route de Narbonne 31062 Toulouse Cedex 9

On en parle sur Twitter !