En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5217-SIHAME-007 - Post-Doc Exploration Guidée des Données: Formalisation, Algorithmes et Validation H/F

Post-Doc Exploration Guidée des Données: Formalisation, Algorithmes et Validation H/F

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : vendredi 30 octobre 2020

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5217-SIHAME-007
Lieu de travail : GRENOBLE,GRENOBLE
Date de publication : vendredi 9 octobre 2020
Type de contrat : CDD Scientifique
Durée du contrat : 12 mois
Date d'embauche prévue : 1 décembre 2020
Quotité de travail : Temps complet
Rémunération : entre 2648.79 et 3054.06 euros
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent

Missions

Le thème de ce post-doc est de développer une formalisation, des algorithmes et une validation pour aider les utilisateurs à atteindre leur objectif d'exploration des données. L'exploration est un domaine de recherche en vogue dans l'analyse des données où les utilisateurs sont impliqués dans le processus d'analyse des données. L'utilisateur n'a qu'une compréhension partielle de ses besoins et cherche à les affiner à mesure qu'elle extrait davantage d'informations à partir des données. Chaque session peut contenir une séquence d'itérations dont la transition est formée par différents types d'exploration. Nous proposons de fournir une couche déclarative
spécifiquement conçue pour exprimer ces besoins. Nous appelons cette couche un pipeline centré sur l'exploration. Chaque pipeline est formé par une séquence d'explorations qui peuvent être revisitées et adaptées à la volée en tant qu'utilisateur
enrichit ses connaissances.

Les utilisateurs diffèrent les uns des autres dans leur connaissance des données et leurs techniques qui déterminent la manière dont ils exploreront les données. Nous distinguons trois rôles d'utilisateur: les data scientists qui peuvent ou non connaître les données et le domaine; experts du domaine qui ont une bonne compréhension des données mais ne savent généralement pas comment former des requêtes; consommateurs d'informations qui sont les moins informés sur les données et les détails techniques. Ils peuvent connaître les attributs du domaine (par exemple, au cas où des sites de commerce électronique Amazon ou eBay). Cependant, avec les nouveaux rôles d'utilisateur en évolution, la catégorisation entre les différents rôles s'estompe. L'approche proposée doit tenir compte de cela.

Activités

L'interaction avec un ensemble de données présente des défis inhérents qui découlent: (a) du volume élevé des données (le volume augmente, tout comme l'écart entre la quantité de données disponibles et la capacité humaine à comprendre les données), (b) la faible familiarité de l'utilisateur avec un ensemble de données (la majorité des utilisateurs ne sont pas familiarisés avec l'organisation du contenu dans un ensemble de données), et (c) les besoins d'informations de l'utilisateur (l'utilisateur peut ne pas
savoir exactement ce qu'elle cherche jusqu'à ce qu'elle le découvre).
En conséquence, interagir avec un ou plusieurs ensembles de données est un parcours difficile et évolutif.
Les services d'assistance en exploration visent à guider l'utilisateur en fournissant des conseils sous la forme (a) de questions qui pourraient être posées et (b) de résultats supplémentaires.

Ce travail se fera en collaboration avec trois fournisseurs de cas d'utilisation: (a) Recherche sur les biomarqueurs du cancer - SIB Institut suisse de bioinformatique, Suisse, (b) Politique de recherche et d'innovation - SIRIS, Espagne, et c) Astrophysique - Institut Max Planck de physique extraterrestre, Allemagne.

Le candidat va développer un cadre pour assister les utilisateurs dans l'exploration des données comprenant les tâches suivantes:
1. Formalisation: opérateurs d'accès aux données et d'exploration, cadre d'exploration.
2. Algorithmes: exploration entièrement et partiellement guidée
3. Validation: cas d'utilisation avec différents objectifs

Compétences

Le candidat doit être compétent en algorithmique et optimisation, en gestion de données massives et en data science de manière générale.
Le candidat doit avoir une thèse en Informatique.

Contexte de travail

Laboratoire d'Informatique de Grenoble, Equipe SLIDE, Université Grenoble Alpes

La croissance et la disponibilité des données ont radicalement changé l'exploration des données au cours des 10 dernières années. De gros volumes de données sont continuellement collectées. Ces ensembles de données sont hétérogènes allant des données hautement structurées sous forme de tableaux, aux images et vidéos.

La proposition de post-doc s'inscrit dans le contexte d'un projet européen INODE - Intelligent Open Data Exploration. Le principe fondamental d'INODE est que les utilisateurs doivent interagir avec les données d'une manière plus dialectique et intuitive similaire à un dialogue avec un humain. Pour atteindre ce principe, INODE proposera une suite de solutions agiles, adaptées aux besoins et services durables pour l'exploration d'ensembles de données qui aident les utilisateurs (a) à lier et à exploiter plusieurs ensembles de données, (b) accéder et rechercher des données en utilisant le langage naturel, en utilisant des exemples et en utilisant des analyses (c) obtenir des conseils du système pour comprendre les données et formuler les bonnes requêtes, et (d) explorer les données et découvrir de nouveaux insights grâce à des visualisations.

Contraintes et risques

N/A

On en parle sur Twitter !