En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR8557-CAMROT-003 - Chercheur post-doctoral en extraction des connaissances (H/F)

Chercheur post-doctoral en extraction des connaissances (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : vendredi 27 septembre 2024 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Chercheur post-doctoral en extraction des connaissances (H/F)
Référence : UMR8557-CAMROT-003
Nombre de Postes : 1
Lieu de travail : PARIS 06
Date de publication : vendredi 6 septembre 2024
Type de contrat : CDD Scientifique
Durée du contrat : 15 mois
Date d'embauche prévue : 1 janvier 2025
Quotité de travail : Temps complet
Rémunération : Entre 3081 et 4292 € bruts mensuels selon expérience
Niveau d'études souhaité : Niveau 8 - (Doctorat)
Expérience souhaitée : Plus de 10 années
Section(s) CN : Interactions, particules, noyaux du laboratoire au cosmos

Missions

Ce poste est proposé dans le cadre du projet de pré-maturation "Hyperquest", qui vise à démontrer la faisabilité d’une application conviviale permettant d’effectuer de manière transparente et simple des tâches complexes d’extraction de connaissances. Le cœur du défi et de la mission consistera en l'articulation entre les approches “top-down” (à base de listes de motifs linguistiques) et “bottom-up” (à base de listes d’exemples). Chacune est en effet individuellement peu adaptée aux besoins d’extraction de connaissances spécialisées et spécifiques, dont la taille moyenne ne justifie ni le développement de systèmes d'extraction ad hoc (“top-down”) ni la fabrication de données d’entraînement étiquetées ad hoc (“bottom-up”). La personne retenue contribuera ainsi à développer un processus semi-automatique permettant aux utilisateurs de concevoir et spécifier le type d’informations et de relations qui les intéressent, sur la base de ce que contiennent leurs corpus, en articulant approches symboliques, notamment liées aux graphes de connaissances, et approches connexionnistes, notamment liées aux plongements de l'extraction de connaissance à partir de corpus textuels.

Activités

La tâche principale est la création de la partie "back-end" du prototype Hyperquest, qui suivra une approche neuro-symbolique. Cela nécessitera de se familiariser avec la littérature pertinente en représentation des connaissances liées à la fois aux graphes de connaissance et aux plongements textuels, d'affiner les algorithmes et les modèles en gardant à l'esprit les applications industrielles pratiques et de coopérer avec un concepteur UX qui sera responsable de la création de la partie "front-end". Le candidat retenu participera également à la recherche sur les utilisateurs, en recueillant les exigences et en collectant des ensembles de données pertinents.

Compétences

Ce poste s'adresse à un profil post-doctoral ayant une formation en informatique, en linguistique informatique, en apprentissage automatique ou dans des domaines connexes, ainsi qu'une solide connaissance du traitement automatique des langues (TAL) contemporain. En raison de la nature pratique du projet, la connaissance et l'expérience de Python et de son écosystème de bibliothèques scientifiques sont également cruciales.

Contexte de travail

Le travail se déroulera au CAMS (Centre d'Analyse et de Mathématique Sociales), laboratoire interdisciplinaire de l'EHESS à l'interface notamment entre sciences sociales et modélisation, dans le cadre du projet de pré-maturation CNRS "Hyperquest", dirigé par Camille Roth. Le projet Hyperquest vise à développer le prototype d'un produit logiciel d'extraction de connaissances semi-automatique et intuitif, avec des applications industrielles, et éventuellement une startup, dont la personne retenue aurait la possibilité de faire partie.

Contraintes et risques

Le poste ne comporte aucun risque particulier.