En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR9015-THOGER-007 - Ingénieur d'études (H/F) pour l'atomisation de propositions pour la vérification de la factualité réponses des modèles génératifs

Ingénieur d'études (H/F) pour l'atomisation de propositions pour la vérification de la factualité réponses des modèles génératifs


Date Limite Candidature : jeudi 23 octobre 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Ingénieur d'études (H/F) pour l'atomisation de propositions pour la vérification de la factualité réponses des modèles génératifs
Référence : UMR9015-THOGER-007
Nombre de Postes : 1
Lieu de travail : GIF SUR YVETTE
Date de publication : jeudi 2 octobre 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 3 mois
Date d'embauche prévue : 1 novembre 2025
Quotité de travail : Complet
Rémunération : 2571
Niveau d'études souhaité : BAC+5
Expérience souhaitée : Indifférent
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Ingenieure ou ingenieur en ingenierie logicielle

Missions

Le projet porte sur l'étude des méthodes du traitement du langage naturel, et comment celles-ci peuvent bénéficier des approches dites d'atomisation du contexte.
L'atomisation consiste à reformuler une phrase ou un ensemble de phrases en une liste de propositions atomiques (c'est-à-dire des phrases qui sont à la fois concises et sémantiquement autonomes).
Cette méthode a déjà porté ses fruits dans les approches de générations augmentées par récupération, en vérification automatique de la factualité et en évaluation de résumé.
Les différentes expériences et évaluations porteront sur des corpus de la littérature du TAL en langue Française. En particulier sur un corpus créer au sein du laboratoire, le corpus de question-réponse CQUAE~\cite{DBLP:conf/coling/GeraldVETP24}. Pour l'évaluation, nous planifions d'évaluer l'apport de ces reformulations en propositions atomiques sur la génération de automatique de questions ou bien de réponses. Par exemple, on pourra imaginer fournir à la place du contexte les atomes au lieu du contexte original et en mesurer l'influence sur la qualité de la génération. Une deuxième question de recherche est la pertinence de ces approches pour la vérification d'information, la construction d'un graphe de connaissance à partir des atomes extraits est envisagée dans le but de vérifier la factualité des réponses.
Le candidat devra pendant la durée du contrat proposer de nouvelles méthodes pour l'atomisation de paragraphes textuels et/ou proposer de nouvelle métrique d'évaluation s'appuyant sur ces approches pour vérifier l’exactitude des générations produites par des modèles génératifs.

Activités

Le candidat devra être en mesure d'intégrer ses connaissances dans les approches de vérification d'information pour l'explicabilité des réponses des modèles génératifs pour tenter de répondre à la question ``Les approches d'atomisation peuvent-elles améliorer les performances ou l'explicabilité des grands modèles de langue ?''. Parmi les objectifs permettant de répondre à cette question, plusieurs axes sont aujourd'hui retenus :
- Proposer des méthodes innovantes pour la création de propositions atomiques
- Évaluation de l'atomicité des propositions (en testant cette évaluation)
- Proposer de nouvelles métriques d'évaluation des modèles génératifs se basant sur l'exploitation des propositions atomiques
- Proposer un code facilement réutilisable, dans différents domaines du traitement du langage naturel.

Compétences

- Un Diplôme de master en Informatique et ou mathématiques et leurs applications
- Avoir déjà travaillé sur des approches incluant la reformulation de texte en propositions atomiques
- Avoir des compétences dans les approches logiques pour la linguistique
- Maîtrise de la programmation avec python
- Expériences d'utilisation dans les outils récents et les architectures neuronales pour le TAL

Contexte de travail

Le candidat travaillera dans le laboratoire LISN sur le campus de l'Université Paris Saclay. Le poste est prévu pour 3 mois et débutera début novembre 2025.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Contraintes et risques

Travail sur écran