En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Thèse Formalismes pour les parcours de conversation génératifs - Application aux questions-réponses H/F

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : mardi 27 mai 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Thèse Formalismes pour les parcours de conversation génératifs - Application aux questions-réponses H/F
Référence : UMR5217-SIHAME-012
Nombre de Postes : 1
Lieu de travail : ST MARTIN D HERES
Date de publication : mardi 6 mai 2025
Type de contrat : CDD Doctorant
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2025
Quotité de travail : Complet
Rémunération : La rémunération est d'un minimum de 2200,00 € mensuel
Section(s) CN : 06 - Sciences de l'information : fondements de l'informatique, calculs, algorithmes, représentations, exploitations

Description du sujet de thèse

Les systèmes d'IA conversationnelle sont des modèles de langage à grande échelle utilisant des réseaux de neurones transformateurs. Ces modèles sont entraînés sur une grande quantité de données textuelles collectées sur le web à l'aide de supercalculateurs pendant plusieurs jours. À titre d'exemple, PaLM, un modèle LLM de Google, comporte 540 milliards de paramètres et nécessite plus d'un mois d'entraînement sur un cluster de calcul spécialisé. L'adoption rapide des LLM a dépassé le développement des techniques d'évaluation de la qualité de leurs résultats. Cette surveillance est cruciale, car il a été démontré que les LLM sont susceptibles de produire ce que l'on appelle des « hallucinations », des réponses plausibles mais factuellement incorrectes ou incompatibles avec l'intention de l'utilisateur. Par conséquent, se fier aux LLM sans une évaluation appropriée peut avoir de graves conséquences. Garantir la qualité des résultats des LLM est essentiel pour exploiter le pouvoir transformateur de ces modèles tout en limitant les risques potentiels. En développant des méthodologies de validation robustes et en intégrant des mesures de contrôle qualité, les entreprises peuvent exploiter les avantages des LLM tout en préservant leur prise de décision.

Les questions à choix multiples (QCM) sont depuis longtemps un pilier de l'éducation, offrant un moyen standardisé d'évaluer les connaissances et la compréhension des étudiants. Cependant, la création de QCM de qualité demeure un processus long et exigeant pour les enseignants en médecine. Ce défi a incité à explorer des solutions innovantes permettant d'alléger la charge de travail des professeurs tout en préservant la qualité et la pertinence du contenu pédagogique. Les avancées récentes dans le domaine des grands modèles de langage (LLM) offrent une voie prometteuse pour résoudre ce problème. Les LLM ont démontré des capacités remarquables en matière de compréhension et de génération de langage dans divers domaines. L'exploration de l'utilisation de ces modèles pour le développement de supports pédagogiques, notamment pour la création de QCM destinés à la formation médicale, mérite une recherche et une évaluation approfondies. Dans cette proposition de thèse, nous introduisons la notion de parcours de conversation générative qui exploitent les LLM pour produire des séquences de questions afin d'évaluer les connaissances et la compréhension des étudiants.

Contexte de travail

PROJET ITN ARMADA au sein du Laboratoire d'Informatique de Grenoble. La rémunération pourra être supérieure en fonction des critères de financement du MSCA.

Le LIG est un laboratoire de 500 membres composé d'enseignants-chercheurs, de chercheurs permanents, de doctorants et de personnel administratif et technique. Sa mission est de contribuer au développement des aspects fondamentaux de l'informatique (modèles, langages, méthodologies, algorithmes) et de relever les défis conceptuels, technologiques et sociétaux. Les 24 équipes de recherche du LIG visent à accroître la diversité et le dynamisme des données, des services, des dispositifs d'interaction et des cas d'usage, afin d'influencer l'évolution des logiciels et des systèmes pour garantir des propriétés essentielles telles que la fiabilité, la performance, l'autonomie et l'adaptabilité. La recherche au sein du LIG s'articule autour de cinq axes : Systèmes intelligents pour relier les données, la connaissance et l'humain, Ingénierie des logiciels et des systèmes d'information, Méthodes formelles, modèles et langages, Systèmes interactifs et cognitifs, Systèmes distribués, Calcul parallèle et Réseaux.

ARMADA est un réseau doctoral visant à former 15 jeunes chercheurs polyvalents et interconnectés, spécialisés dans le domaine de l'intelligence artificielle conversationnelle (IA) et les défis liés aux avancées récentes dans le développement de grands modèles de langage (LLM), tels que ChatGPT et Bard. Ces spécialistes acquerront des connaissances et des compétences uniques en intelligence artificielle, traitement du langage naturel, apprentissage automatique, gestion des données et conception d'algorithmes afin d'améliorer la fiabilité des LLM. Un LLM fiable produira des réponses rapides, cohérentes et vérifiables, et guidera l'utilisateur. Grâce à son caractère fortement interdisciplinaire, le programme proposé proposera de nombreuses activités de formation visant à perfectionner les compétences des stagiaires. Le réseau propose une formation à la recherche avec des écoles d'été et d'hiver sur les aspects multidisciplinaires du sujet, ainsi que des ateliers et des cours visant à développer des compétences sociales et interpersonnelles non techniques, telles que la rédaction scientifique, l'innovation, la supervision et le management. Ce programme répond aux besoins cruciaux de l'UE en matière de réglementation de l'IA en proposant de former des experts en IA conversationnelle qui pourront conseiller les instances européennes sur les questions techniques liées à l'adoption de ces technologies dans des disciplines clés telles que la médecine, l'éducation et l'informatique décisionnelle. Les huit organisations réparties dans sept pays formeront une plateforme d'interopérabilité pour le partage de connaissances et de compétences.

Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.

Contraintes et risques

N/A