En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR7503-CLAGAR-005 - Ingénieur Génération Multilingue, LLMs H/F

Ingénieur Génération Multilingue, LLMs H/F


Date Limite Candidature : vendredi 17 mai 2024

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Ingénieur Génération Multilingue, LLMs H/F
Référence : UMR7503-CLAGAR-005
Nombre de Postes : 1
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : vendredi 26 avril 2024
Type de contrat : CDD Technique/Administratif
Durée du contrat : 12 mois
Date d'embauche prévue : 4 octobre 2024
Quotité de travail : Temps complet
Rémunération : 2304 euros bruts/mois ajustable selon le niveau d'expérience
Niveau d'études souhaité : Niveau 7 - (Bac+5 et plus)
Expérience souhaitée : Indifférent
BAP : Informatique, Statistiques et Calcul scientifique
Emploi type : Ingénieur-e en calcul scientifique

Missions

Le personne recrutée sera chargée de développer des projets en génération de texte multilingue (TAL) avec des méthodes neuronales. Elle jouera un rôle important dans la collecte et la préparation des données, l'implémentation de modèles de langage à grande échelle pour améliorer la génération et leur évaluation.

Activités

Cette mission comprendra les activités suivantes :
- Collecter/créer des données d'apprentissage et d'évaluation
- Mettre en œuvre des modèles neuronaux pour la génération de texte multilingue
- Evaluer ces modèles et interpréter les résultats
- Rediger et soumettre des articles décrivant les expériences réalisés et les résultats obtenus
- Participer à la vie scientifique de l’équipe, en animant des ateliers et des séminaires sur les technologies TAL
- Gérer les aspects techniques du projet, incluant l'installation et l'adaptation de modèles neuronaux, le versionnage et la mise à disposition des résultats dans une optique de science ouverte

Compétences

Nous recherchons une personne de formation supérieure en traitement automatique des langues (Doctorat), avec les compétences suivantes :
- Expérience solide en TAL et en utilisation de bibliothèques et frameworks spécialisés (NLTK, spaCy, PyTorch, Transformers…).
- Compétences en machine learning et deep learning, avec une capacité à appliquer ces techniques à des problématiques de génération de texte
- Maîtrise de la programmation en Python et familiarité avec les outils de gestion de versionnage, des bases de données et des outils et technologies du Web (API, JS…).
- Bonne connaissance des principes de l'analyse de données, y compris la statistique, la visualisation de données et l'interprétation des résultats.
- Capacité à travailler en équipe interdisciplinaire et à communiquer efficacement

Contexte de travail

La personne recrutée travaillera au sein de l'équipe SYNALP du LORIA, en collaboration étroite avec Claire Gardent (Directrice de recherche CNRS) et avec les doctorants et chercheurs du LORIA travaillant dans le domaine du Traitement Automatique des Langues.