En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR7107-ANIFOR-009 - Chercheur en science du langage H/F

Chercheur en science du langage H/F

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : lundi 12 décembre 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR7107-ANIFOR-009
Lieu de travail : VILLEJUIF
Date de publication : lundi 21 novembre 2022
Type de contrat : CDD Scientifique
Durée du contrat : 4 mois
Date d'embauche prévue : 1 février 2023
Quotité de travail : Temps complet
Rémunération : 2889.51€ brut mensuel pour une expérience inferieure à 2 ans
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années

Missions

Sonder les représentations neuronales pour identifier les limites de l'affinage de modèles et détecter automatiquement les propriétés typologiques des langues.

Activités

En concertation avec les partenaires du projet, le/la chercheur/chercheuse recruté-e mènera des expériences pour déterminer dans quelle mesure les méthodes d'affinage de modèles (fine-tuning), aujourd'hui au cœur de nombreuses approches de Traitement Automatique des Langues, peuvent être utilisées pour développer des systèmes de traitement de la parole pour n'importe quelle langue. D'autre part, la personne recrutée participera à la définition et la mise en œuvre de chaîne de traitement intégrant des méthodes et des outils innovants pour faciliter les tâches de documentation linguistique («documentation linguistique computationnelle»).
La personne recrutée aura pour mission de contribuer aux diverses étapes de la recherche :
- participation à la conception des protocoles expérimentaux, considérant différentes méthodes d'analyse utilisées dans la communauté et notamment les challenges sets (corpus constitués d'exemples choisis pour illustrer certains problèmes linguistiques) et les sondes linguistiques (des classifieurs entrainés pour prédire certaines propriétés linguistiques à partir des représentations découvertes par les réseaux de neurones)
- employer des méthodes d'analyses causales et contre-factuelles visant à identifier les informations capturées par les réseaux de neurones, en modifiant l'architecture et/ou les représentations de ceux-ci.
- collaborer étroitement avec des linguistes de terrain afin d'identifier les caractéristiques des langues qu'il sera pertinent d'examiner pour identifier les limites des modèles de représentation de l'état de l'art et approfondir les travaux de la communauté sur l'analyse des représentations neuronales.

Compétences

 Thèse en Sciences du Langage
 Rudiment des outils d'apprentissage machine
 Familiarité avec un langage de script (de préférence Python)
- Capacité de dialogue et de coordination avec différents partenaires : linguistes de terrain, chercheurs en informatique, ingénieurs
- Sens de la rigueur, de l'organisation et de la méthode       
- Compétences managériales

Contexte de travail

Le Laboratoire de Langues et Civilisations à Tradition Orale (LACITO, UMR 7107 CNRS - Université Sorbonne Nouvelle) est une unité de recherche rattachée à l'Institut des Sciences Humaines et Sociales du CNRS. Le LACITO réalise avec des laboratoires d'informatique un projet « La documentation computationnelle des langues à l'horizon 2025 ».

Contraintes et risques

Missions de terrain

On en parle sur Twitter !