En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre CPJ-2022-020 - Apprentissage Automatique pour le Traitement des Langues H/F

Chaire de professeur Junior : ML2P

Apprentissage Automatique pour le Traitement des Langues H/F

Cette offre est disponible dans les langues suivantes :
FrenchEnglish

Date limite de dépôt des candidatures : 31/08/2022

Informations générales

Institut : Institut des Sciences de l'Information et de leurs Interactions
Date de publication : 20/05/2022
Type de contrat : Chaire de professeur Junior
Section du CoNRS : 7 - Sciences de l'information : traitements, systèmes intégrés matériel-logiciel, robots, commandes, images, contenus, interactions, signaux et langues
Durée du contrat : 5 ans. A son terme, le titulaire du contrat a vocation à être titularisé dans le corps des directeurs de recherche.
Date d'embauche prévue : 01/12/2022
Rémunération : Rémunération brute annuelle de 54 600 Euros à 57 800 Euros selon l’expérience professionnelle
Environnement Financier : 320 000 € pour la durée du projet

Thématique scientifique

Intelligence artificielle, traitement automatique des langues

Stratégie d’établissement

Le CNRS est l’établissement le mieux positionné au niveau français sur cette thématique de recherche. Cette chaire s’inscrit dans le contrat d’objectifs et de performance du CNRS (COP 2019-2023), notamment dans l’orientation prioritaire thématique « Numérique » ainsi que dans les grands défis sociétaux «Intelligence artificielle » (principalement) et « Inégalités éducatives ».

Stratégie du/des laboratoires d’accueil

*) Le LISN à Saclay (CNRS/Univ. Paris Saclay) est le laboratoire français en pointe dans le domaine du traitement des langues. Cette activité au sein du LISN doit néanmoins être soutenue suite aux départs récents ou programmés de plusieurs chercheurs. En dehors des activités directement liées au traitement des langues, le LISN dispose également d’un environnement favorable avec une équipe de très bon niveau en Apprentissage et optimisation et une structuration des activités de recherche en formation en IA au niveau de l’Université Parsi Saclay (Institut DATAIA). *) Le LIG (CNRS/Univ. Grenoble Alpes) développe une recherche de très bon niveau en TAL au sein de l’équipe GETALP. Le LIG, et plus généralement le site de Grenoble, dispose d’un environnement très favorable sur ce thème, avec des forces également significatives sur le traitement de la parole au sein du GIPSA-Lab en apprentissage automatique/IA (laboratoires LIG et LJK) dans le cadre plus général du 3IA MIAI. *) Le LORIA (CNRS/Univ. Lorraine) est également un laboratoire envisagé dans le cadre de ce poste. Il dispose d’équipes très bien positionnées sur le TAL, en particulier l’équipe SyNaLP, au sein du département Traitement des langues et des connaissances du LORIA. *) Les travaux de la chaire s’appuieront également sur les moyens techniques et humains liés au supercalculateur Jean-Zay (opéré par le CNRS à l’IDRIS) et au réseau national d’ingénieurs en IA.

Résumé du projet scientifique

Le traitement automatique des langues (écrites, parlées, etc.) est une technologie clé dans le domaine de l'IA qui a connu des changements très profonds au cours des dix dernières années. Les géants du numérique se sont largement appropriés la recherche sur le traitement automatique des langues, accompagnant un changement de paradigme vers des modèles toujours plus démesurés, pré-entraînés sur des quantités de données telles qu'ils peuvent désormais prétendre répondre à des tâches génériques (on parle en anglais de "Foundation models" qui sont devenus en eux-mêmes un domaine de recherche). Face à ces changements, la recherche académique peine à rester compétitive, toutefois il semble difficilement imaginable que la recherche nationale déserte un sujet aussi fondamental que celui de la langue française et de son traitement automatique. L'objectif du poste et de consolider les laboratoires d'excellence du domaine sur des aspects particulièrement stratégiques ou relevant de problématiques souveraines : traitement automatique de la langue française, domaines d'applications spécifiques peu dotés en ressources d'apprentissage ou mal couverts par les modèles génériques (dans les domaines notamment de la sécurité, de la défense, des legaltech ou de la santé) ainsi qu'en lien avec les applications/plateformes éducatives et d'aide aux personnes en situation de handicap.

Résumé du projet d’enseignement/d’observation

Les activités de la personne recrutées s’inscriront dans la dynamique de formation de l’université Paris Saclay, de l’université Grenoble Alpes ou de l’université de Lorraine à travers leurs programmes d’enseignement spécialisés dans le domaine de l’intelligence artificielle.

Diffusion scientifique

La diffusion des résultats passera par des productions scientifiques (publications, logiciels, patents…) de niveau mondial. Par ailleurs, le projet mettra en œuvre une communication vers des cibles diverses telles que communautés scientifiques, médias, décideurs, grand public, scolaires, etc., avec un calendrier adapté. Des outils spécifiques pourront être développés comme des sites web, des newsletters ou encore des rencontres, colloques internationaux, écoles d’été et conférences.

Science ouverte

Le CNRS développe une politique forte en faveur de la science ouverte. La science ouverte consiste à rendre « accessible autant que possible et fermé autant que nécessaire » les résultats de la recherche. À ce titre, le CNRS vise à ce que 100 % des textes des publications issues des travaux de ses unités soient rendues accessibles, notamment grâce au dépôt dans HAL. Les données produites doivent aussi être rendues disponibles et réutilisables, sauf restriction particulière. Par ailleurs, les principes directeurs de l’évaluation individuelle sont revus en conformité avec la déclaration DORA, plus qualitatifs et tenant compte de toutes les facettes du métier de chercheur.

Science et société

Le projet développera cette dimension en synergie avec tous les partenaires. Les travaux de recherche qui en seront issus contribueront à éclairer la décision publique.  Des initiatives de sciences participatives pourront être initiée avec des acteurs des écosystèmes socio-économiques et/ou culturel locaux ou nationaux.

Indicateurs

L’activité sera évaluée notamment sur la base de la production scientifique (publications, logiciels, patent, etc.), sur les partenariats institutionnels et privés formalisés par des contrats, sur le rayonnement international, sur la valorisation des travaux vers des communautés scientifiques pluridisciplinaires, sur l’innovation et son transfert vers la société et sur la diffusion scientifique à destination de publics non spécialistes.

Mots clés

Traitement automatique des langues (TAL), intelligence artificielle (IA)