En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UPR3251-IOAVAS-003 - Analyse linguistique multi-niveaux de la variation sonore (H/F)

Analyse linguistique multi-niveaux de la variation sonore (H/F)

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UPR3251-IOAVAS-003
Lieu de travail : ORSAY
Date de publication : jeudi 30 juillet 2020
Type de contrat : CDD Scientifique
Durée du contrat : 12 mois
Date d'embauche prévue : 1 octobre 2020
Quotité de travail : Temps complet
Rémunération : Entre 2695,56 et 3107,82 brut mensuel selon expérience.
Niveau d'études souhaité : Bac+5
Expérience souhaitée : 1 à 4 années

Missions

Le travail se déroulera dans le le cadre du projet OTELO financé par l'institut de convergence DATAIA et MSH Paris-Saclay, qui propose une
analyse multi-niveaux de la langue parlée à partir de grands corpus oraux, segmentés et annotés
automatiquement. L'hypothèse de travail est la suivante : la langue est intrinsèquement ambiguë et
polysémique. Les linguistes aspirent à rendre compte de cette ambiguïté dans le but de comprendre
son fonctionnement. Les chercheurs en sciences et technologies de l'information sont également
concernés par la formalisation de la variation linguistique dans des buts applicatifs. Les travaux qui
s'intéressent à une description approfondie de la langue sont rares car ils impliquent des démarches
venant de plusieurs communautés scientifiques (SHS et sciences du numérique, langue écrite vs
langue orale, etc.). Le projet OTELO réunit des chercheurs en SHS et sciences du numérique ayant l'objectif commun de rendre compte des ambiguïtés de la langue à travers une analyse qui conjugue exploration des motifs de la variation sonore et statut des unités lexicales en contexte.

Activités

Le travail portera sur une analyse et une modélisation statistiques de différents patrons de variation segmentale (réductions, phénomènes de lénition, de fortition, d'assimilation contextuelle etc.) en anglais et en français, compte tenu de méta-données de type parties du discours, constituants syntaxiques et contraintes sémantiques, et de variables socio-linguistiques (style de parole, profile des locuteurs). Une attention particulière sera portée aux homophonies contextuelles avec le but de répondre à la question de recherche selon laquelle la fusion d'informations contextuelles aide à la désambiguïsation d'unités homophones impliquant notamment des nomes propres.

Compétences

La/le candidat idéal.e est titulaire d'un doctorat en linguistique (phonétique et/ou phonologie, analyse instrumentée de grands corpus) ou TAL et connait la problématique de l'analyse des données massives impliquant des méthodes instrumentées (mise en place de scripts pour l'extraction de paramètres acoustiques, modélisation statistique avec des logiciels comme R, modélisation de la variation avec des méthodes inspirées de la transcription automatique de la parole). La programmation est un plus (Pearl, Python) ainsi que les connaissances linguistiques allant au delà du niveau segmental et supra-segmental. Les données de travail seront en français et en anglais, mais des connaissances concernant d'autres langues traitées par le laboratoire d'accueil et pour lequel des données en grande quantité sont disponibles (comme par exemple, chinois mandarin, arabe) sont un plus.

Contexte de travail

Le projet OTELO est un projet inter et pluridisciplinaire réunissant des chercheurs en SHS et en sciences du numérique du LIMSI (Ioana Vasilescu, Lori Lamel) et du LTCI (Fabian Suchanek).

On en parle sur Twitter !