En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5216-ALLBEL-014 - (H/F) Ingénieur/e d'études: Annotation d'un corpus écrit multilingue

(H/F) Ingénieur/e d'études: Annotation d'un corpus écrit multilingue


Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5216-ALLBEL-014
Lieu de travail : ST MARTIN D HERES
Date de publication : mercredi 31 juillet 2019
Type de contrat : CDD Technique/Administratif
Durée du contrat : 1 mois
Date d'embauche prévue : 1 octobre 2019
Quotité de travail : Temps complet
Rémunération : entre 2076.88€ et 2184.44€ BRUTS mensuels selon expérience
Niveau d'études souhaité : Bac+3
Expérience souhaitée : 1 à 4 années

Missions

Corpus multilingue (L1/L2) narration/émotion:"Le weekend de Laura"

Les textes réunis dans ce corpus constituent le premier ensemble d'un grand corpus multilingue de récits manuscrits composés dans la L1 ou la L2 (sens large) des participants. Les récits sont inspirés d'une histoire présentée sous forme de vignettes dialoguées. Elle a été proposée en format papier et montre ce qui arrive à une jeune fille prénommée Laura pendant un weekend. Le dispositif de recueil de données oriente l'attention des participants sur l'aspect émotionnel de l'histoire et les dirige vers un style narratif. Ce corpus a été rédigé en langue maternelle (français, espagnol, portugais, anglais, bulgare) et en langue étrangère (espagnol, anglais, français, portugais). Les participants sont dans leur majorité des étudiants universitaires.

Ce corpus a pour ambition d'être une base de données riche pour l'exploration des questions particulières de l'usage linguistique et de l'acquisition. Il est très fortement inspiré des études typologiques sur la conceptualisation et l'expression du mouvement, et notamment du dispositif de recueil de données 'Frog, where are you?' (Slobin, 1996). Il s'agit d'une ressource qui peut permettre d'analyser la conceptualisation et l'expression du récit émotionnel dans différentes langues, différentes variantes d'une même langue (espagnol du Mexique/espagnol d'Espagne), différentes configurations dans l'apprentissage d'une langue étrangère (apprenants hispanophones de la langue française, apprenants francophones de la langue portugaise, etc.), différents niveaux du CECRL dans l'apprentissage d'une langue (français L2 B1- français L2 C2) ou même des questions sociologiques comme le genre (expression des émotions par des filles/garçons). Nous avons l'ambition d'enrichir progressivement ce corpus afin de proposer à la communauté de recherche un grand nombre de productions au sein d'une même catégorie (résultats généralisables) ainsi qu'un grand éventail de langues (grande comparabilité).

Les missions essentielles de l'ingénieur.e d'études seront les suivantes:
- annotation en XML-TEI de la structure textuelle de l'ensemble des corpus
- codification des métadonnées avec des en-têtes XML-TEI
- mise à disposition du corpus

Activités

- Assurer l'interface entre les chercheurs porteurs du projet et le consortium CORLI/les équipes des partenaires (ORTOLANG, COCOON, BnF, Nakala).
- Annotation en XML-TEI de la structure textuelle de l'ensemble des corpus
- Catégorisation des metadonnées disponibles
- Assistance éventuelle à la transcription de certaines données
- Codification des métadonnées avec des en-têtes XML-TEI
- Mise à disposition du corpus : depôt des ressources du corpus sur la plateforme vers laquelle l'ingénieur.e d'études sera aiguillé.e (Cocoon, Nakala, Ortolang, etc.)

- Rédaction d'un cahier de charges décrivant la méthodologie du travail et les tâches effectuées afin d'assurer la cohérence et la continuité de ce projet

Compétences

- Connaissance du langage XML-TEI
- Capacité à mener des projets avec des acteurs multiples
- Intérêt pour la recherche universitaire
- Aptitude au travail en équipe et en autonomie
- Rigueur, sens de l'organisation
- La connaissance de plusieurs langues du corpus serait un atout.

Contexte de travail

Le/a candidat.e recruté.e effectuera les missions relevant de ce poste sous la tutelle scientifique du laboratoire Linguistique et Didactique des Langues Etrangères et Maternelles (Lidilem). Le Lidilem est né en 1987 de la fédération de cinq centres de recherche. Son unique tutelle est l'Université Grenoble Alpes. Les axes de recherche traitent des descriptions linguistiques, TAL, corpus ; de la sociolinguistique et acquisition du langage ; et de la didactique des langues, recherches en ingénierie éducative. Il regroupe actuellement une soixantaine de membres permanents et environ 70 doctorants. L'unité et la spécificité du laboratoire résident dans un intérêt partagé pour l'étude des langues et du langage en contexte et pour les situations d'apprentissage et d'enseignement des langues.
Au sein du laboratoire, une grande partie du travail sera effectué en autonomie. Les consignes et objectifs du poste seront explicitées par la responsable scientifique qui effectuera également le suivi du travail demandé.

Informations complémentaires

Durée du contrat: 1,5 mois soit du 01/10/2019 au 15/11/2019.

On en parle sur Twitter !