Assistant-e Ingénieur-e traitement de données et enquêtes H/F

New

Laboratoire de Langues & Civilisations à Tradition Orale

VILLEJUIF • Val-de-Marne

  • IT in FTC
  • 11 mounth
  • BAC + 2

This offer is open to people with a document recognizing their status as a disabled worker.

Offer at a glance

The Unit

Laboratoire de Langues & Civilisations à Tradition Orale

Contract Type

IT in FTC

Working hHours

Full Time

Workplace

94800 VILLEJUIF

Contract Duration

11 mounth

Date of Hire

01/06/2026

Remuneration

2347€ brut

Apply Application Deadline : 16 April 2026 23:59

Job Description

Missions

Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les collègues IT (ingénieure informaticienne et technicien).

Activity

- Participer à la conception et à l'organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » (pangloss.cnrs.fr).
- Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site pangloss.cnrs.fr. - Assurer les opérations de codage et de recodage de métadonnées et d’annotations.
- Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
- Former et conseiller les chercheurs en matière d'outils d'annotation et de traitement.
- Aider à paramétrer les outils selon les particularités des projets et situations d'enquête.
- Exercer une veille sur les méthodes d'enquêtes et les outils de traitement de données.

Your Profil

Skills

Savoirs :
- Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
- Méthodes et outils en production de données (connaissance générale)
- Principes de gestion des métadonnées : préconisations du réseau OLAC d'archives ouvertes, outils spécialisés
- Systèmes de gestion de base de données (connaissance générale)
- Familiarité avec les technologies web : connaissance générale HTML, XML
- Archivage pérenne des données de recherche (notions)
- Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
- Cadre légal et déontologique (connaissance générale)
- Techniques de présentation écrite et orale
- Langue anglaise : B1 (cadre européen commun de référence pour les langues)
- Une familiarité préalable avec les outils logiciels d’annotations les plus couramment employés en linguistique de terrain serait un plus (Elan, Toolbox, FLEx..)
- Savoir assurer la traçabilité des procédures de traitement des informations.
- Savoir transférer les données d'un logiciel à un autre (en traitement manuel ou en paramétrant des scripts Python existant).
- Savoir participer à la rédaction des textes de présentation des divers corpus sur pangloss.cnrs.fr, en français et en anglais

Savoirs-être :
- Travailler en équipe avec des chercheurs, des spécialistes d'informatique, d'audiovisuel, d'Information Scientifique et Technique
- Savoir s'adapter d'une façon qui encourage la créativité

Your Work Environment

La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d'urgence, du fait de l'érosion de cette diversité, parallèle à l'érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics (pangloss.cnrs.fr), est au cœur d'un environnement de Science ouverte, l'enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.
Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un laboratoire à l'écoute des langues, à l'écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d'éléments d'applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d'étroite collaboration avec des partenaires d'autres institutions dont la Très Grande Infrastructure de Recherche Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d'exemple : https://lll.cnrs.fr/actualite/datathon/).

Compensation and benefits

Compensation

2347€ brut

Annual leave and RTT

44 jours

Remote Working practice and compensation

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

About the offer

Offer reference UMR7107-ANIFOR-020
Line of business Human and Social Sciences
Job Type Assistant Data Production, Processing and Surveys Engineer

About the CNRS

The CNRS is a major player in fundamental research on a global scale. The CNRS is the only French organization active in all scientific fields. Its unique position as a multi-specialist allows it to bring together different disciplines to address the most important challenges of the contemporary world, in connection with the actors of change.

CNRS

The research professions

Create your alert

Don't miss any opportunity to find the job that's right for you. Register for free and receive new vacancies directly in your mailbox.

Create your alert

Assistant-e Ingénieur-e traitement de données et enquêtes H/F

IT in FTC • 11 mounth • BAC + 2 • VILLEJUIF

You might also be interested in these offers!

    All Offers