Assistant-e Ingénieur-e traitement de données et enquêtes H/F
New
- IT in FTC
- 11 mounth
- BAC + 2
Offer at a glance
The Unit
Laboratoire de Langues & Civilisations à Tradition Orale
Contract Type
IT in FTC
Working hHours
Full Time
Workplace
94800 VILLEJUIF
Contract Duration
11 mounth
Date of Hire
01/06/2026
Remuneration
2347€ brut
Apply Application Deadline : 16 April 2026 23:59
Job Description
Missions
Contribuer à la conception et la mise en œuvre de protocoles de collecte, de publication électronique et de traitement de corpus de langues rares. Participer à la préparation des corpus audio/vidéo annotés pour publication électronique (archivage), en étroite collaboration avec les chercheurs (Sciences du langage et Anthropologie linguistique) et les collègues IT (ingénieure informaticienne et technicien).
Activity
- Participer à la conception et à l'organisation de corpus multimédia de langues rares dans une archive ouverte, la collection « Pangloss » (pangloss.cnrs.fr).
- Contribuer à la valorisation et à la diffusion des résultats, en particulier via le site pangloss.cnrs.fr. - Assurer les opérations de codage et de recodage de métadonnées et d’annotations.
- Contribuer à la qualité et à la cohérence des corpus par un suivi des projets, de la collecte à la publication électronique des données.
- Former et conseiller les chercheurs en matière d'outils d'annotation et de traitement.
- Aider à paramétrer les outils selon les particularités des projets et situations d'enquête.
- Exercer une veille sur les méthodes d'enquêtes et les outils de traitement de données.
Your Profil
Skills
Savoirs :
- Méthodes et outils en traitement et analyse des données, en particulier celles des enquêtes linguistiques de terrain (Maîtrise).
- Méthodes et outils en production de données (connaissance générale)
- Principes de gestion des métadonnées : préconisations du réseau OLAC d'archives ouvertes, outils spécialisés
- Systèmes de gestion de base de données (connaissance générale)
- Familiarité avec les technologies web : connaissance générale HTML, XML
- Archivage pérenne des données de recherche (notions)
- Connaissances générales en linguistique souhaitables. Un rudiment en ethnologie/anthropologie serait un plus.
- Cadre légal et déontologique (connaissance générale)
- Techniques de présentation écrite et orale
- Langue anglaise : B1 (cadre européen commun de référence pour les langues)
- Une familiarité préalable avec les outils logiciels d’annotations les plus couramment employés en linguistique de terrain serait un plus (Elan, Toolbox, FLEx..)
- Savoir assurer la traçabilité des procédures de traitement des informations.
- Savoir transférer les données d'un logiciel à un autre (en traitement manuel ou en paramétrant des scripts Python existant).
- Savoir participer à la rédaction des textes de présentation des divers corpus sur pangloss.cnrs.fr, en français et en anglais
Savoirs-être :
- Travailler en équipe avec des chercheurs, des spécialistes d'informatique, d'audiovisuel, d'Information Scientifique et Technique
- Savoir s'adapter d'une façon qui encourage la créativité
Your Work Environment
La mission du LACITO (Langues et Civilisations à Tradition Orale, UMR 7107 CNRS / Sorbonne Nouvelle / INALCO) est de décrire et étudier la diversité des langues et des civilisations à tradition orale. Cette mission comporte un caractère d'urgence, du fait de l'érosion de cette diversité, parallèle à l'érosion des écosystèmes et la chute de la biodiversité. La collection Pangloss, archive ouverte principalement dédiée aux langues à tradition orale, regroupe des corpus dans près de 200 langues. Cette collection, en libre accès pour tous les publics (pangloss.cnrs.fr), est au cœur d'un environnement de Science ouverte, l'enjeu étant de parvenir à un progrès cumulatif des connaissances, grâce à un appui mutuel entre données, outils et publications.
Le LACITO est un laboratoire « à taille humaine », à la gouvernance collégiale : un laboratoire à l'écoute des langues, à l'écoute des gens. Au sein du laboratoire, la personne recrutée travaillera en équipe avec une ingénieure (qui assure dépôt des données en archive pérenne, maintenance d'éléments d'applications informatiques, et nouvelles innovations) et un technicien. Le travail autour des corpus oraux bénéficie de relations de confiance et d'étroite collaboration avec des partenaires d'autres institutions dont la Très Grande Infrastructure de Recherche Huma-Num, la Bibliothèque nationale de France et le Laboratoire Ligérien de Linguistique (voir à titre d'exemple : https://lll.cnrs.fr/actualite/datathon/).
Compensation and benefits
Compensation
2347€ brut
Annual leave and RTT
44 jours
Remote Working practice and compensation
Pratique et indemnisation du TT
Transport
Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€
About the offer
| Offer reference | UMR7107-ANIFOR-020 |
|---|---|
| Line of business | Human and Social Sciences |
| Job Type | Assistant Data Production, Processing and Surveys Engineer |
About the CNRS
The CNRS is a major player in fundamental research on a global scale. The CNRS is the only French organization active in all scientific fields. Its unique position as a multi-specialist allows it to bring together different disciplines to address the most important challenges of the contemporary world, in connection with the actors of change.
Create your alert
Don't miss any opportunity to find the job that's right for you. Register for free and receive new vacancies directly in your mailbox.