En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR9003-MARNOE-005 - Ingénieur de recherche en ingénierie logicielle et analyse textuelle - projet ERC (H/F)

Ingénieur de recherche en ingénierie logicielle et analyse textuelle - projet ERC (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : lundi 22 juillet 2024 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Ingénieur de recherche en ingénierie logicielle et analyse textuelle - projet ERC (H/F)
Référence : UMR9003-MARNOE-005
Nombre de Postes : 1
Lieu de travail : CHAMPS SUR MARNE
Date de publication : lundi 1 juillet 2024
Type de contrat : CDD Technique/Administratif
Durée du contrat : 24 mois
Date d'embauche prévue : 16 septembre 2024
Quotité de travail : Temps complet
Rémunération : Entre 2900 et 3600 € bruts mensuels selon expérience
Niveau d'études souhaité : Niveau 7 - (Bac+5 et plus)
Expérience souhaitée : 1 à 4 années
BAP : Informatique, Statistiques et Calcul scientifique
Emploi type : Chef-fe de projet ou expert-e en ingénierie des systèmes d’information

Missions

La mission de l’ingénieur-e de recherche est de concevoir et mettre en œuvre des développements informatiques pour l’analyse de données en sciences sociales au sein de la plateforme CorTexT du LISIS, dans le cadre du projet NanoBubbles (ERC Synergy Grant n°951393), en collaboration avec les chercheurs du LISIS qui participent au projet.

L’ingénieur-e de recherche aura à conduire la maîtrise d'œuvre de projets sur une ou plusieurs phases du cycle de vie dans le respect des normes, des procédures et des référentiels en vigueur : analyse, développement, qualification, intégration et déploiement.

L’ancrage disciplinaire de ses travaux sera celui de l’analyse automatique de la langue, notamment via des méthodes et outils issus de la textométrie et conçus pour l'analyse du discours et la recherche d'information dans de grands corpus textuels. L'objectif principal est de développer et de restructurer les méthodes déjà en place au sein de la plateforme web CorTexT Manager, tout en répondant prioritairement aux besoins d’analyses morpho-syntaxiques et d'études scientométriques réalisées au sein du projet NanoBubbles : détection et analyse des citations et de leur contexte, analyse de textes (de presse, académiques…), extraction et analyses d'informations bibliographiques.

Activités

Tâches principales
- Effectuer une veille sur les méthodes de traitement automatique du langage naturel, multilingue pour coller à l’état de l’art : lemmatisation, étiquetage grammatical…
- Suivre le développement d’outils et méthodes faisant référence dans le domaine, comme par exemples spaCy, TXM, CQPweb.
- Recueillir les besoins fonctionnels, tant aux niveaux méthodes et logiciels, qu’aux niveaux des objectifs du projet NanoBubbles
- Faire une proposition de méthode d’extraction lexicale, incluant d’un côté les étapes de lemmatisation, d’étiquetage grammatical (telles que celles mobilisables des logiciels de traitement de corpus textuels…), et de l’autre l’interrogation, la manipulation et la correction
- Développer la solution méthodologique et logicielle proposée, puis l’intégrer à l’écosystème de méthodes et d’outils accessibles dans CorTexT Manager
- Travailler à l’interface entre l’équipe technique de la plateforme (et sa direction) et les chercheurs du LISIS impliqués dans NanoBubbles.
- Accompagner la conception et le développement de la troisième version du logiciel emblématique de la plateforme CorTexT, dans l’objectif de l’intégration de ce nouvel ensemble méthodologique et fonctionnel.

Tâches secondaires
- Participer aux actions de valorisation et de dissémination
- Coordonner les moyens humains, techniques et financiers nécessaires à la réalisation d’un projet de recherche ou d’une participation à un projet de recherche

Compétences

Savoirs :
- Maîtrise des pratiques et outils d’ingénierie logicielle
- Maîtrise des démarches classiques en NLP : collecte de données, structuration, pré-traitement, traitements et visualisation
- Compréhension de la diversité de méthodes quali-quanti en sciences sociales et de leurs enjeux et applications est souhaitable
- Connaissances en ergonomie et interfaces humain-machine
- Connaissances en statistiques, analyse de données et machine learning (est un plus)
- Connaissances relatives à l'édition scientifique et aux écrits académiques (est un plus)

Savoirs faire :
- Expérience en développement logiciel (Python, PHP, Shell)
- Expérience avec Git et Github/Gitlab
- Connaissance en langage d’interrogation et manipulation de données
- Connaissance des formats de stockage de données
- Expérience avec les systèmes d’exploitation Linux
- Maîtrise des outils de conteneurisation, notamment Docker et Docker Swarm
- Bonne maîtrise de l'anglais (langue de travail de NanoBubbles)
- Connaissances en packaging avec Guix (est un plus)
- Connaissances en administration serveur (est un plus)

Savoirs-être :
- Travail en équipe et sens du collectif
- Sens de la communication, notamment dans l’organisation du dialogue entre savoirs « ingénieuriques » et sciences sociales
- Être force de proposition
- Adaptabilité
- Curiosité
- Autonomie
- Rigueur

Contexte de travail

La plateforme CorTexT est localisée sur le campus de l'Université Gustave Eiffel, dans l’Est Parisien, au sein du Laboratoire Interdisciplinaire Sciences Innovations Sociétés (LISIS). Fondée en 2009, elle est une infrastructure de recherche expérimentale pour les sciences sociales. Elle est un instrument essentiel, par exemple, pour analyser la structuration des communautés d’experts ou les discours dans des controverses scientifiques ou techniques.
Une partie importante des méthodes originales produites sont mises à disposition au sein de l’application web collaborative CorTexT Manager (https://www.cortext.net/anf-tdm-2021-focus-cortext-manager/). En 2023, environ 1200 utilisateurs provenant de plus de 450 institutions différentes ont eu une activité avec les services de la plateforme CorTexT, générant un peu plus de 45000 calculs traités par son infrastructure. Durant la même période, 80 documents ont été publiés en mobilisant une ou plusieurs de nos méthodes (https://www.cortext.net/publications/). Un des défis importants de la plateforme CorTexT pour les années à venir sera de concevoir et développer la version suivante, tout en y ajoutant de nouveaux ensembles méthodologiques.
Le pilotage de la plateforme CorTexT est assuré par son directeur technique, Philippe Breucker, et son directeur scientifique, Lionel Villard. L’équipe de recherche est composée de quinze membres aux compétences et profils variés : ingénieur.e.s (systèmes, backend, front-end et données), ingénieur.e.s d’étude et enseignants-chercheurs. L’ingénieur-e de recherche s’intégrera à cette équipe et sera au contact direct des chercheurs du LISIS du projet NanoBubbles afin de répondre aux besoins méthodologiques et logiciels qu’ils ou elles expriment.
La personne recrutée travaillera sous la direction de Lionel Villard, directeur scientifique de la plateforme CorText, ainsi que sous celle de Frédérique Bordignon et Marianne Noel, ingénieures de recherche au LISIS et membres du projet NanoBubbles.
Le poste est localisé à Noisy-Champs (ligne A du RER), dans les locaux du LISIS sur le campus de l'Université Gustave Eiffel.

Informations complémentaires

Le contrat de travail proposé est un contrat à temps plein, d'une durée de 24 mois, avec un salaire net mensuel variant selon l'expérience. La date de début du contrat est le 16 septembre 2024, mais des arrangements sont possibles. Les candidatures doivent être déposées en ligne via la plateforme du CNRS : https://emploi.cnrs.fr/