Informations générales
Réservé aux agents CNRS (fonctionnaires et CDI) et aux fonctionnaires et CDI de droit public
Intitulé de l'offre : Ingénieur-e de recherche en production, traitement et analyse de données H/F
Référence : UMR8007-MOBINT-N54043
Lieu de travail : PARIS 16
Institut : INSHS - Institut des sciences humaines et sociales
Date de publication : mercredi 4 décembre 2024
Session : Campagne Hiver 2025
Groupe de Fonction : IRG3
BAP : D - Sciences Humaines et Sociales
Emploi type : Ingénieur-e de recherche en production, traitement et analyse de données
Missions
Concevoir, mettre en oeuvre des bases de données et en garantir leur sécurité, leur cohérence et leur évolution ; assurer un rôle de prescription, de conseil, d'assistance, d'information, de formation et d'alerte autour des bases de données auprès de l'équipe de recherche, utilisation de l'IA générative pour analyser et mettre en valeur les données.
Activités
- Assurer la collecte de données issues de la statistique publique (Insee) ou Internet (Twitter, Facebook, LinkedIn ou autre), la récupération des enquêtes existantes (PROGEDO, API sur bases données en ligne), Interface avec la statistique publique (accès avec le CASD) et avec les propriétaires de bases de données.
- Compétences en data science (cleaning, contrôle qualité données, enrichissement des données), utilisation de l'IA dans la collecte et l'enrichissement des données.
- Concevoir, développer des bases de données adaptées aux enquêtes en sciences sociales et économiques.
- Établir des requêtes sur les bases de données.
- Assurer l'entretien des bases de données, le stockage et la mise à jour des données.
- Mettre en place des outils permettant le respect de la réglementation RGPD des données stockées.
- Veiller sur les évolutions nécessaires pour garantir la sécurité logique et physique du système d'information dans son ensemble.
- Sensibiliser et former les chercheurs aux enjeux de sécurité des données et veiller à leur bon usage.
- Assurer la sécurité des données et apporter des conseils pratiques aux chercheurs.
Compétences
Disposer d'une expérience de projets informatiques complexes.
Savoir :
- Expertise du Webscraping.
- Expertise, concept et architecture des bases de données.
- Expertise sur les outils et techniques informatiques de gestion et de traitement de très grandes masses de données.
- Connaissance de la méthodologie de conduite de projet.
- Connaissance des systèmes de gestion de bases de données.
- Connaissance de la sécurité des données.
- Connaissance de la RGPD.
- Connaissance de l'anglais technique.
Savoir faire :
- Savoir concevoir, développer et entretenir des bases de données.
- Savoir veiller au stockage et à la conservation des données.
- Savoir anticiper les évolutions fonctionnelles et techniques.
- Savoir communiquer et faire preuve de pédagogie.
- Savoir jouer un rôle de conseil ou d'aide auprès des chercheurs dans l'élaboration et à la conception leur besoin.
- Connaître les normes de documentation des données.
- Maîtriser les langages informatiques les plus utilisés en sciences de données (Python et R) afin de collecter (utilisation d'API, webscraping) et de manipuler de large ensemble de données via du SQL ou du noSQL. Maîtriser les logiciels de traitement de données géolocalisées (ARCGIS, QGIS...).
- Savoir déployer des large langage models (LLM) afin d'analyser de large corpus de texte.
Savoirs être :
- Savoir travailler en équipe.
- Ouverture d'esprit et disponibilité.
- Capacité d'écoute et de conseil.
Contexte de travail
Le poste d'IR Ingénierie des systèmes d'information sera mutualisé entre trois unités de recherche situées dans les locaux de l'Université Paris Dauphine (Paris 16).
- DRM (UMR7088 CNRS), laboratoire de sciences de gestion regroupant environ 80 chercheurs et enseignants-chercheurs et 85 doctorants.
- IRISSO (UMR7170 CNRS, UMR1427 INRAE), laboratoire de recherche en sociologie, regroupant 54 chercheurs et enseignants-chercheurs et 46 doctorants.
- LEDa (UMR CNRS 8007, IRD 260), laboratoire d'économie, regroupant environ 80 chercheurs et enseignants chercheurs et 60 doctorants.
Les trois laboratoires sont tous situés à l'université Paris-Dauphine, grand établissement et membre fondateur de la COMUE Paris Sciences et Lettres. Dans ce cadre, Paris-Dauphine a développé "Dauphine Numérique", un programme ambitieux visant à promouvoir un écosystème de recherche et de formation de niveau mondial, en se concentrant sur des thématiques telles que l'intelligence artificielle responsable, la transformation numérique et les impacts sociétaux de ces technologies.
L'affectation principale du poste sera au LEDa (UMR CNRS 8007, IRD 260). L'activité de l'ingénieur sera suivie par un comité de pilotage, constitué des directeurs/trices des trois laboratoires concernés, ou de leurs représentants. Ce comité veillera au respect de la répartition du temps de travail de l'ingénieur entre les trois laboratoires.
La personne sera intégrée dans les collectifs de recherche au long cours présents dans les différents laboratoires. Elle pourra le cas échéant apporter son expertise dans les processus de recrutement d'ingénieurs en sciences des données.