En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UAR76-OLIDAS-057 - Ingénieur(e) en analyse de données et fouille de textes (H/F)

Ingénieur(e) en analyse de données et fouille de textes (H/F)


Date Limite Candidature : mardi 12 juillet 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UAR76-OLIDAS-057
Lieu de travail : VANDOEUVRE LES NANCY
Date de publication : mercredi 1 juin 2022
Type de contrat : CDD Technique/Administratif
Durée du contrat : 12 mois
Date d'embauche prévue : 1 septembre 2022
Quotité de travail : Temps complet
Rémunération : Entre 2130 et 2715 € bruts mensuels selon expérience
Niveau d'études souhaité : Bac+3
Expérience souhaitée : Indifférent

Missions

La/le chargé(e) d'analyse de données participe aux différentes phases du cycle de vie des projets de fouille de texte et de données : analyse, développement, qualification, intégration, dans le respect du cahier des charges, des normes et des règles de sécurité et de confidentialité. Il/elle participe à l'analyse, à la sélection des sources, à l'extraction des données, à la mise en œuvre de leur traitement automatique. Il/elle réalise et contribue à l'interprétation et à l'analyse des résultats produits.

Activités

Votre contribution bénéficiera à l'institut et plus largement à la communauté de recherche française.
Vous travaillerez avec une équipe mixte (fonctionnel, IT) fonctionnant selon la méthode SCRUM, et vous contribuerez :

• à analyser des données textuelles à l'aide d'outils et méthodes de traitement automatique des textes et des données associés.
• Vous participerez à la planification des cycles de développement, préparation et sélection des sources, traitements des données ainsi qu'à l'analyse des résultats (Analyse bibliométrique, scientométrique, lexicométrique…)
• Vous participerez à la planification des cycles de développement avec comme activités principales de :

• Sélectionner des sources de données en adéquation avec le besoin,,
• Collecter, sélectionner et valider les données pertinentes pour le projet,
• Identifier les besoins et la problématique d'analyse et de fouille de textes du projet,
• Réaliser les calculs, le traitement des données et l'intégration des composants développés.
• Déterminer les outils et méthodes de traitement et d'analyse,
• Convertir, coder et intégrer les outils, programmes dans les workflows de traitement des données,
• Analyser les résultats obtenus et les présenter sous une forme adaptée aux différents commanditaires
• Effectuer une veille sur les avancées techniques et scientifiques du domaine.

Vous interagissez avec le service ISTEX Textes & Corpus, pour produire l'alimentation, l'enrichissement et l'usage des bases Condtior et ISTEX ou le service Appui au pilotage pour des besoins liés à la bibliométrie. Ponctuellement vous pouvez être amené à participer à des conférences ainsi qu'à la rédaction d'articles scientifiques et à des opérations de formation.

Compétences

• Maîtrise des méthodes d'apprentissage automatique (Machine Learning) et de l'analyse statistique,
• Maîtrise de Python et des bibliothèques d'analyse et de traitement de données,
• Compétences en mathématiques appliquées
• Compétences en programmation et bonne compréhension des structures de données,
• Connaissance des méthodes « word embedding » et des réseaux neuronaux,
• Maîtrise des méthodes et outils de fouille de textes, et de traitement du langage naturel (NLP),
• Capacité à réaliser des analyses prédictives et statistiques à partir de différentes bases de données,
• Maîtrise de Linux Ubuntu,
• Maîtrise de l'anglais niveau B2
• Expérience avec des outils de contrôle de version du code informatique (Git)

Contexte de travail

L'Institut de l'information scientifique et technique (lnist), Unité d'Appui à la Recherche (UAR76 ) du CNRS, facilite l'accès, l'analyse et la fouille de l'information scientifique et valorise la production scientifique (publications et données de recherche). Il siège, depuis 1989, dans un bâtiment conçu par l'architecte Jean Nouvel situé à Vandoeuvre Les Nancy (54500) et compte 156 collaborateurs.
Le ou la candidate intégrera le service Text & Data Mining qui développe et intègre des outils et méthodes de fouille de textes pour valoriser les données proposées par l'Institut (notamment celles du fonds documentaire ISTEX et de la base Conditor/ISTEX), mais également pour répondre à des besoins en analyse de données textuelles émanant du CNRS ou d'autres EPST.

On en parle sur Twitter !