En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UAR3565-FATIDM-008 - Postdoc Machine Learning et bases de données (H/F)

Postdoc Machine Learning et bases de données (H/F)

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : mercredi 5 février 2025 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Postdoc Machine Learning et bases de données (H/F)
Référence : UAR3565-FATIDM-008
Nombre de Postes : 1
Lieu de travail : POITIERS
Date de publication : mercredi 15 janvier 2025
Type de contrat : IT en contrat CDD
Durée du contrat : 12 mois
Date d'embauche prévue : 5 mai 2025
Quotité de travail : Complet
Rémunération : 2991,58 euros bruts
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Chef-fe de projet ou expert-e en Ingéniérie logicielle

Missions

-Présentation
Dans le cadre du projet OSCARS « AMIS » (Advanced Metadata Intelligent System), le Consortium-HN ARIANE recrute un(e) postdoctorant(e) en informatique Data Science- Machine Learning.
Le Consortium-HN ARIANE (Analyses, Recherches, Intelligence Artificielle et Nouvelles Éditions Numériques) est un réseau scientifique interdisciplinaire de l’infrastructure Huma-Num. Il associe des experts en sciences humaines (littérature, linguistique, histoire, etc.) et en informatique. Ce consortium vise à constituer un espace de collaboration entre ces deux champs, favorisant ainsi les avancées méthodologiques et épistémologiques dans l’analyse des objets propres aux sciences du texte. L’objectif d'ARIANE est de contribuer à la conception, l’adaptation et le raffinement des outils numériques actuellement appliqués aux données textuelles des sciences humaines. Le consortium se donne pour mission de développer une approche interdisciplinaire en croisant les méthodologies des humanités numériques et les technologies avancées du traitement automatique du langage naturel. Il cherche à enrichir les processus d’analyse des textes à l’aide de dispositifs (semi-)automatisés, tout en créant un espace critique de discussion sur l’interprétation des résultats produits par ces méthodes.

- Missions
Le/la postdoctorant(e) recruté(e) intégrera l’équipe projet chargée du développement de l’application web innovante « AMIS », une application permettant l’enrichissement des métadonnées pour les chercheurs en sciences humaines.
Le/la postdoctorant(e) recruté(e) sera chargé(e) du développement du module « Robot AMIS », qui utilise des techniques d’intelligence artificielle et de machine learning pour proposer des recommandations de métadonnées basées sur l’analyse de données textuelles. Il/Elle jouera un rôle clé dans la gestion et l’analyse de grandes bases de données et dans l’entraînement de modèles de type LLM (Large Language Models).
Pour ces missions, le/la postdoctorant(e) pourra être amené(e) à suivre les stagiaires recrutés par le consortium en vue d’atteindre les objectifs du projet.

Activités

Plus concrètement, les missions et activités de le/la postdoctorant(e) seront les suivantes :
Choix et entraînement des modèles LLM (Large Language Models) pour l’analyse des textes et l’extraction des métadonnées pertinentes.
Analyse des résultats et proposition de métadonnées enrichies basées sur des critères tels que le contenu, le genre, les motifs, les sentiments, les thesaurus, les ontologies, etc..
Conception et implémentation du « Robot AMIS » (Module 2) pour interroger des bases de données externes via des API et traiter les résultats en vue de proposer des recommandations de métadonnées.
Intégration des fonctionnalités d’explicabilité (X-AI) pour tracer les étapes et fournir des justifications sur les recommandations émises par le modèle.
Optimisation des modèles et des processus de traitement des données pour améliorer la performance et la précision des résultats.

Compétences

Compétences techniques
Technologies d’IA/ML (ex: Python, TensorFlow, PyTorch, scikit-learn, etc.)
Modèles de traitement du langage naturel (NLP) : Fine-tuning des LLM, analyse sémantique, text mining
Bases de données : Gestion des bases de données relationnelles (SQL) et non relationnelles (NoSQL)
APIs et services REST : Développement et intégration d’APIs pour interroger des bases de données externes
Connaissance des ontologies et des vocabulaires contrôlés utilisés dans les sciences des textes (XML-TEI, RDF)
Expérience avec l’infrastructure cloud (Google Colab, AWS, ou infrastructures équivalentes) pour des projets nécessitant une forte puissance de calcul.

Compétences « soft »
Intérêt pour les sciences humaines.
Sens de l’innovation, curiosité intellectuelle, aptitudes à la communication et au soutien technique
Sens relationnel, rigueur, fiabilité
Capacité à travailler en équipe et à collaborer avec des équipes multidisciplinaires.
Intérêt pour les projets open-source

Profil recherché :
Diplôme : Bac +8 Docteur en informatique (science des données, intelligence artificielle)
Expérience : Au moins 2 ans d’expérience dans des projets de machine learning et de traitement des données textuelles
Capacité à travailler sur des modèles complexes et à expliquer leurs résultats de manière claire.

Contexte de travail

Lieu de travail : MSHS de Poitiers. Télétravail possible selon les conditions du Consortium-HN ARIANE

Déplacements fréquents à prévoir en France et possiblement à l’étranger

A Poitiers, il/elle sera placé sous la responsabilité de Fatiha IDMHAND (PR, Université de Poitiers), coordinatrice du Consortium ARIANE.

Contraintes et risques

Néant