Informations générales
Intitulé de l'offre : Post-Doc (ou Ingénieur) Machine Learning et bases de données H/F
Référence : UAR3565-FATIDM-006
Nombre de Postes : 1
Lieu de travail : POITIERS
Date de publication : samedi 16 novembre 2024
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 10 mois
Date d'embauche prévue : 3 février 2025
Quotité de travail : Complet
Rémunération : 2991,58 euros bruts
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années
Section(s) CN : 1 - Interactions, particules, noyaux du laboratoire au cosmos
Missions
Dans le cadre du projet OSCARS -AMIS- (Advanced Metadata Intelligent System), le Consortium-HN ARIANE recrute un(e) post-doctorant(e) en informatique Data - Machine Learning et bases de données.
Le Consortium-HN ARIANE (Analyses, Recherches, Intelligence Artificielle et Nouvelles Éditions Numériques) est un réseau scientifique interdisciplinaire de l’infrastructure Huma-Num. Il associe des experts en sciences humaines (littérature, linguistique, histoire, etc.) et en informatique. Ce consortium vise à constituer un espace de collaboration entre ces deux champs, favorisant ainsi les avancées méthodologiques et épistémologiques dans l’analyse des objets propres aux sciences du texte. L’objectif d'ARIANE est de contribuer à la conception, l’adaptation et le raffinement des outils numériques actuellement appliqués aux données textuelles des sciences humaines. Le consortium se donne pour mission de développer une approche interdisciplinaire en croisant les méthodologies des humanités numériques et les technologies avancées du traitement automatique du langage naturel. Il cherche à enrichir les processus d’analyse des textes à l’aide de dispositifs (semi-)automatisés, tout en créant un espace critique de discussion sur l’interprétation des résultats produits par ces méthodes.
Le/la candidat/e recruté/e intégrera l’équipe chargée du développement de l’application web innovante « AMIS », une application permettant l’enrichissement des métadonnées pour les chercheurs en sciences humaines.
Il ou elle sera chargé(e) du développement du module -Robot AMIS-, qui utilise des techniques d’intelligence artificielle et de machine learning pour proposer des recommandations de métadonnées basées sur l’analyse de données textuelles. Il/Elle jouera un rôle clé dans la gestion et l’analyse de grandes bases de données et dans l’entraînement de modèles de type LLM (Large Language Models).
Pour ces missions, le/la candidat/e recruté/e pourra être amené(e) à suivre les stagiaires recrutés par le consortium en vue d’atteindre les objectifs du projet.
Activités
Plus concrètement, les missions et activités seront les suivantes :
⁻ Conception et implémentation du « Robot AMIS » (Module 2) pour interroger des bases de données externes via des API et traiter les résultats en vue de proposer des recommandations de métadonnées.
⁻ Entraînement et fine-tuning des modèles LLM (Large Language Models) pour l’analyse des textes et l’extraction des métadonnées pertinentes.
⁻ Analyse des résultats issus des bases de données et proposition de métadonnées enrichies basées sur des critères tels que le contenu, le genre, les motifs, les sentiments, les thesaurus, les ontologies, etc..
⁻ Intégration des fonctionnalités d’explicabilité (X-AI) pour tracer les étapes et fournir des justifications sur les recommandations émises par le modèle.
⁻ Gestion des bases de données et des infrastructures cloud nécessaires pour exécuter des tâches d’apprentissage automatique à grande échelle (machine learning).
⁻ Optimisation des modèles et des processus de traitement des données pour améliorer la performance et la précision des résultats.
Compétences
Compétences techniques
⁻ Technologies d’IA/ML (ex: Python, TensorFlow, PyTorch, scikit-learn, etc.)
⁻ Modèles de traitement du langage naturel (NLP) : Fine-tuning des LLM, analyse sémantique, text mining
⁻ Bases de données : Gestion des bases de données relationnelles (SQL) et non relationnelles (NoSQL)
⁻ APIs et services REST : Développement et intégration d’APIs pour interroger des bases de données externes
⁻ Connaissance des ontologies et des vocabulaires contrôlés utilisés dans les sciences des textes (XML-TEI, RDF)
⁻ Expérience avec l’infrastructure cloud (Google Colab, AWS, ou infrastructures équivalentes) pour des projets nécessitant une forte puissance de calcul.
Compétences -soft-
⁻ Intérêt pour les sciences humaines.
⁻ Sens de l’innovation, curiosité intellectuelle, aptitudes à la communication et au soutien technique
⁻ Sens relationnel, rigueur, fiabilité
⁻ Capacité à travailler en équipe et à collaborer avec des équipes multidisciplinaires.
⁻ Intérêt pour les projets open-source
Profil recherché :
⁻ Diplôme : Idéalement, Bac +8. Post-Doc. Docteur en informatique (science des données, IA)
⁻ Expérience : Idéalement, au moins 2 ans d’expérience dans des projets de machine learning et de traitement des données textuelles
⁻ Capacité à travailler sur des modèles complexes et à expliquer leurs résultats de manière claire.
Contexte de travail
Le/la candidat/e recruté/e travaillera pour le Consortium-HN ARIANE à la Mshs de Poitiers https://mshs.univ-poitiers.fr/
- Télétravail possible selon les conditions du Consortium-HN ARIANE
- Déplacements fréquents à prévoir en France et possiblement à l’étranger
A Poitiers, il/elle sera placé sous la responsabilité de Fatiha IDMHAND (PR, Université de Poitiers), coordinatrice du Consortium ARIANE.
Informations complémentaires
Projet européen -AMIS- financé par OSCARS