En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UAR3565-FATIDM-006 - Post-Doc (ou Ingénieur) Machine Learning et bases de données H/F

Post-Doc (ou Ingénieur) Machine Learning et bases de données H/F

Cette offre est disponible dans les langues suivantes :
- Français-- Anglais

Date Limite Candidature : samedi 7 décembre 2024 23:59:00 heure de Paris

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler

Informations générales

Intitulé de l'offre : Post-Doc (ou Ingénieur) Machine Learning et bases de données H/F
Référence : UAR3565-FATIDM-006
Nombre de Postes : 1
Lieu de travail : POITIERS
Date de publication : samedi 16 novembre 2024
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 10 mois
Date d'embauche prévue : 3 février 2025
Quotité de travail : Complet
Rémunération : 2991,58 euros bruts
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années
Section(s) CN : 1 - Interactions, particules, noyaux du laboratoire au cosmos

Missions

Dans le cadre du projet OSCARS -AMIS- (Advanced Metadata Intelligent System), le Consortium-HN ARIANE recrute un(e) post-doctorant(e) en informatique Data - Machine Learning et bases de données.

Le Consortium-HN ARIANE (Analyses, Recherches, Intelligence Artificielle et Nouvelles Éditions Numériques) est un réseau scientifique interdisciplinaire de l’infrastructure Huma-Num. Il associe des experts en sciences humaines (littérature, linguistique, histoire, etc.) et en informatique. Ce consortium vise à constituer un espace de collaboration entre ces deux champs, favorisant ainsi les avancées méthodologiques et épistémologiques dans l’analyse des objets propres aux sciences du texte. L’objectif d'ARIANE est de contribuer à la conception, l’adaptation et le raffinement des outils numériques actuellement appliqués aux données textuelles des sciences humaines. Le consortium se donne pour mission de développer une approche interdisciplinaire en croisant les méthodologies des humanités numériques et les technologies avancées du traitement automatique du langage naturel. Il cherche à enrichir les processus d’analyse des textes à l’aide de dispositifs (semi-)automatisés, tout en créant un espace critique de discussion sur l’interprétation des résultats produits par ces méthodes.

Le/la candidat/e recruté/e intégrera l’équipe chargée du développement de l’application web innovante « AMIS », une application permettant l’enrichissement des métadonnées pour les chercheurs en sciences humaines.

Il ou elle sera chargé(e) du développement du module -Robot AMIS-, qui utilise des techniques d’intelligence artificielle et de machine learning pour proposer des recommandations de métadonnées basées sur l’analyse de données textuelles. Il/Elle jouera un rôle clé dans la gestion et l’analyse de grandes bases de données et dans l’entraînement de modèles de type LLM (Large Language Models).

Pour ces missions, le/la candidat/e recruté/e pourra être amené(e) à suivre les stagiaires recrutés par le consortium en vue d’atteindre les objectifs du projet.

Activités

Plus concrètement, les missions et activités seront les suivantes :
⁻ Conception et implémentation du « Robot AMIS » (Module 2) pour interroger des bases de données externes via des API et traiter les résultats en vue de proposer des recommandations de métadonnées.
⁻ Entraînement et fine-tuning des modèles LLM (Large Language Models) pour l’analyse des textes et l’extraction des métadonnées pertinentes.
⁻ Analyse des résultats issus des bases de données et proposition de métadonnées enrichies basées sur des critères tels que le contenu, le genre, les motifs, les sentiments, les thesaurus, les ontologies, etc..
⁻ Intégration des fonctionnalités d’explicabilité (X-AI) pour tracer les étapes et fournir des justifications sur les recommandations émises par le modèle.
⁻ Gestion des bases de données et des infrastructures cloud nécessaires pour exécuter des tâches d’apprentissage automatique à grande échelle (machine learning).
⁻ Optimisation des modèles et des processus de traitement des données pour améliorer la performance et la précision des résultats.

Compétences

Compétences techniques
⁻ Technologies d’IA/ML (ex: Python, TensorFlow, PyTorch, scikit-learn, etc.)
⁻ Modèles de traitement du langage naturel (NLP) : Fine-tuning des LLM, analyse sémantique, text mining
⁻ Bases de données : Gestion des bases de données relationnelles (SQL) et non relationnelles (NoSQL)
⁻ APIs et services REST : Développement et intégration d’APIs pour interroger des bases de données externes
⁻ Connaissance des ontologies et des vocabulaires contrôlés utilisés dans les sciences des textes (XML-TEI, RDF)
⁻ Expérience avec l’infrastructure cloud (Google Colab, AWS, ou infrastructures équivalentes) pour des projets nécessitant une forte puissance de calcul.

Compétences -soft-
⁻ Intérêt pour les sciences humaines.
⁻ Sens de l’innovation, curiosité intellectuelle, aptitudes à la communication et au soutien technique
⁻ Sens relationnel, rigueur, fiabilité
⁻ Capacité à travailler en équipe et à collaborer avec des équipes multidisciplinaires.
⁻ Intérêt pour les projets open-source

Profil recherché :
⁻ Diplôme : Idéalement, Bac +8. Post-Doc. Docteur en informatique (science des données, IA)
⁻ Expérience : Idéalement, au moins 2 ans d’expérience dans des projets de machine learning et de traitement des données textuelles
⁻ Capacité à travailler sur des modèles complexes et à expliquer leurs résultats de manière claire.

Contexte de travail

Le/la candidat/e recruté/e travaillera pour le Consortium-HN ARIANE à la Mshs de Poitiers https://mshs.univ-poitiers.fr/
- Télétravail possible selon les conditions du Consortium-HN ARIANE
- Déplacements fréquents à prévoir en France et possiblement à l’étranger
A Poitiers, il/elle sera placé sous la responsabilité de Fatiha IDMHAND (PR, Université de Poitiers), coordinatrice du Consortium ARIANE.

Informations complémentaires

Projet européen -AMIS- financé par OSCARS