Informations générales
Intitulé de l'offre : Chercheur CDD (Postdoc) (H/F) – Conception et développement d’un outil de deep learning pour la détection de citations en langues anciennes
Référence : UMR5189-AURBER-004
Nombre de Postes : 1
Lieu de travail : LYON 02
Date de publication : mercredi 14 mai 2025
Type de contrat : Chercheur en contrat CDD
Durée du contrat : 12 mois
Date d'embauche prévue : 1 septembre 2025
Quotité de travail : Complet
Rémunération : A partir de 3021 € bruts mensuels, selon l'expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent
Section(s) CN : 06 - Sciences de l'information : fondements de l'informatique, calculs, algorithmes, représentations, exploitations
Missions
Dans le cadre du projet BiblIndex, index en ligne des citations bibliques dans la littérature chrétienne de l’Antiquité et du Moyen Âge, développé par le laboratoire HiSoMA (UMR 5189) à Lyon, ce postdoc vise au développement d’outils innovants et génériques pour la détection des réemplois textuels dans des textes en langues anciennes. Le poste est financé par l’Equipex+ Biblissima+, Observatoire des cultures écrites anciennes, de l’argile à l’imprimé, auquel appartient HiSoMA.
Le premier corpus d’application sera constitué par les versions anciennes des textes bibliques. Il s’agira de permettre le repérage et la mise en relation de passages à l’intérieur même des corpus bibliques, en fonction de leurs proximités morpho-syntaxiques, sémantiques et de classifier les réemplois textuels par une typologie fine. Dans un second temps, l’outil de détection sera utilisé sur des corpus de textes antiques citant la Bible.
Outre les procédés désormais classiques dans la préparation des corpus pour la détection de l’intertextualité (tokenisation, lemmatisation, découpage en n-grams, plongements lexicaux), le post-doc utilisera l'apprentissage machine (supervisé et non-supervisé) pour le traitement des données textuelles. Ce traitement impliquera en particulier l'entraînement de réseaux neuronaux adaptés à ce type de tâches (LSTM, GRU, Transformers,...) sur des corpus textuels préparés par l’équipe des chercheurs spécialisés en langues anciennes du laboratoire
Activités
• Développement d’outils de détection de l’intertextualité
• Travail itératif en collaboration avec les philologues spécialistes des textes bibliques et patristiques en langues anciennes
• Intégration des outils produits dans la chaîne de traitement du projet BiblIndex, en collaboration avec l’ingénieur qui en a la charge
• Rédaction d’articles pour des revues de sciences humaines et de sciences informatiques,seul.e ou en collaboration.
Compétences
• Maîtrise de langages de programmation (Python, …) et de bibliothèques d'analyse de données (exemple en Python : Pandas, Scikit-learn, ...)
• Compétences en apprentissage profond et traitement automatique des langues
• Si possible, notions de grec ancien et/ou de latin
• Intérêt pour les sciences bibliques, voire formation dans ce domaine
• Intérêt pour l’application de l’informatique aux sciences humaines, voire expérience dans ce domaine
• Aisance relationnelle et communicationnelle (à l’écrit et à l’oral)
• Autonomie, recul et créativité.
Contexte de travail
Vous travaillerez en étroite collaboration avec Laurence Mellerin (coordinatrice du programme BiblIndex) et serez amené(e) à échanger régulièrement avec les autres membres de l'équipe. Vous serez accueilli(e) au sein de l'équipe des Sources Chrétiennes (HiSoMA, Lyon 2e), composée principalement de chercheurs et ingénieurs spécialisés dans l’étude des textes des Pères de l’Eglise. Vous pourrez interagir avec d’autres spécialistes en informatique engagés dans les travaux du réseau Biblissima+, en particulier dans le cadre du Cluster 7 – Interopérabilité et analyse des textes.
Des déplacements en France et à l'étranger sont à prévoir pour la valorisation des résultats de la recherche et les échanges avec les membres de l’Equipex Biblissima+.
Ce que nous vous proposons :
• Un environnement de travail stimulant au contact des personnels de la recherche
• 44 jours de congés / RTT par an
• D'excellentes conditions de travail (horaires flexibles, télétravail, bureau calme)
• Le remboursement partiel des titres de transport (75%) + forfait mobilité durable pouvant aller jusqu'à 300€/an
• Un site accessible en transport en commun
Contraintes et risques
L’équipe d’accueil est une équipe de sciences humaines et non d’informatique, l’appétence pour l’interdisciplinarité est donc indispensable.