En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UPR841-DOMSTU-006 - Ingénieur-e d'études en traitement de données textuelles sur les cartulaires médiévaux (H/F)

Ingénieur-e d'études en traitement de données textuelles sur les cartulaires médiévaux (H/F)


Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UPR841-DOMSTU-006
Lieu de travail : AUBERVILLIERS
Date de publication : jeudi 31 octobre 2019
Type de contrat : CDD Technique/Administratif
Durée du contrat : 12 mois
Date d'embauche prévue : 1 janvier 2020
Quotité de travail : Temps complet
Rémunération : entre 2139 et 2727 euros bruts mensuels selon expérience
Niveau d'études souhaité : Bac+3
Expérience souhaitée : Indifférent

Missions

* Participer à l'élaboration d'un corpus de sources et de données concernant la transmission écrite des textes au Moyen Âge dans le cadre du projet HOME (History of Medieval Europe)
* Assurer la qualité, la structuration et l'uniformisation des corpus textuels
* Assurer la qualité et l'applicabilité des référentiels géographiques et personnes
* Assurer l'exploitation des données résultant de l'indexation d'images par ordinateur
* Mettre en œuvre des outils de correction et d'analyse des données (GIS, analyses factorielles, etc.)

Activités

* établir les données de référence pour le projet :
(a) mettre à jour et enrichir une base de données, déjà existante, sur les cartulaires médiévaux (recherche de numérisation disponibles et de manifests IIIF, mise à jour des données descriptives fondamentales, p. ex. lieu et date de production, écriture) ;
(b) préparer un corpus de référence en TEI contenant le texte structuré d'éditions de chartes et de cartulaires, à partir d'éditions océrisées ou d'éditions numériques natives libres de droits : associer texte et image, uniformiser et structurer les données (utilisation de regex, XSLT ou autres langages de programmation), lemmatiser ;
* valider et corriger les résultats de traitements réalisés par intelligence artificielle sur les images et les textes (classifications de types de pages, segmentations de lignes, segmentation en actes, reconnaissance de texte, identification de langues ; identifications de textes, indexation, association de métadonnées et gestion de la granularité des documents) ;
* accompagner la mise en œuvre des outils d'analyse historique (outils statistiques, analyses factorielles et de réseaux, GIS) ;
* participer aux tâches d'administration et de dissémination : (a) suivi administratif, (b) rédactions de rapport pour l'Agence Nationale de la Recherche ; (c) communiquer et disséminer les développements en cours et les résultats scientifiques (blog scientifique, twitter) ;

Compétences

Connaissances
* Connaissance des cartulaires manuscrits médiévaux (connaissance générale)
* latin et moyen français (connaissance générale)
* anglais (connaissance approfondie)

Compétences opérationnelles
* Savoir lire les écritures anciennes (niveau intermédiaire)
* Utiliser les logiciels spécifiques à l'activité (Transkribus, Oxygen, TXM, Gephi, QGIS)
* Utiliser les langages spécifiques à l'activité (XML, XSLT, XQUERY, python)

Contexte de travail

L'agent sera affecté au sein de l'équipe de la Section de Paléographie latine de l'IRHT, sur le Campus Condorcet (Aubervilliers), dans le cadre du projet HOME (History of Medieval Europe).
L'Institut de recherche et d'histoire des textes se consacre à la recherche fondamentale sur les manuscrits médiévaux et les imprimés anciens. L'histoire des textes écrits dans les principales langues de culture du pourtour méditerranéen, dont le latin et les langues romanes, y est traitée dans tous ses aspects : supports matériels de l'écrit, écriture et décoration, contenu textuel, iconographie, diffusion et réception.
Le projet HOME prend la suite et élargit les objectifs du projet européen HIMANIS grâce auquel 80000 pages des registres du Trésor des chartes ont fait l'objet d'un moteur plein texte. Son objectif est de créer un environnement de recherche centré sur les besoins de l'utilisateur et spécialisé sur les chartes et cartulaires pour mieux comprendre l'histoire de l'Europe médiévale et le patrimoine culturel numérique d'aujourd'hui, en permettant aux chercheurs d'avoir un aperçu des ressources existantes, des ressources numérisées et des contenus numériques natifs. HOME réunit trois types d'acteurs : institutions patrimoniales (Archives nationales de la République tchèque, ICARUS), laboratoires et sociétés privées de recherche en intelligence artificielle et analyse d'image par ordinateur (Université polytechnique de Valencia, Teklia), et des laboratoires et communautés de recherche en sciences humaines et sociales (IRHT-CNRS, ICARUS).
Le projet HOME prévoit (a) de développer des approches d'indexation et de recherche optimisées pour de larges ensembles numérisés de documents patrimoniaux manuscrits, (b) de relier les données, métadonnées et référentiels du domaines, en connectant métadonnées numériques natives et numérisées, (c) d'établir un système de recherche sémantique, permettant de d'accéder aux informations pertinentes (noms de personnes, lieux, dates) dans de larges corpus multilingues, (d) de permettre la visualisation des données et des informations, (e) favoriser l'interprétation et l'engagement d'un public plus large.
https://www.history-of-medieval-europe.eu/
http://himanis.huma-num.fr/himanis/
https://www.irht.cnrs.fr/recherche/les-programmes-de-recherche/home

Contraintes et risques

Travail sur écran.

On en parle sur Twitter !