En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR8630-MATHUS-013 - I.E., Inteligence Artificielle pour la segmentation et l'analyse de manuscrits astronomiques médievaux H/F 40%

I.E., Inteligence Artificielle pour la segmentation et l'analyse de manuscrits astronomiques médievaux H/F 40%


Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR8630-MATHUS-013
Lieu de travail : PARIS 14
Date de publication : mercredi 29 juillet 2020
Type de contrat : CDD Technique/Administratif
Durée du contrat : 10 mois
Date d'embauche prévue : 1 octobre 2020
Quotité de travail : Temps incomplet
Rémunération : Rémunération en fonction de l'expérience professionnelle acquise sur la grille I.E. du CNRS 860 euros brut mensuel minimum
Niveau d'études souhaité : Bac+5
Expérience souhaitée : 1 à 4 années

Missions

En lien avec les chercheurs du projet DISHAS (dishas.obspm.fr), l'ingénieur d'étude aura pour mission de concevoir et d'entrainer différents algorithmes de vision artificielle spécialisés dans le repérage, la segmentation et l'analyse des différents éléments graphiques les plus communément présents dans les manuscrits astronomiques médiévaux (textes, tables et diagrammes). Maintenir une veille sur les développements en I.A. directement en lien avec cette mission

Intégré à l'équipe d'ingénierie en humanités numériques du projet DISHAS, il développera avec les chercheurs et en lien avec les partenaires du projet, les workflows qui permettront aux chercheurs de prendre en main les algorithmes conçus, de les lier aux outils déjà existants ou en développement.

Activités

Dans le détail, les tâches effectuées durant le contrat comprendront tout ou partie des éléments suivants :
Algorithmes de repérage
• Concevoir et entrainer des algorithmes qui permettent de repérer et de distinguer les éléments suivants dans une page de manuscrit : textes, tables, diagrammes.
• Pour les diagrammes il faudra veiller à les distinguer autant que possible des enluminures, initiales, miniatures ou tout autre élément de décor de la page manuscrite (voir aussi algorithme d'analyse).
NB : Une base de travail initiale solide, développée durant le printemps 2020 existe pour ces algorithmes au sein du laboratoire

Algorithmes de segmentation et d'analyse
• Concevoir et entrainer des algorithmes qui permettent de segmenter les tables astronomiques, en particulier leur structure en ligne et colonne.
NB : Une base de travail initiale solide, développée durant le printemps 2020 existe pour ces algorithmes au sein du laboratoire
• Concevoir et entrainer des algorithmes qui permettent d'effectuer des classifications des diagrammes astronomiques (type « plus proche voisin »). Cela pourrait par exemple être utilisé pour rechercher les carrés astrologiques, ou les diagrammes d'éclipses, les représentations de constellations…
• Concevoir et entrainer des algorithmes qui permettent de vectoriser les diagrammes astronomiques de nature mathématique.

Conception de workflow et articulation avec d'autres outils
• L'algorithme de segmentation des tables astronomiques doit pouvoir être articulé à terme à des algorithmes d'HTR qui permettront de transcrire le contenu de chaque cellule.
• Les algorithmes de repérage, de classifications de diagrammes, et de vectorisation pourront être articulés à une plateforme d'annotation IIIF dont il existe déjà un proof of concept
• D'une manière générale, ces outils doivent s'articuler au système d'information DISHAS
NB : Ce travail de conception d'outils et de workflow sera fait au sein de l'équipe humanité numérique de DISHAS en lien avec les partenaires du projet.

Compétences

• M2 en sciences des données
• Compétences sur la vision artificielle
• Python (Pytorch)
• Capacité au travail en équipe
• Anglais, lu écrit

Contexte de travail

Le Projet DISHAS (dishas.obspm.fr) est hébergé au sein de l'équipe d'histoire de l'astronomie du laboratoire SYRTE-UMR8630. Ce laboratoire est une unité mixte du CNRS, de l'Observatoire de Paris et de l'Université Pierre et Marie Curie, implantée sur le site parisien de l'Observatoire. L'unité compte 95 personnes, dont 57 permanents incluant 13 ITA CNRS. L'unité mène des recherches et assure des services scientifiques dans les domaines de l'astronomie fondamentale, la métrologie du temps et des fréquences et de l'histoire de l'astronomie. Les services fournis par le laboratoire sont utilisés par l'état (le CNES, la Marine, etc), l'industrie, la recherche, le grand public en France et à l'étranger.

L'ingénieur pourra s'appuyer sur un corpus numérisé de plus de 1500 manuscrits astronomiques arabe et latin construit par les projets partenaires de DISHAS soit une banque de plusieurs dizaine de milliers de pages. L'expertise des historiens et des ingénieurs en humanités numériques du projet ALFA sera un support essentiel pour l'analyse de ce jeu de données. Il pourra également bénéficier du savoir-faire des chercheurs de l'équipe IMAGINE, en vision artificielle et apprentissage profond sur des sources historiques avec déjà plusieurs projets réalisés dans ce domaine (ANR EnHerit). En particulier, il aura accès à une base de code permettant de générer des données synthétiques et d'apprendre un réseau permettant de segmenter les illustrations et le texte.

Contraintes et risques

RAS

On en parle sur Twitter !