En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Doctorant en informatique (H/F)


Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5800-MAGHIN-005
Lieu de travail : TALENCE
Date de publication : vendredi 28 septembre 2018
Nom du responsable scientifique : Marie Beurton Aimar
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 novembre 2018
Quotité de travail : Temps complet
Rémunération : 1 768,55 € brut mensuel

Description du sujet de thèse

Concevoir une méthodologie d'assemblage automatisé de fragments de papyrus anciens basée sur des algorithmes de traitement d'images, pouvant aller de la classification automatique de ces fragments en fonction de leur appartenance supposée au même papyrus originel jusqu'à la production de reconstruction automatique de ce papyrus.

Activités : 4 pistes de recherche devront être explorées :
- Proposition de classification des fragments en fonction de leur positionnement sur le document global.

- Implémentation d'algorithmes de recherche automatisée d'alignement/assemblage des fragments sur la base de la prise en compte des lignes d'écriture, de la texture du fragment, fibres et/ou de la couleur.

- Mise en œuvre d'une plateforme interactive de manipulation des fragments allant de leur extraction automatique (segmentation) à l'édition par l'ajout de métadonnées et incluant les opérations standards d'alignement, pour une approche semi-automatique de l'assemblage.

- Proposition d'un modèle de chaines de traitements intégrés pour l'assemblage de fragments de papyrus pouvant avoir d'autres provenances régionales, d'autres contenus, ou encore être écrits dans d'autres langues.

Contexte de travail

la thèse est associée au projet ERC GESHAEM porté par Marie-Pierre Chaufray du laboratoire Ausonius, UMR5607, Université Bordeaux Montaigne. Le projet a pour objectif l'étude des papyrus datés du IIIe siècle avant J.-C. et actuellement conservés dans le fonds Jouguet de l'Institut de papyrologie de Sorbonne Université – faculté de Lettres. Ces papyrus ont été remployés pour fabriquer des décorations de momies appelées cartonnages qui ont, pour la plupart, été démontées. Ce remploi explique l'état généralement fragmentaire des papyrus qui doivent être reconstitués. Le projet de thèse concerne essentiellement la tâche de reconstruction de ces papyrus, qui sont des documents relatifs à la production agricole, la politique fiscale et l'administration d'une région d'Egypte au IIIe siècle avant J.-C.
Etant donné l'état de la collection papyrologique et le nombre de documents, un assemblage manuel ne peut être envisagé. La numérisation des fragments permet d'étudier la possibilité d'un travail de recherche automatique de raccord au moyen de méthodes d'analyses multimodales intégrant le traitement d'images et la prise en compte de métadonnées fournies par les papyrologues.
La thèse s'effectuera au LaBRI UMR CNRS 5800 / Université de Bordeaux, dans l'équipe Images et sons, thème Traitement et Analyse d'images, sous la direction de Marie Beurton-Aimar et les co-encadrements de Nicholas Journet et de Marie-Pierre Chaufray.

Contraintes et risques

Bien que le classification automatisée de documents soit un des thèmes les plus actifs du traitement d'images, les papyrus, par leur spécificité (fibres, écriture dont on ne dispose pas de dictionnaire numérique, mise en page peu informative, etc.), justifient la conception et la réalisation de pipe-lines logiciels dédiés.
Le déploiement et les tests des différentes versions de la plateforme qui sont à réaliser nécessitent la mise en place d'une infrastructure client/serveur complexe dans laquelle transiteront de gros volumes de données. Pour minimiser les risques techniques, le candidat s'appuiera sur l'expérience et l'infrastructure du LaBRI en la matière.
Une collaboration très étroite avec le porteur du projet, Marie-Pierre Chaufray, papyrologue, est indispensable, et des réunions mensuelles localement et trimestrielles à la Sorbonne seront mises en place afin d'obtenir une validation par étapes des choix qui seront faits.
Le contrat étant intégré dans un projet ERC au CNRS, il est exclusivement consacré à la recherche lié au projet GESHAEM et aucune charge d'enseignement ne pourra être prise pendant les trois années du contrat.

On en parle sur Twitter !