En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Thèse H/F - Modèle de qualification interactif de données de commerce maritime imparfaites sur le XVIIIème siècle.

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR7266-CHRPLU-002
Lieu de travail : LA ROCHELLE
Date de publication : mardi 8 janvier 2019
Nom du responsable scientifique : Christine PLUMEJEAUD-PERREAU
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2019
Quotité de travail : Temps complet
Rémunération : 1 768,55 € brut mensuel

Description du sujet de thèse

Ce sujet s'inscrit dans le cadre d'un programme financé par l'Agence Nationale de la Recherche, dénommé PORTIC, qui entend étudier les dynamiques spatiales et économiques à l'œuvre dans le processus de construction de marchés de plus en plus intégrés qui prépare et accompagne la Révolution industrielle. A cette fin, il croisera les données sur la navigation des ports français et celles issues de la balance du commerce afin de mieux saisir l'articulation entre espaces régionaux, nationaux et internationaux du commerce français du XVIIIe siècle, en s'appuyant sur deux corpus existants - Navigocorpus et Toflit18 – produits au cours de deux programmes ANR achevés. Le croisement des deux corpus permettra, entre autres, d'estimer plus précisément la part respective du commerce national et étranger, d'affiner les connaissances sur les ports qui articulent les marchés et leurs interactions, d'analyser les phénomènes régionaux de spécialisation entre plusieurs ports, de mesurer l'impact des conflits sur l'économie d'un port, de prendre la mesure de la contrebande à travers la Manche, de peser la part prise par les Français dans les services de transport international qui échappe aux statistiques commerciales de l'époque, ou encore de calculer la ratio entre la valeur du commerce et le tonnage ou les effectifs de main-d'œuvre affectés au transport maritime en fonction des flux.
PORTIC est un projet co-construit par des historiens, des économistes, des géomaticiens, des informaticiens, et des spécialistes de la communication de l'information par le Web, et qui vise à offrir des outils permettant une visualisation claire, scientifiquement irréprochable et calibrée pour des publics différents, d'informations historiques, en prenant pleinement en compte leur caractère imparfait. L'imperfection des données historiques dérive de lacunes documentaires, d'informations contradictoires délivrées par des sources différentes, ou de leur contenu imprécis. Ce caractère incertain d'une partie des informations, fondamental du point de vue de la compréhension du passé, est actuellement insuffisamment intégré par les outils de visualisation des données, notamment des flux. Les humanités numériques accompagnent toutes les étapes du projet, en permettant tout d'abord la mise en évidence des caractères aberrants et contradictoires des données par des outils de fouille et la mise en place de procédures interactives semi-automatisées par lesquelles les chercheurs qualifient la valeur des informations. Tout ce qui sera développé par PORTIC sera sous licence libre.

Ce projet de thèse aborde la question de la qualification de ces données avec une approche combinant à la fois des méthodes symboliques et numériques à travers un processus itératif intégrant les retours d'experts pour la curation des données du corpus.
Différents aspects seront abordés au cours de ce projet de thèse:
- Un modèle sémantique de trajectoires dérivé d'un modèle spatio-temporel générique (Tran et al. 2016) sera utilisé pour déduire des incohérences dans la base de données (informations contradictoires, itinéraires incohérents).
- Ce modèle sera connecté à un moteur exécutant des méthodes de fouille de données statistiques non paramétriques et non supervisées pour la détection de patrons récurrents et de valeurs aberrantes.
- Un modèle de qualité sémantique étendra le modèle sémantique actuel pour les trajectoires afin de gérer les annotations qualitatives.
- Les résultats seront affichés dans les interfaces de géo- visualisation de données (développées ailleurs dans le projet), permettant ainsi aux commentaires de l'expert d'être intégrés dans le modèle sémantique pour une exploration itérative de différentes hypothèses. Cela implique un support pour un raisonnement non monotone en logique formelle de premier ordre.
L'approche sera évaluée tout d'abord en comparant d'anciens ensembles de données brutes avec les mêmes déjà corrigés manuellement, puis avec les données nouvellement collectées dans le projet en faisant en sorte que le logiciel interagisse avec les historiens possédant le rôle d'expert.

Bibliographie:
Moreau, C., Devogele T. and Etienne L., 2018 Extraction de motifs de trajectoires sémantiques similaires. In : Proceedings of Spatial Analysis and GEOmatics (SAGEO'2018), Eds : Mathieu Roche, Maguelonne Teisseire, Montpellier, 6-9 nov. 2018, France
Etienne L., Devogele T., Bouju A., 2009. « Analyse de similarité de trajectoires d'objets mobiles suivant le même itinéraire : Application aux trajectoires de navires », Revue Ingénierie des Systèmes d'Information (ISI), Hermès, vol. 14:5, p. 85-106.
Grosso E., Bouju A., Mustière S., 2009. "Data Integration GeoService: A First Proposed Approach Using Historical Geographic Data" In: Proceedings of 9th International Workshop on Web and Wireless Geographical Information Systems, Eds: J.D. Carswell, A. S. Fotheringham & G.McArdle, W2GIS 2009 7-8 December, Maynooth, Ireland Lecture Notes in Computer Science, pp 103-119.
Plumejeaud C., Villanova-Oliver M., 2012. “QualESTIM: Interactive Quality Assessment of Socioeconomic Data Using Outlier Detection”, in: Gensel J., Josselin D., Vandenbroucke D. (Eds.), Bridging the Geographic Information Sciences: International AGILE'2012 Conference, Avignon (France), April, 24-27, 2012., Heidelberg, pp. 143–160. https://doi.org/10.1007/978-3-642-29063-3_8
Plumejeaud C., Grosso E., Parent B., 2014. 'Dissemination and geovisualisation of territorial entities' history', Journal of Spatial Information Science. doi:10.5311/JOSIS.2014.8.119 ; http://josis.org/index.php/josis/article/view/119
Plumejeaud C., Cristofoli P., Motte C., 2015. “De l'étude des nomenclatures territoriales à la modélisation des dynamiques des territoires administratifs en France”, Revue internationale de géomatique 25, p. 355–392. https://doi.org/10.3166/rig.25.355-392
Plumejeaud-Perreau, C., 2018. La qualité des donnéées. In : Action Nationale de Formation 'Sciences des données' [en ligne]. Sète. 6 novembre 2018. [Consulté le 29 novembre 2018]. Disponible à l'adresse : http://rbdd.cnrs.fr/IMG/pdf/qualite_des_donnees_plumejeaud_2018_04112018.pdf?517/365a13edab604bd0700b045bfac29a3607acb649
Ray C., Napoli A., Bouju A., Martin P.-Y., 2015. Detection of faked AIS messages and Resulting Risks, in: IF&GIS 2015 - 7th International Workshop on Information Fusion and Geographic Information Systems. Grenoble, France.
Tran B.-H., Bouju A., Plumejeaud-Perreau C., Bretagnolle V., 2016. “Towards a semantic framework for exploiting heterogeneous environmental data”. International Journal of Metadata, Semantics and Ontologies, vol. 11, no 3, p. 191-205, https://doi.org/10.1504/IJMSO.2016.081586
Tran B.-H., 2017. Une approche sémantique pour l'exploitation de données environnementales - Application aux données d'un observatoire. Thèse de doctorat, Université de la Rochelle.
Wannous R., Malki J., Bouju A., Vincent C., 2017. “Trajectory ontology inference considering domain and temporal dimensions—Application to marine mammals”. Future Generation Computer Systems 68, 491–499. https://doi.org/10.1016/j.future.2016.01.012

Contexte de travail

Le doctorant sera recruté par le CNRS, à la Rochelle, dans l'Unité Mixte de Recherche Littoral Environnement et Sociétés, (U.M.R. 7266 LIENSs). Le CNRS, dont la devise est «repousser la frontière de la science», couvre tous les domaines scientifiques, de l'étude de la matière et du monde vivant à celle des sociétés humaines. L'école doctorale EUCLIDE suivra le déroulement de la thèse.
Le laboratoire du LIENSs regroupe des experts scientifiques des disciplines de l'écologie, la géographie, la biologie, l'histoire, la chimie moléculaire et les sciences de la terre et interroge des questions liées au développement durable et au changement climatique autour des zones littorales (https://lienss.univ-larochelle.fr/). Le doctorant intègrera donc un milieu fortement interdisciplinaire et en particulier le service de la plateforme base de données au croisement de nombreux projets scientifiques afin d'offrir une meilleure capacité de croisement de données fortement hétérogènes, et de favoriser la mise en œuvre des principes FAIR dans la recherche.
L'équipe de PORTIC sur la Rochelle est coordonnée par Christine Plumejeaud-Perreau, qui travaille depuis 5 ans avec Alain Bouju, Maitre de conférences avec Habilitation à Diriger des Recherches en informatique au Laboratoire d'Informatique, Images et Interactions (L3i) de l'Université de la Rochelle depuis 2014.
Directeurs de thèse : Alain Bouju (L3I) and Christine Plumejaud-Perreau (LIENSs).
• A. Bouju est un expert reconnu dans le domine de travaux sémantiques concernant les objets mobiles et l'étude de leur trajectoires, en particulier en ce qui concerne les mammifères marins et leur suivi par télémétrie (Wannous et al., 2017), ou le suivi de navires en mer (Etienne et al., 2009; Ray et al., 2015). Le L3i est reconnu internationalement dans le domaine des humanités numériques, et A. Bouju a ainsi participé à un projet ANR Alpage afin de proposer des modèles de métadonnées et de services adaptés à l'intégration et la diffusion de cartes anciennes imparfaites (Grosso et al., 2009).
• C. Plumejeaud a proposé durant son doctorat des méthodes de recherche de valeurs exceptionnelles interactives dans le domaine des statistiques socio-économiques (Plumejeaud et al., 2012), et elle a souvent été à l'interface d'historiens et d'informaticiens, notamment dans le cadre de son post-doctorat sur l'ANR GeoPeuple pour lequel elle a produit des interfaces Web interactives de géovisualisation permettant de comprendre l'histoire des communes et leur évolution démographique (Plumejeaud et al., 2014, Plumejeaud et al., 2015). Elle mène actuellement des recherches sur la qualification de données imparfaites, et donne des cours pour la communauté académique sur ce sujet lors d'Actions Nationales de Formation (Plumejeaud, 2018)

Le projet ANR PORTIC est une occasion pour le doctorant de se familiariser à l'interdisciplinarité dans le domaine des humanités numériques avec une équipe d'historiens de rang international, et des experts européens convoqués comme conseillés extérieurs au projet.
Par ailleurs, le modèle de curation interactif de PORTIC couplé au système de géovisualisation interactif de données imparfaites est réutilisable pour beaucoup de domaines et projets du laboratoire LIENSs. Ainsi, LIENSs est également un acteur du projet Atlas historique de la Nouvelle-Aquitaine qui propose entre autres un cas d'étude sur l'Amirauté de Marennes, situé en bordure de l'estuaire de la Seudre, très lié à l'économie maritime de la Rochelle, dans un milieu qui a énormément changé entre le 15 et le 16ème siècle. LIENSs est également un partenaire clé du projet régional DYPOMAR, pour l'étude multi-scalaire de la dynamique portuaire permettant de comprendre les transformations actuelles du littoral anthropisé.

Contraintes et risques

Le fait que le corpus de données à analyser soit déjà présent et structuré dès le départ constitue une garantie pour le doctorant.
La collaboration étroite entre le L3i et le LIENSs (situés à 200 m l'un de l'autre) est également une garantie pour un dialogue fertile et, in fine, la bonne gestion de la thèse. En effet, Alain Bouju et Plumejaud-Perreau ont déjà co-dirigé un doctorant utilisant des technologies sémantiques (Tran, 2017) pour proposer une ontologie spatio-temporelle ayant des capacités de raisonnement et d'inférence logique, afin d'offrir un cadre générique pour une analyse et une visualisation croisées de données à long terme sur la biodiversité et les cultures.
Concernant l'avenir académique du doctorant, bien que le sujet soit réalisé dans un milieu interdisciplinaire, la thèse sera clairement soutenue en informatique (section 6 du CNRS, 27 du CNU, domaine de qualification des deux encadrants) et nous visons des publications dans des revues de rang international. Le doctorant disposera également de fonds pour rencontrer sa communauté de recherche, au niveau national comme international.

Informations complémentaires

Formation : Master 2 spécialité Informatique / Ingénierie des connaissances
Expérience souhaitée en fouille de données (détections de similarités), Statistiques, Web sémantique (Protégé, ontologies) et données liées (RDF, LOD).
La candidature doit inclure un CV, une lettre de motivation, un relevé de notes de Master 2 ou école d'ingénieur dernière année, ainsi que le dernier rapport de stage.

On en parle sur Twitter !