En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5505-CHLBOU-067 - Ingénieur de recherche H/F en fouille de données textuelles et visualisation de données

Ingénieur de recherche H/F en fouille de données textuelles et visualisation de données


Date Limite Candidature : lundi 13 février 2023

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR5505-CHLBOU-067
Nombre de Postes : 1
Lieu de travail : TOULOUSE
Date de publication : lundi 23 janvier 2023
Type de contrat : CDD Technique/Administratif
Durée du contrat : 16 mois
Date d'embauche prévue : 1 avril 2023
Quotité de travail : Temps complet
Rémunération : entre 2583 et 2768€ brut mensuel selon expérience
Niveau d'études souhaité : Bac+5
Expérience souhaitée : Indifférent

Missions

Développement d'une gamme d'algorithmes de fouille de données pour l'exploration interactive d'un corpus de textes numérisés se rapportant à des procès d'inquisition du 16e siècle.

Activités

Le projet D4R (Dissidences religieuses et Réception de la Réforme à la Renaissance en Espagne (XVIe s.) Plus de détails à l'adresse https://d4r.hypotheses.org/) est un projet pluridisciplinaire en humanités numériques qui vise à concevoir une plate-forme logicielle permettant à des historiens d'explorer un corpus documentaire afin de les assister dans leur travail d'analyse. Le corpus de données est constitué d'un volume important de textes historiques et des procès d'inquisition en langue espagnole, numérisés dans un format XML TEI. L'objectif de la plate-forme est le suivant : par des représentations visuelles pertinentes (graphes de connaissance, etc.) et des interactions utilisateur intuitives, elle doit favoriser une navigation naturelle dans le contenu des documents, à savoir les personnes, les lieux, les événements ou des concepts théologiques. L'originalité de la plate-forme est l'intégration d'un algorithme piloté par l'utilisateur de manière interactive, afin d'assister ce dernier dans la mise en évidence des informations pertinentes.
L'équipe du projet se compose de chercheurs en histoire, en linguistique et en informatique, ainsi qu'un doctorant en humanités numériques. Le projet inclut également une dimension de collaboration internationale avec l'Espagne (Barcelone, Madrid, Tolède, Bilbao). Le développement de la plate-forme sera confié à un ingénieur en développement Web qui sera recruté sur le projet. En revanche, le ou les algorithmes qui régissent son fonctionnement interne devront être développés spécifiquement dans le cadre de ce contrat d'ingénieur.

Compétences

- Master en fouilles de données ou formation équivalente reconnue
- Des compétences justifiées en fouille de données et en analyse de texte sont indispensables pour mener à bien la tâche. Une expérience complémentaire en apprentissage automatique (word-embedding, etc.) pourra être mise à profit dans le développement de certaines fonctionnalités.
- Idéalement, le ou la candidate justifiera de compétences ou d'expériences en informatique (Python, etc.) ou linguistique computationnelle.
- Une expérience des techniques de gestion de projet et de git sera appréciée dans le cadre de la collaboration avec l'ingénieur responsable du développement de la plate-forme.
- Enfin, des connaissances de la langue espagnole seront appréciées vu le contexte du travail.

Contexte de travail

La personne retenue sera accueillie à l'Institut de Recherche en Informatique de Toulouse sur le site de l'Université Paul Sabatier. Elle bénéficiera de l'encadrement de Pr Josiane Mothe et David Panzoli, ainsi que de l'environnement des autres chercheurs, doctorants et postdoctorants du laboratoire.
L'encadrement par la personne recrutée de stagiaires en informatique ou sciences de la donnée pourra être envisagée.

On en parle sur Twitter !