En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Doctorant (H/F) Phénotypage piloté par une ontologie à partir de données de dossiers patients informatisés

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : mercredi 29 juin 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR5800-MAGHIN-020
Lieu de travail : BORDEAUX
Date de publication : mercredi 8 juin 2022
Nom du responsable scientifique : Bienvenu Meghyn
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2022
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Contexte :

Avec l'adoption croissante des dossiers patients informatisés, la quantité de données numériques produites au chevet des patients augmente rapidement. Ces données offrent de nouvelles perspectives pour créer et diffuser de nouvelles connaissances mais aussi pour envisager la mise en œuvre d'une médecine personnalisée et prédictive. En effet, l'exploitation secondaire des données biomédicales produites tout au long du parcours de soins des patients est un enjeu crucial et fait l'objet de nombreuses études depuis plusieurs années. Bien que des plateformes d'utilisation secondaire des données biomédicales présentes dans les dossiers patients informatisés aient été développées, leur adoption et leur mise en œuvre demeurent lentes et l'exploitation de ces données par des experts cliniciens et chercheurs reste complexe à mettre en œuvre. L'utilisation secondaire des données issues des dossiers patients informatisés n'est donc pas une tâche aisée.

En particulier, l'utilisation des dossiers patients informatisés bruts à des fins de phénotypage (c'est-à dire l'identification de patients en fonction de leurs caractéristiques cliniques) reste un défi. L'interrogation de ces données pour identifier les patients correspondant à un phénotype spécifique (comme les patients atteints d'un cancer du poumon métastatique traité par des inhibiteurs de tyrosine kinase) aboutit souvent à un ensemble de patients incomplet et bruité en raison de données imparfaites, erronées et incohérentes. Par exemple, les données peuvent ne pas contenir un diagnostic précis si les patients ont été diagnostiqués en dehors de l'hôpital. Cette information doit alors être extraite de documents en texte libre ou déduite d'autres types d'informations disponibles (traitements, actes chirurgicaux...). Enfin, les informations partagées par des professionnels de santé dans le cadre du soin reposent sur une base de connaissances communes et de nombreuses informations (ou relations entre les informations) ne sont pas explicites au sein des données. Il est donc nécessaire d'identifier les patients qui répondent à ces critères et de les classer en fonction de la cohérence et de l'exhaustivité de leurs données dans un contexte de données hétérogènes incomplètes et dépendantes du temps et de connaissances externes.

L'accès aux données au travers d'une ontologie (en anglais : ontology-based data access, OBDA) est une approche déclarative prometteuse qui exploite les connaissances sémantiques et le raisonnement automatique pour combler l'écart entre les besoins d'informations des utilisateurs et la manière dont les données sont réellement stockées. Alors que les systèmes OBDA gagnent en maturité, il est intéressant d'étudier leur apport dans le contexte de l'utilisation secondaire des données de santé.

Sujet :
L'étudiant(e) travaillera en collaboration avec les encadrants pour étudier la capacité des systèmes OBDA à réaliser des tâches permettant l'exploitation des données de santé dans le contexte de cas d'usage appliqués. Ces travaux seront réalisés à partir des données issues de l'Entrepôt de Données de Santé du CHU de Bordeaux. Les étapes envisagées pour cette thèse sont les suivantes :

(1) Mise en œuvre et évaluation d'un système OBDA dans le contexte du phénotypage de patients en cancérologie (identification et annotation automatique de cohortes de patients atteints de tumeurs malignes du poumon),

(2) Mise en œuvre et évaluation d'un système OBDA dans le contexte de la visualisation et de l'exploration rapide de dossiers patients complexes (visualisation par problème, moteur de recherche sémantique centré patient, représentation temporelle d'évènements de santé dépendants d'un ensemble de données ponctuelles).

Il s'agira dans tous les cas d'un travail de recherche appliquée, avec une évaluation des méthodes développées dans le cadre de projets de recherche réels (cancer du poumon métastatique, syndrome de Vexas...) intégrant des problématiques de données incomplètes, potentiellement incohérentes et temporelles.

Profil souhaité :
-- Des connaissances du domaine médical, en représentation des connaissances et raisonnement automatique (ontologies et logiques de description) sont requises.

-- Un excellent niveau en anglais est demandé.

Contexte de travail

Cette thèse s'inscrit dans la chaire IA INTENDED (https://intended.labri.fr/, 2020-2025), dont le but est de développer des méthodes intelligentes pour traiter les données imparfaites.

La thèse sera co-encadrée par Meghyn Bienvenu (LaBRI, Bordeaux), Vianney Jouhet (UIAM – CHU de Bordeaux, AheAD – BPH – Inserm U1219) et Fleur Mougin (AheAD – BPH – Inserm U1219). L'étudiant(e) travaillera principalement dans l'Unité Informatique et Archivistique Médicales (UIAM) du CHU de Bordeaux dont les missions incluent l'utilisation secondaire des données (Entrepôt de Données de Santé, phénotypage) et la gestion centralisée des référentiels biomédicaux. L'étudiant(e) rejoindra par ailleurs l'équipe ERIAS (Equipe de Recherche en Informatique Appliquée à la Santé) du centre Inserm Bordeaux Population Health qui comporte une dizaine de chercheurs développant des approches d'extraction, d'intégration, de représentation et d'interrogation de données et connaissances biomédicales ainsi que l'équipe RATIO (Reasoning with data, knowledge and constraints) du LaBRI (Laboratoire Bordelais de Recherche en Informatique) qui réunit une quinzaine de chercheurs qui travaillent sur diverses problèmes autour du raisonnement logique.

Informations complémentaires

Pour avoir plus d'informations, vous pouvez consulter le site web du projet (https://intended.labri.fr/), ou prendre contact avec Vianney Jouhet (vianney.jouhet@chu-bordeaux.fr).

On en parle sur Twitter !