En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR5505-CHLBOU-040 - CDD chercheur (H/F) - Intégration de données sémantiques et prise de décision pour la cybersécurité

CDD chercheur (H/F) - Intégration de données sémantiques et prise de décision pour la cybersécurité

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : mercredi 29 septembre 2021

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5505-CHLBOU-040
Lieu de travail : TOULOUSE
Date de publication : mardi 3 août 2021
Type de contrat : CDD Scientifique
Durée du contrat : 24 mois
Date d'embauche prévue : 1 février 2022
Quotité de travail : Temps complet
Rémunération : Entre 2 648 et 4 102 euros bruts mensuels selon expérience
Niveau d'études souhaité : Doctorat
Expérience souhaitée : Indifférent

Missions

Projet H2020 STARLIGHT (2021-2025)
Les organismes chargés de l'application de la loi (LEA) créent et ont accès à de grandes quantités de données plus que jamais auparavant. Annoncée comme un âge d'or pour la capacité des LEA à enquêter, résoudre et prédire les crimes, la révolution du big data s'est avérée, à bien des égards, une fausse promesse, les LEA étant encore incapables d'exploiter efficacement une grande partie de ces données. Aujourd'hui, il existe une nouvelle panacée : l'apprentissage automatique en intelligence artificielle (IA). Cette IA est considérée comme la solution miracle à de nombreux défis actuels de la société : rationalisation et amélioration de la productivité et de l'efficacité, détection de modèles et prise de décisions avec une rapidité et une précision inégalées. Pour maximiser les avantages de l'IA, les LEA doivent, pour toutes les données qu'elles possèdent, intégrer une approche critique, humaine et inclusive, ainsi qu'une stratégie cohérente en matière de données, afin de soutenir la mise en œuvre de toute technologie d'IA pour la sûreté et la sécurité de notre société.
STARLIGHT effectuera une analyse approfondie des lacunes actuelles des LEA en matière d'adoption de l'IA et de la manière de renforcer leurs capacités à l'aide de ces outils, en s'appuyant sur des ateliers innovants pour identifier et consolider leurs besoins et leur veille technologique. STARLIGHT activera ensuite la recherche au-delà de l'état de l'art afin d'accompagner les LEA européens vers l'ère de l'intelligence artificielle pour contrer les nouvelles menaces de sécurité émergentes (y compris l'IA contradictoire et l'utilisation abusive de l'IA à des fins criminelles).

Activités

La personne recrutée sera impliquée dans les lots 7 et 8 et les tâches suivantes.
- Tâche 7.1 Fusion et corrélation d'informations multidimensionnelles pour la génération de connaissances opérationnelles : cette tâche porte sur les stratégies et les techniques permettant de fusionner et de corréler des données multimodales et des informations extraites, afin de les réutiliser à des fins d'enquête et de renseignement. À partir d'une représentation des connaissances sous forme de graphe, des modèles de fusion basés sur l'IA et des techniques d'alignement d'entités seront exploités pour détecter les similitudes entre les personnes, les comptes, les objets et les événements, et ainsi mettre en correspondance les informations entre différents cas ou sources multiples. Des modèles adaptatifs basés sur des graphes sémantiques seront appliqués pour reconnaître les relations cachées ou potentielles entre des éléments d'information épars. Ces modèles seront automatiquement et périodiquement ré-entraînés sur les connaissances observées, afin d'être constamment alignés sur l'environnement en évolution et capables de reconnaître les corrélations suspectes émergentes.
- La Tâche 7.2 Exploration et recherche de connaissances et de renseignements opérationnels est axée sur le développement de nouvelles méthodes de recherche et d'exploration de grandes collections multimodales. Elle utilise l'apprentissage de métriques et de représentations, des approches d'apprentissage à zéro, à un ou à quelques coups pour rechercher du contenu qui n'est pas identifié par des classificateurs, des détecteurs ou des traqueurs supervisés prédéfinis, et inclut également des estimations de similarité locale et de quasi-duplication. Cette tâche permettra de développer des méthodes pour fournir des recommandations de contenu, telles que des vidéos similaires prises sous différents angles, la similarité audio et la mise en correspondance de textes, ainsi que de nouvelles approches pour aligner les informations multimodales afin de faciliter les interfaces de recherche agnostiques.
- La tâche 8.7 Mesures de protection des données et de respect de la vie privée dès la conception fournira aux LEA des solutions pour garantir la confidentialité des données au niveau du système. La première consistera en un système d'aide à la décision (DSS) ou un système de recommandation qui proposera des politiques d'autorisation de haut niveau en apprenant les préférences des utilisateurs en matière de confidentialité, dans le but de protéger les données personnelles de l'utilisateur final. Le système proposera des politiques d'autorisation grâce à des algorithmes d'apprentissage spécifiques. Le résultat sera alors un modèle multicritères qui tiendra compte des préférences des utilisateurs finaux en matière de protection de la vie privée. La seconde fusionnera la puissance de l'apprentissage collaboratif/fédéré (avec des données non partagées par conception) et les garanties fournies par la confidentialité différentielle (à un coût de calcul négligeable) dans un cadre unique pour la conception de modèles d'IA, offrant la possibilité d'utiliser et de combiner plusieurs techniques en fonction des contraintes des cas d'utilisation dans le contexte des opérations LEA et de la cybersécurité.

Compétences

Les candidats doivent être titulaires d'un doctorat en informatique, avoir une solide expérience des technologies du web sémantique, de l'ingénierie ontologique, de la gestion et de l'interrogation des données liées, des systèmes d'aide à la décision, des systèmes de recommandation et de l'analyse décisionnelle multicritères. La maîtrise de l'anglais écrit et parlé est également requise. Une expérience en programmation, un bon dossier de publication ainsi qu'une bonne maîtrise de la langue française seront un plus.

Contexte de travail

Localisation : Institut de Recherche en informatique de Toulouse (IRIT) - UPS, 118 Route de Narbonne F-31062 Toulouse Cedex - France et UT1C, 2 rue du Doyen Gabriel Marty - 31042 Toulouse Cedex 9
Equipes d'accueil :
ADRIA https://www.irit.fr/en/departement/dep-artificial-intelligence/adria-team/
MELODI https://www.irit.fr/en/departement/dep-artificial-intelligence/melodi-team/
La personne recrutée travaillera avec trois permanents universitaires et collaborera avec les organismes partenaires du projet, en particulier le CEA, ENG, CRI, MIL, NBI, WEBIQ, CRI, EUROPOL, TNO, ZITIS.

On en parle sur Twitter !