Informations générales
Intitulé de l'offre : Ingénieur (H/F) de recherche en reconnaissance d'images
Référence : UMR6074-LAUAMS-002
Nombre de Postes : 1
Lieu de travail : RENNES
Date de publication : jeudi 26 septembre 2024
Type de contrat : CDD Technique/Administratif
Durée du contrat : 30 mois
Date d'embauche prévue : 18 novembre 2024
Quotité de travail : Temps complet
Rémunération : Entre 2847,42 et 3206.65€
Niveau d'études souhaité : Niveau 7 - (Bac+5 et plus)
Expérience souhaitée : Indifférent
BAP : Informatique, Statistiques et Calcul scientifique
Emploi type : Chef-fe de projet ou expert-e en ingénierie des systèmes d’information
Missions
Ce travail se fait dans le contexte d'un laboratoire commun réunissant les équipes de recherche de l'IRISA et de Ouest-France, premier quotidien régional en France. Il s'agit de confronter les techniques les plus récentes en vision par ordinateur aux millions de photographies que possède Ouest-France dans ses archives.
Activités
Les archives de Ouest-France contiennent plus de 35 millions de photographies, très diverses, en époque, en contenu, mais très peu exploitées, essentiellement manuellement par des documentalistes.
Un premier travail consiste à fournir la preuve que les outils d'analyse automatique fondées sur des architectures neuronales récentes (CNN, Transformers, ...) spécialisées en traitement d'images ouvrent des possibilités d'exploitation multiples. Cette preuve se fondera d'abord sur l'analyse d'un sous-ensemble de la collection d'images, sur laquelle trois tâches seront montrées : la capacité des outils modernes à faire de la classification d'images, de la reconnaissance fine d'objets ou de détails, et la reconnaissance de personnes et d'instances. Les défis concernent l'apprentissage de classes à partir de peu d'exemples et la dynamicité de cet apprentissage, la capacité d'identifier toutes les images d'un même sujet (par exemple, un lieu, une peinture, ou une statue) malgré des variations significatives de lumière, de cadrage, ou d'autres conditions de prise de vue, mais aussi malgré les changements dans l'aspect des sujets eux-mêmes au fil du temps. Globalement, ces travaux vont permettre de créer des liens au sein de vastes collections d'images, facilitant ainsi leur exploration et leur structuration par les conservateurs. Un retour des documentalistes et des journalistes sera central puisqu'ils seront les utilisateurs de ces technologies. Une analyse fine des besoins computationnels sera menée, les ressources en calcul étant limitées.
Cette preuve de fonctionnement permet de guider ensuite des analyses en lien avec des difficultés liées au passage à l'échelle et aux coûts des apprentissages et du requêtage. Suivra un travail sur l'adaptation des processus d'apprentissage et d'inférence à l'impossible connaissance de tous les services et les tâches avals innovants qui viendront exploiter ce corpus visuel (en plus de tâches comme la déduplication, la recommandation, la similarité avec de la diversité, le regroupement dynamique de séries d'images selon divers critères sémantiques : mêmes lieux, mêmes personnages, …), la génération automatique de descriptions ou de mots-clés, la visualisation de ces images. Fondamentalement, le travail évoqué ici devra aborder des questions scientifiques difficiles de représentation d'images, d'apprentissage de métriques, de recherches dans des variétés, d'apprentissage continu, d'augmentation de données, d'adaptation de modèles, d'indexation multidimensionnelle. Il vise à identifier les faiblesses des techniques actuelles et à proposer des améliorations pour des applications dans des contextes réels. Un prolongement de ces analyses se fera en évaluant les capacités des modèles multimodaux comme CLIP et ses descendants.
Une présence occasionnelle dans les locaux du journal Ouest-France, le plus grand quotidien de France, situé à Rennes, sera mise en place. Ouest-France dispose d'une archive en croissance continue, où la récupération rapide et précise d'instances ainsi que la création de liens de navigation pertinents sont essentiels pour les journalistes et les documentalistes. Des jeux de données absolument uniques y existent, s'écartant fortement de ceux utilisés dans toutes les études académiques, souvent artificiels et simplistes. Il est certain que les meilleurs systèmes modernes de récupération d'instances seront sérieusement mis à l'épreuve dans des contextes d'utilisation avec des images réelles, offrant ainsi des opportunités pour mener des recherches innovantes. Un partenariat étroit existe entre Linkmedia et Ouest-France. La présence occasionnelle chez Ouest-France facilitera le travail avec les archives et les discussions avec ses utilisateurs.
Compétences
Le candidat ou la candidate doit :
- posséder une thèse en informatique ou un diplôme d'ingénieur (ou équivalent Bac+5) en informatique avec une spécialisation en apprentissage automatique
- posséder de solides connaissances de programmation en Python, une grande habitude de la programmation, une familiarité avec les techniques de génie logiciel modernes facilitant la reproducibilité des résultats
- avoir un niveau d'anglais (niveau B2) et de français (A2) permettant d'analyser les données et d'échanger avec les partenaires
- une expérience/spécialisation en vision par ordinateur ou à défaut en apprentissage artificiel et réseaux de neurones est indispensable
- être autonome, avoir une approche scientifique rigoureuse, être force de propositions et d'initiatives
Contexte de travail
Le poste proposé se situe sur le campus de Beaulieu à Rennes.
Des déplacements sont à prévoir dans les locaux de Ouest-France
Poste à temps plein, 38h30 hebdomadaires avec RTT.
Télétravail possible.
A propos du laboratoire
=============
www.irisa.fr
L'IRISA est aujourd'hui l'un des plus grands laboratoires de recherche français (plus de 850 personnes) dans le domaine de l'informatique et des technologies de l'information. Structuré en sept départements scientifiques, l'IRISA est un laboratoire d'excellence dont les priorités scientifiques sont la bioinformatique, la sécurité des systèmes, les nouvelles architectures logicielles, la réalité virtuelle, l'analyse des big data et l'intelligence artificielle. Tourné vers l'avenir de l'informatique et nécessairement tourné vers l'international, l'IRISA est au cœur même de la transition numérique de la société et de l'innovation au service de la cybersécurité, de la santé, de l'environnement et de l'écologie, des transports, de la robotique, de l'énergie, de la culture et de l'intelligence artificielle.
Présentation du CNRS en tant qu'employeur : https://www.cnrs.fr/fr/le-cnrs
Présentation de l'IRISA comme laboratoire d'affectation : https://www.irisa.fr/umr-6074
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite éventuellement, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Informations complémentaires
Ce travail s'effectue dans le contexte du laboratoire commun SYNAPSES