En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR6072-SOPRAS-007 - Ingénieur(e) H/F de recherche "Segmentation pixelique de flux vidéo en stéréo-vision

Ingénieur(e) H/F de recherche "Segmentation pixelique de flux vidéo en stéréo-vision

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : lundi 22 août 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Informations générales

Référence : UMR6072-SOPRAS-007
Lieu de travail : CAEN
Date de publication : lundi 1 août 2022
Type de contrat : CDD Technique/Administratif
Durée du contrat : 8 mois
Date d'embauche prévue : 10 octobre 2022
Quotité de travail : Temps complet
Rémunération : entre 2400 et 2600 € brut mensuel
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années

Missions

Les travaux effectués pour ce poste se feront dans le cadre de l'ANR Mobideep visant à proposer des solutions de navigation ou d'aide à la navigation à des robots et/ou des personnes malvoyantes. Dans ce cadre, il est important d'avoir une classification au niveau pixelique des flux vidéos disponibles notamment pour identifier l'espace navigable et anticiper l'évolution de l'environnement dans lequel se déplace l'agent. L'utilisation de boîtes englobantes n'offre à ce jour pas une précision suffisante au système et un détourage plus précis est alors nécessaire. Les travaux réalisés se feront en collaboration avec l'INRIA et l'INJA et ont vocation à être intégrés à une plateforme commune. Le ou la postulant(e) effectuera un travail de recherche consistant à réaliser un état de l'art des méthodes existantes et à proposer des solutions pour résoudre les problèmes spécifiques au projet.

Activités

La segmentation sémantique est un domaine qui a connu d'importante avancé ses dernières années. L'apparition des réseaux entièrement convolutionnel [1] a permis à la fois de réduire le nombre de paramètre des architectures, accélérant ainsi les calculs tout en réduisant le coût mémoire, mais aussi de travailler avec des images à des résolutions différentes. Les travaux suivants tel que SegNet [2] et U-Net [3] ont étudié de manière plus approfondit comment on peut transmettre des informations entre les couches de convolution et les couches de déconvolution permettant la génération de carte sémantique à n'importe quel niveau d'échelle. En effet lors des premières couches du réseau, l'utilisation de fonction de type max-pooling a pour conséquence de perdre une partie de l'information de localisation. Il est donc nécessaire de propager une partie de l'information pour permettre une reconstruction précise de la carte sémantique. [4] introduisent ParseNet afin d'ajouter la connaissance du contexte de la scène au niveau local. Des réseaux de type récurrent tel que des couches Conv-LSTM ont été utilisés notamment dans [5] pour améliorer la segmentation de vidéo. Certain travaux utilise également des mécanismes issus de la détection d'objet pour les appliquer à la segmentation tel que Mask-RCNN [6].


Le postulant/la postulante, après la rédaction d'un état de l'art précis des méthodes de segmentation sémantique applicable à des vidéos en stéréo-vision, développera de nouvelles architectures pour répondre aux contraintes particulières du projet. Nous cherchons à tirer le plein potentiel des images stéréo ainsi que des précédentes annotations issu des frames précédentes de la vidéo.

Compétences

- Doctorat en Apprentissage automatique,
- Expérience dans les techniques d'apprentissage profond et dans les frameworks associés ( Pytorch, Tensorflow…),
- Bonnes expériences en publication d'articles scientifiques.

Contexte de travail

Le Laboratoire GREYC est un laboratoire de recherche situé à Caen en Normandie ( France). Il réalise des activités de recherche dans le domaine des sciences du numérique couvrant plusieurs aspects en informatique dont le traitement des images, la fouille de données, l'intelligence artificielle, la sécurité informatique, l'informatique mathématique, traitement automatique des langues, électronique et instrumentation. Les travaux seront effectués au sein de l'équipe Image dont les activités de recherche sont centrées sur le développement de nouvelles méthodes de traitement et d'analyse de signaux/images/vidéos ou de données discrètes. L'équipe bénéficie d'une solide expertise en reconnaissance de formes et recherche d'information dans les images/vidéos via des méthodes basées graphes, réseaux de neurones, apprentissage de métriques, ingénierie des connaissances ... L'équipe est composée de membres d'origines variées ( informatique, traitement du signal, mathématiques appliquées, intelligence artificielle). Cette variété de compétences constitue l'un des points forts de l'équipe, car elle lui permet d'aborder le traitement, l'analyse des images, vidéos ou encore des données discrètes selon plusieurs points de vue ou paradigmes de modélisation complémentaires.

Dans le cadre de la collaboration avec les autres partenaires, la mise en œuvre se fera sur la plateforme expérimentale du projet qui se situe à l'Inria de Sophia Antipolis, nécessitant possiblement de faire quelques déplacements sur site.

On en parle sur Twitter !