Informations générales
Intitulé de l'offre : Ingénieur (H/F) conception et développement logiciel (projet TAP)
Référence : UMR6074-OLIZEN-002
Nombre de Postes : 1
Lieu de travail : RENNES
Date de publication : lundi 2 décembre 2024
Type de contrat : IT en contrat CDD
Durée du contrat : 13 mois
Date d'embauche prévue : 27 janvier 2025
Quotité de travail : Complet
Rémunération : Rémunération mensuelle selon diplôme et expérience, entre 2 847 € bruts (2 288 € net à payer) et 3 514 € bruts (2 824 € net à payer).
Niveau d'études souhaité : BAC+5
Expérience souhaitée : Indifférent
BAP : E - Informatique, Statistiques et Calcul scientifique
Emploi type : Ingénieur-e en ingénierie logicielle
Missions
Mission confiée
Vos tâches
L'objectif principal de l'équipe DiverSE pour ce projet est d'identifier les vulnérabilités dans les codes générés par les LLM. Pour atteindre cet objectif, nous mettrons en place un système capable de générer automatiquement des ensembles de données (datasets) de vulnérabilités. Cela sera réalisé en utilisant les catalogues web disponibles pour les vulnérabilités et en modélisant ces vulnérabilités de manière à les intégrer de manière transparente dans un outil de test, nous permettant ainsi d'analyser le code et les bibliothèques générés par LLM. Les langages cibles seront prioritairement C et Java, du fait de leur grande utilisation et afin de maximiser l’impact de nos travaux.
Dans ce cadre, l’équipe DiverSE (en étroite collaboration avec le laboratoire IPAL et la DGA) recrute une ingénieure ou un ingénieur pour une durée de 13 mois, extensible à 35 à 40 mois (selon expérience), sous la responsabilité scientifique et technique de permanents de l’équipe impliqués dans le projet. Cette personne sera chargée des travaux de conception et développement liés aux objectifs de DiverSE indiqués ci-dessus, dans le but de concevoir et réaliser des prototypes et démonstrateurs.
Les synergies avec d’autres travaux effectués dans l’équipe seront également explorées et exploitées.
Les résultats de nos travaux seront utilisés par les partenaires de NUS à Singapour.
Activités
Atouts du poste
Pourquoi nous rejoindre à IRISA Rennes chez DiverSE
Ce projet présente des opportunités uniques par domaine d'application, son ambition, son réseau de contacts internationaux, son impact potentiel. Il se retrouve au cœur des activités de DiverSE, équipe particulièrement dynamique, et en relation avec une équipe non moins dynamique à Singapour.
En Bretagne au coeur d'une équipe dynamique
L'équipe de recherche DiverSE étudie les techniques de l'ingénierie logicielle pour la construction fiable et efficace d'applications, avec des travaux déclinés notamment autour de la cybersécurité et des LLMs.
Avec actuellement une quinzaine de permanents F/H (chercheurs Inria et CNRS, enseignants-chercheurs et enseignante-chercheuse INSA/Université de Rennes dont 3 IUFs), une quinzaine de doctorantes et doctorants, plusieurs ingénieurs et un ingénieur associé de la DGA, l'équipe est reconnue au niveau mondial dans ces domaines d'expertise. Elle met de plus un point d'honneur à ce que ses recherches soient applicables voire appliquées, avec de très forts liens avec l'industrie internationale, nationale et locale.
Elle est aussi reconnue en local pour son ambiance sur site, ses pauses café et ses séminaires au vert mémorables.
Ambition
Vous participerez à un projet open source d'envergure mondiale. Dans une époque où la sécurité des codes sources est un enjeu stratégique pour les États, le projet collaboratif international TAP a l'ambition de répondre directement à cet enjeu. Il pourra également servir de première brique à la construction d'une collaboration renforcée entre DiverSE et NUS. Au niveau national, européen et mondial, il contribuera à garantir une souveraineté et une sécurité renforcée dans les domaines de l'ingénierie logicielle, de l'IA et en particulier les LLMs, et de la cybersécurité (sécurité de la software supply chain).
Réseau de contacts
Dans le cadre du projet TAP, les contacts seront fréquents avec nos partenaires de NUS (National University of Singapore) et d'IPAL (Nantes). Un ou des séjours à Singapour pourront être envisagés selon vos souhaits. De façon plus générale, les contacts dans et hors de l'équipe DIverSE seront pour vous une opportunité pour voir au-delà de vos propres travaux, offrant un contexte large et varié avec les nombreux projets de recherche, innovation et transfert industriel de l'équipe.
Après le projet, vous ferez partie des (nombreux) anciens de l'équipe DiverSE, dont la plupart sont toujours en contact.
Impact potentiel
Le développement exponentiel de l'usage des LLMs pour toutes sortes de tâches, dont la production assistée de code source, assure aux résultats du projets un impact considérable. En effet, la sécurisation des codes produits par le LLMs est actuellement balbutiante, et fournir un système s'acquittant de cette tâche automatiquement répondrait à un besoin mondial tout à fait immense. Les enjeux de cybersécurité qui en découlent sont donc considérables en pratique.
Compétences
Compétences
Des compétences en conception et développement sont nécessaires; une expérience est appréciée.
Des connaissances en C et Java seront appréciées; de façon générale, nous nous attendons à recevoir des candidats ayant la capacité de maîtriser plusieurs langages de développement.
La capacité à interagir dans un environnement international, en anglais, est appréciée.
Un bon niveau d'autonomie est apprécié.
Contexte de travail
A propos du centre
L’IRISA (Institut de Recherche en Informatique et Systèmes Aléatoires) est aujourd'hui l'un des plus grands laboratoires de recherche français (+ de 850 personnes) dans le domaine de l'informatique et des nouvelles technologies de l'information.
Organisé en sept départements scientifiques, le laboratoire est un centre de recherche d'excellence axé sur des domaines prioritaires tels que la bio-informatique, la sécurité des systèmes, les nouvelles architectures logicielles, la réalité virtuelle, l'analyse des données massives et l'intelligence artificielle.
L’IRISA est au centre d'un écosystème régional dynamique en recherche et innovation, se démarquant en France et à l'étranger grâce à son expertise reconnue, notamment à travers des collaborations scientifiques internationales.
Orienté vers l'avenir de l'informatique et tourné vers l'international, l'IRISA est au cœur de la transition numérique et de l'innovation pour la cybersécurité, la santé, l'environnement, les transports, la robotique, l'énergie, la culture et l'intelligence artificielle.
Contexte
Le projet TAP (Trustworthy Automatic Programming)
TAP est un projet conjoint de CNRS-IPAL-IRISA et NUS (National University of Singapore), financé par le DGA et son homologue Singapourien.
Depuis les 60 à 70 dernières années, la programmation a largement prévalu dans le domaine de l'informatique, englobant la capture d'intentions et la production de code. Les spécifications formelles ont gagné en importance grâce aux avancées en modélisation et conception de systèmes, ce qui permet une capture plus précise des objectifs. Malgré les progrès réalisés, les ingénieurs en logiciel hésitent à rédiger des spécifications formelles, ce qui se traduit par l'absence d'une déclaration formelle d'intention pour les grands systèmes logiciels, rendant ainsi le débogage et la correction d'erreurs difficiles. Malgré l'absence de capture d'intention, des tests et des analyses ont été utilisés pour élaborer des bases de code fiables. Lors des tests, ces travaux visent à obtenir une couverture comportementale plus étendue et utilisent des oracles de test. Les approches de fuzzing ont gagné en importance au cours de la dernière décennie. Cependant, obtenir la correction fonctionnelle du logiciel sans exigence formelle approfondie reste un objectif difficile.
Les récents progrès dans la génération automatique de code à partir de grands modèles de langage (LLMs) offrent une nouvelle perspective. Il est envisageable de programmer à partir de spécifications en langage naturel en utilisant la génération de code par LLM, ce qui suggère que l'autocodage est réalisable. Cela soulève la question de la correction et la sécurité du code généré automatiquement par les LLMs et des conditions dans lesquelles il est possible de lui faire confiance.
Le projet TAP (Trustworthy Automatic Programming), se focalise spécifiquement sur ces aspects. Les objectifs de ce projet consistent à identifier les vulnérabilités dans le code généré par LLM, à les analyser et les classifier, ainsi qu'à déterminer si certains types de vulnérabilités sont plus fréquents dans le code généré par LLM que dans le code rédigé par des humains. Les objectifs du projet comprennent également la correction automatique des vulnérabilités dans le code généré par LLM et le renforcement des LLM par rapport aux vulnérabilités dans les codes générés.
Avantages
Télétravail possible jusqu'à 2 jours par semaine
Prise en charge partielle des frais de transport en commun sur le trajet domicile-travail ou FMD
Prise en charge partielle des frais de mutuelle
Restauration subventionnée sur place
Parking voitures et vélos gratuits sur place; bus à 5 minutes à pied; métro à 10 minutes à pied.
Localisation
Campus de Beaulieu Irisa/Inria Rennes
Bâtiment 12
263 avenue du Général Leclerc
35 042 RENNES cedex
Présentation du CNRS en tant qu'employeur : https://www.cnrs.fr/fr/le-cnrs
Présentation de l'IRISA en tant que laboratoire d'affectation : https://www.irisa.fr/umr-6074
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.
Contraintes et risques
Le travail peut impliquer des voyages en France et à l'étranger, y compris par avion.