Apprentissage ingénieur (H/F) de 3 ans sur le volet modélisation des données du métier de "data scientist"

New

Institut de Recherche en Informatique de Toulouse

TOULOUSE • Haute-Garonne

  • Apprenticeship contract
  • 36 month
  • BAC+5

This offer is open to people with a document recognizing their status as a disabled worker.

Offer at a glance

The Unit

Institut de Recherche en Informatique de Toulouse

Contract Type

Apprenticeship contract

Working hHours

Full Time

Workplace

31062 TOULOUSE

Contract Duration

36 month

Date of Hire

01/09/2026

Apply Application Deadline : 24 June 2026 23:59

Job Description

Missions

L’apprenti-e sera rattaché-e dans l’équipe Supports aux projets du CRI dont l’objectif est d’aider à la réalisation des différents projets de recherche de l’IRIT notamment sur les aspects de la recherche par les données tels que le calcul, le développement logiciel, les données et l’IA. L’équipe met à disposition des chercheurs la plateforme de calcul Occidata pour l’expérimentation des codes de calcul et la plateforme logicielle OCS pour la Science Ouverte.
La mission confiée à l’apprenti-e sera de contribuer aux développements fonctionnels et logiciels de la plateforme OCS dédiée aux données de la recherche pour répondre aux besoins des projets de l’IRIT dans les domaines de la Science Ouverte (SO) et des Sciences des Données (SD) :
- étudier les principes FAIR pour les produits de la recherche (Findable Accessible, Interoperable, Reusable), l’existant de la plateforme OCS, l’éco-système numérique de la SO et des SD.
- faire l’état de l’art sur la spécification des données et des traitements pour les SD et enrichir leur modèle sémantique dans la plateforme. Mettre en place des indices de qualité.
- intégrer un modèle pour la description des codes et des services de traitement et de déploiement.
- enquêter sur les besoins des chercheurs dans les domaines de la SO, des SD et des sciences reproductibles. Faire ressortir des cas d’usage d’intérêt.
- contribuer à la feuille de route fonctionnelle et technique de la plateforme.
- élaborer des documentations, des communications et des ateliers à destination des
chercheurs et ingénieurs.
- construire la cartographie des produits de la recherche ouverts de l’IRIT (données, codes, publications, work services de traitement, vocabulaires, DMP, datapapers) pour contribuer à améliorer la visibilité scientifique de l’IRIT, la citabilité et la réutilisabilité de ses travaux et des produits de ses recherches.
- enrichir la sémantique des produits de la recherche et de la plateforme avec les langages du web des données et une base graphe SPARQL. Mettre en place l’inférence sémantique pour améliorer les fonctionnalités de la plateforme.
- refactorer des codes existants, développer de nouvelles fonctionnalités et de nouvelles vues de l’interface utilisateur de la plateforme. Ecrire leurs tests logiciels (frameworks javascript VueJS). Adopter l’environnement de développement (Gitlab, VSC).
- faire évoluer la plateforme vers un Environnement Virtuel de Recherche (VRE). Ses usages de recherche par les données seront intégrés à l’éco-système de la Science Ouverte et dans le web des données pour améliorer les usages, la provenance des ressources, une exploitation et une reproductibilité amélioré des expérimentations dans les projets en recherche par les données.

Your Profil

Le profil recherché est un apprenti-e sur tout le cycle d’ingénieur (bac+3, bac+4, bac+5 avec le stage de fin d’étude) dans le domaine de l’informatique et des sciences des données souhaitant ajouter de fortes compétences autour des données à son profil de data scientist.
Le ou la candidate devra avoir un fort intérêt pour la recherche par les données et les environnements ouverts associés. Intéressé-e, l’apprenti-e contribuera à la spécification, à la conception et aux développements logiciel d’un Environnent Numérique de Travail (ENT) constitué de ressources ouvertes telles que les données, les codes, les workflows, les publications, les services et les plateformes pour des recherches intersciences. La base de données étant le web, le ou la candidate devra avoir un goût prononcé pour le web avancé tel que les bases de données graphes sémantiques et le développement de systèmes d’information web en lien avec l’éco-système numérique de la Science Ouverte et des communs de la recherche permettant l’accès, l’utilisation et la valorisation des produits de la recherche.
Le ou la candidate devra avoir de bonne capacité à synthétiser et à formaliser pour
modéliser les ressources et les activités de la plateforme pour les rendre compréhensible par l’humain et exploitable par les machines. Les fonctionnalités de l’ENT seront augmentés par l’inférence sémantique dans les graphes de connaissance constitués.
Le ou la candidat.e devra faire preuve d’autonomie.

Your Work Environment

Description of the employer

Le Centre National de la Recherche Scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation. Ses 10 instituts scientifiques couvrent tous les champs de la connaissance en biologie, physique, chimie, ingénierie, sciences humaines et sociales, mathématiques, écologie, sciences de l’information et sciences de l’univers. Le CNRS emploie près de 32 000 personnes, dont plus de 11 000 chercheurs travaillant au sein de 1 144 laboratoires répartis sur tout le territoire national. Les 17 délégations régionales (DR) du CNRS ont un rôle de gestion et d’accompagnement de proximité de ces unités de recherche, en particulier dans le domaine des Ressources Humaines. Pour toute information complémentaire, il est possible de consulter le site Internet du CNRS : http://www.cnrs.fr/

L’Institut de Recherche en Informatique de Toulouse (IRIT) est une des plus imposantes unité de Recherche (UMR 5505) au niveau national et est l’un des piliers de la recherche en Occitanie avec ses 600 membres et une centaine de collaborateurs extérieurs.
La recherche de l’institut se matérialise par de nombreux projets avec une forte orientation Calcul, Données, IA dans les domaines d’application suivants:
- Santé, Autonomie, Bien-être
- Ville Intelligente
- Aéronautique, Espace, Transports
- Média sociaux numériques et diffusion de l’information
- e-Education
- Cybersécurité, Sécurité des biens et des personnes

Special conditions of exercise

L’apprentissage s’effectuera sur le site de UT – Rangueil au sein du CRI et en lien
avec les chercheurs de l’Institut de Recherche en Informatique de Toulouse.
Utilisation des outils collaboratifs.

Compensation and benefits

Compensation

Annual leave and RTT

44 jours

Remote Working practice and compensation

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

About the offer

Offer reference UMR5505-CHLBOU-108
Line of business IT, Statistics and Scientific Calculation

About the CNRS

The CNRS is a major player in fundamental research on a global scale. The CNRS is the only French organization active in all scientific fields. Its unique position as a multi-specialist allows it to bring together different disciplines to address the most important challenges of the contemporary world, in connection with the actors of change.

CNRS

The research professions

Langues

Create your alert

Don't miss any opportunity to find the job that's right for you. Register for free and receive new vacancies directly in your mailbox.

Create your alert

Apprentissage ingénieur (H/F) de 3 ans sur le volet modélisation des données du métier de "data scientist"

Apprenticeship contract • 36 month • BAC+5 • TOULOUSE

You might also be interested in these offers!

    All Offers