Apprentissage ingénieur (H/F) de 3 ans sur le volet modélisation des données du métier de "data scientist"

Nouveau

Institut de Recherche en Informatique de Toulouse

TOULOUSE • Haute-Garonne

  • Contrat d'apprentissage
  • 36 mois
  • BAC+5

Cette offre est ouverte aux personnes disposant d’un titre leur reconnaissant la qualité de travailleur handicapé ou travailleuse handicapée.

L'offre en un coup d'oeil

L'unité

Institut de Recherche en Informatique de Toulouse

Type de Contrat

Contrat d'apprentissage

Temps de Travail

Complet

Lieu de Travail

31062 TOULOUSE

Durée du contrat

36 mois

Date d'Embauche

01/09/2026

Postuler Date limite de candidature : mercredi 24 juin 2026 23:59

Description du Poste

Les Missions

L’apprenti-e sera rattaché-e dans l’équipe Supports aux projets du CRI dont l’objectif est d’aider à la réalisation des différents projets de recherche de l’IRIT notamment sur les aspects de la recherche par les données tels que le calcul, le développement logiciel, les données et l’IA. L’équipe met à disposition des chercheurs la plateforme de calcul Occidata pour l’expérimentation des codes de calcul et la plateforme logicielle OCS pour la Science Ouverte.
La mission confiée à l’apprenti-e sera de contribuer aux développements fonctionnels et logiciels de la plateforme OCS dédiée aux données de la recherche pour répondre aux besoins des projets de l’IRIT dans les domaines de la Science Ouverte (SO) et des Sciences des Données (SD) :
- étudier les principes FAIR pour les produits de la recherche (Findable Accessible, Interoperable, Reusable), l’existant de la plateforme OCS, l’éco-système numérique de la SO et des SD.
- faire l’état de l’art sur la spécification des données et des traitements pour les SD et enrichir leur modèle sémantique dans la plateforme. Mettre en place des indices de qualité.
- intégrer un modèle pour la description des codes et des services de traitement et de déploiement.
- enquêter sur les besoins des chercheurs dans les domaines de la SO, des SD et des sciences reproductibles. Faire ressortir des cas d’usage d’intérêt.
- contribuer à la feuille de route fonctionnelle et technique de la plateforme.
- élaborer des documentations, des communications et des ateliers à destination des
chercheurs et ingénieurs.
- construire la cartographie des produits de la recherche ouverts de l’IRIT (données, codes, publications, work services de traitement, vocabulaires, DMP, datapapers) pour contribuer à améliorer la visibilité scientifique de l’IRIT, la citabilité et la réutilisabilité de ses travaux et des produits de ses recherches.
- enrichir la sémantique des produits de la recherche et de la plateforme avec les langages du web des données et une base graphe SPARQL. Mettre en place l’inférence sémantique pour améliorer les fonctionnalités de la plateforme.
- refactorer des codes existants, développer de nouvelles fonctionnalités et de nouvelles vues de l’interface utilisateur de la plateforme. Ecrire leurs tests logiciels (frameworks javascript VueJS). Adopter l’environnement de développement (Gitlab, VSC).
- faire évoluer la plateforme vers un Environnement Virtuel de Recherche (VRE). Ses usages de recherche par les données seront intégrés à l’éco-système de la Science Ouverte et dans le web des données pour améliorer les usages, la provenance des ressources, une exploitation et une reproductibilité amélioré des expérimentations dans les projets en recherche par les données.

Votre Profil

Le profil recherché est un apprenti-e sur tout le cycle d’ingénieur (bac+3, bac+4, bac+5 avec le stage de fin d’étude) dans le domaine de l’informatique et des sciences des données souhaitant ajouter de fortes compétences autour des données à son profil de data scientist.
Le ou la candidate devra avoir un fort intérêt pour la recherche par les données et les environnements ouverts associés. Intéressé-e, l’apprenti-e contribuera à la spécification, à la conception et aux développements logiciel d’un Environnent Numérique de Travail (ENT) constitué de ressources ouvertes telles que les données, les codes, les workflows, les publications, les services et les plateformes pour des recherches intersciences. La base de données étant le web, le ou la candidate devra avoir un goût prononcé pour le web avancé tel que les bases de données graphes sémantiques et le développement de systèmes d’information web en lien avec l’éco-système numérique de la Science Ouverte et des communs de la recherche permettant l’accès, l’utilisation et la valorisation des produits de la recherche.
Le ou la candidate devra avoir de bonne capacité à synthétiser et à formaliser pour
modéliser les ressources et les activités de la plateforme pour les rendre compréhensible par l’humain et exploitable par les machines. Les fonctionnalités de l’ENT seront augmentés par l’inférence sémantique dans les graphes de connaissance constitués.
Le ou la candidat.e devra faire preuve d’autonomie.

Votre Environnement de Travail

Description de l'employeur

Le Centre National de la Recherche Scientifique est un organisme public de recherche pluridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation. Ses 10 instituts scientifiques couvrent tous les champs de la connaissance en biologie, physique, chimie, ingénierie, sciences humaines et sociales, mathématiques, écologie, sciences de l’information et sciences de l’univers. Le CNRS emploie près de 32 000 personnes, dont plus de 11 000 chercheurs travaillant au sein de 1 144 laboratoires répartis sur tout le territoire national. Les 17 délégations régionales (DR) du CNRS ont un rôle de gestion et d’accompagnement de proximité de ces unités de recherche, en particulier dans le domaine des Ressources Humaines. Pour toute information complémentaire, il est possible de consulter le site Internet du CNRS : http://www.cnrs.fr/

L’Institut de Recherche en Informatique de Toulouse (IRIT) est une des plus imposantes unité de Recherche (UMR 5505) au niveau national et est l’un des piliers de la recherche en Occitanie avec ses 600 membres et une centaine de collaborateurs extérieurs.
La recherche de l’institut se matérialise par de nombreux projets avec une forte orientation Calcul, Données, IA dans les domaines d’application suivants:
- Santé, Autonomie, Bien-être
- Ville Intelligente
- Aéronautique, Espace, Transports
- Média sociaux numériques et diffusion de l’information
- e-Education
- Cybersécurité, Sécurité des biens et des personnes

Conditions particulières d'exercice

L’apprentissage s’effectuera sur le site de UT – Rangueil au sein du CRI et en lien
avec les chercheurs de l’Institut de Recherche en Informatique de Toulouse.
Utilisation des outils collaboratifs.

Rémunération et avantages

Rémunération

Congés et RTT annuels

44 jours

Pratique et Indemnisation du TT

Pratique et indemnisation du TT

Transport

Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€

À propos de l’offre

Référence de l’offre UMR5505-CHLBOU-108
Secteur d’activité Informatique, Statistiques et Calcul scientifique
Langues L’anglais technique et scientifique à l’écrit est demandé.

À propos du CNRS

Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.

Le CNRS

Les métiers de la recherche

Langues

Créer une alerte

Ne manquez aucune opportunité de trouver le poste qui vous correspond. Inscrivez-vous gratuitement et recevez les nouvelles offres directement dans votre boite mail.

Créer une alerte

Apprentissage ingénieur (H/F) de 3 ans sur le volet modélisation des données du métier de "data scientist"

Contrat d'apprentissage • 36 mois • BAC+5 • TOULOUSE

Ces offres pourraient aussi vous intéresser !

    Toutes les offres