Informations générales
Intitulé de l'offre : Apprenti (H/F) Master Informatique de la sciences des données
Référence : UMR9012-HINBEN-008
Lieu de travail : ORSAY
Pays : France
Date de publication : jeudi 27 mars 2025
Type de contrat : Contrat d'apprentissage
Durée du contrat : 24 mois
Date d'embauche prévue : 1 septembre 2025
Quotité de travail : Complet
Rémunération :
Niveau de diplôme préparé : BAC+5
BAP : E - Informatique, Statistiques et Calcul scientifique
Description du poste
Le département informatique du laboratoire IJCLab est à la recherche d'un ou d'une apprenti(e) dans les technologies de cloud computing et du big data. L'apprentissage se concentrera sur 3 domaines :
1. la familiarisation avec une plateforme cloud pour le stockage, la gestion et le traitement des données de la Recherche,
2. la mise en œuvre, le déploiement et la maintenance automatisés de services big data dans le cloud pour le calcul scientifique,
3. la veille autour des technologies du cloud & big data.
L'apprenti(e) aura l'opportunité de recevoir une formation approfondie aux techniques du génie logiciel - de l'exploitation des ressources (réseau, stockage, calcul) au développement et au déploiement d'applica-tions - et rejoindra l'équipe technique du projet Fink (https://fink-broker.org), l'un des plus grands projets big data pour l'astrophysique en France.
En première année, l’apprenti(e) se formera sur les outils utilisés dans le cadre du projet Fink :
- Ceph pour la partie stockage
- Kubernetes pour l’orchestration de conteneurs
- Apache Spark pour le calcul scientifique
- Apache Kafka pour le streaming
- Apache Hbase pour la partie base de données
- Dash pour la partie visualisation de données
- Grafana pour la partie monitoring des ressources
Dans ce cadre, le travail de l’apprenti(e) se concentrera sur (1) l’automatisation des déploiements et le monitoring des performances, (2) l’optimisation des workflows existants (notamment du point de vue de la gestion des données), et (3) proposition et mise en œuvre de nouvelles solutions face aux problèmes actuels.
En deuxième année, l’accent sera aussi mis sur les outils du traitement de l’information, notamment au-tour du machine et deep learning (scikit-learn, tensorflow, pytorch, sparkML). L’apprenti(e) aura l’opportunité de proposer des améliorations aux modèles existants, et/ou de proposer de nouvelles ar-chitectures.
Tout au long de l’apprentissage, un accent particulier sur l’ingénierie logicielle sera fait (intégration conti-nue, déploiement continue, tests, documentation, ...). L’apprenti(e) aura aussi l’opportunité de présenter son travail lors de réunions d’équipes, et de participer si il/elle le souhaite à des conférences organisées dans le cadre de son travail.
Description de l'employeur
Le Centre National de la Recherche Scientifique est un organisme public de recherche plu-ridisciplinaire placé sous la tutelle du ministère de l’Enseignement supérieur, de la Re-cherche et de l’Innovation. Ses 10 instituts scientifiques couvrent tous les champs de la connaissance en biologie, physique, chimie, ingénierie, sciences humaines et sociales, ma-thématiques, écologie, sciences de l’information et sciences de l’univers.
Le CNRS emploie près de 32 000 personnes, dont plus de 11 000 chercheurs travaillant au sein de 1 144 laboratoires répartis sur tout le territoire national. Les 17 délégations régio-nales (DR) du CNRS ont un rôle de gestion et d’accompagnement de proximité de ces uni-tés de recherche, en particulier dans le domaine des Ressources Humaines.
Pour toute information complémentaire, il est possible de consulter le site Internet du CNRS : http://www.cnrs.fr/
Descriptif du profil recherché
Le département informatique du laboratoire IJCLab est à la recherche d'un ou d'une apprenti(e) dans les technologies de cloud computing et du big data. L’apprenti(e) devra être diplômé(e) d’une licence en informatique ou analogue. Une bonne connaissance des systèmes d’exploitation de type Unix est demandée, ainsi des bases solides dans le langage de programmation Python.
Conditions particulières d'exercice
N/A
Langues
Langue : Français/Anglais
Informations complémentaires
L’apprentissage se déroulera au Laboratoire de Physique des 2 infinis Irène Joliot-Curie – IJCLab. IJCLab est constitué de près de 510 permanents (dont 325 ingénieurs, techniciens et administratifs) et environ 238 non-permanents (dont 136 doctorants). Ses thèmes de recherche sont la physique nucléaire, la phy-sique des hautes énergies, les astroparticules et la cosmologie, la physique théorique, les accélérateurs et les détecteurs de particules ainsi que les recherches et développements techniques et applications asso-ciées pour l’énergie, la santé et l’environnement.
Au sein du département Informatique (54 agents), le service Développement comprend 18 personnes, contribuant à de nombreux logiciels de simulation et de traitement de données, ainsi que des sites webs scientifiques et administratifs. Le service exploitation (20 personnes) du Département Informatique gère une infrastructure informatique de plusieurs milliers de machines (serveurs essentiellement sous envi-ronnement Linux), assure le bon fonctionnement et l’évolution de cette infrastructure et garantit la dis-ponibilité des services systèmes et réseaux supportant l’ensemble des applications informatiques néces-saires à l’accomplissement du programme scientifique du laboratoire.
Le projet Fink (https://fink-broker.org) est un projet mêlant informatique et astronomie. Commencé en 2019, ce projet se base sur des technologies du cloud & du big data, et il a permis plusieurs découvertes majeures en astronomie.