En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)
Portail > Offres > Offre UMR7271-VIVROS-024 - CDD CHERCHEUR EN STOCKAGE DE DONNEES NUMERIQUES SUR DE L'ADN SYNTHETIQUE (H/F).

CDD CHERCHEUR EN STOCKAGE DE DONNEES NUMERIQUES SUR DE L'ADN SYNTHETIQUE (H/F).

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : jeudi 3 février 2022

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR7271-VIVROS-024
Lieu de travail : SOPHIA ANTIPOLIS
Date de publication : jeudi 13 janvier 2022
Type de contrat : CDD Scientifique
Durée du contrat : 12 mois
Date d'embauche prévue : 1 mars 2022
Quotité de travail : Temps complet
Rémunération : Entre 2690.42 et 3099.75 € bruts mensuels selon expérience.
Niveau d'études souhaité : Doctorat
Expérience souhaitée : 1 à 4 années

Missions

Le stockage des données numériques devient un défi pour l'humanité en raison de la durée de vie relativement courte des dispositifs de stockage. Dans le même temps, l'"univers numérique" (toutes les données numériques dans le monde) devrait atteindre plus de 175 zettaoctets en 2025. Une fraction importante de ces données est dite "froide" ou peu accessible. Les vieilles photographies stockées par les utilisateurs sur Facebook sont un exemple de données froides ; Facebook a récemment construit un centre de données entier dédié au stockage de ces photographies froides. Malheureusement, tous les supports de stockage actuels utilisés pour le stockage de données froides (disques durs ou bandes) souffrent de deux problèmes fondamentaux. Premièrement, le taux d'amélioration de la densité de stockage est au mieux de 20 % par an, ce qui est nettement inférieur au taux de croissance de 60 % des données froides. Deuxièmement, les supports de stockage actuels ont une durée de vie limitée de cinq (disque dur) à vingt ans (bande). Comme les données sont souvent stockées pendant une durée beaucoup plus longue (50 ans ou plus) pour des raisons de conformité légale et réglementaire, elles doivent régulièrement être transférées vers de nouveaux dispositifs de stockage, ce qui augmente le prix de la propriété des données.
Une approche alternative peut découler de l'utilisation de l'ADN, support de l'hérédité dans les organismes vivants. L'utilisation de l'ADN pour stocker des données froides est une possibilité intéressante car il est extrêmement dense, avec une limite brute de 1 exaoctet/mm3, et durable, avec une demi-vie observée bien supérieure à 500 ans. Ceci est dû aux récents développements biotechnologiques permettant une écriture (synthèse) et une lecture (séquençage) de l'ADN faciles et abordables. Cependant, l'un des problèmes majeurs du stockage de l'ADN est que toutes les informations stockées sur l'ADN subissent l'introduction d'erreurs tant dans la phase de synthèse que dans la phase de séquençage. Les erreurs prennent la forme de substitutions, d'insertions et de suppressions de nucléotides simples. En ce qui concerne l'introduction d'erreurs, la phase la plus critique est le séquençage des brins : dans ce cas, le choix de différentes machines de séquençage entraîne des fluctuations importantes du nombre d'erreurs de séquençage, car différentes techniques sont disponibles pour s'attaquer à cette tâche.
Dans le contexte du stockage sur ADN, les processus biotechnologiques peuvent être poussés à leur limite dans le but de réduire les coûts et d'augmenter le débit. Dans ce cas, le nombre d'erreurs aura tendance à augmenter. Mais tant que les codes correcteurs d'erreurs, combinés au traitement des données post-séquençage, sont capables de corriger le signal, il est possible d'optimiser l'ensemble du processus. Ceci est particulièrement vrai pour l'étape de synthèse qui est aujourd'hui optimisée pour fournir des oligonucléotides de très haute qualité. La contrepartie est qu'ils sont limités en taille. Relâcher la pression sur la qualité permettrait probablement d'allonger très significativement la taille des oligonucléotides, et donc de maximiser l'espace pour les informations utiles.

Activités

L'objectif de ce CDD chercheur est de quantifier par des actions expérimentales les contraintes et la dégradation du signal apportées par les différents processus biotechnologiques. Pour cela, nous considérerons le processus de stockage de l'ADN comme un canal de transmission (comme dans la communication numérique) qui génère des erreurs fournissant un signal bruité et modéliserons précisément le type d'erreurs (synthèse, packaging de stockage, dégradation à long terme de l'ADN, sélection des molécules, séquençage), pour finalement concevoir des codes correcteurs d'erreurs adaptés. Ce travail permettra de fournir des modèles d'erreurs précis des principaux composants biotechnologiques afin d'alimenter les couches supérieures avec les meilleures informations requises par les pré- et post-traitements numériques. Ces modèles tiendront compte des diverses contraintes imposées aux séquences d'ADN par les technologies de synthèse et de séquençage : erreurs d'insertion ou de suppression (indels) causées par des tronçons de longs nucléotides identiques (homopolymères) ; pourcentage requis de GC dans les séquences d'ADN.

Compétences

• Très motivé et bon esprit d'équipe.
• Doctorat en traitement du signal ou de l'image ou dans une discipline connexe.
• Compétences en développement expérimentées, C/C++ ou équivalent, Matlab, Python.
• Une expérience dans le domaine de la synthèse et du séquençage d'ADN sera appréciée.
• Curiosité, ouverture d'esprit, créativité, persévérance, professionnalisme, responsabilité et esprit d'équipe sont les compétences personnelles clés que nous recherchons pour ce poste.

Contexte de travail

Le travail sera effectué au laboratoire I3S dans le cadre du projet européen « OligoArchive » (https://oligoarchive.eu).

On en parle sur Twitter !