Informations générales
Intitulé de l'offre : Ingénieur en biotechnologie (H/F)
Référence : UMR6074-ANNBUZ-026
Nombre de Postes : 1
Lieu de travail : RENNES
Date de publication : vendredi 1 novembre 2024
Type de contrat : Contrat de projet Ingénieur Technicien
Durée du contrat : 24 mois
Date d'embauche prévue : 1 janvier 2025
Quotité de travail : Temps complet
Rémunération : Entre 2 466€ et 2 849€ bruts mensuels selon expérience
Niveau d'études souhaité : Niveau 7 - (Bac+5 et plus)
Expérience souhaitée : Indifférent
BAP : Informatique, Statistiques et Calcul scientifique
Emploi type : Ingénieur-e en ingénierie logicielle
Missions
La mission du CDD de projet est de développer un procédé de stockage d’information sur ADN basé sur l’assemblage semi-aléatoire de molécules d’ADN double brin à partir d’un pool d’oligonucléotides avec lecture par séquençage nanopore et de déposer un brevet associé. Ce développement inclut les aspects biotechnologiques de la chaîne de stockage, à savoir : la synthèse, l’assemblage, la sélection et le séquençage des molécules d’ADN. La mission inclut également l’automatisation du procédé sur la plateforme robotisée DNAmaker développée par l’équipe GenScale. La personne recrutée devra pouvoir justifier les diverses solutions biotechnologiques qu’elle mettra en place. Les aspects codage et décodage, qui requièrent des compétences en informatiques, seront étudiés avec les chercheurs de l’équipe GenScale. Finalement, le procédé complet (lecture et écriture de l’information) sera validé en conditions réelles à l’échelle du laboratoire.
Activités
La mission se déroulera sur 2 années à travers la réalisation de 2 « workpackages » détaillés ci-dessous. Les tâches de chaque « workpackage » seront menées simultanément pour atteindre les sous-livrables intermédiaires. L’état d’avancement des sous-livrables sera réalisé à la fin de chaque « workpackage » (prévus à t0+12 et t0+24) par Dominique LAVENIER, DR CNRS au laboratoire IRISA. Le résultat objectif du projet, qui déterminera la fin du contrat, sera (1) la validation expérimentale du procédé et (2) la rédaction d’un brevet sur le procédé de stockage d’information sur ADN basé sur l’assemblage semi-aléatoire d’un « pool » d’oligonucléotides avec lecture par séquençage nanopore. L’évènement de fin de projet sera le dépôt d’un brevet.
WORKPACKAGE 1 : t0 t0 + 12 mois
Tâches :
• Séquençage direct des « pools » d'oligonucléotides
o Revue des protocoles existants et développement d'une méthode de séquençage direct (Oxford Nanopore Technologies) pour des « pools » d'oligonucléotides.
• Assemblage semi-aléatoire de « pool » d’oligonucléotides
o Développement d’une méthode PCR pour convertir un « pool » d’oligonucléotides simple brin en doubles brins.
o Développement d’une méthode d'assemblage semi-aléatoire (« One-pot Golden-Gate ») à partir des travaux antérieurs de l’équipe GenScale et de la littérature.
• Accès à l’information sur les assemblages semi-aléatoires d’ADN
o Développement d’une méthode d’accès, dite « random access », à l’information souhaitée basée sur les travaux antérieurs de l’équipe GenScale et la littérature.
• Codage et décodage de l’information
o Spécification des contraintes en entrée (« pools » d'oligonucléotides) et en sortie du processus de stockage (assemblages semi-aléatoires) :
Caractérisation des « pools » d’oligonucléotides issus de la synthèse chimique à partir de la méthode de séquençage directe des ADN simple brin et validation des spécifications annoncées par le ou les fournisseur(s).
Caractérisation des molécules d’ADN issues de la méthode d’assemblages semi-aléatoire.
Caractérisation des assemblages semi-aléatoires d’ADN consécutif à l’accès par la méthode de « random access ».
o Développement des programmes informatiques de codage et décodage adaptés :
Codage approprié aux mélanges de millions d’oligonucléotides uniques.
Décodage approprié aux mélanges de centaines de milliers de molécules d’ADN uniques.
Cette tâche sera réalisée en collaboration avec les informaticiens de l’équipe GenScale
• Structuration du brevet
o Prise de contact avec le service valorisation du CNRS pour mettre en place les éléments permettant la rédaction d’un brevet
Sous-livrables :
• Délivrance d’une méthode de séquençage direct des ADN simple brin.
• Délivrance d’une méthode d’assemblage semi-aléatoire des mélanges d’oligonucléotides.
• Délivrance d’une méthode d’accès dite « semi-aléatoire » à l’information stockée.
• Délivrance d’une méthode de séquençage du support de stockage d’information sur ADN à grande échelle.
• Délivrance des programmes d’encodage et de décodage adaptés aux mélanges d’oligonucléotides assemblés de façon semi-aléatoire.
WORKPACKAGE 2 : t0 + 12 mois t0 + 24 mois
Tâches :
• Monté en échelle du WORKPACKAGE 1
o Augmentation de la taille et de la complexité des mélanges oligonucléotides à une échelle compatible avec l’archivage de données numériques : adaptations et validations de l’ensemble des méthodes développées dans le WP1.
• Automatisation « écriture » sur ADN
o Développement d’un protocole d’automatisation de l’assemblage semi-aléatoire d’un pool d’oligonucléotides sur la plateforme DNAmaker
Entrée = mélange d’oligonucléotides
Sortie = assemblages semi-aléatoires
• Automatisation « lecture » de l’ADN
o Développement d’un protocole d’automatisation de séquençage de 3ème génération (Oxford Nanopore Technologies) sur la plateforme DNAmaker
Entrée = assemblages semi-aléatoires
Sortie = données en format FASTQ.
• Validation du procédé de stockage
o Validation expérimentale du procédé de stockage sur ADN basé sur l’assemblage semi-aléatoire d’un « pool » d’oligonucléotides
o Les étapes comprennent :
1. l’encodage d’un ou plusieurs documents en bases nucléiques
2. la synthèse des ADN correspondants (sous-traitée)
3. l’assemblage semi-aléatoire en molécule d’ADN de taille donnée (automatisé)
4. l’accès par une méthode dite « random-access » à l’information souhaitée (automatisé)
5. la lecture de l’information par séquençage ADN de 3rd génération (automatisé)
6. le décodage du ou des documents.
• Rédaction du brevet
o La rédaction du brevet en patenariat avec le service de valorisation du CNRS.
Sous-livrables :
• Délivrance d’une méthode automatisée pour l’écriture d’information sur ADN. Méthode basée sur l’assemblage semi-aléatoire d’un « pool » d’oligonucléotides
• Délivrance d’une méthode automatisée pour la lecture d’information stockée sur ADN. Méthode basée sur le séquençage par nanopore.
• Brevet sur le procédé de stockage d’information sur ADN basé sur l’assemblage semi-aléatoire d’un « pool » d’oligonucléotides avec lecture par séquençage nanopore.
Livrable de fin de projet
Le développement d’un procédé de stockage d’information sur ADN basé sur l’assemblage semi-aléatoire de molécules d’ADN double brin à partir d’un pool d’oligonucléotides avec lecture par séquençage nanopore, son automatisation sur la plateforme robotisée DNAmaker et le dépôt de brevet associé.
Évènement marquant la fin du projet
Dépôt du brevet
Compétences
Connaissances
• Biologie moléculaire des acides nucléiques, clonage, séquençage haut débit, réalisation de banques et séquençage
• Réglementation en matière d'hygiène et de sécurité
• Des connaissances informatiques en analyse de données de séquençage haut débit sont requises
• Langue anglaise : B2 à C1 (cadre européen commun de référence pour les langues)
Compétences opérationnelles
• Concevoir des dispositifs expérimentaux
• Développer une expertise scientifique et technologique dans le domaine de la production et de l'analyse de séquences ADN à vocation de stockage d'information
• Utiliser les logiciels spécifiques à l'activité
• Rédiger des documents scientifiques
Résultats attendus et contrôles
Le développement d’un procédé de stockage d’information sur ADN basé sur l’assemblage semi-aléatoire de molécules d’ADN double brin à partir d’un pool d’oligonucléotides avec lecture par séquençage nanopore, son automatisation sur la plateforme robotisée DNAmaker et le dépôt de brevet associé.
Contexte de travail
L'IRISA (Institut de Recherche en Informatique et Systèmes Aléatoires) est aujourd'hui l'un des plus grands laboratoires de recherche français (+ de 850 personnes) dans le domaine de l'informatique et des nouvelles technologies de l'information. Structuré en sept départements scientifiques, le laboratoire constitue un pôle de recherche d'excellence avec des priorités scientifiques telles que : la bio-informatique, la sécurité des systèmes, les nouvelles architectures logicielles, la réalité virtuelle, l'analyse des masses de données et l'intelligence artificielle.
La personne sera rattachée à l'équipe GenScale, IRISA, Beaulieu, Rennes. GenScale est une équipe de recherche en bioinformatique. Son objectif principal est de développer des méthodes, des outils et des logiciels évolutifs pour le traitement des données génomiques. Les recherches sont motivées par le développement rapide des technologies de séquençage de nouvelle génération (NGS) et de troisième génération (TGS) qui posent des problèmes très difficiles tant en termes de bioinformatique que d'informatique. Depuis quelques années, l’équipe GenScale développe un nouvel axe de recherche : le stockage d’information sur ADN, supporté actuellement par le Labex CominLabs et le PEPR MoleculArxiv. Dans le cadre de ce PEPR, l’IRISA est impliqué dans 2 PC (PC2 et PC4).
Présentation du CNRS en tant qu'employeur : https://www.cnrs.fr/fr/le-cnrs
Présentation de l'IRISA comme laboratoire d'affectation : https://www.irisa.fr/umr-6074
Le poste se situe dans un secteur relevant de la protection du potentiel scientifique et technique (PPST), et nécessite donc, conformément à la réglementation, que votre arrivée soit autorisée par l'autorité compétente du MESR.