En poursuivant votre navigation sur ce site, vous acceptez le dépôt de cookies dans votre navigateur. (En savoir plus)

Doctorat: Comment identifier la part de l'introgression qui est due à la sélection? (H/F)

Cette offre est disponible dans les langues suivantes :
Français - Anglais

Date Limite Candidature : mardi 22 juin 2021

Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature. Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !

Faites connaître cette offre !

Informations générales

Référence : UMR5554-FRAROU-003
Lieu de travail : MONTPELLIER
Date de publication : mardi 1 juin 2021
Nom du responsable scientifique : François Rousset
Type de contrat : CDD Doctorant/Contrat doctoral
Durée du contrat : 36 mois
Date de début de la thèse : 1 octobre 2021
Quotité de travail : Temps complet
Rémunération : 2 135,00 € brut mensuel

Description du sujet de thèse

Ce projet de doctorat fait partie d'un projet de recherche plus global intitulé « Impact génomique et causes évolutives de l'introgression aux stades avancés de la spéciation », financé par l'ANR, et consacré à 1) l'évaluation de l'impact génomique de l'introgression et 2) l'examen du rôle de l'introgression adaptative - le transfert d'allèles d'une espèce à une autre favorisée par la sélection naturelle - comme mécanisme d'adaptation des espèces pendant les stades avancés de la spéciation. Le modèle biologique considéré dans ce projet est un complexe d'espèces de petits lézards (Podarcis) étroitement apparentées et s'hybridant en Péninsule Ibérique, pour lequel le génome entier d'individus échantillonnés dans des situations écologiques contrastées seront séquencés. Le projet global repose donc sur l'analyse de ces données génomiques pour obtenir des informations sur les niveaux d'introgression pour différentes régions génomiques dans différentes populations. Le véritable défi est de détecter, parmi les régions introgressées, celles qui sont dues à de l'introgression adaptative. La but du projet de doctorat que nous proposons est de développer et tester différentes approches méthodologiques pour répondre à cette question, en s'appuyant principalement sur deux types d'information, détaillées ci dessous : (1) la variation du niveau d'introgression entre régions génomiques neutres et sélectionnées ; et (2) l'utilisation de statistiques résumantes (résumant l'information génétique présente dans les différents échantillons) qui portent spécifiquement de l'informations sur les processus d'introgression adaptative.
Intuitivement, la variation du niveau d'introgression entre régions génomiques neutres et sélectionnées est relativement «simple»: partant de l'hypothèse que la majorité des régions introgressées sont dues à des processus neutres, toute région génomique qui présente un niveau d'introgression « beaucoup plus élevé » que le niveau moyen d'introgression génomique a probablement été soumis à un processus sélectif. Ce raisonnement s'apparente conceptuellement à l'approche bien connue de détection des locus « outliers », définis comme ayant un niveau de différenciation « beaucoup plus élevé » que le niveau de différenciation moyen du génome, couramment utilisée dans les analyses génomiques de détection de locus sous sélection divergente. La partie délicate de ce type d'approche est de fournir un seuil statistique optimal de ce qui constitue un taux d'introgression «beaucoup plus élevé» que le taux moyen pour avoir une bonne puissance de détection des vrais positifs associé à une faible détection de faux positifs, en particulier lors de la manipulation de données génomiques couvrant une large partie du génome pour lesquelles un grand nombre de faux positifs peut être détecté. Dans un premier temps, le doctorant se focalisera donc sur le développement d'une approche permettant d'obtenir une estimation robuste de la proportion d'introgression adaptative au niveau global du génome, sans identifier les régions dites « outliers » mais comme modèle de base expliquant les patrons de diversité, différenciation et hétérogénéités génomiques globales observées. Dans ce but, le doctorant développera une approche par simulation pour explorer la variance du niveau d'introgression attendu entre locus/régions nucléaires neutres, en fonction de potentiels effets confondants tels que l'histoire démographique et la structure spatiale des populations ainsi que la variation des taux de recombinaison le long du génome, trois facteurs pouvant augmenter la variance des niveaux d'introgression entre regions génomiques. Ces simulations permettront d'obtenir l'enveloppe de la variation du niveau d'introgression en l'absence de sélection qui peut être atteinte entre régions génomiques et nous permettre d'estimer la proportion de régions introgressées qui auraient pu faire l'objet d'une introgression adaptative.
Dans un second temps, le doctorant concevra une approche inférentielle plus raffinée pour cibler directement les régions sous introgression adaptative. À cette fin, il s'inspirera, par exemple, des travaux récents de Racimo et al. (2017) ayant développés de nouvelles statistiques génomiques portant spécifiquement des informations sur les processus d'introgression adaptative ayant eu lieu chez l'Homme et ceux de Schrider et al. (2018) qui ont utilisés une méthode d'inférence par simulation basé sur des techniques d'apprentissage automatique et l'utilisation des statistiques résumantes pertinentes pour révéler les locus introgressées à partir des données génomiques chez deux espèces de drosophiles. Contrairement aux approches citées ci-dessus qui ne prennent pas en compte l'aspect spatialisé des populations, le doctorant considérera des modèles avec structuration spatiale des populations, de type isolement par la distance. En effet, la dispersion des lézards Podarcis étant extrêmement limitée dans l'espace, les différences de patrons spatiaux observés entre régions introgressées neutres vs. adaptatives devraient être très informatifs. Le doctorant développera donc une méthode d'inférence par simulation pour détecter les régions introgressées neutres et adaptatives à partir de génomes complets sous des modèles spatialisés de structuration des populations. Pour cela, il couplera (1) un simulateur de données génomiques spatialisés avec processus sélectifs ; (2) des méthodes statistiques d'inférence par simulation comme le calcul bayésien approché basé sur les techniques de random-forest (Pudlo et al.2016, Raynal et al.2019) ou la méthode de vraisemblance résumée (Rousset et al.2017) ; et (3) le calcul d'un ensemble de statistiques résumantes portant de l'information sur les processus neutres démographiques et historiques (tailles de populations, dispersion, introgression, divergence) et les processus sélectifs (introgression adaptative). Le but de cette méthode sera principalement de classer les régions génomiques en trois catégories: non-introgressées, introgressées neutres et introgressées sous-sélection.

Ce sujet requiert de l'étudiant un intérêt pour le développement de méthodes statistiques (et non simplement l'utilisation de méthodes et logiciels d'analyse de données existants). Il présuppose une aisance pour le calcul des probabilités et s'appuiera sur la maitrise des modèles de génétique des populations, concernant en particulier la structuration spatiale et l'évolution des déséquilibres de liaison entre marqueurs.

Ce projet de thèse s'inscrit dans un projet plus général portant sur les causes évolutives et les conséquences génomiques des processus d'introgression lors des stades tardifs de spéciation chez un complexe d'espèces de lézards en péninsule Ibérique. Le contexte et la problématique de ce projet plus général sont décrit ci dessous.
Il a longtemps été considéré que les flux de gènes ne pouvaient avoir lieu qu'entre populations d'une même espèces, à travers les processus de migration et/ou d'admixture. Aujourd'hui, il est clairement admis que les flux de gènes peuvent aussi avoir lieu entre différentes espèces par hybridation et qu'ils peuvent être un facteur important d'adaptation locale à différentes niches écologiques, notamment entre espèces proches, par transfert de matériel génétique avantageux (adaptations) d'une espèce bien adapté à un certain milieu vers les populations d'une autre espèce, présente dans ce même milieu mais moins bien adaptée localement, par exemple, pour des raisons historiques. Ce phénomène transfert de matériel génétique avantageux d'une espèce à une autre est appelé «introgression adaptative». Bien qu'il existe quelques exemples récemment découvert d'introgression adaptative, il n'y a pas encore de caractérisation claire de l'impact global (proportion) sur les génomes que peuvent avoir ces processus d'introgression, notamment chez des espèces à un stade tardif de spéciation, ni de l'importance globale qu'ils peuvent avoir pour l'adaptation locale des espèces à leur environnement.
Dans le projet global, nous abordons principalement les deux questions suivantes: i) quelle proportion du génome est affectée par l'introgression et ii) quelle proportion de l'introgression est adaptative?
Pour cela, nous avons sélectionné un complexe d'espèces de lézards des murailles de la péninsule Ibérique pour lequel (1) les espèces montrent une forte divergence génomique ; (2) des phénomènes d'introgression nucléaire et mitochondriale se produisent toujours malgré de fortes barrières globales au flux génétique; (3) un transcriptome pour une des espèces du complexe et un génome de référence d'un proche parent sont disponibles ; (4) nous connaissons les aires de distribution de chaque espèce, leur écologie et leurs niches climatiques. Enfin, nous avons déjà plus de 1 000 échantillons disponibles, de sorte que l'échantillonnage sera limité à populations supplémentaires spécifiquement ciblés pour ce projet. Nous utiliserons des données de séquençage complet des génomes des individus échantillonnnés et la méthodologie développé dans le projet de thèse proposé ici pour quantifier la proportion du génome affectée par l'introgression, puis quelle proportion de génome introgressé correspond à de l'introgression adaptative. Enfin, pour pouvoir dépasser certaines limites potentielles des approches purement génomiques, nous proposons également un test écologique de l'hypothèse d'adaptation locale par introgression adaptative basé sur des gènes candidats à l'adaptation climatique (ADN mitochondrial et gènes nucléaires de la chaîne OXPHOS) dans des populations montrant des conditions climatiques contrastées. Nous échantillonnerons plusieurs paires de populations au sein de chaque espèce, chaque paire étant composée d'une population située dans une zone climatique optimale pour l'espèce cible (« receveuse de l'introgression ») et l'autre dans une zone où les conditions climatiques correspondent à la niche climatique d'une espèce voisine (donneuse) avec laquelle l'espèce cible peut s'hybrider. Trouver plus de loci ayant subi une introgression dans des zones qui ressemblent davantage aux conditions climatiques des espèces «donneuses» soutiendrait le rôle de l'introgression adaptative.

Contexte de travail

Ce projet est une collaboration entre trois laboratoires de Montpellier: l'ISEM (Institut des Sciences de l'Evolution, 158 permanents), laboratoire du directeur de thèse ; le CEFE (Centre d'Ecologie Fonctionnelle et Evolutive, 133 permanents) laboratoire du porteur du projet ANR, et le CBGP (Centre de Biologie et Gestion des Populations Naturelles, 78 permanents) laboratoire ayant des collaborations de longue date avec les autres partenaires sur les thématiques d'inférence statistique à partir de données génétiques issues des populations naturelles. Le doctorant pourra partager son temps entre les trois laboratoires au cours de la thèse, en accord avec les encadrants. Ces trois laboratoires développent des recherche de premier rang international dans tous les domaines de la biologie évolutive, de l'écologie, et de la biologie des populations d'intérêt agronomique.

On en parle sur Twitter !