Comment optimiser le marquage moléculaire grâce aux marqueurs SNP ?



delord_petit_lassalle.jpg

Une nouvelle méthode simplifiée et standardisée de séquençage/génotypage pour gagner du temps… et de l’argent

Chrystelle Delord, Eric Petit et Gilles Lassalle (INRA, ESE) et leurs collègues publient en septembre 2018 dans la revue Methods in Ecology and Evolution une nouvelle méthode simplifiée et standardisée de séquençage/génotypage de marquage moléculaire grâce aux marqueurs SNP.


Avant de se lancer dans la présentation de cette méthode… peut-être n'est-il pas inutile de procéder à quelques rappels élémentaires en génétique et donner des éléments de vocabulaire !

Un des objectifs de la génétique est de fournir une description de la variabilité génétique d’un individu par rapport à un autre. Chaque individu d’une espèce donnée peut être identifié rigoureusement par une empreinte génétique originale. Pour établir cette empreinte, une analyse du polymorphisme de l’ADN est conduite sur un ensemble de marqueurs moléculaires : quelques dizaines à quelques centaines qu’il va donc falloir identifier ! Cela implique de disposer d’une technologie efficace d’identification de ces marqueurs. En génétique comme ailleurs, outre la rigueur, efficacité signifie économe en temps et en argent.

Le marquage moléculaire regroupe un ensemble de techniques révélant des différences de séquences d’ADN (acide désoxyribonucléique) entre individus. Les marqueurs moléculaires permettent de détecter ces différences (polymorphisme) dans des régions spécifiques de l’ADN : ce sont donc des « balises » du génome. L’ADN est le support de l’information génétique



Genetique

Genome
(source : GNIS Pédagogie)



Parmi les marqueurs moléculaires, les SNP (Single Nucleotide Polymorphism) sont des différences d’une seule base dans une séquence d’ADN.

Svg
(source wikipedia : Polymorphisme nucléotidique)



Jusqu’ici vous suivez ? OK, alors on continue !

La génétique des populations multi espèces (ou multispécifique) est un domaine émergent qui fournit des informations pertinentes sur la biologie de la conservation et l'écologie des communautés. Cependant, à ce jour, cette approche est limitée aux espèces ayant des ressources génétiques disponibles, c’est-à-dire des espèces pour lesquelles on connait tout ou partie du génome, et donc les fameux SNP. Chez les espèces non modèles, des technologies récentes de génotypage par séquençage (GBS = genotyping-by-sequencing) constituent aujourd’hui la stratégie préférentielle, mais elles restent prohibitives lorsque plusieurs espèces sont concernées, et elles fournissent par ailleurs des milliers de marqueurs pas tous utiles qu’il faut trier, ce qui représente un temps d’analyse – un « temps machine » important - et donc un coût financier associé conséquent.

Les trois équipes du labo ESE se sont associées pour surmonter ce problème en utilisant un seul cycle de HiSeq3000 - un système de séquençage de nouvelle génération de l’ADN - en l’associant à un outil de représentation réduite du génome (génotypage RAD-Seq) : cette combinaison a été utilisée pour extraire les marqueurs SNP de 40 espèces diverses, notamment des plantes, des invertébrés, des poissons et des mammifères. Gilles et Chrystelle ont développé un pipeline (i.e. un pipeline est un enchaînement de plusieurs étapes de traitement des données) basé sur le langage de programmation informatique Python afin d’isoler 100 à 500 marqueurs SNP de haute qualité pour chaque espèce. Le critère de qualité principal est ici une très forte probabilité que le SNP sélectionné puisse être génotypé par des méthodes classiques.

Pour évaluer la qualité de ces marqueurs, Chrystelle, Eric et leurs collègues ont ensuite validé cette approche sur 160 SNP caractérisés pour chacune de 18 espèces de poissons néotropicaux de la rivière Maroni (Guyane, Amérique du Sud), en utilisant la plate-forme MassARRAY iPLEX d'Agena Bioscience (San Diego, Californie, États-Unis).



Agena
(Source : Agena Bioscience MassARRAY® System with Chip prep module Workflow)


L'application de paramètres de filtrage rigoureux a permis de concevoir avec succès entre 130 et 3492 marqueurs SNP pour 30 des 40 espèces étudiées (allez voir le papier, vous y trouverez peut-être des marqueurs génétiques pour votre espèce préférée !). L'assouplissement des paramètres du pipeline a en outre permis d'augmenter le nombre de SNP détectés pour certaines espèces récalcitrantes. Sur les 18 espèces de Guyane française, 85 % des SNP issus du pipeline d’analyse ont été amplifiés avec succès, c’est-à-dire ont fourni un génotype pour plus de 90 % des individus (soit environ 200 individus par espèce). Ces marqueurs génétiques ont ainsi permis de fournir les premières données de structure génétique des populations pour une grande partie de la communauté de poissons du Maroni. En d’autres termes, l’approche développée permet d’accéder à la génétique des communautés.

Cette identification des SNP a été effectuée au coût d'environ 110 $ (95 €) pour chacune des 40 espèces. Le génotypage a été effectué au coût d'environ 6 000 $ (5200 €) pour chacune des 18 espèces de poissons avec une moyenne de 200 individus par espèce. Cette stratégie s'est avérée efficace sur le plan des coûts et du temps pour mettre au point des centaines de marqueurs SNP pour une vaste gamme d'espèces non-modèles, marqueurs qui peuvent être utilisés ensuite pour étudier des questions écologiques et évolutives pour lesquelles une couverture du génome entier n’est pas indispensable.


Quelques perspectives pour la génétique multispécifique des populations ?

Faciliter l'accès aux ressources moléculaires pour plusieurs espèces non modèles est un premier pas vers une meilleure compréhension des modèles et des mécanismes qui se produisent dans tout assemblage d'espèces. A une époque où l’acquisition de données à haut débit s’est grandement démocratisée, la disponibilité d'ensembles de données pour la génétique comparative des populations est de plus en plus considérée comme une question clé. Or il s’avère fastidieux de réconcilier des ensembles de données provenant de différentes stratégies et de différentes périodes pour une analyse intégrée, particulièrement dans le cas des données HTS (high-throughput screening : i.e. criblage à haut débit, notamment en génomique) où les préjugés des utilisateurs sur le traitement bioinformatique pourraient sérieusement affecter les analyses et comparaisons génétiques ultérieures des populations, si aucune précaution adéquate n'est prise, comme c’est le cas avec les données GBS décrites ci-dessus.

Par conséquent, toute donnée multispécifique obtenue à partir d'une procédure commune et normalisée pourrait aider à résoudre ce problème. D’où l’intérêt évident de la méthode mise au point par Chrystelle Delord, Eric Petit et leurs collègues : ici, les marqueurs SNP ont été isolés à l'aide d'un protocole standardisé et sont facilement transférables à n'importe quel autre laboratoire, d'une manière plus facile que les microsatellites – autres marqueurs moléculaires à côté des SNP - car le génotypage ne repose pas sur une estimation de la taille des allèles. En raison de la taille relativement petite des amplicons (fragments d'ADN amplifié par PCR), les marqueurs sont également utilisables pour l'ADN dégradé, par exemple, avec des échantillons provenant de protocoles non-invasifs ou de collections de musées…


Référence
Chrystelle Delord Gilles Lassalle Adrien Oger Dominique Barloy Marie‐Agnes Coutellec Adline Delcamp Guillaume Evanno Clemence Genthon Erwan Guichoux Pierre‐Yves Le Bail Patricia Le Quilliec Guillaume Longin Olivier Lorvelec Marie Massot Elodie Reveillac Raphaelle Rinaldo Jean‐Marc Roussel Regis Vigouroux Sophie Launey Eric J. Petit . A cost‐and‐time effective procedure to develop SNP markers for multiple species: A support for community genetics. Methods Ecol Evol. 2018;9:1959–1974. doi.org/10.1111/2041-210X.13034


Contact OSUR
Eric Petit (INRA, ESE) / @
Chrystelle Delord (INRA, ESE) / @
Gilles Lassalle (ESE) / @
Alain-Hervé Le Gall (multiCOM OSUR) / @