Le Barcoding de l'ADN microbien est l'une des formes du métabarcoding, utilisée pour caractériser un mélange de micro-organismes par exemple prélevés sans tri dans l'environnement, à partir de « marqueurs génétiques universels » permettant d'identifier l'ADN de nombreuses espèces, même au sein d'un mélange de nombreux microbes[1].
Histoire
L'idée d'utiliser des segments d'ADN pour dresser la liste des microbes présents dans une communauté microbienne remonte au moins au début des années 1970.
Le processus autrefois fastidieux de clonage de ces fragments d'ADN pour le séquençage a été accéléré par l'amélioration constante des technologies de séquençage. Dès le début des années 2000 le séquençage à haut débit (HTS) a permis de traiter ces données volumineuses à l'aide d'une bioinformatique moderne et démocratisée (algorithmes en grappes) qui a beaucoup facilité la recherche sur la vie microbienne.
Marqueurs génétiques
Le patrimoine génétique concerne aussi le monde microbien ; chaque espèce y est caractérisée par des spécificités génomiques, faisant qu'il est possible de distinguer des espèces rien que via une courte séquence d'ADN à partir d'une partie standard du génome. C'est cette courte séquence est ici dite code barre.
La condition requise pour qu'une partie spécifique du génome serve de code barre pour le barcoding est que cette partie du génome varie fortement d'une espèce à l'autre, mais varie peu entre deux individus de la même espèce, afin de faciliter la différenciation entre espèces[4],[5].
Pour les bactéries et les archées, le gène ARNr 16S/ADNr est utilisé. Ce gène est courant chez tous les procaryotes ; il est donc utilisé comme code barre standard pour évaluer la diversité au sein des procaryotes.
Les microbes sont presque partout présents sur la planète, et parfois difficilement accessibles (au cœur d'un organisme, au fond de l'océan ou dans le sous-sol à plus d'un kilomètre de profondeur par exemple, et certains sont vraiment très petits). Leur biodiversité est loin d'être bien connue même si nous savons qu'elle est principalement composée de bactéries, d'archées, de microchampignons et d'eucaryotes unicellulaires[4].
L'identification taxinomique des eucaryotes microbiens nécessite une grande expertise, et elle est souvent rendue encore plus difficile en raison de la petite taille des organismes, parce que dans l'échantillon le micoorganisme peut être déjà fragmenté par lyse, et parce qu'il existe de la diversité cachée et des espèces cryptiques[8],[9]. En outre, les procaryotes ne peuvent pas être taxonomiquement identifiés via des méthodes traditionnelles telles que la microscopie, car trop petits et la plupart du temps morphologiquement indiscernables, alors que le métabarcodage de l'ADN permet l'identification de ces microorganismes sans expertise taxonomique particulière, simplement en faisant correspondre des fragments de gènes courts dérivés de séquences à haut débit (HTS) à une base de données de séquences de référence (NCBI par exemple)[10]. Ces qualités font du barcoding une méthode rentable, fiable et bien plus rapide que les méthodes traditionnelles, qui devrait permettre de répondre au besoin croissant d’évaluations environnementales locales et à grande échelle.
Applications
De nombreuses études ont suivi la première utilisation par Woese et al. de cette méthode, couvrant maintenant diverses applications.
Les cyanobactéries sont un groupe bien différencié de procaryotes photosynthétiques, qui présentent des enjeux importants car elles sont importantes dans le réseau trophique et dans certaines symbioses, et pouvant pour nombre d'entre elles libérer dans certaines circonstances des toxines dans l'environnement (cyanotoxines). Comme pour d'autres procaryotes, la taxonomie des cyanobactéries, quand elle passe par le barcodage, est basée sur la similarité de séquences d'ADN du gène ribosomal 16S[16]. Ainsi, le code à barres le plus couramment utilisé pour identifier des cyanobactéries est le marqueur ADNr 16S. Il est difficile de définir les espèces au sein des procaryotes, mais le marqueur 16S peut être utilisé pour déterminer des unités taxonomiques opérationnelles (OTU). Parfois ces OTU peuvent aussi être liées à des espèces définies traditionnellement et peuvent donc être considérées comme une représentation fiable des relations évolutives[17].
Cependant, pour analyser une structure taxonomique ou la biodiversité d'une communauté cyanobactérienne entière (voir Métabarcodage de l'ADN), il est plus instructif d'utiliser des marqueurs spécifiques aux cyanobactéries. Les amorces bactériennes universelles 16S ont été utilisées avec succès pour isoler l'ADNr cyanobactérien à partir d'échantillons environnementaux, mais elles récupèrent également de nombreuses séquences bactériennes[18],[19].
Des marqueurs 16S spécifiques de cyanobactéries[20] ou phyto-spécifiques sont couramment utilisés pour se concentrer uniquement sur les cyanobactéries[21]. Des ensembles de ces amorces ont été testés pour le codage à barres ou le métabarcodage d'échantillons environnementaux et ont donné de bons résultats, éliminant la majorité des organismes non photosynthétiques ou non cyanobactériens[21],[22],[23],[24].
Le nombre de génomes cyanobactériens séquencés disponibles dans les bases de données augmente régulièrement[25].
Outre le marqueur 16S, les études phylogénétiques pourraient donc inclure des séquences plus variables, telles que des séquences de gènes codant des protéines (gyrB, rpoC, rpoD[26], rbcL, hetR[27], psbA[28],[29], rnpB[30], nifH[31], nifD[32]), l'espaceur interne transcrit des gènes de l'ARN ribosomal (ITS de l'ARNr 16S-23S)[25],[33] ou l'espaceur intergénique à la phycocyanine (PC-IGS)[33]. Cependant, les gènes nifD et nifH ne peuvent être utilisés que pour l'identification de souches cyanobactériennes fixatrices d'azote.
Le barcoding d'ADN de cyanobactéries peut être utilisé par divers types d'études écologiques, évolutives et taxonomiques. À titre d'exemple, il a servi à évaluer la diversité et la structure de communautés cyanobactériennes[34], à identifier des cyanobactéries indésirables (causes de fermetures de baignades et de dégradation d'eaux potables ou destinées à la potabilisation...) dans des masses d'eau importantes sur le plan écologique et économique[35] ; ou encore pour l'évaluation des symbiotes cyanobactériens d'invertébrés marins[24]. Il pourrait bientôt faire partie des programmes de surveillance de routine des eaux de surface pour y détecter les cyanobactéries avant même qu'elles ne soient responsables de blooms potentiellement écotoxiques ou toxiques dans les masses d'eau, au profit de stratégies de gestion de l'eau plus ciblées et efficientes. L'identification des espèces de cyanobactéries sera facilitée car elle est particulièrement difficile en microscopie, notamment car leurs caractères morphologiques (base de la définition traditionnelle des espèces) varient selon leurs conditions de croissance[20],[36]. L'identification au microscope optique demande une grande expertise et est longue et donc relativement coûteuse.
Enfin, les méthodes moléculaires détectent des concentrations beaucoup plus faibles de cellules cyanobactériennes dans l'échantillon que les méthodes traditionnelles.
Base de données de référence
Ce type de base rassemble un grand nombre de séquences d’ADN attribuées à une espèce ou à une fonction.
Elle permet de relier des séquences moléculaires trouvées dans un organisme à une taxonomie préexistante.
Des bases de données générales telles que la plate-formeNCBI incluent toutes sortes de séquences, allant de génomes entiers à des gènes marqueurs spécifiques d'organismes connus. D'autres plates-formes ne contiennent que les séquences d'un groupe distinct d'organismes, par ex. la base de données UNITE[37] exclusivement dédiée aux séquences de champignons ou la base de données PR2 dédiée aux séquences ribosomales de protistes[38].
Certaines bases de données sont vérifiées, et permettent une affectation taxonomique plus précises et certaines.
↑ a et b(en) Chakraborty C, Doss CG, Patra BC, Bandyopadhyay S (April 2014). "DNA barcoding to map the microbial communities: current advances and future directions". Applied Microbiology and Biotechnology. 98 (8): 3425–36. DOI10.1007/s00253-014-5550-9. PMID24522727.
↑(en) Gardham S, Hose GC, Stephenson S, Chariton AA (2014). "DNA Metabarcoding Meets Experimental Ecotoxicology". Big Data in Ecology. Advances in Ecological Research. 51. p. 79–104. DOI10.1016/B978-0-08-099970-8.00007-5. (ISBN978-0-08-099970-8).
↑(en) Creer S, Deiner K, Frey S, Porazinska D, Taberlet P, Thomas WK, Potter C, Bik HM (September 2016). "The ecologist's field guide to sequence-based identification of biodiversity". Methods in Ecology and Evolution. 7 (9): 1008–1018. DOI10.1111/2041-210X.12574.
↑(en) Bickford D, Lohman DJ, Sodhi NS, Ng PK, Meier R, Winker K, Ingram KK, Das I (March 2007). "Cryptic species as a window on diversity and conservation". Trends in Ecology & Evolution. 22 (3): 148–55. DOI10.1016/j.tree.2006.11.004. PMID17129636.
↑(en) Keeley N, Wood SA, Pochon X (February 2018). "Development and preliminary validation of a multi-trophic metabarcoding biotic index for monitoring benthic organic enrichment". Ecological Indicators. 85: 1044–1057. DOI10.1016/j.ecolind.2017.11.014.
↑(en) Turnbaugh PJ, Hamady M, Yatsunenko T, Cantarel BL, Duncan A, Ley RE, Sogin ML, Jones WJ, Roe BA, Affourtit JP, Egholm M, Henrissat B, Heath AC, Knight R, Gordon JI (January 2009). "A core gut microbiome in obese and lean twins". Nature. 457 (7228): 480–4. Bibcode : 2009Natur.457..480T. DOI10.1038/nature07540. PMC 2677729. PMID19043404.
↑(en) Yatsunenko T, Rey FE, Manary MJ, Trehan I, Dominguez-Bello MG, Contreras M, Magris M, Hidalgo G, Baldassano RN, Anokhin AP, Heath AC, Warner B, Reeder J, Kuczynski J, Caporaso JG, Lozupone CA, Lauber C, Clemente JC, Knights D, Knight R, Gordon JI (May 2012). "Human gut microbiome viewed across age and geography". Nature. 486 (7402): 222–7. Bibcode : 2012Natur.486..222Y. DOI10.1038/nature11053. PMC 3376388. PMID22699611.
↑(en) Vasselon V, Rimet F, Tapolczai K, Bouchez A (November 2017). "Assessing ecological status with diatoms DNA metabarcoding: Scaling-up on a WFD monitoring network (Mayotte island, France)". Ecological Indicators. 82: 1–12. DOI10.1016/j.ecolind.2017.06.024.
↑(en) Guo Y, Hou L, Zhang Z, Zhang J, Cheng J, Wei G, Lin Y (12 March 2019). "Soil Microbial Diversity During 30 Years of Grassland Restoration on the Loess Plateau: Tight Linkages With Plant Diversity". Land Degradation & Development. DOI10.1002/ldr.3300.
↑(en) Morand S (April 2018). "Advances and challenges in barcoding of microbes, parasites, and their vectors and reservoirs". Parasitology. 145 (5): 537–542. DOI10.1017/S0031182018000884. PMID29900810.
↑(en) Eckert EM, Fontaneto D, Coci M, Callieri C (December 2014). "Does a barcoding gap exist in prokaryotes? Evidences from species delimitation in cyanobacteria". Life. 5 (1): 50–64. DOI10.3390/life5010050. PMC 4390840. PMID25561355.
↑(en) Van der Gucht K, Vandekerckhove T, Vloemans N, Cousin S, Muylaert K, Sabbe K, Gillis M, Declerk S, De Meester L, Vyverman W (July 2005). "Characterization of bacterial communities in four freshwater lakes differing in nutrient load and food web structure". FEMS Microbiology Ecology. 53 (2): 205–20. DOI10.1016/j.femsec.2004.12.006. PMID16329941.
↑ a et b(en) Stiller JW, McClanahan AN (March 2005). "Phyto-specific 16S rDNA PCR primers for recovering algal and plant sequences from mixed samples". Molecular Ecology Notes. 5 (1): 1–3. DOI10.1111/j.1471-8286.2004.00805.x.
↑(en) Betournay S, Marsh AC, Donello N, Stiller JW (June 2007). "Selective recovery of microalgae from diverse habitats using 'phyto-specific' 16S rDNA primers". Journal of Phycology. 43 (3): 609–613. DOI10.1111/j.1529-8817.2007.00350.x.
↑(en) Boutte C, Grubisic S, Balthasart P, Wilmotte A (June 2006). "Testing of primers for the study of cyanobacterial molecular diversity by DGGE". Journal of Microbiological Methods. 65 (3): 542–50. DOI10.1016/j.mimet.2005.09.017. PMID16290299.
↑ a et b(en) Juteršek M, Klemenčič M, Dolinar M (December 2017). "Discrimination Between Synechocystis Members (Cyanobacteria) Based on Heterogeneity of Their 16S rRNA and ITS Regions". Acta Chimica Slovenica. 64 (4): 804–817. DOI10.17344/acsi.2017.3262. PMID29318299.
↑(en) Seo PS, Yokota A (June 2003). "The phylogenetic relationships of cyanobacteria inferred from 16S rRNA, gyrB, rpoC1 and rpoD1 gene sequences". The Journal of General and Applied Microbiology. 49 (3): 191–203. DOI10.2323/jgam.49.191. PMID12949700.
↑(en) Vioque A (September 1997). "The RNase P RNA from cyanobacteria: short tandemly repeated repetitive (STRR) sequences are present within the RNase P RNA gene in heterocyst-forming cyanobacteria". Nucleic Acids Research. 25 (17): 3471–7. DOI10.1093/nar/25.17.3471. PMID9254706.
↑(en) Zehr JP, Mellon MT, Hiorns WD (April 1997). "Phylogeny of cyanobacterial nifH genes: evolutionary implications and potential applications to natural assemblages". Microbiology. 143 (Pt 4) (4): 1443–50. DOI10.1099/00221287-143-4-1443. PMID9141707.
↑(en) Henson BJ, Hesselbrock SM, Watson LE, Barnum SR (March 2004). "Molecular phylogeny of the heterocystous cyanobacteria (subsections IV and V) based on nifD". International Journal of Systematic and Evolutionary Microbiology. 54 (Pt 2): 493–7. DOI10.1099/ijs.0.02821-0. PMID15023966.
↑ a et b(en) Piccin-Santos V, Brandão MM, Bittencourt-Oliveira M (August 2014). Gabrielson P (ed.). "Phylogenetic study of Geitlerinema and Microcystis (Cyanobacteria) using PC-IGS and 16S-23S ITS as markers: investigation of horizontal gene transfer". Journal of Phycology. 50 (4): 736–43. DOI10.1111/jpy.12204. PMID26988457.
↑(en) Dadheech PK, Glöckner G, Casper P, Kotut K, Mazzoni CJ, Mbedi S, Krienitz L (August 2013). "Cyanobacterial diversity in the hot spring, pelagic and benthic habitats of a tropical soda lake". FEMS Microbiology Ecology. 85 (2): 389–401. DOI10.1111/1574-6941.12128. PMID23586739.
↑(en) Kurobe T, Baxa DV, Mioni CE, Kudela RM, Smythe TR, Waller S, Chapman AD, Teh SJ (2013). "Identification of harmful cyanobacteria in the Sacramento-San Joaquin Delta and Clear Lake, California by DNA barcoding". SpringerPlus. 2 (1): 491. DOI10.1186/2193-1801-2-491. PMC 3797325. PMID24133644.
↑(en) Gugger M, Lyra C, Henriksen P, Couté A, Humbert JF, Sivonen K (September 2002). "Phylogenetic comparison of the cyanobacterial genera Anabaena and Aphanizomenon". International Journal of Systematic and Evolutionary Microbiology. 52 (Pt 5): 1867–80. DOI10.1099/00207713-52-5-1867. PMID12361299.