Variant de séquence d'amplicon

Variant de séquence d'amplicon (VSA ou ASV en anglais pour amplicon sequence variant, plus couramment utilisé) est un terme utilisé pour désigner des séquences d'ADN individuelles récupérées à partir d'une analyse de gène marqueur à haut débit à la suite de l'élimination de séquences parasites générées pendant l'amplification par PCR et le séquençage qui s'ensuit. Les ASV sont donc des séquences déduites d'origine biologique véritable. Le terme a été introduit pour faire la distinction entre, d'une part, les méthodes traditionnelles qui délimitent les unités taxonomiques opérationnelles (ou OTUs en anglais, plus couramment utilisé) générées en regroupant (clustering) des séquences basées sur un seuil de similarité partagé, et d'autre part, les nouvelles méthodes alternatives qui traitent des séquences individuelles sans besoin de clustering. Les méthodes ASV sont capables de traiter des séquences qui diffèrent même d'un nucléotide et évitent le regroupement basé sur la similitude ; pour ces raisons, les ASV sont également appelés variants de séquence exacte (ESVs pour exact sequence variants) ou OTU à rayon nul (zOTUs pour zero-radius OTUs)[1].

ASV versus OTU

L'introduction des méthodes ASV a suscité un débat parmi les biologistes moléculaires quant à leur utilité. Certains ont fait valoir que les ASV devraient remplacer les OTU dans l'analyse des gènes marqueurs[2]. Les arguments en faveur des ASV se concentrent sur l'utilité d'une résolution de séquence plus fine et sur l'avantage de pouvoir comparer facilement des séquences entre différentes études[3]. D'autres ont fait valoir que la technologie de séquençage existante n'est souvent pas suffisante pour résoudre avec précision les séquences exactes, et que leur utilisation peut masquer les tendances biologiques qui seraient plus faciles à détecter à l'aide des OTU. De plus, les OTU de novo sont plus lentes à assigner, mais conservent toutes les séquences de l'échantillon et ne présentent aucun risque de biais de référence car elles sont générées sans référence[4].

Méthodes ASV

Il existe plusieurs programmes utilisés pour traiter les ASV, y compris DADA2[5], Deblur[6], MED[7], et UNOISE2[8]. Ces méthodes fonctionnent globalement en générant un modèle d'erreur adapté à une séquence de séquençage individuelle et en utilisant des algorithmes qui utilisent ce modèle d'erreur pour faire le tri entre les vraies séquences d'origine biologique et celles générées par erreur.

Notes et références

  1. (en) Porter et Hajibabaei, « Scaling up: A guide to high-throughput genomic approaches for biodiversity analysis », Molecular Ecology, vol. 27, no 2,‎ , p. 313–338 (ISSN 1365-294X, PMID 29292539, DOI 10.1111/mec.14478).
  2. (en) Callahan, McMurdie et Holmes, « Exact sequence variants should replace operational taxonomic units in marker gene data analysis », The ISME Journal, vol. 11, no 12,‎ , p. 2639–2643 (PMCID 5702726, DOI 10.1038/ismej.2017.119).
  3. (en) Vincent Caruso, Xubo Song, Mark Asquith et Lisa Karstens, « Performance of Microbiome Sequence Inference Methods in Environments with Varying Biomass », mSystems, vol. 4, no 1,‎ (ISSN 2379-5077, DOI 10.1128/mSystems.00163-18, lire en ligne, consulté le ).
  4. (en) « MICROBIOME INFORMATICS: OTU VS. ASV », sur zymoresearch.com, .
  5. (en) Benjamin J. Callahan, Paul J. McMurdie, Michael J. Rosen et Andrew W. Han, « DADA2: High-resolution sample inference from Illumina amplicon data », Nature Methods, vol. 13, no 7,‎ , p. 581–583 (ISSN 1548-7105, DOI 10.1038/nmeth.3869, lire en ligne, consulté le ).
  6. (en) Amir, McDonald, Navas-Molina et Kopylova, « Deblur Rapidly Resolves Single-Nucleotide Community Sequence Patterns », mSystems, vol. 2, no 2,‎ (ISSN 2379-5077, PMID 28289731, PMCID 5340863, DOI 10.1128/mSystems.00191-16).
  7. (en) Eren, Morrison, Lescault et Reveillaud, « Minimum entropy decomposition: Unsupervised oligotyping for sensitive partitioning of high-throughput marker gene sequences », The ISME Journal, vol. 9, no 4,‎ , p. 968–979 (ISSN 1751-7362, PMID 25325381, PMCID 4817710, DOI 10.1038/ismej.2014.195).
  8. (en) Robert C. Edgar, « UNOISE2: improved error-correction for Illumina 16S and ITS amplicon sequencing », bioRxiv,‎ , p. 081257 (DOI 10.1101/081257, lire en ligne, consulté le ).