Dinucléotide CpG

(en) Îlot CpG (à gauche) montrant une concentration dix fois plus élevée en dinucléotides CpG (en jaune) par rapport à une séquence typique du génome (à droite) où on les trouve tous les cent nucléotides environ.
L'îlot CpG représenté ici est un promoteur, dont le codon d'initiationATG — est souligné en rouge.

Un dinucléotide CpG, parfois appelé site CpG en référence à l'anglais CpG site, est un segment d'ADN de deux nucléotides dont la séquence de bases nucléiques est CG. La notation « CpG » est une abréviation de cytosinephosphateguanine destinée à être clairement distinguée de la notation « CG » qui peut également désigner une paire de bases sur deux brins d'ADN distincts et non la séquence d'un brin d'ADN donné. Dans les génomes, les dinucléotides CpG ont une distribution différente de celle d'autres dinucléotides comme GpC, ApT ou TpA, car ils définissent des îlots CpG dans lesquels leur concentration est bien plus élevée et qui jouent un rôle dans la régulation de l'expression génétique.

Les résidus de cytosine des dinucléotides CpG peuvent être méthylés en 5-méthylcytosine. Chez les mammifères, la méthylation de la cytosine d'un gène peut inactiver ce dernier dans le cadre d'un mécanisme plus général relevant de l'épigénétique ; les enzymes qui procèdent à la méthylation de l'ADN sont des ADN méthyltransférases. De 70 % à 80 % des résidus de cytosine des dinucléotides CpG sont méthylés chez les mammifères[1].

Les dinucléotides CpG non méthylés peuvent être détectés par les récepteurs de type Toll TLR9[2] des cellules dendritiques plasmacytoïdes, des monocytes, des lymphocytes NK et des lymphocytes B chez l'homme. Ceci permet de détecter la présence intracellulaire d'ADN d'agents infectieux tels que virus, mycètes ou bactéries.

On a observé depuis longtemps que l'occurrence des dinucléotides CpG dans le génome des vertébrés est sensiblement inférieure à celle qu'on s'attendrait statistiquement à trouver. Ainsi, dans un génome ayant un taux de GC de 42 %, la probabilité de la séquence CG sur un brin d'ADN donné vaut (0,42 / 2)2 = 0,0441 = 4,41 %, à comparer la fréquence du dinucléotide CpG dans le génome humain, qui n'est que de 1 %. Une explication de cette anomalie statistique a été proposée en 1967 par la désamination spontanée de la 5-méthylcytosine en thymine sous l'effet de la méthylation de la cytosine des dinucléotides CpG tendant à convertir progressivement ces derniers en dinucléotides TpG[3].

Notes et références

  1. (en) Kamel Jabbari et Giorgio Bernardi, « Cytosine methylation and CpG, TpG (CpA) and TpA frequencies », Gene, vol. 333,‎ , p. 143-149 (PMID 15177689, DOI 10.1016/j.gene.2004.02.043, lire en ligne)
  2. (en) Zaida G. Ramirez-Ortiz, Charles A. Specht, Jennifer P. Wang, Chrono K. Lee, Daniella C. Bartholomeu, Ricardo T. Gazzinelli et Stuart M. Levitz, « Toll-Like Receptor 9-Dependent Immune Activation by Unmethylated CpG Motifs in Aspergillus fumigatus DNA », Infection and Immunity, vol. 76, no 5,‎ , p. 2123-2129 (PMID 18332208, PMCID 2346696, DOI 10.1128/IAI.00047-08, lire en ligne)
  3. (en) E. Scarano, M. Iaccarino, P. Grippo et E. Parisi, « The Heterogeneity of Thymine Methyl Group Origin in DNA Pyrimidine Isostichs of Developing Sea Urchin Embryos », Proceedings of the National Academy of Sciences of the United States of America, vol. 57, no 5,‎ , p. 1394-1400 (PMID 5231746, PMCID 224485, DOI 10.1073/pnas.57.5.1394, Bibcode 1967PNAS...57.1394S, lire en ligne)