ノンコーディングDNA (ncDNA )配列は、生物のDNA のうち、タンパク質 配列をコードしない部分である。ノンコーディングDNAの一部は、機能的なノンコーディングRNA 分子(転移RNA 、マイクロRNA 、リボソームRNA など)に転写される。ノンコーディングDNA分画のその他の機能領域には、遺伝子発現を制御する制御配列、足場付着領域、DNA複製 起点、セントロメア 、テロメア などがある。ノンコーディング領域の中には、イントロン 、偽遺伝子 、トランスポゾン やウイルス の断片など、ほとんどが非機能的と思われるものもある。
概要
バクテリア の場合、コーディング領域 は通常ゲノムの88%を占める[ 1] 。残りの12%はタンパク質をコードしないが、RNA転写物が機能する遺伝子 (ノンコーディング遺伝子)や制御配列として、その多くが生物学的機能を有しているため、ほとんどすべてのゲノムが機能を持っていることになる[ 1] 。一方で、真核生物 のゲノムには、原核生物 には見られない反復DNAが大量に含まれているため、真核生物のコーディングDNAの量は、通常ゲノムのごく一部である。機能的なエクソン の数やヒトゲノムの総サイズをめぐって論争があるため、正確な数はわかっていないが、ヒトゲノム のうちコーディングDNAは1 - 2%程度である[ 2] [ 3] 。つまり、ヒトゲノムの98 - 99%はノンコーディングDNAで構成されており、これにはノンコーディング遺伝子や制御配列など多くの機能的要素が含まれている。
真核生物のゲノムサイズ (英語版 ) は、近縁種間でさえも、広い範囲にわたって変化することがある。この不可解な現象は当初、減数分裂などによって生じる単相(n)のときのゲノムのDNA量を表す「C値 (英語版 ) 」からC値パラドックス(C-value Paradox)として知られていた[ 4] 。後に、このゲノムサイズの違いのほとんどは、遺伝子の数の違いによるものではなく、反復DNAの伸縮によるものであるということが発見されて、このパラドックスは解決された[ 5] 。研究者の中には、この反復DNAはほとんどがジャンクDNA であると推測する者もいた。ゲノムサイズの変化の理由はまだ解明されておらず、この問題はC値の謎(C-value Enigma)と呼ばれている[ 6] 。
その結果、遺伝子の数は比較的一定であるように思われるため、遺伝子の数は複雑さの概念とは相関しないのではないかという見方が生まれ、この問題はG値パラドックスと呼ばれるようになった[ 7] 。例えば、単細胞生物 であるポリカオス・ドゥビウム (Polychaos dubium )(以前はAmoeba dubia として知られていた)のゲノムには、ヒトの200倍以上のDNAが含まれていると報告されている(ポリカオス・ドゥビウムが6,000億対を超える塩基対を持つのに対して、ヒトが持つ塩基対は30億対強)[ 8] 。トラフグ (Takifugu rubripes )のゲノムはヒトゲノムの約8分の1の大きさだが、遺伝子の数は同程度である。遺伝子はトラフグゲノムの約30%を占め、コーディングDNAは約10%である(ノンコーディングDNAは約90%)。トラフグゲノムのサイズが小さくなったのは、イントロンの長さが短くなり、反復DNAが少なくなったためである[ 9] [ 10] 。
オオバナイトタヌキモ (英語版 ) (Utricularia gibba )は、ほとんどの植物と比較して非常に小さな核ゲノム (100.7 Mb)を持つ[ 11] [ 12] 。おそらく1,500Mb程度の祖先ゲノムから進化したのだろうと考えられる[ 12] この植物のゲノムは、他の植物とほぼ同じ数の遺伝子を持つが、コーディングDNAの総量はゲノムの30%程度である[ 11] [ 12] 。ゲノムの残り(70%のノンコーディングDNA)はプロモーター と制御配列からなり、他の植物種よりも短い[ 11] 。遺伝子はイントロンを含むが、その数は少なく、他の植物ゲノムのイントロンよりも小さい[ 11] 。ゲノムには、リボソームRNA遺伝子のコピーを含むノンコーディング遺伝子やテロメア配列とセントロメアも含まれている[ 12] 。他の真核生物に見られる反復DNAの多くは、その系統が他の植物と分かれて以来、オオバナイトタヌキモのゲノムから削除されている。オオバナイトタヌキモゲノムの約59%はトランスポゾン関連配列で構成されているが、ゲノムは他のゲノムに比べて非常に小さいため、このDNAの量はかなり減少していることになる[ 12] 。2013年のオリジナル論文の著者は、動物のノンコーディングDNAに機能的要素が追加されているという主張は、植物ゲノムには当てはまらないようだと指摘している[ 11] 。
ニューヨーク・タイムズ 紙の記事は、この種の進化の過程で、「...目的を果たさない遺伝的なジャンクが取り除かれ、必要なものが残された」と言及した[ 13] 。バッファロー大学 のビクター・アルバートは、この植物はいわゆるジャンクDNAを取り除くことができ、「多くの異なる細胞、器官、組織型、花を持つ完璧に優れた多細胞植物をジャンクなしで作ることができる。ジャンクDNAは必要ないのだ」と主張した[ 14] 。
ノンコーディングDNA配列の種類
ノンコーディング遺伝子
遺伝子 にはタンパク質をコードする遺伝子とノンコーディング遺伝子の2種類がある[ 15] 。ノンコーディング遺伝子はノンコーディングDNAの重要な一部であり、転移RNA やリボソームRNA の遺伝子が含まれる。これらの遺伝子は1950年代から1960年代にかけて発見された[ 16] [ 17] 。
真核生物におけるノンコーディングRNA遺伝子の典型的なクラスには、核内低分子RNA(snRNA)、核小体低分子RNA(sno RNA)、マイクロRNA (miRNA)、siRNA 、PIWI相互作用RNA(piRNA)、および長鎖ノンコーディングRNA(lncRNA)の遺伝子が含まれる。さらに、リボザイム を産生するユニークなRNA遺伝子も数多く存在する[ 18] 。
ノンコーディング遺伝子は、原核生物ゲノムの数パーセントを占めるに過ぎない[ 19] が、真核生物ゲノムではそれ以上の割合を占めることもある[ 20] 。
ヒトゲノムのノンコーディング遺伝子の総数については議論がある。ノンコーディング遺伝子は5,000個程度しかないと考える科学者もいれば、100,000個以上あるかもしれないと考える科学者もいる。この違いは、lncRNA遺伝子の数をめぐる議論によるところが大きい[ 21] 。よく定義された例だけをとると、ノンコーディング遺伝子はゲノムの少なくとも6%を占めることになる[ 2] [ 22] 。
プロモーターと調整因子
プロモーターとは、転写が始まる遺伝子の5'末端付近のDNAセグメントのことで、RNA合成を開始するためにRNAポリメラーゼ が結合する場所である。全ての遺伝子にはプロモーター領域が存在する。
シスエレメント は、近傍の遺伝子の転写を制御する部位である。ほとんどの場合、転写因子がDNAに結合する配列であり、これらの転写因子は転写を活性化したり(アクチベーター )、転写を抑制したりする(リプレッサー )。
多くの制御配列はプロモーター付近、通常は遺伝子の転写開始部位の上流に存在する。遺伝子内に存在するものもあれば、転写終結部位の下流に存在するものもある。真核生物では、プロモーター領域からかなり離れたところに位置する調節配列もある。これらの離れた制御配列はしばしばエンハンサーと呼ばれるが、他の転写因子結合部位と区別するエンハンサーの厳密な定義はない[ 23] [ 24] 。
イントロン
5つのイントロン と6つのエクソン を持つ、スプライシングされていないmRNA前駆体の図(上)。イントロンがスプライシングによって取り除かれた後、成熟mRNA配列は翻訳の準備が整う(下)。
イントロンはmRNA前駆体 に転写されるが、成熟RNAに加工される過程でPre-mRNA スプライシング によって最終的に取り除かれる部分である。イントロンはタンパク質をコードする遺伝子と非コード遺伝子の両方のタイプに存在する。イントロンは原核生物にも存在するが、真核生物のゲノムではより一般的である。
制限酵素をコードする領域があり転移現象を起こすグループIイントロンと、逆転写酵素をコードする領域があり転移現象を起こすグループIIイントロンは、存在してもゲノムのわずかな割合しか占めない。スプライソソームによってスプライスされるスプライセオソーム型イントロン(図参照)は真核生物にのみ存在し、ゲノムのかなりの割合を占めることがある。例えばヒトでは、タンパク質をコードする遺伝子のイントロンはゲノムの37%を占める。約1%のコード配列と合わせると、タンパク質コード遺伝子はヒトゲノムの約38%を占めることになる[ 25] 。
非翻訳領域
標準的な生化学や分子生物学の教科書には、遺伝子の5'末端と翻訳開始コドンの間に位置するmRNAのヌクレオチドについて記述されている。これらの領域は5'-非翻訳領域(5'-UTR)と呼ばれる。また、遺伝子の末端には3'-非翻訳領域(3'-UTR)と呼ばれる同様の領域が存在する。5'-UTRと3'-UTRは細菌では非常に短いが、真核生物では数百ヌクレオチドになる。これらには、翻訳開始(5'-UTR)と転写終結(3'-UTR)を制御する短いエレメントや、mRNAの安定性、プロセシング、細胞内の様々な領域へのターゲティングを制御する調節エレメントが含まれている[ 26] [ 27] [ 28] 。
複製の起点
DNA合成は複製起点と呼ばれる特定の場所から始まる。これらはDNA複製装置が組み立てられ、DNA合成を開始するためにDNAが巻き戻されるゲノムの領域である。ほとんどの場合、複製は複製起点から両方向に進行する。
複製起点の主な特徴は、特定の開始タンパク質が結合している配列である。典型的な複製起点はDNAの約100-200塩基対をカバーする。原核生物の複製起点は染色体またはプラスミド1つにつき1つであるが、真核生物の染色体には通常複数の複製起点が存在する。ヒトゲノムには、ゲノムの約0.3%に相当する約10万個の複製起点が存在する[ 29] [ 30] [ 31] 。
セントロメア
ヒトの核図表。G分染法 によるヒトゲノムの概観を示す。ノンコーディングDNAはセントロメア(各染色体の細長い部分として示されている)に存在し、また暗い(GCの乏しい)領域により多く存在する[ 32] 。
セントロメアは、細胞が分裂する際に、複製されたばかりの染色体を娘細胞に分離するために紡錘体が付着する部位である。真核生物の各染色体には1つのセントロメアがあり、細胞分裂中期の凝縮した染色体では収縮した領域として観察される。セントロメアDNAは多くの反復DNA配列からなり、その長さは数百万塩基対にもなるためしばしばゲノムのかなりの部分を占める。例えばヒトでは、24個のセントロメア全ての塩基配列が決定されており[ 33] 、ゲノムの約6%を占めている。しかし、個体によってセントロメアDNAの総量にはかなりのばらつきがあるため、このノンコーディングDNAがすべて必須であるとは考えにくい[ 34] 。セントロメアは、半世紀近く前から知られている機能的なノンコーディングDNA配列のもう一つの例であり、コードDNAよりも豊富である可能性が高い。
テロメア
テロメアは染色体 の末端にある反復DNAの領域で、DNA複製 の際に染色体の劣化を防ぐ役割を果たす。ショウジョウバエ をはじめとしたいくつかの昆虫では、トランスポゾン がテロメアを構成することが知られている[ 35] 。最近の研究では、テロメアは自身の安定性を助ける機能を持つことが明らかになっている。テロメアDNAの一部はTERRA (英語版 ) (Telomeric Repeat-Containing RNA)というノンコーディングRNAに転写され、これが染色体末端の安定性、長さ、ヘテロクロマチン の状態に影響を与えることが示されている[ 36] 。
足場付着領域
足場付着領域 (英語版 ) (SAR)またはマトリックス結合領域(MAR)は、真核生物の染色体のDNAのうち、細胞核の基本骨格となる核マトリックス (英語版 ) が付着する部分の配列で、様々なタンパク質との相互作用を通じて、転写や複製などに関与する。ヒトゲノムには約10万個のループがあり、それぞれが約100bpのDNAで構成されている。SARに費やされるDNAの総量はヒトゲノムの約0.3%である[ 37] 。
偽遺伝子
偽遺伝子の多くは、かつては遺伝子であったものの、突然変異などによって機能しなくなったものであるが、機能する遺伝子が産生するRNAから派生した不活性なDNA配列(プロセス型偽遺伝子)も指す。単細胞生物は排他的な効果を持つ偽遺伝子をほとんど、あるいは全く持たないのに対し、原核生物や真核生物を含む多細胞生物は、より多くの偽遺伝子を保有している[ 38] 。哺乳類やその他の真核生物では、レトロトランスポジションやゲノムDNAの複製によって偽遺伝子が生じる[ 39] [ 40] 。対照的に、原核生物では、偽遺伝子は元々ある遺伝子やその重複の崩壊や、水平伝播の失敗により生じると考えられている[ 41] 。偽遺伝子は負の選択によって排除されるため、原核生物ではゲノム中のノンコーディングDNAのごく一部でしかない。一部の真核生物では、選択が偽遺伝子を排除するほど強力でないため、偽遺伝子が蓄積すると考える研究者もいる(分子進化のほぼ中立説 を参照)[ 42] 。
最初の偽遺伝子は1977年に報告され[ 43] 、それ以来、ヒトをはじめとする多くの生物種で多数の偽遺伝子が報告され、記載されている[ 44] [ 45] [ 46] 。ヒトゲノムには、タンパク質をコードする遺伝子に由来する約15,000の偽遺伝子が含まれている他、ノンコーディング遺伝子に由来する偽遺伝子も含まれているが、その詳細な数は分かっていない[ 47] 。偽遺伝子の多くはかつてのイントロン配列を含んでいるため、ゲノムのかなりの部分(~5%)を占めている可能性がある。
偽遺伝子は定義上ジャンクDNA の一種であり、中立的な速度で進化する[ 48] 。ただし、一部の元偽遺伝子は二次的に機能を獲得しており、このことから、ほとんどの偽遺伝子はまだ発見されていない機能を持っているためジャンクではないと推測する科学者もいる[ 49] 。
リピート配列、トランスポゾン、ウイルス由来の配列
細胞内の可動遺伝因子 (左)とその移動方法(右)
トランスポゾン とレトロトランスポゾン は可動遺伝因子 の一種である。レトロトランスポゾンの反復配列 には、長鎖散在反復配列 (long interspersed nuclear elements、LINE)と短鎖散在反復配列 (short interspersed nuclear elements、SINE)があり、多くの生物種でゲノム配列の大きな割合を占めている。LINEに分類されるLINE1 (英語版 ) やSINEに分類されるAlu配列 は、ヒトゲノムに特に多く存在する可動遺伝因子であり、それぞれヒトゲノムの約17%と約11%を占めるとされている[ 50] [ 5] 。いくつかのタンパク質コード遺伝子の転写制御を行うSINEの例も見つかっている[ 51] [ 52] [ 53] 。
内在性レトロウイルス配列は、生殖細胞のゲノムへのレトロウイルスゲノムの逆転写の産物である。これらのレトロ転写された配列内の変異はウイルスゲノムを不活性化することができる[ 54] 。
ヒトゲノムの42%以上はレトロトランスポゾンに由来すると認識されており、そのうち全体の8%以上は内因性レトロウイルス配列(ただし、ほとんど崩壊している)で構成されており、さらに3%はDNAトランスポゾンの残骸であると同定できる。ゲノムの残り半分のうち、現在その起源が説明されていないものの多くは、ランダムな突然変異によって認識できなくなった、2億年以上前に活動していたトランスポゾン要素に起源があると予想される[ 55] 。少なくとも2種類の植物におけるゲノムサイズの変異は、ほとんどがレトロトランスポゾン配列の結果である[ 56] [ 57] 。
高頻度反復DNA
高頻度反復DNA(Highly repetitive DNA)は、短いDNAがタンデムに何度も繰り返されるものである。反復される配列は通常2bpから10bpの間であるが、より長いものも知られている。高頻度反復DNAは原核生物では稀であるが、真核生物、特に巨大ゲノムを持つ生物では一般的である。サテライトDNA と呼ばれることもある。
高頻度反復DNAのほとんどはセントロメアとテロメアに存在し(上記参照)、そのほとんどは機能的であるが、一部は機能を持たない冗長なものであるかもしれない。残りの大部分は、ATCのような単純で短い繰り返しからなるショートタンデムリピート(STR;マイクロサテライト とも呼ばれる)として存在する。ヒトゲノムには約35万個のSTRが存在し、平均約25回の繰り返しでゲノム全体に散らばっている[ 58] [ 59] 。
遺伝子内に存在するSTRの繰り返し数にばらつきがあると、遺伝性疾患を引き起こす可能性があるが、これらの領域のほとんどは、繰り返し数が個体によってかなり異なる、機能しないジャンクDNAであると思われる。このため、これらの長さの違いはDNAフィンガープリンティング で広く用いられている[ 60] 。
ジャンクDNA
ジャンクDNAとは、偽遺伝子やかつて活動していたトランスポゾンの断片など、生物学的に関連性のない機能を持つDNAのことである。細菌やウイルスのゲノムにはジャンクDNAはほとんど存在しないが[ 61] [ 62] 、真核生物の中にはそのゲノムに相当量のジャンクDNAを持つものもある[ 63] 。ヒトやその他の大きなゲノムを持つ生物種における非機能性DNAの正確な量は明らかにされておらず、科学文献上でもかなりの論争がある[ 64] [ 65] 。
細菌ゲノムの非機能性DNAは、ほとんどがノンコーディングDNAの遺伝子間に存在するが、真核生物ゲノムではイントロン内にも存在する。ノンコーディングDNAの中にも機能的なDNAエレメントの例が多くあり、ノンコーディングDNAの全てをジャンクDNAと同一視するのは誤りであることに注意することが重要である。
ゲノムワイド関連解析とノンコーディングDNA
ゲノムワイド関連解析 (GWAS)は、ゲノム全域にわたる遺伝子変異について、表現型や疾患などの観察可能な形質との関連を明らかにするものである。ほとんどの関連は一塩基多型 (SNPs)と調査される形質との間にあり、これらのSNPsのほとんどは非機能性DNAに位置している。関連は形質の原因となるDNA領域のマッピングに役立つ連鎖を確立するが、必ずしも疾患や表現型の違いを引き起こす変異を同定するものではない[ 66] [ 67] [ 68] [ 69] [ 70] 。
形質と密接に関連しているSNPは、原因変異を同定する可能性が最も高いものである(このような関連は連鎖不平衡 と呼ばれる)。これらの多型の約12%はコード領域に存在し、約40%はイントロンに存在し、残りの大部分は調節配列を含む遺伝子間領域に存在する[ 67] 。
関連項目
脚注
^ a b “The ingenuity of bacterial genomes”. Annual Review of Microbiology 74 : 815–834. (2020). doi :10.1146/annurev-micro-020518-115822 . PMID 32692614 .
^ a b “Human protein-coding genes and gene feature statistics in 2019” . BMC Research Notes 12 (1): 315. (2019). doi :10.1186/s13104-019-4343-8 . PMC 6549324 . PMID 31164174 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6549324/ .
^ “Reflections on the HUPO Human Proteome Project, the Flagship Project of the Human Proteome Organization, at 10 Years” . Molecular & Cellular Proteomics 20 : 100062. (2021). doi :10.1016/j.mcpro.2021.100062 . PMC 8058560 . PMID 33640492 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8058560/ .
^ “The genetic organization of chromosomes”. Annual Review of Genetics 5 : 237–256. (1971). doi :10.1146/annurev.ge.05.120171.001321 . PMID 16097657 .
^ a b T Ryan Gregory (2005). “Synergy between sequence and size in large-scale genomics”. Nat Rev Genet. 6 (9): 699-708. doi :10.1038/nrg1674 . PMID 16151375 .
^ “What's in a genome? The C-value enigma and the evolution of eukaryotic genome content” . Phil. Trans. R. Soc. B 370 (1678): 20140331. (2015). doi :10.1098/rstb.2014.0331 . PMC 4571570 . PMID 26323762 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4571570/ .
^ “The g-value paradox”. Evolution and Development 4 (2): 73–75. (2002). doi :10.1046/j.1525-142X.2002.01069.x . PMID 12004964 .
^ “The modulation of DNA content: proximate causes and ultimate consequences”. Genome Research 9 (4): 317–324. (April 1999). doi :10.1101/gr.9.4.317 . PMID 10207154 .
^ “Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes”. Science 297 (5585): 1301–1310. (2002). Bibcode : 2002Sci...297.1301A . doi :10.1126/science.1072104 . PMID 12142439 .
^ “So much "junk" DNA in our genome”. Brookhaven Symposia in Biology 23 : 366–370. (1972). OCLC 101819442 . PMID 5065367 .
^ a b c d e “Architecture and evolution of a minute plant genome” . Nature 498 (7452): 94–98. (2013). Bibcode : 2013Natur.498...94I . doi :10.1038/nature12132 . PMC 4972453 . PMID 23665961 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4972453/ .
^ a b c d e “Long-read sequencing uncovers the adaptive topography of a carnivorous plant genome” . Proceedings of the National Academy of Sciences 114 (22): E4435–E4441. (2017). Bibcode : 2017PNAS..114E4435L . doi :10.1073/pnas.1702072114 . PMC 5465930 . PMID 28507139 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5465930/ .
^ “Genetic Tidying Up Made Humped Bladderworts Into Carnivorous Plants” . New York Times . (19 May 2017). https://www.nytimes.com/2017/05/19/science/humped-bladderwort-carnivorous-plant-genome.html May 30, 2022 閲覧。
^ Hsu C, and Stolte D (13 May 2013). "Carnivorous Plant Throws Out 'Junk' DNA" (Press release). Tucson, AZ, USA: University of Arizona. 2022年5月29日閲覧 。
^ Making sense of genes . Cambridge UK: Cambridge University Press. (2017). ISBN 978-1-107-12813-2 [要ページ番号 ]
^ Kresge, Nicole; Simoni, Robert D.; Hill, Robert L. (October 7, 2005). “The Discovery of tRNA by Paul C. Zamecnik” . Journal of Biological Chemistry 280 (40): e37–e39. doi :10.1016/S0021-9258(20)79029-0 . https://www.jbc.org/article/S0021-9258(20)79029-0/abstract .
^ D DANON, Y MARIKOVSKY, U Z LITTAUER (1961-02). “A comparative electron microscopical study of RNA from different sources” . J Biophys Biochem Cytol. 9 (2): 253-61. doi :10.1083/jcb.9.2.253 . PMC 2225006 . PMID 13719673 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2225006/ .
^ “The Noncoding RNA Revolution - Trashing Old Rules to Forge New Ones”. Cell 157 (1): 77–94. (2014). doi :10.1016/j.cell.2014.03.008 . PMID 24679528 .
^ “Congruent evolution of different classes of non-coding DNA in prokaryotic genomes” . Nucleic Acids Research 30 (19): 4264–4271. (October 2002). doi :10.1093/nar/gkf549 . PMC 140549 . PMID 12364605 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC140549/ .
^ “Congruent evolution of different classes of non-coding DNA in prokaryotic genomes” . Nucleic Acids Research 30 (19): 4264–4271. (October 2002). doi :10.1093/nar/gkf549 . PMC 140549 . PMID 12364605 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC140549/ .
^ “Genome-Wide Analysis of Human Long Noncoding RNAs: A Provocative Review”. Annual Review of Genomics and Human Genetics 23 : 153–172. (2022). doi :10.1146/annurev-genom-112921-123710 . hdl :20.500.11820/ede40d70-b99c-42b0-a378-3b9b7b256a1b . PMID 35395170 .
^ “GENCODE: the reference human genome annotation for The ENCODE Project” . Genome Research 22 (9): 1760–1774. (2012). doi :10.1101/gr.135350.111 . PMC 3431492 . PMID 22955987 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3431492/ .
^ “The Long Road to Understanding RNAPII Transcription Initiation and Related Syndromes”. Annual Review of Biochemistry 90 : 193–219. (2021). doi :10.1146/annurev-biochem-090220-112253 . PMID 34153211 .
^ “Genomic views of distant-acting enhancers” . Nature 461 (7261): 199–205. (September 2009). Bibcode : 2009Natur.461..199V . doi :10.1038/nature08451 . PMC 2923221 . PMID 19741700 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2923221/ .
^ 岩切 淳一「大規模配列データにより加速するノンコーディングRNA研究」『JSBi Bioinformatics Review』第3巻第1号、June 2022、1–10頁、doi :10.11234/jsbibr.2022.primer1 。
^ Molecular Biology of the Cell, 3rd edition . London, UK: Garland Publishing Inc.. (1994) [要ページ番号 ]
^ Genes VIII . Upper Saddle River, NJ, USA: Pearson/Prentice Hall. (2004) [要ページ番号 ]
^ Principles of Biochemistry Fifth Edition . Upper Saddle River, NJ, USA: Pearson. (2012) [要ページ番号 ]
^ “DNA replication origins” . Cold Spring Harbor Perspectives in Biology 5 (10): a010116. (2013). doi :10.1101/cshperspect.a010116 . PMC 3783049 . PMID 23838439 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3783049/ .
^ “The hunt for origins of DNA replication in multicellular eukaryotes” . F1000Prime Reports 7 : 30. (2015). doi :10.12703/P7-30 . PMC 4371235 . PMID 25926981 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4371235/ .
^ “DNA replication origins—where do we begin?” . Genes & Development 30 (15): 1683–1697. (2016). doi :10.1101/gad.285114.116 . PMC 5002974 . PMID 27542827 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5002974/ .
^ “Analytical Biases Associated with GC-Content in Molecular Evolution” . Frontiers in Genetics 8 : 16. (2017). doi :10.3389/fgene.2017.00016 . PMC 5309256 . PMID 28261263 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5309256/ .
^ “Complete genomic and epigenetic maps of human centromeres” . Science 376 (6588): 56. (2021). doi :10.1126/science.abl4178 . PMC 9233505 . PMID 35357911 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC9233505/ .
^ “Centromeric satellite DNAs: hidden sequence variation in the human population” . Genes 10 (5): 353. (2019). doi :10.3390/genes10050352 . PMC 6562703 . PMID 31072070 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6562703/ .
^ “The unusual telomeres of Drosophila”. Trends Genet. 11 (2): 58-62. (Feb 1995). doi :10.1016/s0168-9525(00)88998-2 . PMID 7716808 .
^ “Telomeric noncoding RNA: telomeric repeat-containing RNA in telomere biology”. Wiley Interdisciplinary Reviews. RNA 5 (3): 407–419. (May 2014). doi :10.1002/wrna.1220 . PMID 24523222 .
^ “The self-organizing genome: Principles of genome architecture and function” . Cell 183 (1): 28–45. (2020). doi :10.1016/j.cell.2020.09.014 . PMC 7541718 . PMID 32976797 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7541718/ .
^ “Re-recognition of pseudogenes: From molecular to clinical applications” . Theranostics. 10 (4): 1479–1499. (2020-01-01). doi :10.7150/thno.40659 . PMC 6993246 . PMID 32042317 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6993246/ .
^ “Vertebrate pseudogenes”. FEBS Lett. 25 (468): 109-14.. (2000-02-25). doi :10.1016/s0014-5793(00)01199-6 . PMID 10692568 .
^ “Studying genomes through the aeons: protein families, pseudogenes and proteome evolution”. J Mol Biol. 318 (5): 1155-74. (2002-05-17). doi :10.1016/s0022-2836(02)00109-2 . PMID 12083509 .
^ “Comprehensive analysis of pseudogenes in prokaryotes: widespread gene decay and failure of putative horizontally transferred genes” . Genome Biol. 5 (9). (2004-08-26). doi :10.1186/gb-2004-5-9-r64 . PMC 522871 . PMID 15345048 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC522871/ .
^ “Pseudogene evolution and natural selection for a compact genome”. J Hered. 91 (3): 221-7. (2000). doi :10.1093/jhered/91.3.221. . PMID 10833048 .
^ “A pseudogene structure in 5S DNA of Xenopus laevis”. Cell 12 (1): 109-120. (1977-07). doi :10.1016/0092-8674(77)90189-1 . PMID 561661 .
^ “Gene arrangement and organization in a approximately 76 kb fragment encompassing the oriC region of the chromosome of Mycobacterium leprae”. Microbiology (Reading). 142 (11): 3147-61. (1996-11). doi :10.1099/13500872-142-11-3147 . PMID 8969512 .
^ “Structural analysis of a hmg-coA-reductase pseudogene: insights into evolutionary processes affecting the hmgr gene family in allotetraploid cotton (Gossypium hirsutum L.)”. Curr Genet. 34 (4): 241-9. (1998-10). doi :10.1007/s002940050393 . PMID 9799357 .
^ “Molecular evolution of the Cecropin multigene family in Drosophila. functional genes vs. pseudogenes” . Genetics. 150 (1): 157-71. (1998-09). doi :10.1093/genetics/150.1.157 . PMC 1460299 . PMID 9725836 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1460299/ .
^ “Ensemble Human reference genome GRCh38.p13 ”. 2024年1月16日 閲覧。
^ “Are human translated pseudogenes functional?” . Molecular Biology and Evolution 33 (3): 755–760. (2015). doi :10.1093/molbev/msv268 . PMC 5009996 . PMID 26589994 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5009996/ .
^ “Pseudogenes are not pseudo any more.”. RNA Biology 9 (1): 27–32. (2012). doi :10.4161/rna.9.1.18277 . PMID 22258143 .
^ Roy-Engel, A. M; Carroll, M. L; Vogel, E; Garber, R. K; Nguyen, S. V; Salem, A. H; Batzer, M. A; Deininger, P. L (2001). “Alu insertion polymorphisms for the study of human genomic diversity” . Genetics 159 (1): 279–90. doi :10.1093/genetics/159.1.279 . PMC 1461783 . PMID 11560904 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1461783/ .
^ “Genomic gems: SINE RNAs regulate mRNA production” . Current Opinion in Genetics & Development 20 (2): 149–155. (April 2010). doi :10.1016/j.gde.2010.01.004 . PMC 2859989 . PMID 20176473 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2859989/ .
^ “Useful 'junk': Alu RNAs in the human transcriptome” . Cellular and Molecular Life Sciences 64 (14): 1793–1800. (July 2007). doi :10.1007/s00018-007-7084-0 . PMID 17514354 . https://archive-ouverte.unige.ch/unige:17489 .
^ “InvAluable junk: the cellular impact and function of Alu and B2 RNAs” . IUBMB Life 61 (8): 831–837. (August 2009). doi :10.1002/iub.227 . PMC 4049031 . PMID 19621349 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4049031/ .
^ “Human endogenous retroviruses: transposable elements with potential?” . Clinical and Experimental Immunology 138 (1): 1–9. (October 2004). doi :10.1111/j.1365-2249.2004.02592.x . PMC 1809191 . PMID 15373898 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1809191/ .
^ “Initial sequencing and analysis of the human genome”. Nature 409 (6822): 860–921. (February 2001). Bibcode : 2001Natur.409..860L . doi :10.1038/35057062 . hdl :2027.42/62798 . PMID 11237011 .
^ “Doubling genome size without polyploidization: dynamics of retrotransposition-driven genomic expansions in Oryza australiensis, a wild relative of rice” . Genome Research 16 (10): 1262–1269. (October 2006). doi :10.1101/gr.5290206 . PMC 1581435 . PMID 16963705 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1581435/ .
^ “Differential lineage-specific amplification of transposable elements is responsible for genome size variation in Gossypium” . Genome Research 16 (10): 1252–1261. (October 2006). doi :10.1101/gr.5282906 . PMC 1581434 . PMID 16954538 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1581434/ .
^ “Abundant contribution of short tandem repeats to gene expression variation in humans” . Nature Genetics 48 (1): 22–29. (2016). doi :10.1038/ng.3461 . PMC 4909355 . PMID 26642241 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4909355/ .
^ “High-resolution comparative analysis of great ape genomes” . Science 360 (6393): 1085. (2018). doi :10.1126/science.aar6343 . PMC 6178954 . PMID 29880660 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6178954/ .
^ National Commission on the Future of DNA Evidence (July 2002). “Using DNA to Solve Cold Cases ”. アメリカ合衆国司法省 . 2024年1月17日 閲覧。
^ “Factors behind junk DNA in bacteria” . Genes 3 (4): 634–650. (2012). doi :10.3390/genes3040634 . PMC 3899985 . PMID 24705080 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3899985/ .
^ Brandes, Nadav; Linial, Michal (2016). “Gene overlapping and size constraints in the viral world” (英語). Biology Direct 11 (1): 26. doi :10.1186/s13062-016-0128-3 . ISSN 1745-6150 . PMC 4875738 . PMID 27209091 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4875738/ .
^ “The case for junk DNA” . PLOS Genetics 10 (5): e1004351. (May 2014). doi :10.1371/journal.pgen.1004351 . PMC 4014423 . PMID 24809441 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4014423/ .
^ Morange, Michel (2014). “Genome as a Multipurpose Structure Built by Evolution” . Perspectives in Biology and Medicine 57 (1): 162–171. doi :10.1353/pbm.2014.0008 . PMID 25345709 . https://hal.archives-ouvertes.fr/hal-01480552/file/ARTICLE%20ENCODE%20MM%2070114%20corrige%C2%A6%C3%BC.pdf .
^ “No Gene in the Genome Makes Sense Except in the Light of Evolution.”. Annual Review of Genomics and Human Genetics 25 : 71–92. (2014). doi :10.1146/annurev-genom-090413-025621 . PMID 24773316 .
^ “The advantages and limitations of trait analysis with GWAS: a review” . Plant Methods 9 : 29. (2013). doi :10.1186/1746-4811-9-29 . PMC 3750305 . PMID 23876160 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3750305/ .
^ a b “Genomewide association studies and assessment of the risk of disease”. The New England Journal of Medicine 363 (2): 166–76. (July 2010). doi :10.1056/NEJMra0905980 . PMID 20647212 .
^ “10 Years of GWAS Discovery: Biology, Function, and Translation” . American Journal of Human Genetics 101 (1): 5–22. (2017). doi :10.1016/j.ajhg.2017.06.005 . PMC 5501872 . PMID 28686856 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5501872/ .
^ “The Post-GWAS Era: From Association to Function” . American Journal of Human Genetics 102 (5): 717–730. (2018). doi :10.1016/j.ajhg.2018.04.002 . PMC 5986732 . PMID 29727686 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5986732/ .
^ “Replicability and Prediction: Lessons and Challenges from GWAS” . Trends in Genetics 34 (7): 504–517. (2018). doi :10.1016/j.tig.2018.03.005 . PMC 6003860 . PMID 29716745 . https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6003860/ .
参考資料
外部リンク