Tegra T20 (Tegra 2) と T30 (Tegra 3)
Motorola Xoomに実装されたTegra 2
NVIDIA Tegra(エヌビディア テグラ)は、NVIDIAによるARM系の省電力SoC[1]のシリーズ。2023年現在はNintendo Switch、nVidia Shield TV、自動車のインフォテインメントシステムなどに採用されている。
概要
TegraにはモバイルSoCの基本構造として、1チップ内に独立したプロセッサコアが機能別に搭載されている(ARMプロセッサ、GPU、2Dエンジン、HD動画のエンコーダ・デコーダ、オーディオ処理、画像処理)。使っていない機能のプロセッサは電源が遮断され、消費電力を下げる仕様となっており(100 - 500mW程度)初代から低消費電力高パフォーマンスを目指す設計となっていた[2]。
競合製品は同じくモバイルSoCでシェアを持つ、クアルコム社のモバイル向けプロセッサSnapdragonや、TI社のモバイル向けプロセッサOMAPなど。
初代モデルTegra APX2500は2008年に、APX 2600は2009年に発表、携帯電話などの搭載に適したチップとして当初から打ち出されていた。Tegra600および650チップはスマートフォン向けに設計されUMPCなどの搭載にも対応した。Tegraを使用した最初の製品はマイクロソフトのZune HDである。
2011年頃に登場したTegra2から徐々にタブレット等に搭載され始める事となる[3]。同チップを搭載する端末では、テレビに繋いで大画面に出力できるほか、対応するPS3、Wii、Xboxなどのゲームコントローラーをつなげて、家庭用ゲーム機レベルの3Dゲームが楽しめる[4]。
Tegraはスマートフォンやタブレット機器等のモバイル端末向けSocとしては、特にゲーム等に強い高パフォーマンス型の処理の出来る方向性の設計思想が打ち出されたが、採用シェア率は低く、自社開発を行ったタブレットゲーム機nVidia Shieldへの搭載を行ってシェアの挽回を計った(Tegra K1)[5]。
低消費電力であるモバイルSoCは自動車の運転支援システムにおけるサポートAIの性能需要も満たしており、2010年には自動運転車載用コンピュータとしてアウディがTegra採用を表明し、その後は他にもフォルクスワーゲンや、電気自動車ベンチャーのテスラモーターズのEV「Model S」にも採用された。車載分野では、Tegraとともにメモリなどの周辺ICや電子部品を搭載したモジュール製品『Tegra VCM(Visual Computing Module)を展開しており、これらはTegraのアップグレードを容易にするとしている[6]。
先行運転支援システム(ADAS)に代表される、自動車の自動運転機能・補助機能、及び全自動運転を目指すAI用チップの開発は、PCのコンシューマ用GPUでも採用されたTensor Core等の技術も統合、フィードバックされた最新半導体が開発される事で、2022年時も継続されており[7]、EV車メーカーにおいての採用シェアでは60%を超える高いシェアを誇っている[8]。
2017年に発売された任天堂ハイブリッドゲーム機Nintendo Switchへの搭載が発表され[9]、2018年にはTegraのみで15億3000万ドルの収益を記録した(内訳は9億7200ドルがSwitch、5億5800万ドルが自動車)[10]。
特徴
- 省電力でありながらグラフィック性能が高い
- コンピュータに必要な機能が1枚のチップに収まっているので、チップセットの面積が小さい
- 世界初のデュアルコアARM Cortex A9 CPUを搭載 (Tegra 2)
- 世界初のクアッドコアARM Cortex A9 CPUを搭載 (Tegra 3)
- 低周波数で低消費電力動作を実現する第5のコンパニオンCPUコアを搭載 (Tegra 3)
- モバイルプロセッサとして世界初の1TFLOPSの処理を実現した(Tegra X1)
仕様
Tegra 250[11]
|
製造プロセス
|
アーキテクチャ
|
CPU
|
GPU
|
メモリ
|
動画 エンコード
|
画面解像度
|
モデム
|
コア数
|
クロック
|
|
コア数
|
演算性能
|
Tegra APX 2500, 2600
|
|
ARM11
|
1
|
0.6 GHz
|
NEON 非対応 (Advanced SIMD)
|
|
|
LPDDR-333
|
720p@30fps
|
854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI)
|
なし
|
Tegra 600
|
|
0.7 GHz
|
|
|
1280x1024
|
Tegra 650
|
|
0.8 GHz
|
|
|
LPDDR-400
|
1080p@24fps
|
1680x1050
|
Tegra 230
|
40 nm[12]
|
Cortex-A9
|
2
|
1.0 GHz
|
VFPv3-D16 (VFPv3に対してレジスタ数が半分) NEON 非対応 (Advanced SIMD)
|
8 (VS : 4 PS : 4)[13]
|
単精度 5.6 GFLOPS (333 MHz)[14]
|
シングルチャネル LPDDR2-600
|
1080p
|
1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI)
|
Tegra 250
|
シングルチャネル LPDDR2-600, 667
|
1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI)
|
Tegra 3 / Tegra 4
|
製造プロセス
|
アーキテクチャ
|
CPU
|
GPU
|
メモリ
|
動画 エンコード
|
画面解像度
|
モデム
|
コア数
|
クロック
|
|
演算性能
|
L2 キャッシュ
|
コア数
|
演算性能
|
Tegra 3
|
40 nm[15]
|
Cortex-A9
|
4 + 1[16]
|
1.3 - 1.7 GHz
|
VFPv3 NEON 対応 (Advanced SIMD)
|
単精度 27.2 GFLOPS[17] 倍精度 10.2 GFLOPS[18]
|
1 MB[19]
|
12 (VS : 4 PS : 8[20]
|
単精度 12.4 GFLOPS(520 MHz[21][22])
|
32bit シングルチャネル LPDDR3-L 1600, LPDDR2-1066
|
1440p
|
2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI)
|
なし
|
Tegra 4i
|
28 nm[23]
|
Cortex-A9 R4
|
? - 2.3 GHz
|
VFPv4 NEON 対応 (Advanced SIMD)
|
単精度 36.8 GFLOPS[24] 倍精度 13.8 GFLOPS[25]
|
60 (VS : 20 PS : 40[26])
|
単精度 79.2 GFLOPS (660 MHz[27])
|
32bit シングルチャネル LPDDR3-2133
|
1920x1200(LCD) 1920x1080(HDMI)
|
LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE
|
Tegra 4
|
Cortex-A15 r2
|
1.2 - 1.9 GHz
|
単精度 60.8 GFLOPS[28] 倍精度 15.2 GFLOPS[29]
|
2 MB + 0.5 MB[30]
|
72[31] (VS : 24 PS : 48[32]
|
単精度 96.76 GFLOPS (672 MHz[33])
|
32bit デュアルチャンネル LPDDR3-L, LPDDR3-1866
|
3200x2000(LCD) 3840x2160(HDMI)
|
なし
|
Tegra K1 / Tegra X1 / Tegra X2
|
製造プロセス
|
アーキテクチャ
|
CPU
|
GPU
|
メモリ
|
動画 エンコード
|
画面解像度
|
モデム
|
コア数
|
クロック
|
演算性能
|
L2 キャッシュ
|
コア数
|
クロック
|
演算性能
|
Tegra K1
(32ビット)
|
28 nm[34] (TSMC HPM)
|
Cortex-A15 r3
|
4 + 1
|
? - 2.3 GHz
|
単精度 73.6 GFLOPS[35] 倍精度 18.4 GFLOPS[36]
|
2 MB + 0.5 MB[37]
|
CUDA Kepler Unified Shader 192コア
|
950 MHz
|
単精度 365 GFLOPS[38]
|
64bit デュアルチャンネル LPDDR3,LPDDR3-L 14.9 GB/s
|
H.264, VP8など 2160p 30fps
|
3840x2160 (LCD) 4096x2160 (HDMI)
|
なし
|
Tegra K1
(64ビット)
|
Denver
|
2
|
? - 2.5 GHz[39]
|
単精度 40 GFLOPS[40] 倍精度 20 GFLOPS[41]
|
2 MB[42]
|
Tegra X1[43]
|
20 nm (TSMC 20 SoC)
|
Cortex-A57 + Cortex-A53[44]
|
4 + 4[45]
|
Cortex-A57 1.9 GHz[46]
|
|
2 MB + 0.5 MB[47]
|
CUDA Maxwell 256コア[48]
|
1024 MHz
|
単精度 512 GFLOPS[49]
半精度 1 TFLOPS
|
64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[50]
|
H.265, VP9など 2160p 30fps
|
4096x2160 60fps
|
Tegra X1+[51][52]
|
16 nm
|
1267 MHz[53]
|
単精度 649 GFLOPS
半精度 1298 GFLOPS
|
64bit LPDDR4X
|
|
Tegra X2 (Parker)[54]
|
16 nm
|
Denver 2 + Cortex-A57
|
2 + 4
|
2.0 GHz + 2.0 GHz
|
|
2 MB + 2 MB
|
CUDA Pascal 256コア
|
1465 MHz
|
単精度 750 GFLOPS
半精度 1.5 TFLOPS
|
128bit LPDDR4 58.4 GB/s
|
H.265, VP9など 2160p 60fps
|
|
Xavier / Orin
|
製造プロセス
|
アーキテクチャ
|
CPU
|
GPU
|
メモリ
|
動画 エンコード
|
画面解像度
|
モデム
|
コア数
|
クロック
|
演算性能
|
L2 キャッシュ
|
L3 キャッシュ
|
コア数
|
クロック
|
演算性能
|
Xavier[55]
|
12 nm
|
NVIDIA Carmel Arm®v8.2
|
8
|
1.9GHz(Nano) 2.2 GHz(AGX)
|
|
6MBr[55]
8MB[55]
|
4MB[55]
|
CUDA Volta 384コア Tensor 48コア(Nano)
Volta512コア Tensor64コア(AGX)
|
1.1 GHz(Nano)
1377 MHz(AGX)
|
単精度 1410 GFLOPS
半精度 2.820 TFLOPS
INT8 21[56] - 32 TOPS
|
128bit LPDDR4X 59.7 GB/s
256bit LPDDR4X 136.5GB/s
|
H.265,VP9など 4K 60fps
|
3840x2160 60fps
|
|
Orin[57]
|
8 nm
|
Cortex®-A78AE v8.2
|
12
|
1.5GHz(Nano) 2.2 GHz(AGX)
|
|
1.5MB(Nano) 3MB(AGX)
|
4MB(Nano) 6MB(AGX)
|
CUDA Ampere 512コア Tensor 16コア(Nano)
Ampere 2048コア Tensor 64コア(AGX)
|
625 MHz(Nano)
1.3 GHz(AGX)
|
単精度 0.64 – 5.32 TFLOPS
INT8 20[58][59][58] ー 275 TOPS[58]
|
128bit LPDDR5 102.4 GB/s
256bit LPDDR5 204.8 GB/s
|
H.265,VP9,AV1など 4K 60fps
|
3840x2160 60fps
|
|
性能
Tegra 650のグラフィック性能は「GeForce 6」シリーズ相当で、『Quake III Arena』を46fpsで実行できる[60]。Tegra 250は1024x600の解像度を60fpsで実行できる[61]。
Tegra 3は12コアのGeForce GPUを搭載しており、Tegra 2と比べ約3倍のグラフィックス性能を持つ[62]。また、最新のビデオ・エンジンを実装することで、1080p、40Mbpsのビデオを再生することが可能[62]。このほか、ステレオスコピック3Dにも対応する。
Tegra 4は72コアのGeForce GPUを搭載しており、Tegra 3の約6倍、Tegra 2の約20倍のグラフィック性能を持つ[63]
Tegra K1は192のCUDAコアを搭載、Tegra 4の3.75倍のグラフィック性能をもっており[64]第7世代の据え置きゲーム機(PS3/Xbox 360)の性能を超えている[65]。
Tegra X1は256のCUDAコアを搭載、Tegra K1の1.5~2倍のグラフィック性能を持つ。正式にFP16に対応しており、最大で1TFLOPSの演算能力を有する[66][67]。またHDMI 2.0とHDCP 2.2に対応したことで、最新の著作権保護付き60fpsの4Kコンテンツの出力をサポートしたほか、内蔵されるハードウェアビデオプロセッサもHEVC対応となった。色深度はDeep Color相当の10bitまで対応している[68]。
Xavierは512のCUDAコアを搭載、GPUアーキテクチャであるVoltaにAI処理を行うための「Tensorコア」を搭載しており、Tegra X1の10倍以上の演算性能を発揮する(Jetson Xavier NXとJetson Nanoの比較において)[69][70]。Xavierには10W消費の小型省電力NXシリーズ(8GB・16GB)から、40W消費の大型高性能のAGXシリーズ(AGX32GB・64GB、Industrial)の2シリーズ5モデルが存在する[55]。
OrinはXavierの6倍の処理性能を有する[58]。Orinには7W消費の小型省電力から順にNano、NX、AGX(最大70W消費)の3シリーズ9モデル[71]が存在する[58]。
メモリ帯域
ARMアーキテクチャのデュアルコアCPUで LPDDR2 SDRAM を利用している場合はデュアルチャネル(32ビット×2)を採用しているものが多い中、Tegra 2 と Tegra 3 はシングルチャネル(32ビット×1)を採用している。
Tegra 3の省電力技術
- 「4-PLUS-1」
- メインである4つのコアに加え、低性能・低消費電力のコンパニオンコアを状況に応じて活用する技術。端末のパフォーマンスが必要なときは4つのコアから必要な数のコアを使い、不要なときは低消費電力のコンパニオンコアだけで動作して全体の消費電力を削減する。ビデオ再生時では最大61%、Web閲覧では最大30%の消費電力の削減が可能[72]。
- PRISM Display Technology(プリズム・ディスプレイ・テクノロジ)
- 液晶の消費電力を低減するための技術。液晶に表示される画像・動画のピクセル1つ1つを分析して、明るい色に置き換えることで、バックライトを暗くしても同じ明るさを維持する。バックライトの消費電力を最大40%削減できる[4]。
- DirectTouch(ダイレクト・タッチ)
- タッチパネルの消費電力を削減する技術。タッチパネルの制御を専用チップではなくTegra 3で行うことで、消費電力およびチップ面積を低減する。また、タッチパネルの制御にTegra 3のパフォーマンスを活用できるため、タッチレスポンスが向上する[4]。
サポートするOS
Tegraを搭載した製品
Tegra 2以降のプロセッサを搭載したスマートフォン・タブレットを、NVIDIAでは「Tegraスーパー・フォン」「Tegraスーパー・タブレット」と呼ぶ。
- 第1世代
- Tegra 2
- スマートフォン
- タブレット端末
- ノート型端末
- ポータブルメディアプレイヤー
- 埋め込み用
- Avionic Design 多聞天 (Tamonten)[77] Processor Module[78]
- Tegra 3
- スマートフォン
- タブレット端末
- ノートパソコン
- ゲーム機
- デスクトップ
- ASUS Portable AiO P1801-T
- カーナビゲーションシステム
- Tegra 4
- タブレット
- 着脱式ノートパソコン
- HP Slatebook10 x2
- ASUS Pad TF701T
- デスクトップ
- ゲーム機
- スマートフォン
- Tegra K1 (32ビット)
- NVIDIA SHIELD Tablet K1
- Jetson TK1
- Acer Chromebook CB5-311
- Tegra K1 (64ビット)
- Tegra X1
- Tegra X1+
- NVIDIA SHIELD TV (2019年版)
- NVIDIA SHIELD TV Pro
- カスタマイズされたTegra(分解解析からシリコンはX1そのものと判明している[81]が、公式には詳細非公表)
競合製品
脚注
外部リンク
|
---|
企業 |
| |
---|
製品・ サービス |
GPU |
|
---|
SoC・組み込み機器 | |
---|
NVIDIA SHIELD | |
---|
その他 | |
---|
ソフトウェア・技術 |
|
---|
|
---|
|
ARMベースのチップ |
---|
|
アプリケーションプロセッサー |
|
---|
組込み用マイクロコントローラ |
Cortex-M0 | |
---|
Cortex-M0+ | |
---|
Cortex-M1 | |
---|
Cortex-M3 |
- Actel SmartFusion, SmartFusion 2
- Atmel AT91SAM3
- Cypress PSoC 5
- Energy Micro EFM32 Tiny, Gecko, Leopard, Giant
- Fujitsu FM3
- NXP LPC1300, LPC1700, LPC1800
- Silicon Labs Precision32
- STマイクロエレクトロニクス STM32 F1, F2, L1, W
- テキサス・インスツルメンツ F28, LM3, TMS470, OMAP 4
- Toshiba TX03
|
---|
Cortex-M4 | |
---|
Cortex-M4F | |
---|
|
---|
リアルタイム処理マイクロコントローラ |
|
---|
クラシックプロセッサー |
|
---|