Nvidia、ディープラーニングの総合�を見せつける
Nvidiaは単なるファブレス半導��メーカーにとどまっていない。AI(ディープラーニング)やHPC(高性�Ε灰鵐團紂璽謄�鵐亜砲離泪轡鵑鮴濕�するコンピュータメーカーでもある。最�咾�GPUであるTesla V100(図1)を使いこなす。AIでは学�{だけではなく推�b�にGPUを動かすための推�bソフトウエアTensorRTの新バージョンも開発した。�O動運転�プラットフォーム、IoT�の推�bアクセラレータも提供する。こんな�eが浮かび�屬�襦�

図1 Nvidia最�咾�GPU「Tesla V100」は5000個以�屬�GPUコアを�並�`に配�した210億トランジスタを集積している
こういった最新のNvidiaの実�を同社は2018�Q3月に�盜颪離汽鵐離爾膿�したGTC 2018での発表内容を、4月下旬東�Bで開�されたNdivia Deep Learning Seminar 2018で�o開した。ディープラーニングコンピュータとその仕組み、最新版の推�bソフトウエアTensorRT 4、実際の応�として�O動運転�のシミュレータ「Drive Constellation」を発表した。さらに組み込みシステムやIoT端�でもAIを使うためのNvidiaのディープラーニングアーキテクチャ(NVDLA)を英Armの「Project Trillium」に組込むためArmとも提携した。ハイエンドコンピューティングでは、レイトレーシング(Ray Tracing)という光の陰影を実際の�^真並みの����派集修垢訃}法をリアルタイムで実現するNvidia RTX�\術も発表した。
世�cに�したディープラーニング�サーバNvidia DGX-2では、�来1ラックに20�のサーバを搭載し、それを15ラック並べた広いデータセンターに匹�發垢襯妊�璽廛蕁璽縫鵐綾萢�ξ�を�eちながら、1ラック分にも満たない5�のサーバで実現できるコンピュータシステムを開発した。サイズは1/60、電�効率は18倍という高性�Δ淵灰鵐團紂璽燭箸覆辰拭�海譴泙任離灰鵐團紂璽織機璽弌�DGX-1は、最�j8個のGPUを搭載していた。
このディープラーニング�サーバDGX-2では、最も�嗄�なGPUであるNvidiaのTesla V100のメモリを�来の2倍の32GBに�j容量化し、最�j16個のGPUを搭載している。16個のGPUをどのように構成するか。これまでは4GPUを1組として、四角形の頂点に�QGPUを配�する構成で互いに連�Tし行き来できるアーキテクチャであり、8個のGPUの場合はこれを2組で互いにデータを行き来できる構成を採っていた。しかし16GPUとなると、もはやこのアーキテクチャは使えないため、バス�擬阿�瑤織侫.屮螢奪�NVLinkインターコネクトチップを新たに設�した(図2)。このチップにはクロスバースイッチを集積しており、18個のポートを�eち、最�j900GB/sでデータ転送する。このチップだけでも20億トランジスタを集積している。
図2 16個のGPUをNVLinkインターコネクトで100%接�する
推�bソフトウエアTensorRT 4をGoogleのディープラーニング�フレームワークTensorFlow 1.7に統合し、推�bアプリケーションをGPU�屬納孫圓靴笋垢�靴拭3�{済みのニューラルネットワークを迅�]に最適化し、検証、�t開するために�W�する。Googleがこのソフトを使い別のGPUで実行した�T果、TensorFlow内でGPU推�bの�]度はこのソフトを使わない場合と比べ8倍高�]のスループットが�uられたとしている。
�O動運転のための���認識に使うAI機�Δ鬟轡潺絅譟璽轡腑鵑垢襪燭瓩隣Z載シミュレーションプラットフォームNdivia Drive Constellationをリリースした。これは2�のサーバからなり、それぞれが専�のソフトウエアを搭載している。1番�`のサーバにはNdivia DRIVE Simを搭載し、�O動運転に�㌫廚淵�瓮蕕肇潺�Sレーダー、Lidarなどのセンサをシミュレーションし、センサデータを�收�垢襦�發�1�のサーバにはAI�Z載コンピュータNvidia Drive Pegasusと、�O動運転�のソフトウエアスタックが搭載され、あたかも実際の�O路�屬鯀�圓垢襯�襯泙離札鵐気�蚶uられたデータのように処理を行い、走行�X況を指�し、シミュレータにフィードバックされる。このHIL(Hardware in the loop)は1秒間に30�vシミュレーション動作できる。
シミュレーションソフトのDrive Simは、暴風�Uや吹雪などの異常気��筺�覺屬麗�しい�陵杆��牢屬琉鼎びX況、ありとあらゆるタイプの路�Cや地形など、などさまざまなテスト環境を創り出すという。こういった�X況の中でカメラ映�気筌譟璽澄爾糧深o�S形などのデータを�Dり込みシミュレーションする。
Nvidiaはまた、IoTのような軽いエッジデバイスにも推�b�プロセッサを搭載できるようにするため、CPUコアベンダーのArmとも提携した。Nvidiaのディープラーニングアクセラレータ(NVDLA)アーキテクチャをArmの「Project Trillium」プラットフォームに組み込み、機械学�{を実現するという。NvidiaのNVDLAは、SoCのXavierをベースとして、ディープラーニングの推�bアクセラレータを設�する際の�Y��を�`指す無料のオープンアーキテクチャである。推�bソフトウエアのTensorRTの最新版もサポートしている。
Nvidiaは、今や半導��GPUチップからコンピュータハードウエアとソフトウエアまで�}�Xける演�Qに��化したコンピュータメーカーと言えるかもしれない。