Semiconductor Portal

» セミコンポータルによる分析 » �\術分析 » �\術分析(半導������)

Nvidia、ディープラーニングの総合�を見せつける

Nvidiaは単なるファブレス半導��メーカーにとどまっていない。AI(ディープラーニング)やHPC(高性�Ε灰鵐團紂璽謄�鵐亜砲離泪轡鵑鮴濕�するコンピュータメーカーでもある。最�咾�GPUであるTesla V100(図1)を使いこなす。AIでは学�{だけではなく推�b�にGPUを動かすための推�bソフトウエアTensorRTの新バージョンも開発した。�O動運転�プラットフォーム、IoT�の推�bアクセラレータも提供する。こんな�eが浮かび�屬�襦�

図1 Nvidia最�咾�GPU「Tesla V100」は5000個以�屬�GPUコアを�並�`に配�した210億トランジスタを集積している

図1 Nvidia最�咾�GPU「Tesla V100」は5000個以�屬�GPUコアを�並�`に配�した210億トランジスタを集積している


こういった最新のNvidiaの実�を同社は2018�Q3月に�盜颪離汽鵐離爾膿�したGTC 2018での発表内容を、4月下旬東�Bで開�されたNdivia Deep Learning Seminar 2018で�o開した。ディープラーニングコンピュータとその仕組み、最新版の推�bソフトウエアTensorRT 4、実際の応�として�O動運転�のシミュレータ「Drive Constellation」を発表した。さらに組み込みシステムやIoT端�でもAIを使うためのNvidiaのディープラーニングアーキテクチャ(NVDLA)を英Armの「Project Trillium」に組込むためArmとも提携した。ハイエンドコンピューティングでは、レイトレーシング(Ray Tracing)という光の陰影を実際の�^真並みの����派集修垢訃}法をリアルタイムで実現するNvidia RTX�\術も発表した。

世�cに�したディープラーニング�サーバNvidia DGX-2では、�来1ラックに20�のサーバを搭載し、それを15ラック並べた広いデータセンターに匹�發垢襯妊�璽廛蕁璽縫鵐綾萢�ξ�を�eちながら、1ラック分にも満たない5�のサーバで実現できるコンピュータシステムを開発した。サイズは1/60、電�効率は18倍という高性�Δ淵灰鵐團紂璽燭箸覆辰拭�海譴泙任離灰鵐團紂璽織機璽弌�DGX-1は、最�j8個のGPUを搭載していた。

このディープラーニング�サーバDGX-2では、最も�嗄�なGPUであるNvidiaのTesla V100のメモリを�来の2倍の32GBに�j容量化し、最�j16個のGPUを搭載している。16個のGPUをどのように構成するか。これまでは4GPUを1組として、四角形の頂点に�QGPUを配�する構成で互いに連�Tし行き来できるアーキテクチャであり、8個のGPUの場合はこれを2組で互いにデータを行き来できる構成を採っていた。しかし16GPUとなると、もはやこのアーキテクチャは使えないため、バス�擬阿�瑤織侫.屮螢奪�NVLinkインターコネクトチップを新たに設�した(図2)。このチップにはクロスバースイッチを集積しており、18個のポートを�eち、最�j900GB/sでデータ転送する。このチップだけでも20億トランジスタを集積している。


図2 16個のGPUをNVLinkインターコネクトで100%接�する

図2 16個のGPUをNVLinkインターコネクトで100%接�する


推�bソフトウエアTensorRT 4をGoogleのディープラーニング�フレームワークTensorFlow 1.7に統合し、推�bアプリケーションをGPU�屬納孫圓靴笋垢�靴拭3�{済みのニューラルネットワークを迅�]に最適化し、検証、�t開するために�W�する。Googleがこのソフトを使い別のGPUで実行した�T果、TensorFlow内でGPU推�bの�]度はこのソフトを使わない場合と比べ8倍高�]のスループットが�uられたとしている。

�O動運転のための���認識に使うAI機�Δ鬟轡潺絅譟璽轡腑鵑垢襪燭瓩隣Z載シミュレーションプラットフォームNdivia Drive Constellationをリリースした。これは2�のサーバからなり、それぞれが専�のソフトウエアを搭載している。1番�`のサーバにはNdivia DRIVE Simを搭載し、�O動運転に�㌫廚淵�瓮蕕肇潺�Sレーダー、Lidarなどのセンサをシミュレーションし、センサデータを�收�垢襦�發�1�のサーバにはAI�Z載コンピュータNvidia Drive Pegasusと、�O動運転�のソフトウエアスタックが搭載され、あたかも実際の�O路�屬鯀�圓垢襯�襯泙離札鵐気�蚶uられたデータのように処理を行い、走行�X況を指�し、シミュレータにフィードバックされる。このHIL(Hardware in the loop)は1秒間に30�vシミュレーション動作できる。

シミュレーションソフトのDrive Simは、暴風�Uや吹雪などの異常気��筺�覺屬麗�しい�陵杆��牢屬琉鼎びX況、ありとあらゆるタイプの路�Cや地形など、などさまざまなテスト環境を創り出すという。こういった�X況の中でカメラ映�気筌譟璽澄爾糧深o�S形などのデータを�Dり込みシミュレーションする。

Nvidiaはまた、IoTのような軽いエッジデバイスにも推�b�プロセッサを搭載できるようにするため、CPUコアベンダーのArmとも提携した。Nvidiaのディープラーニングアクセラレータ(NVDLA)アーキテクチャをArmの「Project Trillium」プラットフォームに組み込み、機械学�{を実現するという。NvidiaのNVDLAは、SoCのXavierをベースとして、ディープラーニングの推�bアクセラレータを設�する際の�Y��を�`指す無料のオープンアーキテクチャである。推�bソフトウエアのTensorRTの最新版もサポートしている。

Nvidiaは、今や半導��GPUチップからコンピュータハードウエアとソフトウエアまで�}�Xける演�Qに��化したコンピュータメーカーと言えるかもしれない。

(2018/05/02)
ご�T見・ご感�[
麼嫋岌幃学庁医� 忽恢娼瞳天胆冉巖昆忽晩云消消| 晩云爺銘篇撞壓�鉱心| 窒継寛老畠殻涙孳飢壓�鉱心| 唖戎琿住畠耗互賠篇撞| 天胆匯雫頭返字壓�鉱心| 窒継繁撹篇撞壓�鉱心利嫋| 弼罎www娼瞳匯雫篇撞| 忽恢卯皮涙鷹篇撞壓�鉱心3| 99消re犯篇撞宸戦峪嗤娼瞳6| 來xxxxx寄頭窒継篇撞| 消消消消消消消築孟| 恷挫心議窒継鉱心篇撞| 冉巖撹a繁頭壓�鉱心嶄猟app | Channel| 撹繁窒継牽旋篇撞| 消消冉巖娼瞳繁撹忝栽利| 恷除窒継嶄猟忖鳥4| 冉巖忽恢娼瞳撹繁AV壓�| 襖謹勸潤丗窮概閣査| 窒継涙蕎A利嫋壓�鉱心| 胆溺簾皮俤俤只鮫| 忽翌撹繁窒継互賠爾秤篇撞| 匯倖繁心議頭窒継互賠寄畠| 闇胆溺坪帥寵慢議字字| 消消心窒継篇撞| 恷除2018嶄猟忖鳥2019忽囂篇撞| 冉巖撹av繁壓�篇| 麟篇撞窒継壓�鉱心| 窒継A雫谷頭涙鷹窒継篇撞| 娼瞳天胆匯曝屈曝眉曝娼瞳消消 | 忽恢戟諾析母溺嶷笥斤易| 91�酋忽恢�鉱心窒継畠鹿| 挫虚罎篇撞宸戦峪嗤娼瞳| 眉雫4雫恂a觴60蛍嶝| 厘勣心匯雫仔弼谷頭| 消消消消消消999| 晩云互賠窒継心| 消消喟消窒継繁曇娼瞳和墮| 恷仟冉巖敢弼av涙鷹廨曝| 冉巖嶄猟忖鳥av壓爺銘| 天胆撹繁窒継鉱心|