Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

Imagination、CNN推bアクセラレータAIコアを提供

英国のIPベンダー、Imagination Technologiesは、推b専のAI向けIPコア「PowerVR 2NX NNA」のライセンス提供を開始した。クラウドを通すとレイテンシがくなるエッジやフォグなどのに使うだけではなく、モバイルにも使えるほど消J電は少ないという。「セキュリティAIをエッジにeってくる」と同社PowerVR 担当DirectorのChris Longstaffは喞瓦垢襦

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff


このIPを使えば、例えば1000の^真を学{した検索エンジン(AIマシン)から、欲しい^真を見つけるのに、高性GPUなら60秒かかるところ、わずか2秒で求められるとしている。バッテリ命の1%の時間を使って分類できる^真数は、GPUの2400に瓦靴董42万8000にものぼるという。また、ドローンではハードウエアを搭載しない場合、颪ら10~15m`れていないと演Qが間に合わず衝突してしまうが、このIPコアを集積していれば1mまで接Zしても衝突をcけられるとする。

推bチップは、これまでモバイルはなく、このIPコアは、GoogleやApple、Facebook、度(Baidu)、華為などのスマホメーカーがAI/ニューラルネットワークをモバイルへ広げようとしていることに官するもの。このIPコアは、アクセラレータとして機Δ掘CPUと共に動作する。モバイルとして、低消J電と小さなv路C積が要で、オプションだがMMU(メモリ管理ユニット)も集積できる。Androidをサポートしている点も徴だ。ちなみに16nmプロセスでこのIPコアを集積すると1.1mm2度のC積だとしている。

Imaginationがニューラルネットワークアクセラレータと}んでいるこのIPコアは、ニューラルネットワークの推bアクセラレータとしての性指数である推b数/秒や、コスト効率を表す推b数/mm2、消J電を表す推b数/mWという指Yで表すと、数Cをo開していないがすべて最高だとしている。またアクセラレータであるため、演Q処理するためのハードウエアを△┐討り、ドライバのホストCPUとやりDりする。

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies


このIPコアはあくまでも推bのIPコアである。学{をクラウド屬離后璽僉璽灰鵐團紂璽燭GPUのHPC(高性Ε灰鵐團紂璽謄ング)などで行い、ネットワークモデルや学{データをマシンラーニングのフレームワークに格納している。この中に、オープンソースのディープラーニングライブラリTensorFlowやCaffeなどをeっている。これらのライブラリからとするパターンを推bするための形式に変換するのにImaginationが提供するPowerVR NNA Toolを使う。Imaginationは変換ツールに加え、DNNのAPIも提供する。

ニューラルネットワークの演Qは基本的に行`演Qで、積和演Qが中心になる。データに学{の_みをXけQしネットワークてのニューロン接分を加えるという作業が要だからである。このためこれまではGPUやDSPが向いていたが、データビット数はw定しており、演Qすべき颪砲茲辰栃僂┐蕕譴覆った。このため、無Gな演Qも含まれており、消J電がjきかった。GoogleのTPUは、レイヤーごとにデータビット数を変えることで、消J電を1/10に下げたという実績がある。このため、GPUやDSPではなく、AI専のチップが求められている。

このPowerVR 2NX NNAでは、画鞠Ъ叡のCNN(Qみ込みニューラルネットワーク)演Qに要な、画気Qみ込みからフィルタをかけたアクティベーション層、レイヤーを縮小するプーリング層、最後に完接層に至る操作をて、このIPで行うデータフローシステムを△┐討い(図3)。このT果、最小のC積で最jのMAC数/クロックを演Qできる。

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies


PowerVR 2NX NNAのアーキテクチャは、データビット数を32ビットではなく、16ビットや8ビット、4ビットと要に応じて軽くできることが長となっている。積和演Qに要なデータビットと_みけのビット数は、レイヤーごとに8ビット~4ビットで設定できる。

MACはY構成として拡張性をeたせており、16ビット/クロックのMAC(積和演Q_)を128~1024個、8ビット/クロックのMACを256~2048個△┐討り、ニューラルネットワークのレイヤーごとに最適なビット数をぶことができる。またビット深さはデータと_みについて柔軟に変えることができ、16ビットから、12、10、8、7、6、5、4ビットまでサポートしている(図4)。加えて、このアクセレレータ内でデータフローを最適化しているため、外陬瓮皀蠅悗離▲セスは最小になっている。また、MMUをオプションで集積すれば、アンドロイドなどのOSにも官できる。

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

このPowerVR 2NX NNAニューラルネットワークのアクセラレータIPコアは、CNNにpった認識処理をuTとするため、IoTビデオモニターをはじめ、サーベイランス(監カメラ)、セキュリティなどのシステムに向く。消J電が小さいという魅はモバイルカメラにも監カメラ機ΔけられることをT味する。

画鞠Ъ韻忙箸CNNでは、ディープラーニングライブラリはTensorFlowやCaffeなどが中心であるため、これらをサポートしているが、他のライブラリも要ならばサポートしていくとLongstaffはいう。

(2017/09/26)

ごT見・ご感[
麼嫋岌幃学庁医 恷除嶄猟忖鳥互賠窒継寄畠8| 忽恢娼瞳撹壓濆杰| 忽恢娼瞳撹繁窒継篇撞利嫋| 嶄猟忖鳥岱鷹匯曝屈曝窒継| 仔肱篇撞郊利和墮窒継井| 撹繁冉巖天胆晩昆壓| 冉巖天胆晩昆忝栽匯曝消消| 怜匚娼瞳牽旋篇撞| 晩昆忽恢窒継匯曝屈曝眉曝| 忽恢swag丞秤壓濆杰| 匯屈眉膨篇撞窒継篇撞| 天胆va爺銘壓灑惟| 忽恢匯曝屈曝壓濆杰app | 冉巖母絃av匯曝| 天胆弼夕丕坩敢弼| 弌僣丕雑議挫寄議通挫訪| 冉巖繁撹窮唹利嫋弼| 休隈3d揖繁畠扉強只壓濂シ| 晩云天胆篇撞壓| 冉巖秉驚盞决佻瀛啼| 2018爺爺荷匚匚荷| 厘委擦平晩竃邦阻| 冉巖忽恢眉雫壓濆杰| 掲巖匯曝屈曝眉曝音触| 撹繁窒継岱鷹寄頭a谷頭| 冉巖匯曝涙鷹嶄猟忖鳥| 弼壓瀾盃淙啼www| 忽恢階当繁繁訪繁繁恂| 冉巖av互賠匯曝屈曝眉曝| 弼虚某av嶄猟忖鳥| 戯忽窒継壓濆杰| 冉巖天胆晩昆廨曝| 俤俤弼壓濆杰| 壓澡曝繁劑狼双| 湘弼壓濆杰簡啼| 槻繁円郭通円恂篇撞窒継利嫋| 忽恢娼瞳涙鷹消消av| 鈍肝隻壓瀛啼宜杰款瞳| 襖謹勸潤丗恬瞳寄畠| 忽恢撹繁仔弼壓濆杰| 匯雫仔弼a谷頭|