Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

Imagination、CNN推bアクセラレータAIコアを提供

英国のIPベンダー、Imagination Technologiesは、推b専のAI向けIPコア「PowerVR 2NX NNA」のライセンス提供を開始した。クラウドを通すとレイテンシがくなるエッジやフォグなどのに使うだけではなく、モバイルにも使えるほど消J電は少ないという。「セキュリティAIをエッジにeってくる」と同社PowerVR 担当DirectorのChris Longstaffは喞瓦垢。

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff


このIPを使えば、例えば1000の^真を学{した検索エンジン(AIマシン)から、欲しい^真を見つけるのに、高性GPUなら60秒かかるところ、わずか2秒で求められるとしている。バッテリ命の1%の時間を使って分類できる^真数は、GPUの2400に瓦靴董42万8000にものぼるという。また、ドローンではハードウエアを搭載しない場合、颪ら10~15m`れていないと演Qが間に合わず衝突してしまうが、このIPコアを集積していれば1mまで接Zしても衝突をcけられるとする。

推bチップは、これまでモバイルはなく、このIPコアは、GoogleやApple、Facebook、度(Baidu)、華為などのスマホメーカーがAI/ニューラルネットワークをモバイルへ広げようとしていることに官するもの。このIPコアは、アクセラレータとして機Δ掘CPUと共に動作する。モバイルとして、低消J電と小さなv路C積が要で、オプションだがMMU(メモリ管理ユニット)も集積できる。Androidをサポートしている点も徴だ。ちなみに16nmプロセスでこのIPコアを集積すると1.1mm2度のC積だとしている。

Imaginationがニューラルネットワークアクセラレータと}んでいるこのIPコアは、ニューラルネットワークの推bアクセラレータとしての性指数である推b数/秒や、コスト効率を表す推b数/mm2、消J電を表す推b数/mWという指Yで表すと、数Cをo開していないがすべて最高だとしている。またアクセラレータであるため、演Q処理するためのハードウエアを△┐討り、ドライバのホストCPUとやりDりする。

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies


このIPコアはあくまでも推bのIPコアである。学{をクラウド屬離后璽僉璽灰鵐團紂璽燭GPUのHPC(高性Ε灰鵐團紂璽謄ング)などで行い、ネットワークモデルや学{データをマシンラーニングのフレームワークに格納している。この中に、オープンソースのデープラーニングライブラリTensorFlowやCaffeなどをeっている。これらのライブラリからとするパターンを推bするための形式に変換するのにImaginationが提供するPowerVR NNA Toolを使う。Imaginationは変換ツールに加え、DNNのAPIも提供する。

ニューラルネットワークの演Qは基本的に行`演Qで、積和演Qが中心になる。データに学{の_みをXけQしネットワークてのニューロン接分を加えるという作業が要だからである。このためこれまではGPUやDSPが向いていたが、データビット数はw定しており、演Qすべき颪砲茲辰栃僂┐蕕譴覆った。このため、無Gな演Qも含まれており、消J電がjきかった。GoogleのTPUは、レイヤーごとにデータビット数を変えることで、消J電を1/10に下げたという実績がある。このため、GPUやDSPではなく、AI専のチップが求められている。

このPowerVR 2NX NNAでは、画鞠Ъ叡のCNN(Qみ込みニューラルネットワーク)演Qに要な、画気Qみ込みからフィルタをかけたアクティベーション層、レイヤーを縮小するプーリング層、最後に完接層に至る操作をて、このIPで行うデータフローシステムを△┐討い(図3)。このT果、最小のC積で最jのMAC数/クロックを演Qできる。

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies


PowerVR 2NX NNAのアーキテクチャは、データビット数を32ビットではなく、16ビットや8ビット、4ビットと要に応じて軽くできることが長となっている。積和演Qに要なデータビットと_みけのビット数は、レイヤーごとに8ビット~4ビットで設定できる。

MACはY構成として拡張性をeたせており、16ビット/クロックのMAC(積和演Q_)を128~1024個、8ビット/クロックのMACを256~2048個△┐討り、ニューラルネットワークのレイヤーごとに最適なビット数をぶことができる。またビット深さはデータと_みについて柔軟に変えることができ、16ビットから、12、10、8、7、6、5、4ビットまでサポートしている(図4)。加えて、このアクセレレータ内でデータフローを最適化しているため、外陬瓮皀蠅悗離▲セスは最小になっている。また、MMUをオプションで集積すれば、アンドロイドなどのOSにも官できる。

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

このPowerVR 2NX NNAニューラルネットワークのアクセラレータIPコアは、CNNにpった認識処理をuTとするため、IoTビデオモニターをはじめ、サーベイランス(監カメラ)、セキュリティなどのシステムに向く。消J電が小さいという魅はモバイルカメラにも監カメラ機ΔけられることをT味する。

画鞠Ъ韻忙箸CNNでは、ディープラーニングライブラリはTensorFlowやCaffeなどが中心であるため、これらをサポートしているが、他のライブラリも要ならばサポートしていくとLongstaffはいう。

(2017/09/26)

ごT見・ご感[
麼嫋岌幃学庁医 嗽寄嗽間嗽訪議眉雫弌篇撞| 忽恢醍狭篇撞窒継鉱心| 消楳課唹垪壓濆杰換恢| 襖謹勸潤丗嶄猟忖鳥匯曝屈曝眉曝 | 冉巖爺銘窮唹壓濆杰| 娼瞳窒継繁撹篇撞APP| 忽恢忽囂斤易其然屎壓殴慧| **利嫋天胆寄頭壓濆杰| 爺爺匚爺孤爺爺訪| 嶄猟忖鳥匯曝屈曝眉曝消消利嫋 | av窒継利峽壓濆杰| 撹畠篇撞窒継互賠| 消消娼瞳窒継匯曝屈曝眉曝| 天胆岱繁戴繁曇嶄猟忖鳥| 冉巖娼瞳怜匚忽恢va消消撹繁 | 曾倖繁心議www篇撞晩云| 晩云涙孳飢只鮫| 冉巖av嶄猟涙鷹岱繁戴| 天胆恷値菜繁xxxx| 富絃寄出湊寄湊訪鞭音阻| 冉巖忽恢娼瞳撹繁消消| 襖富勸潤丗弼壓| 窒継鉱心忽恢娼瞳| 析遊値勇序弌哦議悶坪弌傍畠鹿| 忽恢撹繁av曝匯曝屈曝眉| 冉巖恷寄議仔弼利| 忽恢娼瞳蒙雫其然AV谷頭| 99忽恢秤壓瀛啼| 溺繁嚥巷昂住狛殻互賠篇撞| 嶄忽speakingathome塩鋼僥伏| 晩云a‥壓濆杰| 消消娼瞳忽恢99消消消| 恷除窒継嶄猟忖鳥寄畠互賠寄畠1 恷除窒継嶄猟忖鳥寄畠互賠頭 | 褒返喧壓圈虎円哭栽彭h| 弼篇撞窒継井互賠壓濆杰| 忽恢房房99re99壓濆杰| 晩云壓xxxx| 忽恢娼瞳xxx| 爺銘彿坿壓炒侘| 忽恢娼瞳涙鷹匯曝屈曝壓濆柢| 91秉斤斛濘緩夙睦惟|