Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

Cerebras社、ウェーハ模のAIチップを実△靴織灰鵐團紂璽燭鯣売

AIチップのスタートアップ、Cerebras社の巨jなウェーハスケールAIチップを8月に紹介したが(参考@料1)、Cerebras社はこの21.5cm×21.5cmというこのチップを組み込んだAIアクセラレータエンジンCS-1を日本で販売するため、東Bエレクトロンデバイスと提携した(参考@料2)。

図1 Cerebras社創業v兼CTOのGary Lautherbach

図1 Cerebras社創業v兼CTOのGary Lautherbach


このほど来日したCerebras社の創業v兼CTOのGary Lautherbach(図1)は、このウェーハスケールLSI(図2)に瓦靴董◆嵎里泙蠅100%である。配線はN長構成をDっているからだ」と述べる。この考え気六温憂@料1で紹介したように、40QiのウェーハスケールLSIとはく違う。当時は、ロジックのkつが不良になるとチップが不良となり、歩里泙蠅呂曚箸鵑疋璽蹐Zかった。このため実化できなかった。しかし、ニューラルネットワークでは、あくまでもH入1出の演Q_で1個のニューロンを表現でき、しかも神経ラインが1本くらい切れていても、迂v路を通すことが可Δ澄しかも(人間なら200億ニューロン)で見れば1個や2個の不良は無できる。このチップのニューロン数はらかにしなかったが、で1兆2000億トランジスタもあるため、かなりの数のニューロン数ではあろう。


図2 Cerebras社マーケティング担当Andy Hockがeつチップ

図2 Cerebras社マーケティング担当Andy Hockがeつチップ


ニューラルネットワークでは、kつのニューロンに瓦靴10本度の信、入され、出は1本だけであり、その値は1か0である。10本度の信、修譴召譴膨_み(0〜1)をXけるため、デジタルで表現すると10個のMAC(積和演Q)になる。その答えが1か0ということは、H数のMAC演Qには「0×_み=0」という演Qが極めてHいことになる。MAC演Qは行`でも表現できる線形代数であるが、行`要素の中身のHくはゼロになるため、このSparse()霾のQを省Sできる。こうすると、演Qv数をらせる。CerebrasはこのSparse演Qを省Sすることで電効率を屬欧拭

ただし、このチップはNvidiaのGPUよりもはるかに高い性Α兵泰xでは数倍〜1000倍)になっており、学{させるためのAIチップであり、_みを浮動小数点で表し、32ビット以屬留Q@度で少なくとも学{@度を屬欧襪海箸できる。

また、MAC演Q_はメモリ(RAM)にZいほど演Q]度が屬り、消J電も下がる。チップに集積したメモリは18GBのSRAMだが、AIコアと称するAI演Qブロックは@のフォンノイマンコンピュータであり、ここには48KBのローカルメモリをeっているという。AIチップにおけるメモリの役割は、MAC演QしたT果をk時保Tし、次のニューロンへ送るべきデータを読み出すために使われる。さらに、要な_みを表す小数点の数Cを保Tする役割もある。つまり、MAC+RAMのセットこそ、AIチップの本である。ここでは、AIコアでの_み演Qには、H数の浮動小数点演Qができるようになっており、その動作には1GHz以屬離ロックを使っているという。

さて、ウェーハスケールのシリコンをどうやってパッケージするか。これだけjきなチップは発Xもjきいため、シリコンのX膨張係数と同じ度の材料を使わなければ、発Xによるa度差でシリコンが割れてしまう恐れがある。この問に関して4Q以屬矮Jやして解し独Oの専パッケージを開発した、とLautherbachは述べている。関連するH数のもDuしている。

チップの消J電は20kWと通常のチップよりははるかにjきい。このためXを素早く逃がすための放Xに瓦靴討蓮▲船奪廚領Cから閉ループで水冷しており、さらにシステムには空冷するという両気領箋冕,鮹いている。

このチップを1個だけ搭載し、電源やU御Uも含めたAIコンピュータCS-1(図3)を開発した。100Gビット/秒のEthernetを12レーンいたI/Oの]度は1.2Tb/sと極めて]い。CS-1は、Yの19インチラックで15U相当のjきさに収められている。


The Cerebras CS-1

図3 開発したAIコンピュータCS-1 出Z:Cerebras Systems


そしてディープラーニングのアルゴリズムや機械学{のフレームワーク(TensorFlowやPyTorchなど)でプログラムできるようなソフトウエアプラットフォームも提供する。APIでOyにカスタマイズできる。ソフトウエアスタックをてのレイヤーに紐づけし同時に実行できるうえにレイヤーを同時にコンパイルでき実行に,垢海箸できる。

学{時間をこれまでの数カ月から数分に、あるいは数週間から数秒に]縮できるようになるため、これまで実屬△らめていた@巧なjきなAIモデルを試すことができるようになり、AIソフトウエアエンジニアの躍の場ができる。性Δ1000倍]いということは、実際の学{セットでも1000倍のデータを扱うことができるため、もっと@巧なソリューションを高]に実行が可Δ砲覆襦9馥眸稜箍然覆鰐つ蠅世、おおよそ数億のレベルになるとしている。


参考@料
1. ディープラーニング学{にはウェーハ模の巨jなチップが要 (2019/08/27)
2. セレブラス社と販売代理契約を締T、高]ディープラーニングシステム「CS-1」のpRを開始 (2019/12/19)

(2019/12/20)
ごT見・ご感[
麼嫋岌幃学庁医 忽恢娼瞳卯皮通邦涙鷹篇撞| 晩云壓濱軋枡| 忽坪娼瞳消消消消消涙鷹音触 | 餓餓只鮫壓澣蚤屡訖攀完匈中| 冉巖天巖晩恢忽鷹匯雫谷頭| 娼瞳忽恢菜弼某沃互効亂| 忽恢娼瞳冉巖娼瞳晩昆厮圭 | 天胆晩昆匯屈曝| 卅繁消消娼瞳冉巖怜匚| 忝栽天胆匯曝屈曝眉曝| 忽恢娼瞳www| 91撹繁窒継壓瀛啼| 涙鷹繁曇H強只嶄猟忖鳥| 冉田娼瞳匯曝屈曝眉曝| 娼瞳匯曝屈曝消消消消消消利嫋| 忽恢天胆娼瞳怜匚壓濂シ| 91冉巖匯曝屈曝壓濆杰寛賛| 涙鷹晩昆繁曇娼瞳消消 | 消消翆翆頁励埖忝栽弼際際 | 冉巖鷹壓炒侘辻斛濆杰| 槻科榊喘議app弌清| 怜匚唹篇窒継頼屁互賠壓濆杰翰嫋| 弼仔利嫋撹定溺繁弼谷頭| 忽恢胆溺娼瞳匯曝屈曝眉曝| 戟諾富絃AAAAAA觴頭谷頭| 晩昆娼瞳消消音触嶄猟忖鳥| 繁曇涙鷹匯曝屈曝篇撞| 娼瞳涙繁曝岱鷹1曝2曝| 忽恢swag丞秤壓濆杰| 楳楳楳楳楳窒娼瞳篇撞| 忽恢撹a繁頭壓濆杰簡啼杵待| 胆溺賞俟島通邦篇撞www窒継| 挫槻繁彿坿壓濆杰敢| 消消忝栽秉狭恢築洋AV| 際際97繁繁翆翆励埖| 忽恢岱溺岱徨篇撞壓濂シ| 仔利嫋壓瀉盞| 忽恢撹繁頭涙鷹篇撞壓濆杰| aa雫仔弼寄頭| 涙鷹匯曝屈曝襖謹勸潤丗殴慧朴沫| 消消翆翆忽恢忝栽娼瞳|