拉墻と橙磨拉の光いMIMDア〖キテクチャのAIチップで盡砷するGraphcore
AIプロセッサチップからAIコンピュ〖タシステム∈哭1∷まで緘齒けるGraphcoreが2021鉗に掐り泣塑でも寵瓢に蝸を掐れている。怠常池漿に努した畝事誤借妄のMIMDア〖キテクチャを蝗い、AI拉墻が端めて光いのが潑墓だ。すでに躥柜奶慨オペレ〖タのKTでネットワ〖ク跟唯を懼げ、Microsoft Azureクラウド懼での板聞茶嚨尸梧千急で呵糠GPUよりも12擒も光廬という悸烙を斧せている。

哭1 IPUを4改烹很したAIボ〖ド≈IPU-GC200、M2000∽ この1綏のボ〖ドの拉墻は1P∈ペタ∷FLOPS 叫諾¨Graphcore Corp.
毖柜のハイテク徹の辦つ、ブリストルに塑家を積つGraphcoreは、坤腸稱孟にセ〖ルスオフィスを彌き、倡券したAIマシンの舍第に咆めている。2016鉗に肋惟されたばかりのこのスタ〖トアップは7.1帛ドルの獲垛拇茫に喇根しているが、措度擦猛は27.7帛ドルに第ぶと斧姥もられている。
驢くのVC∈Venture Capital∷やGoogle、OpenAI、DeepMindなど措度抨獲柴家がここまで錢看に抨獲するのは、Graphcoreのテクノロジ〖に果れ哈んだからであろう。奶慨尸填では、ネットワ〖ク拉墻の呵努步にAIを蝗うことがよく乖われているが、ネットワ〖クの覺輪恃步から拉墻パタ〖ンを尸老してこれから黎の拉墻を徒盧する。奶慨トラフィックが礁面しそうになれば禍漣に弧夢して俱巢を餞賴しておくことができる。附哼、呵黎眉でかつ舍第しているNvidiaのGPU∈V100∷と撅に孺秤しているが、ネットワ〖クの尸老では沒いレイテンシで腆260擒廬い。また、MicrosoftのAI禱窖を蝗っての板聞茶嚨の豺老でGPUと孺秤した眷圭も12擒廬かった。
このAIチップ≈IPU∈Intelligent Processing Unit∷∽は橙磨拉が光く、IPUを4改烹很した哭1のボ〖ド∈1PFLOPSのIPU-M2000∷を4綏腳ねるIPU-POD16は、1綏ボ〖ドの4擒の4PFLOPS拉墻を券帶し、さらにそれを4改腳ねるとさらに4擒の16PFLOPSの拉墻を積つラックIPU-POD64となる。これを4駱儡魯するとさらに4擒の64P∈ペタ∷FLOPSとなる∈哭2∷。
哭2 IPUを橙磨儡魯しても拉墻は鏈く皖ちない 叫諾¨Graphcore
このAIチップの呵絡の潑墓は、これまでのマルチコアア〖キテクチャでは悸附できなかったMIMD∈Multiple Instructions Multiple Data∷を蝗っていることだ。GPUやCPUなどのこれまでのシステムではSIMD∈Single Instruction Multiple Data∷ア〖キテクチャをベ〖スにしており、炭吾セットが剩花なのでMIMD數及をとることは豈しかった。
IPUプロセッサは、客粗の薔に叫丸るだけ奪いプロセッサとして、畝事誤のMIMDア〖キテクチャを何脫した。客粗は票箕に剩眶のことを雇えるからだという。そこで、プロセッサの怠墻を怠常池漿のプロセスだけに、炭吾を遍換、票袋、デ〖タ蛤垂の話つに故ることで、MIMDを蝗えるようにした。
またここでは坷沸の帕嚷を雇えて光廬メモリとなるSRAMを何脫した。それもチップあたりのインプロセッサメモリは900MBも烹很している。哭3のようにメモリの面にプロセッサのコアが歡りばめられた菇隴をしている。IPUには迫惟したコアが1472改礁姥しており、8832改のプログラムスレッドがそれぞれ迫惟に瓢く。TSMCの7nmプロセスで瀾隴し、チップ燙姥は823mm2。IPUチップの久銳排蝸は150Wで、ヒ〖トシンクを肋けているが、武笛は鄂武數及。
哭3 インプロセッサメモリ∈SRAM∷を900MB礁姥し、1472コアを礁姥したIPUチップ 叫諾¨Graphcore
尸歡メモリを網脫したMIMD事誤遍換では、BSP∈バルク票袋事誤∷ソフトウエアを蝗って、哭4のように遍換する。つまり、IPU柒では遍換し、票袋をとるとデ〖タの覓れや渴み惡圭がバラバラだが、デ〖タを蛤垂し、さらに遍換を渴める。肌にもう辦つのIPUとも票袋をとり、デ〖タ蛤垂ˇ遍換を乖う。
哭4 遍換ˇ票袋ˇデ〖タ蛤垂の3つの炭吾で畝事誤を悸附 IPU票晃も票袋をとる 叫諾¨Graphcore
このような數及で遍換、票袋、デ〖タ蛤垂を帆り手していくと、さらにIPUを納裁してもどこかで澀ず票袋をとってデ〖タ借妄していくため、IPUを納裁しても拉墻は皖ちない。これが哭2で績した、IPUを烹很したボ〖ドを絡翁に事誤橙磨できる妄統だ。
IPU-M2000ボ〖ドの久銳排蝸は900×1100W∈篩潔∷と絡きいため、脫龐はデ〖タセンタ〖やクラウド羹けになる。ボ〖ド1綏で4改のIPUチップを擴告するSoCはArmのCortex-AコアとFPGAからなる。ゲ〖トウエイはIPU票晃を儡魯するために蝗う。またボ〖ドにはSSDやDRAMメモリも烹很しており、IPUチップは150W/チップだが、鏈攣では1kW漣稿になる。
Graphcoreの動みはチップとハ〖ドウエアの橙磨拉だけではない。ソフトウエア倡券キットも脫罷しており、PytorchやTensorFlow、Onnxなど怠常池漿フレ〖ムワ〖クにも灤炳し、GPUライブラリのCUDAに陵碰するようなソフトウエアスタック≈Poplar-SDK∽を灑えている。
鱗年杠狄はデ〖タセンタ〖を積つ、垛突、HPC、ヘルスケア、澄唯琵紛借妄などの度腸になる。絡きなAIモデルにも灤炳できることがIPUシステムの動みと咐えそうだ。