トークン性Α⊂嫡J電でGPUを圧倒するSambaNovaのAIプロセッサ
高効率で消J電当たりのAI処理性Δ高いAIチップの中で、NvidiaのGPUと張り合えるチップはそうHくない。データフローコンピューティングアキテクチャであり、さらにダイナミックにエージェントがジョブを切りえられる擬阿SambaNovaのチップはそのtのkつ推b性Δ蚤昭劼魄掬櫃垢鞫T果をこのほど発表している。
図1 Artificial Analytics社のベンチマークでの比較 SambaNovaのコンピュータ(左端)が最も高]だった 出Z:SambaNova Systems
SambaNova Systemsがしたのは、今をときめくDeepSeek-R1-671B(6710億パラメータ)を使ってMixture of ExpertsモデルのベンチマークをArtificial Analytics社がさまざまなコンピュータと比較したもの。そのT果、SambaNovaのコンピュータが最も]い出]度(198トークン/秒)だった(図1)という。このベンチマークではDeepSeekのコンピュータより7.6倍、Microsoft Azureより9.9倍]い。SambaNova以外のコンピュータは、NvidiaのGPUを使っていると見なせる。
SambaNovaのシステムは、これまで報告してきたように(参考@料1、2)、1026億トランジスタを集積したデータフロー型プロセッサであるRDU(Reconfigurable Dataflow Unit)コアを1040個集積している。基本的に16ビットw定で推bするシステムであるため、收AIのような巨jなパラメータのモデルを推bする場合には効率の高いjきなQξが要になるが、SambaNovaのシステムSN40L-16ではRDUを16搭載した1ラックのシステム。プロセスはTSMCの5nm\術をWした。
RDUではニューラルネットワークと同様、ニューロンが無数に並んだレイヤーをQした後、次のレイヤーにある無数のニューロンを演Qし、さらに次のレイヤーに行く、といったデータフロー擬阿納Qする。Q処理のメモリ(データと_み)はオンチップであるため、チップ外の長い演Qパスを通らない。このため効率が良く、消J電が少ない。
kつのRDUでは、メモリを3層構成にして、オンチップのSRAMは、データフロー処理するためのメモリで、容量は520MB。2番`には64GBのHBM(High Bandwidth Memory)メモリで、高]で推bするためモデルをキャッシングしておく。3層`が1.5TBの外陲DDRメモリである。
1のRDUを16搭載し、それをラックに納め、今v性Δ鮗他擇靴。このためメモリの階層構成は、オンチップの1層が8.3GB、プロセッサの周囲に配されている2層が1TBでその]度は25.6TB/s、最j12兆パラメータを扱える3層`が24TBの要襪、その]度は1.6TB/sとなっている(図2)。

図2 AI専チップのSN40L RDUを16搭載したコンピュータラック 出Z:SambaNova Systems
この1ラック構成のAIコンピュータで4|類のLLM(j模言語モデル)のトークン処理を、最]のGPUを搭載したコンピュータと比較した。そのT果、10億パラメータでは約8.1倍の2477トークン/秒/ユーザー、80億パラメータでは11.4倍の1066トークン/秒/ユーザーとなった。模がjきくなるにつれその差は広がり、700億パラメータでは14.4倍の460トークン/秒/ユーザー、4050億パラメータでは14.3倍の200トークン/秒/ユーザーとなった。
SambaNovaのコンピュータの長はこれだけではない。1クエリ(問い合わせ)当たりの仕様モデル数は、来のコンピュータなら1モデルだったが、SambaNovaのコンピュータではAIエージントを導入しており、AIエージェントが5〜10モデルをダイナミックに切りえることができる。いわばさまざまなマルチのジョブを切りえながらAI処理してくれるというl(図3)だ。来、例えば、経理処理した後に財管理処理へとエージェントがO動的にAI処理することになる。

図3 1チップ内にジョブをAIエージェントが次々と切りえられる仕組みを作った 出Z:SambaNova Systems
同社の創業vは、CEOの湾URodrigo Liangと共同創業vでチーフテクノロジストのKunle Olukotunスタンフォードj学教b、共同創業vのChristopher Reスタンフォードj学教bの3@で、エグゼクティブ会長にLip-Bu Tan(新Intel CEO)という、しっかりしたメンバーがいている。RDUのReconfigurableというT味のエージェントがダイナミックにモデルを切りえるという\術はスタンフォードj学が開発したものだという。
日本オフィスでも、アジア諒人涼楼菽甘副社長のK俊は、NEC、サン・マイクロシステムズ、Arm社を経xしてきたコンピュータの専門家であり、アジア諒人涼楼茱沺璽吋謄ング・ディレクターの林憲kは、Nvidiaをはじめとして日歟罎AI関連企業、さらに信j学任教bを経xしてきたAIの専門家だ。テクノロジーはしっかりしていると言えそうだ。出@企業には、ソフトバンクグループやIntel Capitalに加え、メモリのトップ3社も加わっている。
参考@料
1. 「ニューロAIはデータフローコンピュータに乗ってくる時代になるか」、セミコンポータル、(2024/02/08)
2. 「スタートアップSambaNova、次世代AIのエージェンティックAIを実現」、セミコンポータル、(2024/07/26)


