28nmのFPGAはインタポーザWでTbps実現、マルチコア内鼎能萢+解析に
湾のTSMCが28nmプロセスの量を開始、28nmプロセスをベースにしたFPGAを盜颪離競ぅ螢鵐ス(Xilinx)社とアルテラ(Altera)社がそれぞれ発表した。共に、28nmという微細化プロセスに長があるのではなく、ザイリンクスはシリコンインタポーザをWした2.5次元ICを、アルテラは英ARMのCortex-A9のマルチコアを内鼎靴Cyclone VとArria Vをそれぞれ発表している。
TSMCがTできたのは、28HP(high performance)と28HPL(high performance low power)、28LP(low power)、28HPM(high performance mobile computing)4つのプロセスである。そのうちiの3つは量凮始しており、28HPMのみ今Qまでに量を開始する。
ザイリンクスのVirtex-7 2000Tは、TSMCの28HPLプロセスをWしている。このチップは、シリコンインタポーザとFPGAチップ4個をTSV(through silicon via)で_ね合わせて接、合68億トランジスタに及ぶICである。FPGAチップにTSVで楉鵡Α△気蕕縫泪ぅロバンプを設け、配線陲箸覆襯轡螢灰鵑離ぅ鵐織檗璽兇C4バンプを設け、それぞれを接している。これまでと比べ16〜20倍もの配線密度になる。FPGAチップ同士は直接接せず、共通のインタポーザの屬FPGAを4`並べる。インタポーザの配線総数は4層。ロジックエレメント数にして200万エレメント、ASICゲートに換Qして2000万ゲートになる。消J電は組み合わせv路にもよるが20W度。
ザイリンクスによると、これまで最j模のモノリシックFPGAは39億トランジスタで98万ロジックエレメントだという。ロジックW率を考慮して機εには来最jのFPGAとして70万ロジックエレメントのFPGAを4個使い、配線で接する場合と同じ機Δ魴eつとして、消J電を見積もると、QFPGAが20W、それらをTぶ配線を~動するための電が8Wとして、20W×4個+8W×4個=112Wとなり、消J電は新の5.6倍にも達する。
今vザイリンクスは、巨jなロジックLSIを4分割し、それらを1個のjきなシリコンインタポーザにフェースダウンで搭載する(図1)。インタポーザは単なる配線層だけであるが、QFPGAのシリコンダイを4層配線で接している。インタポーザの裏C笋棒澆韻討い襯泪ぅロバンプをプリント基のバンプに接した後、キャップを被せて完成する。
ここまで巨jなFPGAになると、Tbpsのデータレートとして通信バックボーンでトラフィックのボトルネック解消への~デバイスとなる。
図1 4つのFPGAダイをシリコンインターポーザ屬暴言僉配線後、実△垢
アルテラは組み込み狙いで28LPプロセスW
k機▲▲襯謄蕕離船奪廚蓮∩箸濆みをターゲットとし、プロセッサにARM Cortex-A9デュアルコアを集積したCyclone VとArria Vファミリを発表している。性Δ旅發ぅ廛蹈札奪汽灰△鯏觝椶靴霾と、ハードウエアをプログラムで組み立てる霾の両気鮟言僂垢襪海箸可Δ砲覆蝓低コストで顧客仕様のカスタマイズを~単にできるようになる。これによってシステムコストを下げようという狙いがある。
このARMコア搭載のFPGAのデュアルコア霾では、単@度と倍@度の浮動小数点プロセッサや、ECCでメモリの読み出しエラーをするL2キャッシュ、Neonメディアプロセッサ、ECCきのマルチポートメモリコントローラ、QPSI/NANDフラッシュ/NORフラッシュのコントローラ、その他USB2.0やCAN、Ethernetなどの周辺インタフェースなども集積されている。さらに最j10Gbpsの高]トランシーバ、単@度・倍@度・3倍@度のDSPなども集積している。トランシーバはSERDES代わりにもなる。これにより、システムのj半を組み込みUで構成することができ、差別化したいv路だけFPGAでロジックを組むようにできる。
アルテラは開発環境も同時にD△掘ARMベースのソフトウエア開発ツールやFPGA向けのハードウエア開発ツールQsysシステム統合ツール、シミュレーションもTしている。RTLの検証が終了した時点で、デバイス~のソフトウエアを開発することができ、ハード・ソフトの同時開発が可Δ砲覆襦これによって、開発期間を]縮できる。
このARMプロセッサ内伝塙UFPGAは、例えばカメラからの映疑、鮟萢するv路ではARMベースのビデオ信ス萢を行い、映疑、らクルマや人の動きなどを検出・解析するようなQ処理をFPGAがpけeつ、というようなサーベイランスへの応などに向いている。