Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

アーム社が実にx場を拡j(lu┛)するためつの新をARM Forum 2010で発表

最j(lu┛)}のIPベンダーである英国のアーム社はARM Forum 2010を11月11日に開、新をつ発表した。このうちハイエンドのグラフィックスIPであるMali-T604グラフィックスプロセッサに関しては記v会見を開いたため、すでに報Oしたメディアもある。実際に「今v発表した新はつある」(同社COOのGraham Budd)。

図1 グラフィックス機Δ悗陵弋瓩く

図1 グラフィックス機Δ悗陵弋瓩く


より性Δ屬欧燭里GPU(グラフィックスプロセッサユニット)Mali-T604であるが、残りの二つは、マルチコアによる並`処理をスムーズに行うやすくするためのバスインターコネクトであるCoreLink、そして駘IPとして最適化したCortex-A9を今すぐシリコンにインプリメントするためのパッケージPOP(プロセッサ最適化パック)サービス、である。3〜5Q後のスマートフォンやタブレットへの応を考えたとしては、Mali-T604とCoreLink、今すぐタブレットを出荷するためのSoCを作りたい、と考えるユーザーにはPOPサービスのW(w┌ng)が可Δ任△襦いずれも来のアーム社の顧客の枠を広げ、数Q先のから今すぐ使えるまでカバーできるように広げている。

発表したMali-T604は果てしないグラフィックス性Δ悗陵弋瓩鳳えるためのIPだ。同社メディアプロセッシング靆マネージャーのSteve Steeleによると、来の携帯やスマートフォンと比べ解掬戮WVGAからHDの1080pと比べ5倍以屬忙\加し、さらにOpenGL ES1.1で設できる度のコンテンツから今の要求はその10倍の複雑さに達しているという。しかも携帯機_(d│)に使うことを考慮に入れると、パワーバジェットとしては平均850mW以下に抑える要がある。

消J電を屬欧困棒Δ屬欧襪燭瓠▲◆璽爐魯泪襯船灰△悗粒板ダを屬欧襪燭瓩離灰鵐團紂璽謄ング}法の工夫と、グラフィックス画Cを表するためのレンダリングを工夫した。


図2 Mali-T604GPUコアの基本アーキテクチャ

図2 Mali-T604GPUコアの基本アーキテクチャ

コンピューティングξを屬欧襪燭瓠▲轡鵐哀襪GPUコアの中に3|類のパイプライン構]をとり、性Δ屬欧襪閥Δ縫侫譽シビリティも屬欧訐濕を採っている。そして最新鋭のプロセッサコアであるCortex-A15とGPU、そしてメモリーを効率よくレイテンシを少なく保つために新CoreLinkバスで接する。グラフィックス機Δ屬欧襪燭瓠同時に画C屬痢岾─廚筺岷董廚鯏匹蠅弔屬垢燭瓩離轡А璽澄璽灰△4個並`に動作させる。それらのコアで実行すべきタスクを割り当て、電管理も行う役割をeつのがジョブマネージャーである。

こういったマルチコア、マルチスレッド(sh┫)式のプロセッサアーキテクチャでは共~メモリーであるL2キャッシュのコヒーレンシを高めることが_要なカギを曚襪海箸砲覆襦メモリーのコヒーレンシとは、共~メモリーの内容をk致させる\術のこと。マルチコアのような複数のコアで処理する場合、共~メモリーの内容がコアごとにバラバラでは性Δ忘垢j(lu┛)きくなってしまう。このためキャッシュに使うメモリーの内容を同じにしてコアごとのキャッシュミスがきないようにしておく。このため、共~メモリーを管理するMMU、そしてメモリーのコヒーレンシを管理するSCU(スヌープU(ku┛)御ユニット)をeつ。これによってシェーダーコア間のコヒーレンシを管理できる。並`処理としては、最j(lu┛)256スレッドまで管理できる。


図3 GPUコア1個内も並`処理している

図3 GPUコア1個内も並`処理している


こういったH数のシェーダーコアに適した並`処理をGPUで行うアーキテクチャを構成したことは、実はレンダリング}法とも関連する。消J電を屬欧覆い燭瓩縫瓮皀蝓爾離丱鵐鰭を(f┫)らしているが、そのために1つの画Cを例えば4×4分割して、分割した覦茲鬟織ぅ襪扉}び、そのH数のタイルを塗りつぶすためにH数のシェーダーコアで並`処理する。このタイルベースアーキテクチャを実行するためにマルチスレッド(sh┫)式の並`処理を導入したlだ。

タイルベースアーキテクチャでは、Q順M(j━n)に優先度をめ、まず表から見えない霾のシェーダーは行わない。次に画C後ろ笋砲△覲┐離丱奪グラウンドを塗りつぶす。そのバックグラウンドに乗っている徴的な霾のタイルを処理する。この徴的な霾がタイル間にまたがっていることがHいため、徴を順位けしながら徴のあるタイルだけを処理する。このようにしてレンダリングの要な霾のタイルから順番にQしていくことで、無GなQを行わないように工夫している。

GPUコアはもちろんマルチコアも可Δ任△蝓∧数のGPUコアをつなぎ、メモリーのコヒーレンシを確保するためにCoreLinkバスを設した。CoreLinkバスはアーム社が来から使っているAMBAバスのハイエンド版ともいえるバスで、AMBA4 キャッシュコヒーレントインターコネクト(CCI-400)と}んでいる。キャッシュのW(w┌ng)効率が高くなりキャッシュミスが(f┫)る。ソフトウエアでキャッシュのメンテナンスを行う要もない。


図4 CPUとGPUをつなぎメモリーのコヒーレンシを高めるためのCoreLinkバス

図4 CPUとGPUをつなぎメモリーのコヒーレンシを高めるためのCoreLinkバス


CoreLinkを通じて、GPUからCPUのキャッシュを探しに行くことができ、キャッシュデータの共~化が~単になる。このため不要なキャッシングをなくすこともでき、Q効率が屬ることになる。

現実的なソリューションを欲しい顧客に向けた3番`の新であるPOPサービスは、シリコンにv路を焼きけすぐに動作を実証できるパッケージサービスだが、ファウンドリをパートナーとしてファブレスやIDMの顧客に提供する。例えば、32nmのハイkメタルゲートのサムスンのプロセスを使ってSoCを]したり、1.7GHzで動作するテキサスインスツルメンツ(TI)のOMAPプロセッサを実現したりしている。SoCをすぐに設]したい顧客に適したサービスでCortex-A9の駘IPのほかにARMが認定するベンチマークをテストでき、リファレンス}法も提供する。ファウンドリパートナーとしては、サムスンに加え、TSMC、グローバルファウンドリーズも使える。

参考@料
1) ARM社ニュースリリース
ARM Heralds New Era In Embedded Graphics With Next-Generation Mali GPU

(2010/11/12)

ごT見・ご感[
麼嫋岌幃学庁医 仔弼眉雫壓濂シ| 冉巖利嫋篇撞壓濆杰| 秉曲啼技読壓濆杰| 晩云触匯触屈仟曝| 冉巖忽恢晩昆壓潦蛭肪柝 | 寄心酋a壓濆杰| 冉巖av喟消涙鷹匯曝屈曝眉曝 | nanana恷仟壓瀛啼誼盞儿杰翰| 涙孳飢匯雫谷頭來篇撞音触| 冉巖AV涙鷹廨曝冉巖AV音触| 娼瞳曝触匯触2触眉窒継| 忽恢牽旋唹垪壓濆杰| 某沃溺少雑瓜畝鰯距縮| 晩云岷殴壓濆杰www.| 冉巖卯皮娼瞳涙鷹匯曝屈曝 | 壓瀉盞儿杰h頭| 消消消消消牽旋| 天胆互賠篇撞www匚弼彿坿利| 巷盃係螺的働疏繁曇單| 忽恢検薦及匯匈課課唹垪| 溺寄僥伏議紐霜| 消消忝栽消消忝栽湘弼| 天胆晩昆忽恢匯曝眉曝| 膨拶喟消壓濔瞳窒継唹篇 | 楳楳楳忽恢返字壓濂シ| 忽恢槻溺訪訪訪訪訪窒継篇撞| 91娼瞳忝栽消消消消消励埖爺| 涙鷹娼瞳忽恢匯曝屈曝眉曝窒継 | 晩云富絃互咳島邦xxxxxxx| 冉巖卯皮涙鷹廨曝www| 槻來螺挺凛螺隈| 怜匚析望字喟消窒継心頭| 嶄猟忖鳥晩昆娼瞳醍狭狼双| 蝕伉消消翆翆忝栽嶄猟忖鳥 | 及湘弼曝AV爺銘| 亜挫寄挫訪篇撞| 弼裕裕際際弼忝栽利| 忽恢娼瞳撹繁消消消| 999壓瀛啼犠瞳窒継殴慧鉱心| 涙鷹販低夊消消消消消| 消消怜匚忝栽消消|