中文字幕精品视频在线观看,国产色拍精品福利视频app,91精选国产

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(2-3)

2016年8月10日 ∶大蠱∈染瞥攣炳脫∷

媽2鞠¨ディ〖プˇニュ〖ラルネットワ〖クのニュ〖ロチップへの悸劉×その椽疥は!!
この媽2鞠の呵稿に碰たる2-3では、ニュ〖ラルネットワ〖クをチップに悸劉する眷圭のメモリの憚滔がどの鎳刨になるか、さらにメモリ憚滔を負らすための供勺などを疽拆する。∈セミコンポ〖タル試礁技∷

螟莢¨　傅染瞥攣妄供池甫墊センタ〖∈STARC∷/傅澎記　紗昆　芳

2.7　　ディ〖プˇニュ〖ラルネットワ〖ク　×メモリ悸劉に簇する雇弧¨　3つのタイプ×
塑淚では、CNN笆嘲も崔めニュ〖ラルネットワ〖クの菇喇の房が3つに尸けられることを棱湯し、稱」の房のパラメ〖タ眶、すなわちメモリの憚滔が掘鳳によりどのように恃わるのかに緬謄する。その妄豺を奶して、LSIへのメモリの悸劉の椽疥を南む。その面で、謄奧の罷蹋も崔めてオンチップ∈寒很∷を辦つの的俠のポイントとする。なお、オンチップメモリ∈SRAM∷と嘲燒けメモリ∈DRAM∷ではパワ〖、廬刨鼎に2峰鎳刨佰なる∈徊雇獲瘟13∷。

(1) 3つのタイプに尸けられる
哭13に給夢の稱鹼ネットワ〖クもしくはモデルの借妄灤據(jù)掐蝸眶∈茶嚨および帽姐デ〖タ∷と澀妥パラメ〖タ眶との簇犯を績した。CNN笆嘲のアルゴリズム、さらにはアプリケ〖ションへの努炳をにらんだ悸ネットワ〖クの猛も掐れた。またパラメ〖タ碰たりのビット眶を16ビットとし、バイト垂換した翁を?qū)毤搐死^した。澀妥なメモリ推翁∈Byte=8bit∷である。稱デ〖タポイントにネット嘆もしくはモデル嘆を燒淡した∈澀妥な眷圭には徊雇矢弗を徊救∷。さらに肩にCNNに灤してはクラス眶を裁えた∈毋えばC10(Classが10∷)。AlexNet、VGGNet霹のモデルのクラス眶は1000である。

哭13　掐蝸眶と澀妥メモリ推翁の簇犯

哭13　掐蝸眶と澀妥メモリ推翁の簇犯
Googleの黔∈徊雇獲瘟33¨兜徽なし池漿∷、2016極瓢∈極瓢笨啪徊雇獲瘟34∷、Deep Q-Learning∈
徊雇獲瘟35∷、Autoencoder∈マルチモ〖ダル¨徊雇獲瘟36∷、DaDianNao(Super Leaning Machine Chip¨徊雇獲瘟37)。　廟罷爬¨C房はConv霖がモジュ〖ル步されていることが潑魔。

ネットワ〖クの菇喇の房として、漣淚までに疽拆したCF房、C房に糠たにF房を裁えた。F房は馮圭が鏈馮圭もしくは、決哈み霖でも潤鼎奶パラメ〖タ房∈腳み鼎銅weight sharingされていない∷のネットワ〖クを回す。兜徽なし池漿で螟嘆なグ〖グルの黔のネットが澈碰する。この妨のネットワ〖クをDNN (Deep Neural Net) とCNNと惰侍するために蝗脫する眷圭があり哭でも蝗脫した。

玻即はニュ〖ラルネットが1刨にタスク借妄をする掐蝸眶である。この哭の認跋でCNNの眷圭には茶燎、DNN (F房) の眷圭には、茶燎に裁えて不蘭、デ〖タ∈逞刨、スピ〖ド霹∷も崔まれる。蝗脫したDeep Q-Learning ∈考霖動步池漿のひとつ∷の眷圭にはデ〖タのみである。奶撅俠矢霹の券山ではパラメ〖タはあからさまに淡很しないので、染尸鎳刨は螟莢が活換した猛である。徊雇獲瘟14も徊雇にした。

(2) 稱」の房の潑魔
ネットの菇喇の房ごとに柒推を棱湯する
2-1)　F房∈鏈馮圭肩攣房∷×兜徽なし池漿DNN、マルチモ〖ダルAutoencoder、動步池漿D QL∷
附箕爬では、茶嚨の兜徽なし池漿、剩眶鹼のデ〖タを票箕借妄するマルチモ〖ダル、浩耽房RNN、さらには動步池漿が鏈馮圭∈Fully Connected∷が肩攣のF房となるようだ。鏈馮圭霖が肩攣なので、掐蝸肌傅眶に灤して、2捐でパラメ〖タが澀妥となる。兜徽なしでの茶嚨千急だとパラメ〖タ眶が締籠するので灤忽が澀妥である。これに灤して、海攙蝗脫したDeep Q-learning∈考霖動步池漿∷では、そもそも茶嚨デ〖タを胺っていない。廬刨、疤彌といったデ〖タであり翁弄には警ない。RNNなり動步池漿で茶嚨攫鼠を胺う狠は、夢る認跋では禍漣にCNNでデ〖タを藐據(jù)步∈毋えば疤彌とか廬刨に恃垂∷して、掐蝸肌傅眶を皖とすのが奶撅である。

2-2)CF房∈CNN 決哈み霖≤鏈馮圭霖鼎賂房∷¨兜徽あり茶嚨千急が洛山
掐蝸眶の2捐に孺毋してパラメ〖タ眶は籠裁し樂い悸俐懼に很る。224x224と豺嚨刨の絡(luò)きめ茶嚨の眷圭と32x32と井さい茶嚨の眷圭が肩にプロットされている。クラス眶はそれぞれ1000と10と端眉に般う。樂い悸俐に捐るとするならば、ネットワ〖クが呵努步されると≈掐蝸眶(X)とクラス眶∈C∷の孺は辦年猛に皖ち緬く∽ことを罷蹋する。X/C=100の罷蹋するところは≈1クラス碰たり10x10の茶燎が澀妥∽との豺堅もできる。この付妄の墊湯は海稿の草瑪である。哭の濫い←で績したClass10のネットワ〖クは樂い悸俐よりも布婁にプロットされている。クラス眶に灤して冊娟の豺嚨刨を積った掐蝸茶嚨を蝗脫していると雇えられる。この馮蔡のひとつはNVIDIAの極瓢笨啪(End to end learning for Self-Driving Cars¨徊雇獲瘟34)に蝗脫されているネットワ〖クである。部か戮の罷哭があるのかもしれない。なお、システムの柒推は媽3鞠笆慣で棱湯する。

2-3)C房∈CNN 決哈み霖肩攣∷¨ モジュ〖ル步
Class1000のGoogLeNet22とResNet34/152を哭13に裁えてある。豺嚨刨が你いケ〖スは、漣淚で疽拆したMSRAのResNet110 (110霖) のCIFAR-10 (3x32x32) でのベンチマ〖クの馮蔡をプロットした。さらに徊雇獲瘟14に很っていた笆布の3つのモデルを哭13に掐れてある。それらはAll-CNN(徊雇獲瘟54)、Hex Kernel(徊雇獲瘟55)、そしてNiN (Network in Network) のCIFAR惹である。パラメ〖タ眶は100×170它改と3x32x32の豺嚨刨にしてはかなり驢い。動苞に馮ぶと∈彭咖の泅い俐∷と飯きが1でパラメ〖タと豺嚨刨は孺毋簇犯にある。かなり宛私だが、決哈み霖の眷圭には、掐蝸の廟謄茶燎∈凡∷の奪說での潑魔藐叫の姥み腳ねなので、あながち掐蝸の肌傅眶に孺毋するとみるのも粗般ってはいない。この賴しい簇犯と付妄の墊湯も海稿の草瑪である。

まとめるとパラメ〖タ眶∈y∷は掐蝸眶∈x∷に灤して、それぞれの房及で
F房∈鏈馮圭霖房∷ ˇˇˇ y=x²
CF房∈鼎賂房∷ ˇˇˇ y=x²/100
C房∈決哈み霖房∷ ˇˇˇ y㈢x　　∈ただし、モジュ〖ル步∷

(3) メモリの悸劉に簇する雇弧
哭13の寶即に面柜彩池薄CASが2014鉗瑣に券山したDaDianNaoの寒很DRAM烹很翁を績した。256Mビット∈8.2mm逞∷、32Mバイトである。2014鉗8奉券山のIBMのTrueNorthも票じくSRAMの寒很で推翁は256Mビット(25x17mm2)である。鼎に28nmでの寒很であることから碰燙の謄奧になる。

3-1) F房∈鏈馮圭房∷
鏈馮圭肩攣であることからメモリへのアクセスが裳人に乖われる。メモリの寒很は端めて跟蔡弄である。しかし256Mビット/32Mバイトを寒很の謄奧とすると、茶嚨炳脫では憚滔弄にかなりかけ違れている。茶嚨を胺う狠には匙糠弄な禱窖が略司される。

3-2) CF房∈鼎賂房∷
掐蝸の茶燎眶は途偷を積たせると100x100×150x150茶燎鎳刨がメモリ寒很の嘎腸と雇えられる。鼎賂房とは咐え、鏈馮圭嬸が拉墻の90%漣稿を貍めることから寒很した狠の久銳排蝸、スピ〖ド猖簾の跟蔡は絡(luò)きい。メモリアクセスへの芹胃が腳妥である。

3-3) C房(決哈み肩攣房)
掐蝸の茶燎眶が3x224x224∈1000クラス∷事みのネットワ〖クもメモリ寒很が紀鎳柒に掐ってきた。景、決哈み霖では票じパラメ〖タを帆り手し蝗脫する禍から∈士堆200攙鎳刨、2.6淚で棱湯∷メモリへのアクセスは供勺により絡(luò)升に汾負される。エッジˇモバイル廢へのディ〖プラ〖ニングの努脫がかなり附悸弄になって丸た。その懼で、どの鎳刨你久銳排蝸步を納滇するかがポイントとなる。

(4) ResNet34をLSIに悸劉してみる
警し哭13から違れて、LSIに悸劉した狠にどのようになるか詞帽に活換してみる∈山3の16ビットのケ〖ス∷。モデルは候鉗瑣の券山から呵奪(2016鉗7奉箕爬)までの染鉗粗でかなりの納浮沮ˇ鷗倡浮沮悸烙鼠桂∈濕攣浮夢、Recurrent NNとの剩圭/戮怠簇鼠桂崔め¨徊雇獲瘟29∷のあるResNet、霖眶としては緘孩な34霖を聯(lián)買した。山1より澀妥なメモリの憚滔としては、352Mビット∈パラメ〖タ碰たり16ビット∷が澀妥である。附箕爬では漣揭のTrueNorth/DaDianNaoクラスの256Mビットが寒很の悸烙とするとそれより絡(luò)きく、海稿の腮嘿步を漣捏としても途偷があるとは咐えない。しかし、エッジ炳脫を雇えるとメモリ悸劉にかなりの極統(tǒng)刨が叫たと雇えることができる。拉墻に簇しては、あくまで帽姐活換だが、36.4帛攙のMAC遍換が澀妥であることから3.64msecで1茶嚨∈フレ〖ム∷の千急借妄が材墻なレベルである(16ビット步で廬くなるが雇胃せず)。簿に10擒覓くても36msecで30fps(frame per sec)には灤炳できるレベルである。ちなみに漣捏として1TFLOPS/s(MAC垂換)を蝗脫したが、かなりレベルが光い。

ResNet霹C房のCNNの判眷によりエッジ廢はもとよりかなりモバイルへの鷗倡が附悸蹋を掠びてきた。なお、システム炳脫の眷圭には掐蝸の豺嚨刨、事誤タスク眶、パラメ〖タのビット眶、霖眶∈34霖でいいのか々∷、クラス眶、エラ〖の釣推認跋、息魯で借妄する剩圭怠墻霹、システム菇喇の攫鼠を裁蹋する澀妥がある。媽3鞠笆慣で惡攣弄な毋を脫いて材墻な嘎りシステムイメ〖ジに趨る徒年である。

山3 メモリ推翁と遍換箕粗の帽姐活換

山3 メモリ推翁と遍換箕粗の帽姐活換

2.8　　ディ〖プˇニュ〖ラルネットワ〖ク　×メモリ翁楓負サブ0.1Wも— モバイルにロックオン×
(1) パラメ〖タˇデ〖タ你ビット步/暗教の瓢きとその跟蔡
山4に呵奪のメモリ翁猴負に木馮するパラメ〖タˇデ〖タ你ビット步/暗教の瓢羹を辦枉として績す。パラメ〖タˇデ〖タは奶撅は、32ビットの赦瓢井眶爬遍換をベ〖スに甫墊倡券、絡(luò)緘IT措度のデ〖タセンタ〖での悸脫が渴められている。しかし、ほとんどのこの尸填に簇わる數(shù)は32ビットもいらないのではと蛔う∈潑に悸乖箕は∷。32ビットと光籃刨步することと、潑魔藐叫の狠に灤據(jù)を藐據(jù)步∈稍妥な濕をそぎ皖として∷することが嫡乖しているからである。

慷り手ると2012鉗笆漣より蓋年臘眶、8ビット步の浮皮霹がなされていた∈徊雇獲瘟38∷。2013×2014鉗にはフィルタを乖と誤に尸充して悸乖箕の紛換翁を2×3擒鎳刨猴負するSeparable Filter (徊雇獲瘟39、ニュ〖ヨ〖ク絡(luò)池とFacebook AI Researchの鼠桂)などのネットの暗教恕の鼠桂があった。さらに2014鉗にもコロンビア絡(luò)池のSoudryらの腳みを∞1とする緘恕(Expectation Backpropagation¨徊雇獲瘟40) 霹の鼠桂もあった。しかし、山4に績すように候鉗の11奉∈候鉗12奉のNIPS)のBinary Connectの券山 (徊雇獲瘟41) の孩より木奪の草瑪としてより廟謄され叫し、またLSI悸劉に奪い妨での券山も籠えてきた。潑僧すべきは稱券山が、エッジの面でも烹很が覓いだろうと鱗年されていたモバイル怠達への絡(luò)憚滔ネットワ〖クの烹很を咳奪な濕としてうたっている爬である∈Googleも票屯にモバイルを回羹。しかしまずは、木奪の草瑪であるデ〖タセンタ〖での悸狠の笨脫が黎と蛔われる∷。

パラメ〖タˇデ〖タの你ビット步/暗教の跟蔡は、光廬步と票箕に久銳排蝸も猖簾され、2捐の跟蔡があり端めて胎蝸弄である。さらにうまく乖けばSRAMのオンチップ步も材墻となり紊いことばかりである。千急唯の你布が伏前されるが、CNN霹で斧る嘎りはぼぼ痰いかもしくは井さいとの馮蔡が鼠桂されている。

山4　パラメ〖タˇデ〖タの你ビット步/暗教の瓢羹

山4　パラメ〖タˇデ〖タの你ビット步/暗教の瓢羹

(2) 你ビット步/暗教數(shù)恕の尸梧
稱禱窖の拒嘿を揭べる。山4のパラメ〖タˇデ〖タの你ビット步/暗教は3つに尸梧される。

2-1) バイナリ〖步∈1ビット步∷¨
∞1の2猛(1ビット)で遍換を乖う。バイナリ〖コネクトではパラメ〖タだけを、バイナライズトネットワ〖クでは裁えてバッチˇノ〖マライゼ〖ション稿の叫蝸猛を2猛步する。なお、籃刨が澀妥な池漿箕疙汗嫡帕橋恕のパラメ〖タ腮拇箕は、瘦積しているパラメ〖タの悸眶を蝗脫して猛を構(gòu)糠する。MNIST/CIFAR∈ベンチマ〖クの鹼梧∷への努脫で紊い馮蔡が評られており、海稿はImagenet霹の絡(luò)憚滔茶嚨での浮沮を乖う霹鷗倡の升を弓げるとのこと∈2016鉗4奉¨徊雇獲瘟42∷である。稿莢と擊た數(shù)恕をIBMがTrueNorthのチップア〖キテクチャに努脫して、伏捌であった考霖池漿からスパイキングニュ〖ラルネットワ〖クへ抖を餐けることに喇根している。考霖池漿での喇蔡をスパイキングニュ〖ラルネットワ〖クに酒き木しニュ〖ロモルフィックア〖キテクチャ懼で悸乖できる。票じく附箕爬ではMNIST/CIFAR(CNN)への努炳である。拒嘿は媽3鞠で棱湯徒年である。

2-2) パラメ〖タの暗教∈Deep Compression∷¨
パラメ〖タの暗教を池漿から悸乖にかけて山の3つの卉忽を脫いて乖う。跟蔡は絡(luò)きい。剩花すぎて材渾拉が礙いとの回紐も減けている。また、C房∈決哈み霖肩攣∷のCNNモデルへの努脫馮蔡が略たれる霹、禱窖の嚼起拉がどの鎳刨あるかを夢りたい。

2-3) ビット眶の猴負∈翁灰步∷¨
遍換∈姥下遍換、寵拉步遍換、プ〖リング、賴憚步ほか∷だけを8ビット臘眶(0-255)で借妄する。ユ〖ザ〖は驕丸奶り32ビット赦瓢井眶爬遍換のライブラリ〖がほぼそのまま蝗える∈と妄豺している∷。掐蝸婁と叫蝸婁でデ〖タの翁灰步∈32ⅹ8ビット∷と瓤翁灰步を乖うが、恃垂箕のラウンド借妄の艱り胺いで廟罷が澀妥のようである。2-1)×2-3)とも鼎奶にハ〖ドも呵努步しないと100%の跟蔡が苞き叫せない。1×2鉗齒けてTPU (Tensor Processing Unit)なるカスタムチップを倡券したことをGoogleが5奉に給山した。デ〖タˇパラメ〖タの你ビット步の跟蔡はオ〖バ〖ヘッド尸があり、廬刨∈サイクル眶∷猖簾およびメモリ翁猴負は稱」3×4擒と夸盧する。パワ〖も票屯で、馮蔡パワ〖跟唯猖簾としては10擒鎳刨となる。辦忍ユ〖ザ〖は夢らないうちに、8ビット臘眶借妄のディ〖プラ〖ニングをしていることになる。もちろん、籃刨は皖ちないことが漣捏である。Googleにとってはデ〖タセンタ〖のディ〖プラ〖ニング悸乖コストが1/3×1/4になり、かなりのインパクトと徒鱗する。パワ〖も負る。このタイミングでのビット眶の猴負の卉忽の鷗倡は、媽1鞠肆片で揭べたように、≈ディ〖プラ〖ニングのモデルライブラリ〖への鷗倡すなわちデ〖タセンタ〖鷗倡の回眶簇眶弄廓い∽を毀えるための凳鈍の草瑪とみることも叫丸る。

その戮、山4に績すように掐蝸ˇ面粗デ〖タの嘲嬸メモリとの啪流箕にロスレス暗教を蝗う禱窖の鼠桂がISSCC2016でMIT/NVIDIAからあった∈徊雇獲瘟48∷。ハ〖ドの恃構(gòu)は澀妥で、跟蔡は井さいが澄悸である。

(3) モバイルへの悸劉の材墻拉は?!
Googleの瓢きに斧られるように、貸に悸乖フェ〖ズでは臘眶8ビットは千夢されつつある。4擒煎の猖簾は澄悸、さらに你ビット步が渴めば猖簾は32擒まで袋略できる。海稿、絡(luò)花悄に10擒鎳刨の
パラメ〖タの你ビット步/暗教がなされると簿年して、どの鎳刨LSI悸劉に跟蔡があるのかResNet34(22.0Mパラメ〖タ)を蝗脫して活換してみる。

3-1) 澀妥メモリ燙姥は々
漣淚に蝗脫した山3の呵寶誤∈ピンク咖の先∷に猛を裁えてある。32ビットに灤して1/10の跟蔡とすると、眉眶で附悸弄ではないが3.2ビット/パラメ〖タとなる。另メモリビット眶は、22Mx3.2=71.4Mビット。呵奪給山されている攫鼠(徊雇獲瘟49)から、SRAMのオンチップでの燙姥は、7Mbit/mm2 @16nm とする。澀妥エリア燙姥は10mm2@16nm (3mm逞動のサイズ)となる。∈152霖のResNet152だと56Mパラメ〖タで、25.5mm2となる。これだとさすがに絡(luò)きい∷。ResNet34だとかなりの途偷を積ってSRAMのオンチップメモリ步∈寒很∷が材墻となる。馮蔡、哭13の焊の即の22Mパラメ〖タ笆布∈ほとんどe-DRAM DaDianNaoのラインの警し懼∷の撾拌はカバ〖できる。荒るのは、かなり絡(luò)きな豺嚨刨の濕∈絡(luò)茶燙∷、もしくはマルチタスク借妄、兜徽なし池漿霹となる。

3-2) 姥下遍換のパワ〖はどのくらいのレベル々
モバイル烹很を雇えると丹になる爬だ—票屯に、Imagenetの茶嚨千急を30 frames/secで乖った眷圭のパワ〖を活換してみた。掘鳳は漣淚で蝗ったものと票じで、LSIとしては1TFLOPS/Wの拉墻が叫せることを漣捏としている。票じく山3にまとめた。32ビットに灤して、その10尸の1の借妄翁で紊いので1/10の久銳排蝸、100mWとする。3.6msecで1茶嚨フレ〖ムの千急が姜わるので肌のフレ〖ムが丸る30msec鎳はスタンバイ覺輪になる。帽姐に1/10の蒼漂唯と雇えると、10mW鎳刨の姥下遍換久銳パワ〖となる。オンチップSRAMのパワ〖霹」を裁えると、もう警し籠える。しかし巴臉かなりのロ〖パワ〖でモバイルへの烹很も澆尸材墻なレベルである∈なお1TFLOPS/Wがかなり阜しいが∷ことがわかる。

まだ、いくつかの草瑪もあるが、SRAMオンチップでサブ0.1W鎳刨は斧哈める覺斗と雇えられる。エッジ廢はもとより、モバイル廢も紀鎳柒でロックオンされている覺輪である。パラメ〖タˇデ〖タの你ビット步/暗教に簇して塑淚のいくつかを媽3鞠で警し僻み哈み疽拆する。

まとめ
海稿のCNNのモデルの渴步に簇しては、NiN、GoogLeNet、およびResNetがもたらしたモジュ〖ル妨及の猖紊で渴んで乖くと雇えたい。ここ染鉗ほどの粗に另崇弄なSqueeze Net(徊雇獲瘟50)、ENet(徊雇獲瘟52)なるモデルの券山もある。海鉗のImageNet(9奉×10奉)およびNIPS(12奉)で海稿どのような渴步の數(shù)羹拉を績すのか督蹋考い。そのようなネットワ〖クモデルの渴步と箭蘆の萎れに裁えて、悸狠のアプリケ〖ションにどのモデルをどのように蝗脫するのかといった悸倆弄、蜀崇弄かつ兜績弄な廈も海稿叫てくると徒鱗している。掐蝸の肌傅眶と叫蝸のクラス眶、そして釣推疙汗認跋も晚んでくると雇える。徊雇獲瘟51の螟莢∈Purdue絡(luò)のEugenio Culurciello兜鑒、TeraDeep家のCTOでLeCun會の兜え灰∷はまとめることを績憾しているので袋略したい。

LSI步の椽疥として、拒嘿を斧端めるまでには魂っていないが、ある鎳刨の數(shù)羹拉を塑鞠で揭べた。
　ˇ光拉墻步と剩圭怠墻步(システム步)ˇˇˇ2つの絡(luò)きな萎れ
　ˇ答塑菇喇∈決哈み霖、鏈馮圭霖、寵拉步簇眶、プ〖リングˇˇˇ、池漿箕の禱恕∷は箭蘆へ
　ˇモデルの渴步∈CF房からC房への敗乖∷ˇˇˇC房が肩萎になりつつある
　ˇC房のモジュ〖ルが腳妥
　ˇ霖眶とエラ〖唯猖簾∈ディ〖プ步へ∷ˇˇˇ100霖笆懼材墻
　ˇ姥下遍換眶とパラメ〖タ眶∈メモリ∷の簇犯ˇˇˇ200×300擒
　ˇモデルのタイプ∈F,CF,C房∷と遍換眶ˇパラメ〖タとの簇犯
　ˇパラメ〖タˇデ〖タの你ビット步/暗教の瓢羹ˇˇˇここ染鉗で渴步
　ˇエッジˇモバイル廢への努脫の材墻拉ˇˇˇ紀鎳柒でロックオン

塑鞠の呵稿に輸顱する。LSIの悸劉弄な尸填で、MIT、Stanford絡(luò)池、そしてUCB霹の寵瓢が寵券である。その面にデジタルLSIの肋紛尸填で螟嘆なStanford絡(luò)池のHorowitz兜鑒のグル〖プも嘆を息ねており(徊雇獲瘟46, 53, 13)廟謄される。それにも籠して、かなりの裳刨で絡(luò)池の俠矢にNVIDIAが嘆を息ねている(ハ〖ドのGPUとソフトCuDNN霹のSDKのサポ〖ト)爬が丹になる。肌鞠笆慣、塑鞠の俠爬を僻まえ、ディ〖プラ〖ニングLSIの攙烯ア〖キテクチャおよび悸炳脫システムへの悸劉に趨る。

(2016/08/10)

徊雇獲瘟 (1×32までは漣攙笆漣)

Q. V. Le, and A. Y. Ng., "Building High-level Features Using Large Scale Unsupervised Learning", In International Conference on Machine Learning, June 2012. 20120626. グ〖グルの黔.
Mariusz Bojarski+, "End to End Learning for Self-Driving Cars", 2016鉗4奉25泣. 2016ADAS(哭13), CNNによる極瓢笨啪.
揪傅泵辦, ≈尸歡考霖動步池漿でロボット擴告∽, Preferred Research (Preferred Infrastructure Inc,), 2015鉗6奉10泣 ∈浩非¨哭13のパラメ〖タ猛は僧莢の活換猛∷
Noda, , Hiroaki Arie , Yuki Suga , Tetsuya Ogata, "Multimodal integration learning of robot behavior using deep neural networks", Robotics and Autonomous Systems, Volume62, Issue6, 721-736是, 2014鉗6奉. マルチモ〖ダル
Yunji Chen, Tao Luo1,3, Shaoli Liu1, Shijin Zhang1, Liqiang He2,4, Jia Wang1, Ling Li1, Tianshi Chen1, Zhiwei Xu1, Ninghui Sun1, Olivier Temam2, "DaDianNao: A Machine-Learning Supercomputer", in Proceedings of the 47th IEEE/ACM International Symposium on Microarchitecture(MICRO∏14), IEEE, 2014. DaDianNao、20141213.
Vincent Vanhoucke, Andrew Senior, Mark Z. Mao, "Improving the speed of neural networks on CPUs", 介袋の你ビット步浮皮の俠矢
Emily Denton, Wojciech Zaremba, Joan Bruna, Yann LeCun, Rob Fergus, "Exploiting Linear Structure Within Convolutional Networks for Efficient Evaluation", 2014鉗6奉9泣. Separable Filter.
Daniel Soudry, Itay Hubara, Ron Meir, "Expectation Backpropagation: Parameter-Free Training of Multilayer Neural Networks with Continuous or Discrete Weights", 2014鉗12奉, ニュ〖ロンと砷操を∞1∈Binary步∷.
Matthieu Courbariaux, Yoshua Bengio, Jean-Pierre David, "BinaryConnect: Training Deep Neural Networks with binary weights during propagations", 2016鉗4奉18泣(ver3). Binary Connect.
Matthieu Courbariaux, Itay Hubara, Daniel Soudry, Ran El-Yaniv, Yoshua Bengio, "Binarized Neural Networks: Training Deep Neural Networks with Weights and Activations Constrained to +1 or -1", 2016鉗3奉13泣(v3). Binarized NN
Steve K. Esser, Rathinakumar Appuswamy, Paul Merolla, John V. Arthur, and Dharmendra S. Modha, "Backpropagation for Energy-Efficient Neuromorphic Computing", Advances in Neural Information Processing Systems 28 (NIPS 2015), 2015鉗12奉NIPS2015.SNNへBP努脫.
Steven K. Esser, Paul A. Merolla, John V. Arthur, Andrew S. Cassidy, Rathinakumar Appuswamy, Alexander Andreopoulos, David J. Berg, Jeffrey L. McKinstry, Timothy Melano, Davis R. Barch, Carmelo di Nolfo, Pallab Datta, Arnon Amir, Brian Taba, Myron D. Flickner, Dharmendra S. Modha, "Convolutional Networks for Fast, Energy-Efficient Neuromorphic Computing", 2016鉗5奉24泣(V2).スパイキングNNへのCNN/BP炳脫.
Song Han, Huizi Mao, William J. Dally, "Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman Coding", 2016鉗2奉15泣(V5).Deep Compression.
Song Han, Xingyu Liu, Huizi Mao, Jing Pu, Ardavan Pedram, Mark A. Horowitz, William J. Dally, "EIE: Efficient Inference Engine on Compressed Deep Neural Network", 2016鉗5奉3泣(V2). Deep Compression IP步.
Pete Warden, "How to quantize Neural Networks with TensorFlow", ブログ, 2016鉗5奉3泣, 遍換の翁灰步∈32bitⅹ8bit∷
Yu-Hsin Chen, Tushar Krishna, Joel Emer, Vivienne Sze, "Eyeriss: An Energy-Efficient Reconfigurable Accelerator for Deep Convolutional Neural Networks", 2016 IEEE International Solid-State Circuits Conference, Session 14.5, p262-264, 2016鉗2奉 Eyeriss CNNの呵努攙烯(ISSCC2016)
泣沸テクノロジ〖オンライン　"ルネサス、16nmFinFET羹けデュアルポ〖ト雖哈みSRAMを倡券", 2015鉗12奉8泣. SRAMの燙姥
Forrest N. Iandola, Song Han, Matthew W. Moskewicz, Khalid Ashraf, William J. Dally, Kurt Keutzer, "SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and &llt;0.5MB model size", 2016鉗4奉6泣∈V3∷, Squeeze Net.
Eugenio Culurciello, "Neural Network Architectures", ブログ, 2016鉗6奉4泣浩非, Neural Network Architectureのサマリ.
Adam Paszke, Abhishek Chaurasia, Sangpil Kim, Eugenio Culurciello, "ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation", ENet, 2016鉗6奉7泣. リアルタイムのSemantic Segmentation.
Xuan Yang, Jing Pu, Blaine Burton Rister, Nikhil Bhagdikar, Stephen Richardson, Shahar Kvatinsky, Jonathan Ragan-Kelley, Ardavan Pedram, Mark Horowitz, "A Systematic Approach to Blocking Convolutional Neural Networks", 2016鉗6奉14泣. スタンフォ〖ド絡(luò)池ホロビッツ兜鑒簇息.
Jost Tobias Springenberg, Alexey Dosovitskiy, Thomas Brox, Martin Riedmiller, "Striving for Simplicity: The All Convolutional Net", 2014鉗12奉21泣. All-CNN(C房)
Zhun Sun, Mete Ozay, Takayuki Okatani, "Design of Kernels in Convolutional Neural Networks for Image Classification", 2015鉗11奉30泣. Hex Kernels(C房).

ご罷斧ˇご炊鱗

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(2-3)

Breaking News

2025鉗5奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

ニュ〖ロチップ車棱 ×いよいよ染瞥攣の叫戎(2-3)

Breaking News

2025鉗5奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(2-3)