www亚洲精品,免费观看中文字幕,99综合久久

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(4-3)

2017年4月 5日 ∶大蠱∈染瞥攣炳脫∷

ニュ〖ロチップの洛山毋として、∈4-3∷では暗教禱窖を脫いたチップの倡券毋として、Googleが倡券したニュ〖ロチップTPU∈Tensor Processing Unit∷、およびStanford絡(luò)池を面看に甫墊されている暗教禱窖Deep Compressionを疽拆する。暗教は、翁灰步ビット眶を32ビットなどから16ビットあるは8ビットに猴負する禱窖で、ニュ〖ロチップの排蝸跟唯を懼げるもの。警」墓いが、チップ步には澀妥な禱窖である。∈セミコンポ〖タル試礁技∷

螟莢¨傅染瞥攣妄供池甫墊センタ〖∈STARC∷/傅澎記　紗昆　芳

4.3　洛山弄チップ∈暗教禱窖を脫いたチップ∷×諒暗教、翁灰步そしてロスレス
塑淚で胺うデ〖タおよび腳みの暗教禱窖は悸乖脫だ。鼎奶の千急は≈池漿箕には疙汗嫡帕橋恕の腳みを腮拇する狠に籃刨を妥し驢ビットが澀妥∽という爬だ。籃刨昔步に簇しても井さめで0.5%鎳刨までである∈この釣推認跋は努脫のアプリの慌屯に絡(luò)きく巴賂するはず∷。

塑淚の(1)でGoogle家のASICであるTPUに簇息する禱窖を、(2)と(3)でStanford絡(luò)池を面看としたDeep Compressionに簇する辦息の禱窖を棱湯する。なお漣莢はデ〖タセンタからモバイルはもとよりIoT (エッジ)までの鷗倡を晾い、稿莢はモバイル∈エッジ∷灤炳の墊端∈?!∷を晾っている。そして、呵稿に(4)で戮のチップ∈IoE霹¨4.1淚で棱湯∷の暗教禱窖も崔めて鏈攣を車囪する。なお、暗教禱窖にはBinary Connect/Binarized Neural Networkといったバイナリでの池漿ˇ悸乖借妄を玫滇する瓢羹もあるが、塑大蠱では充唉した。またTPUに簇しては、2017鉗4奉にGoogleよりTPUに簇しての拒嘿な疽拆、第び俠矢が叫たのでそちらを徊救してほしい。笆布のブログより俠矢のダウンロ〖ドが材墻∈https://cloudplatform.googleblog.com/2017/04/quantifying-the-performance-of-the-TPU-our-first-machine-learning-chip.html∷。

哭35はここ1鉗でのGoogleとStanford絡(luò)池を面看とした2つの瓢きを箕廢誤でまとめたものだ。暗教借妄の數(shù)恕からLSI悸劉∈GoogleはASICを倡券ˇ蝗脫面∷、悸炳脫へと締楓に鷗倡しているのが斧て艱れる。潑に潑魔弄なのは、NMT∈Neural Machine Translation¨RNNベ〖スのニュ〖ラル怠常溯條∷を篩弄として甫墊ˇ倡券が締である爬だ。鏈馮圭霖を肩攣として眶紗メガバイト∈1ギガ∷甸のサイズのネットワ〖クモデルである。奪い經(jīng)丸、スマホで極瓢溯條がスタンドアロ〖ンでできるようになる廓いだ。泣塑胳をスマホに廈しかけると、スマホが面柜胳をしゃべってくれるのも粗奪かもしれない。

哭35 暗教禱窖の倡券の2つの萎れ∈晾うはモバイル/エッジ炳脫∷

哭35 暗教禱窖の倡券の2つの萎れ∈晾うはモバイル/エッジ炳脫∷

(1)TPU (Tensor Processing Unit)　Google家×デ〖タセンタからエッジへ
哭35に績すように、TPUは、2016鉗5奉18泣にGoogleのブログで券山∈徊雇獲瘟94、95∷された。2014鉗塑呈倡券緬緘、2015鉗秸にはチップを、そして22泣で悸跟弄に蝗えるようになったとのことだ。デ〖タサ〖バで蝗われる悸乖脫の漓脫ASICチップである。悸狠にRankBrain/Street View/Alpha Go霹に蝗脫されたとのことだ∈哭36∷。

Alpha Goに蝗脫されたいわゆる客供夢墻が寶のラックだ。GoogleのTensorflowのライブラリ懼で瓢くことが漣捏である。柒嬸はデ〖タˇ腳み鼎に8ビットで遍換、エネルギ〖跟唯が1峰∈10擒∷猖簾された。ハ〖ドウェアの拒嘿は稍湯だ。32ビット赦瓢井眶爬遍換を、8ビットで遍換しているなら遍換攙眶が1/4に負警∈廬刨∷、1遍換碰たりのメモリアクセス砷操が1/4に猴負する禍からエネルギ〖跟唯が10擒鎳刨羹懼する。∈懼揭の俠矢では、陵灤孺秤だが灤CPU/GPUの廬刨孺15×30擒、エネルギ〖跟唯30×80擒と鼠桂されている∷。なお、掐叫蝸嬸尸は32ビット赦瓢井眶爬のまま胺えるのがポイントである。

哭36 TPUが悸劉されたボ〖ド∈焊∷、デ〖タセンタでの悸乖覺斗∈ラックに烹很¨寶哭∷　Alpha Goで蝗脫されたサ〖バラック∈鴿茸の敞が漚り燒けられている∷　∈徊雇獲瘟94 Google Cloud Platform Blogより啪很∷

哭36 TPUが悸劉されたボ〖ド∈焊∷、デ〖タセンタでの悸乖覺斗∈ラックに烹很¨寶哭∷　Alpha Goで蝗脫されたサ〖バラック∈鴿茸の敞が漚り燒けられている∷
∈繼靠は徊雇獲瘟94 Google Cloud Platform Blogより啪很∷

Googleユ〖ザ〖のAI蝗脫翁∈悸乖∷の回眶簇眶弄な凱びへの灤鉤忽と斧てとれる∈3×4擒のユ〖ザ〖を陵緘にできる∷。またパワ〖你負によるデ〖タセンタの拜積コスト你負にも芬がる∈メインテナンスを崔めたコストメリットは10擒∷。Googleのビジネス喇墓のための里維エンジンと斧ることができる。嫡に斧るならば、その拉墻羹懼の七步はAIの券鷗ˇ喇墓への圍廬妥傍となる。またユ〖ザ〖は痰罷急のうちにその哺訪∈攙批が玲いなりAIも腑くなったと炊ずる∷を減ける。

ただし3×4擒のスピ〖ドアップでは1×2鉗しか積たない。エッジ婁で悸乖の借妄をしないと玲」にデ〖タセンタはパンクする。潑に極瓢溯條の拉墻が懼がり、廠が塑呈弄に蝗い叫したらたまったものではない∈海はまだまだ踏喇較で付胳で粕まざるを評ない∷。

辦數(shù)、アルゴリズム、もしくはプログラム甫墊莢、倡券莢にとってのメリットも絡(luò)きい。なぜなら池漿は籃刨が澀妥なことから32ビット鎳刨の赦瓢井眶爬の蝗脫が附覺閏けられない。その32ビットのコ〖ドをGoogleに畔し、TPU懼で瓢侯させると4擒廬く瓢侯できる。TPUから廈はずれるが、蓋年の腳み∈パラメ〖タ∷も1/4となることから、モバイルへの鷗倡(奶撅100MB笆布がモバイルへの烹很釣材のリミットと使いている)、すなわちGoogle Play懼での光刨のAIプログラム悸劉を夸渴する付瓢蝸ともなる。この爬からも肌なるGoogleの里維が磺える。

哭35に績すように、5奉笆慣のGoogle簇息の攫鼠を濺ってみると、2016鉗7奉にTPUをIPコアとしてベンチャ〖措度であるフランスのGreenWaves Technologiesに捏丁している∈徊雇獲瘟98∷。タ〖ゲットは坤腸呵介の塑呈IoTチップだ∈嘆疚¨GAP8 12 GOPS、20mW 2017鉗2奉チップ∷。漣揭したが、TPUをグ〖グルのニュ〖ラル怠常溯條∈GNMT¨Google Neural Machine Translation¨徊雇獲瘟99, 100∷にも努脫して貸に笨脫しているとのことだ。Stanford絡(luò)池でも票屯の瓢き∈徊雇獲瘟72, 73∷をしており、怠常溯條∈不蘭千急も票屯∷はAI簇息で呵もホットな撾拌だ。

翁灰步禱窖∈Quantization∷×遍換スピ〖ドアップの帽姐な緘恕
ハ〖ドウェアに簇しては攫鼠が給倡されていないが、では辦攣どのように8ビットに翁灰步するのかが夢りたい爬である。2016鉗5奉18泣のTPUの券山に黎惟つこと2降粗漣の5奉3泣にGoogleのPete Warden會のブログにTensorFlow懼で瓢侯する翁灰步のコ〖ドおよびその豺棱淡禍が給倡されていた∈徊雇獲瘟96∷。かなり繞脫拉∈だれでも詞帽に蝗えトラブルの警ない∷のある暗教禱窖と雇える。なお、このPete Warden會は、傅JetPec家のCTOで啡掠脫茶嚨千急ソフト∈Apple Storeに非很¨Deep Brief Network¨DBNベ〖ス∷を卿り叫した甜黎、2014鉗財にGoogleに柴家が傾箭された沸悟を積つ∈徊雇獲瘟97∷。懼淡のTPUの倡券緬緘と票じ箕袋だ。

哭37に翁灰步のフロ〖を績す。徊雇獲瘟96の哭をまとめた。32ビット赦瓢井眶爬遍換を、柒嬸のみ8ビットの蓋年臘眶數(shù)及でデ〖タ/腳み鼎に紛換する。腳み∈Weight∷は禍漣にオフラインで紛換してもよいはずだ。啼瑪は、悸デ〖タ∈掐蝸潑魔マップ、叫蝸潑魔マップの稱猛∷をどのように借妄するかである。哭では寵拉步簇眶∈Rectified Linear簇眶/ランプ簇眶¨ReLu∷を毋として蝗脫した。その8ビットでのReLu遍換の漣にデ〖タを32ビットから8ビットに恃垂する。

恃垂の數(shù)恕は、掐蝸の32ビットデ〖タ柒のMaxとMinの粗を256に尸充して、俐妨に0-255 (8ビットの臘眶山附に恃垂)で充り燒ける。なおこの俐妨に充り燒ける緘恕はDeep Compression∈徊雇獲瘟45∷で蝗脫されている緘恕と票じである。ReLuを8ビットで遍換した稿、潤翁灰步を乖う。寶婁の哭は驢霖の龐面冊鎳を猴近しスリム步したものである。もちろん、翁灰步が叫丸ていない遍換があればその嬸尸は32ビット赦瓢井眶爬で遍換するとのことだ。

草瑪はちょっとした疙汗が券欄する爬のようだ。翁灰步の狠の摧め疙汗である。拒嘿はLibrary∈徊雇獲瘟96、Blog徊救∷を粕み妄豺する澀妥がある。Stanford絡(luò)池およびUC BerkleyのDeep Compression嬸騾との的俠があった∈徊雇獲瘟96のコメント抨蠱腕∷。Pete Warden會の罷斧は、Deep Compressionは遍換翁が驢すぎるとのことであった。
禱窖弄にはシンプルだが、瞥掐の秦肥∈デ〖タセンタの遍換翁の回眶簇眶弄な籠裁∷と冉們妄統(tǒng)∈ともかく借妄箕粗の沒教∷が督蹋考い。鏈攣の瓢きを斧ているとTensorFlowの認跋という軀りを涂えながら、エッジ/IoTへの悸乖借妄敗乖を裁廬步させるという里維が赦き叫てくる。TPUはLSIもしくはIPとしてその里維コアとして疤彌づけられると斧ることもできる。

哭37 デ〖タ翁灰步の緘界　∈Pete Warden會のBlog(徊雇獲瘟96)を徊雇に侯喇した∷

哭37 デ〖タ翁灰步の緘界　∈Pete Warden會のBlog(徊雇獲瘟96)を徊雇に侯喇した∷

(2)Deep Compression　(Stanford絡(luò)池など) ×稱妥燎禱窖×
哭35に績すように、Stanford絡(luò)池のSon Han會らの辦息の券山∈徊雇獲瘟101、45、46∷をベ〖スとして、UC Berkleyのメンバ〖が裁わり、乖った呵糠のネットワ〖クモデルSqueeze Netへの努脫、さらにはStanford絡(luò)池の怠常溯條の漓嚏踩たちとの鼎票倡券であるNMT(Neural Machine Translation¨ニュ〖ラル怠常溯條)への努脫と、かなり絡(luò)がかりに甫墊倡券が乖われてきた。

塑灌では、企つの俠矢を胺う。辦つ謄は2015鉗10奉に券山、Pruningに簇して胺った俠矢、企つ謄は、翁灰步およびハフマン射規(guī)步を崔めたDeep Compressionを討灣弄に胺った塑炭の俠矢である。

哭38　Deep Compressionの暗教のステップ　∈徊雇獲瘟45を徊雇にして侯喇∷

哭38　Deep Compressionの暗教のステップ　∈徊雇獲瘟45を徊雇にして侯喇∷

俠矢∈徊雇獲瘟45∷を徊雇にして哭38を侯喇した。Deep Compressionは3つのPruning、クラスタ步∈翁灰步∷、およびハフマン射規(guī)步∈ロスレス∷からなる暗教禱窖の另疚だ。クラスタ步は翁灰步と咐われているが、Google家のTPUで蝗脫しているものと禱窖柒推は佰なる。また哭38に績すように悸狠には、Pruning稿の荒った腳みの疤彌攫鼠を暗教する暗教誤呈羌數(shù)及∈CSC¨Compressed Sparse Column∷、さらには掐蝸デ〖タに灤して乖うゼロスキップがある∈デ〖タの暗教に簇してはこの禱窖のみを脫いている∷。なお、ゼロスキップはEyerissが悸劉しているものと晾いは票屯である。

緘界を績すようStep1×Step5を燒淡した。この5つのStepのうち、Pruningとクラスタ步は籃刨の昔步の材墻拉があるが、それ笆嘲はロスレスで塑丸籃刨への逼讀は痰い。なお、Pruningおよびクラスタ步では昔步が彈こらない認跋での暗教を乖っている∈昔步は0.4%笆布∷。

∈ア∷Pruning禱窖 ∈徊雇獲瘟101∷
泣塑胳に條すと、≈晦おとし∽とか≈羊年∽とかぴったりの嘆漣があるが、どうも禱窖脫胳としてはいまひとつなのでそのまま、Pruningを蝗脫する。腳みの暗教は
(1)腳みの翁∈眶∷ˇˇˇPruning
(2)腳みの疤彌攫鼠ˇˇˇ暗教誤呈羌數(shù)及
(3)腳みのビット眶∈翁灰步/クラスタ〖步∷ˇˇˇクラスタ步
の話つの攫鼠翁をいかに暗教するかにある。腳みの翁を負らし、腳みのビット眶を故る。しかし、世巢として (2)の腳みの疤彌攫鼠が澀妥となる。晦を皖として暗教するが、どこの晦を荒したのかを承えておく澀妥がある。塑禱窖では、漓脫のメモリ∈諒マトリクス∷を脫罷している。SRAMだ。

哭39 Pruning禱窖の棱湯　(a) ネットワ〖ク、　(b) 腳みの尸邵の恃步　徊雇獲瘟101を徊雇に侯喇

哭39 Pruning禱窖の棱湯　(a) ネットワ〖ク、　(b) 腳みの尸邵の恃步
徊雇獲瘟101を徊雇に侯喇

Pruningの緘界∈徊雇獲瘟101∷
哭39(a)のネットワ〖クの哭のように、稍妥な≈晦/儡魯∽をそぎ皖とし、≈ニュ〖ロン∽を猴近する。その灤據(jù)となるのは哭39(b)に績す稍妥なものである。哭(b)も俠矢を徊雇に侯喇した。懼婁の哭が呵介の池漿により評た腳みの尸邵を績す。この眷圭は∞0.015の粗にほとんどのものが掐っている。Pruningの灤據(jù)は、腳みの猛が井さいものである。なぜなら、猛が井さいので肌檬への逼讀が警ないからである。Deep Compressionでは≈しきい猛∽を肋年して推枷なくPruningする。また腳みが鏈てゼロの箕、もしくは叫蝸猛がゼロの箕ニュ〖ロン極攣も猴近する。しきい猛の肋年の數(shù)恕には迫極の緘恕が掐っているらしい。あまり湯澄に今かれていない∈稱霖髓にPruningをするとか、鏈パラメ〖タをどの屯に尸充するかの緘恕らしい∷。

猴近した稿、浩池漿を帆り手す。池漿レ〖トを1/10に皖として銘謙に乖う。びっくりしないようにゆっくりやるので箕粗が齒かる。猴近した稿の腳みの尸邵を(b)の布婁の哭に績した。その眶は1/9となった。尸邵は介袋覺輪より弓がりを積つ。プラスˇマイナスの2つの賴憚尸邵の妨になっている爬が督蹋考い。娃擴拉、督食拉シナプスを息鱗させる。

さて、この禱窖のオリジンは30鉗漣に撂る。徊雇獲瘟102·103, 104にあるように、1990鉗漣稿に澄惟した禱窖のリバイバルである。潑にYann LeCun會∈徊雇獲瘟103∷により、かなり銘謙に浮皮されている。浩池漿、またかなり箕粗の齒かる爬、跟蔡が1/8である爬霹、貸に腆30鉗漣に鼠桂されている。さらに辦殊僻み哈み、エラ〖簇眶の2肌腮尸猛を呵警にする腳みを猴近する緘恕∈ある罷蹋BP恕に雇え數(shù)が奪い∷を脫いている。CNNの俠矢券山の9鉗漣である。LeCun會はご賂じのように附哼もディ〖プラ〖ニングの坤腸をリ〖ドされている數(shù)なのである鹼の炊瓢を承える。

しきい猛を絡(luò)きくすると暗教唯は懼がり、嫡にエラ〖唯も籠裁する。絡(luò)憚滔なネットワ〖ク(AlexNet/VGGNetのImagenet/ILSVRC)でエラ〖唯の礙步が絡(luò)きくても0.4%鎳刨と端めて井さい爬に病さえている。揉らの呵絡(luò)と冉們した暗教唯は1/9である。8/9は稍妥な遍換だった。稿揭するクラスタリング∈翁灰步∷崔めてどの鎳刨梧擊のタスクに鷗倡できるか∈啪敗池漿に蝗える∷はまだ夢る嘎り鼠桂はない。ニュ〖ラル怠常溯條(NMT)への炳脫毋は稿揭する。

疤彌攫鼠の暗教∈暗教誤呈羌數(shù)及¨CSC Compressed Sparse Column∷
漣揭したように、しきい猛によりそぎ皖とした儡魯∈晦∷の疤彌を承えておく澀妥がある。揉らが辦戎蝸を掐れている爬だ。哭40(a)の腳みマトリクスで承えておく。マトリクスを辦誤の攫鼠誤に彌き垂え、そぎ皖とした儡魯をゼロと斧なす。さらに鏈攣にゼロが驢いことから≈暗教誤呈羌數(shù)及∽を脫いてマトリクス攫鼠を暗教する。償咖のゼロは賂哼だけをカウントして疤彌攫鼠を暗教する。哭(a)の布婁に績した山淡だ。この山淡のために4ビットが澀妥となる。15改ゼロが息なることを雇えるとそうなる。馮蔡、Pruningで欄き荒った腳みは4ビットの疤彌攫鼠∈Index∷を積つ。笆懼がPruningの緘界と柒推である。これをハ〖ドウェアに悸劉した。

哭40　(a) 腳みの疤彌攫鼠の暗教、　(b) 腳みの猛のクラスタ步∈翁灰步∷ 徊雇獲瘟45を徊雇に侯喇

哭40　(a) 腳みの疤彌攫鼠の暗教、　(b) 腳みの猛のクラスタ步∈翁灰步∷
徊雇獲瘟45を徊雇に侯喇

∈イ∷腳みのクラスタ步∈翁灰步∷
腳みの疤彌は暗教したので、海刨は猛の暗教だ。Deep Compressionでは、稱霖ごとに腳みをK士堆恕によりクラスタリングしている。哭40(b)に績すように、腳みをクラスタリングし、グル〖プ戎規(guī)が腳みに侖わる。悸狠の猛はグル〖プの洛山猛∈Centroid¨32ビット∷になる。池漿は哭40(b)に績した洛山猛に灤して、バックプロパゲ〖ション恕による池漿を瓤鼻させることにより乖う。なお、この洛山猛の池漿箕の介袋猛は呵絡(luò)、呵井猛に灤して堆辦に肋年される。この帽姐なクラスタリング恕だが、揉らが鵝汐した爬だと夸弧する。

∈ウ∷ハフマン射規(guī)步
Deep Compressionでは、ハフマン射規(guī)步を脫いている。ロスレスの暗教禱窖である。塑淚での棱湯は充唉する∈徊救獲瘟45∷。

∈エ∷ゼロスキップ
哭40(a)の掐蝸ベクタ〖と腳みマトリクスのマトリクスˇベクタ〖遍換の狠に、掐蝸ベクタ〖猛の妥燎ゼロの眷圭はその嬸尸の遍換をスキップすする。Eyerissでは50%鎳刨の暗教の跟蔡があったが、EIEの眷圭には、禍漣にPruningが乖われていることから跟蔡は警ないと夸盧している。鏈攣攙烯菇喇鏈忍に浮夢システムを悸劉しないといけないようでかなり腳たい禱窖だ。ちなみにEyerissでは、帽姐に稱PE柒でデ〖タを浮夢しているだけのようだ。

笆懼、Deep Compressionの稱暗教のStep 1×5∈哭38∷を腔酶はあるが、棱湯した。

苞き魯き、剩眶の俠矢鏈攣を徊雇にしてまとめた馮蔡を績す。
哭41で、暗教のフロ〖(a)と稱ステップでの暗教の跟蔡の萎れ(b)を棱湯する。デ〖タに簇してはベクトル遍換をする狠に、ゼロであればスキップする。腳みに簇しては、Pruningにより腳みの眶が9尸の1になった稿に、そのゼロ笆嘲の腳みの疤彌攫鼠に簇しては暗教誤呈羌數(shù)及を努脫する。4ビットの疤彌攫鼠∈Sparse Indexes∷に礁腆される。オ〖バ〖ヘッドは16%となる。腳みに簇してはクラスタリングで翁灰步を乖う。

32ビットから決哈み霖∈Conv∷は8ビットに暗教、鏈馮圭霖∈FC∷は5ビットにそれぞれクラスタ步される。8ビットは256鹼梧に尸けられ、5ビットは32鹼梧に尸けられたことになる。士堆は(b)に績したように5.4ビットとなる。票箕に256鹼梧かつ32鹼梧の圭紛288鹼梧32ビットの洛山∈Centroid∷の腳みをコ〖ドブックとして積つ。AlexNetの眷圭、そのオ〖バ〖ヘッドは0.1%と端めて井さい。その稿、ハフマン射規(guī)步を沸て、腳みは士堆4ビットで山附され、疤彌攫鼠は3.2ビットで山附されるようになる。呵稿の悸狠の遍換では、嫡射規(guī)步霹を乖い姥下の遍換を乖う。

なお、廟罷してほしい爬は、哭41(a)の射規(guī)步の嬸尸は、池漿の檬超でオフラインで乖っておく侯度である。悸乖では、嫡射規(guī)步とデ〖タのゼロ猛の浮叫が肩なEIEの侯度となる。

哭41 Deep Compressionでの暗教の萎れ　∈徊雇獲瘟45を徊雇に侯喇∷

哭41 Deep Compressionでの暗教の萎れ　∈徊雇獲瘟45を徊雇に侯喇∷

(3)EIE (Energy Efficient Inference Engine¨Stanford絡(luò)池)×モバイル努脫を晾う
漣灌に苞き魯き、Deep Compression簇息である。LSIへの悸劉∈CADレベル∷したものが部刨も棱湯しているEIE(Energy Efficient Inference Engine¨徊雇獲瘟46)である。

揉らはEIEの悸劉では、笆布に績す爬で柒推を腮拇臘したり、俠矢の柒推を恃えている。
1.ハフマン射規(guī)步∈嫡射規(guī)步∷は崔まれていない。
2.鏈攣のビット眶は16ビット蓋年井眶爬が叫券爬。
3.デ〖タにゼロスキップを掐れている∈暗教唯は3擒と絡(luò)きい∷。
4.鏈馮圭に腳きを彌いている∈RNN/LSTM、極臉咐胳への鷗倡霹∷。
5.嫡射規(guī)步と、デ〖タのゼロ猛の浮叫により、悸乖が乖われる。
6.戮のLSI禍毋との孺秤/繞脫墑(GPU/CPU)を裁えた。

LSIとしての怠墻は、Pruning、クラスタ步∈翁灰步∷の嫡射規(guī)步と、ゼロ猛の浮叫と、そしてニュ〖ラルネットワ〖クの奶撅の悸乖である。潑侍な攙烯の悸劉が澀妥だ。嫡射規(guī)步攙烯霹を瞥掐しないと、100 GOPS鎳刨の拉墻だが、瞥掐すると3TOPSと30擒の廬刨猖簾が評られる。奶撅のCPU/GPUで悸乖すると、その廬刨猖簾は3擒鎳刨と淡されている。ハ〖ドウェアで漓脫步することから辦峰拉墻が懼がることになる。攙烯弄にはハフマン射規(guī)步∈嫡射規(guī)步∷への灤炳は掐れていない。妄統(tǒng)は稍湯である。答潔となるビット眶は32ビットではなく、16ビットまで布げている。禍漣に浮沮して昔步がないと冉們しての16ビットの何脫だ。8ビットは昔步が楓しかった。

紛換の緘界は笆布となる。デ〖タ∈Activation∷の潤ゼロ浮叫を乖う。面看の擴告ユニット∈Central Control Unit∷で64改の遍換ユニットPE (Processing Element)に潤ゼロ猛の遍換を尸芹している。ひまそうな遍換ユニットPEに遍換をさせるように擴告している。その狠に、掐蝸デ〖タの猛とデ〖タの疤彌∈index∷をペアで流慨する。疤彌攫鼠を傅に灤炳する腳みの猛と海刨は腳みの疤彌を嫡射規(guī)步する。その狠にSRAM柒の諒乖誤の猛を蝗い、またコ〖ドブックより腳みの悸狠の猛を苞っ磨ってくる。その稿やっと姥下の遍換をする。

哭 42 EIEの車妥慌屯 ∈徊雇獲瘟46を徊雇に侯喇∷

哭 42 EIEの車妥慌屯　∈徊雇獲瘟46を徊雇に侯喇∷

チップの菇喇とラフなレイアウトを、徊雇獲瘟46を徊雇にして侯喇した。稱PEは遍換嬸を面看に鏈攣の75%を貍めるSRAM∈腳み諒乖誤脫∷が艱り跋む菇喇となる(memoryの貍銅唯は93%にも懼る)。SRAM∈腳み諒乖誤∷がパワ〖に貍める充圭は54%だ。遍換極攣のエネルギ〖久銳は10%と井さい。

AlexNet8, GoogLeNet22,そしてResNet34が烹很材墻
哭42の寶婁の慌屯拉墻を績した。オンチップメモリの翁は10MB動だ。AlexNetの腳みに澀妥なメモリ翁は、潤暗教で240MB∈32ビット垂換∷、Pruningとクラスタ步∈翁灰步∷で27尸の1に暗教されるとすると、9MB鎳刨の腳み脫の推翁が澀妥なので、ほぼぎりぎりAlexNetのネットワ〖クが呈羌できる。また、決哈み霖が肩攣のGoogLeNet22、ResNet34も暗教唯を10擒鎳刨と斧姥もっても、途偷を積って烹很材墻だ。

800MHz瓢侯で、悸乖3TOPSの遍換墻蝸を肛る。エネルギ〖跟唯は5TOPS/Wと仆叫して紊い。28nmを漣捏として4擒にすると拉墻は∵0.8となるも、ほぼ8mm逞でかなり鏈馮圭タイプのネットワ〖ク∈RNN∷が悸附できそうだ。

(4)暗教數(shù)及のまとめˇˇˇ諒暗教、翁灰步、ロスレス暗教
山7に海まで揭べてきたいくつかのニュ〖ロチップの暗教禱窖をまとめた。肌淚で棱湯するTrueNorthも徊雇に掐れてある。暗教には、腳みとデ〖タに灤するものがあるが、腳みにはピンク咖を、デ〖タには搏渦咖をつけて斧やすくしている。稱瀾墑嘆の布に肩に努脫している霖∈Layer∷を淡很してある。毋えばEIEは肩にFC霖∈鏈馮圭霖∷に緬謄している。それに灤してEyrissはCONV霖∈決哈み霖∷に潑步している∈徊雇獲瘟92には鏈馮圭霖での浮皮も乖っている∷。

チップで斧ると、TPU、EIE、IoEが姥端弄で、Eyerissはオ〖ソドックスだ。紛換肩攣房でデ〖タの暗教(ゼロスキップ崔め)を媽辦庭黎としていると斧ることができる。

山7のように暗教を3つに尸違することができる。諒暗教は、帽姐にゼロと斧なしてカットしてしまう暗教恕としてまとめている。エラ〖唯に逼讀が叫る眷圭がある。翁灰步は、それぞれの緘恕により猛を彌き垂えることによりビット眶を暗教している。ロスレス暗教は塑丸祿己のない暗教數(shù)及だ。∈なお、スキップ恕もロスレスの緘恕だ∷

∈ア∷諒暗教
ニュ〖ラルネットワ〖クに潑に潑魔弄とみることができるゼロ、もしくはゼロ奪收のデ〖タを猴近∈Pruning∷したりスキップしたりする動苞な數(shù)恕だ。寵拉步簇眶ReLUが跟蔡を擒籠している。姥下遍換が答塑なので繳炭でもある∈姥により端井步し、下によって陵滬されゼロ步される∷。腳みの眷圭には瑯弄な暗教で、デ〖タの眷圭には瓢弄な暗教となる。かつ尉數(shù)恕ともに漓嚏弄な攙烯を掐れる澀妥がある。潑に腳りの眷圭には荒った儡魯を承えてかつ、悸乖では賴しく瓢侯させないといけないので剩花な磅據(jù)を減ける。デ〖タの眷圭にはダイナミックな緘恕が澀妥∈Eyrissでは、PE柒嬸での借妄に偽まっている∷。鏈馮圭の眷圭には儡魯が弓認でかつ1灤1であることからゼロと斧なせる材墻拉が光く跟蔡が絡(luò)きい∈10擒笆懼¨傅」鵑墓?!∷。そのことから澀寇禱窖だ。

∈イ∷翁灰步
TPUは帽姐な俐妨の暗教∈Max-Min猛を俐妨に256尸梧∷により8ビット步を乖っている。辦數(shù)、Stanford絡(luò)の刪擦∈EIE¨徊雇獲瘟46∷では8ビットでは拉墻昔步が絡(luò)きい∈AlexNet80%ⅹ53%∷との鼠桂もある。TPUでは努脫毋により蝗い尸けているということかもしれない∈なお、TPU極攣がビット眶材恃である材墻拉もある∷。

その爬、EIEはクラスタ步により暗教唯を懼げている。帽姐にやると8bitは痰妄だが、クラスタ步を乖うと士堆5.4ビット(決哈み霖8ビット、鏈馮圭霖5ビット)まで暗教が材墻だと肩磨している。潑檢攙烯が澀妥だ。より劑の光い數(shù)恕に、漣淚でも揭べたがIoEのフィルタ/カ〖ネル∈腳み∷のパタ〖ン步により暗教恕がある。光肌のカ〖ネルレベルでの射規(guī)步∈潑魔藐叫∷と斧ることもできる。しかし、雇えようによってはネットワ〖クの霖が渴むこと極攣が、カ〖ネルの藐據(jù)步∈マクロ步∷であるから部が部だかわからなくなる。海稿どのように渴むのか督蹋のある禱窖だ。

∈ウ∷ロスレス暗教
柒嬸でかなり暗教が渴めば、跟蔡は你く叫ると雇えられるが、1.5擒鎳刨の跟蔡が斧哈めるようだ。

山7 暗教禱窖の辦枉

山7 暗教禱窖の辦枉

暗教禱窖に簇するまとめ
決哈み霖∈潑にC房のCNN∷では途り蛔い磊った忽は艱りにくい。跟蔡が孺秤弄你めに叫るからだ。∈肌淚で揭べるSqueeze Netは掐れ哈んでいるが∷。
鏈馮圭霖を肩攣とするネットモデルでは、姥端弄な鷗倡があると鱗年している。眷圭によってはバイナリˇコネクトなりバイナライズドˇネットワ〖クの叫戎かもしれない∈徊雇獲瘟41、42∷。
介蠱の檬超から箕粗が沸ち、附箕爬(3奉)では2奉のISSCC2017、第び2奉稿染のFPGA2017(International Symposium on FPGA 2017)の柒推も冉湯している。詞帽に揭べると、決哈み霖をタ〖ゲットにISSCC2017ではデ〖タ/砷操鼎に翁灰步を乖う禱窖の鼠桂があった。霖髓でビット眶を呵努步する緘恕∈4-9bit∷、さらには靠にダイナミック∈Real Time∷に呵努ビット眶を浮夢し悸乖する數(shù)恕の鼠桂があった。かなり嘎腸まで低め磊った磅據(jù)を減けた。FPGA2017では1bit(Binary/XNOR) /2bit(ternary)に簇する禱窖の鼠桂が攔んになされた。この禱窖に簇してはある鎳刨禱窖弄に數(shù)羹拉が斧えつつ銅りまた草瑪も斧えてきた覺斗である。

笆懼、媽4鞠では4.1淚から4.3淚に齒けて、CNN、DNN、および暗教禱窖に簇してのニュ〖ロチップの拒嘿を鼠桂した。呵姜の媽5鞠では呵奪の瓢羹を裁える。ニュ〖ロモルフィックチップとして呵奪糠しい弓がりを斧せるIBMのTrueNorthと暗教禱窖∈Deep Compression∷の悸劉毋を疽拆する。呵稿に塑大蠱のまとめとして瓢羹と海稿の草瑪を揭べる。

試礁廟∷紗昆會の附哼の釜今は、頌長蘋絡(luò)池絡(luò)池薄攫鼠彩池甫墊彩池窖甫墊鎊である。

徊雇獲瘟 (1×88まではこれまでの≈ニュ〖ロチップ車俠∽徊救)

TeraDeep家の糠劉のホ〖ムペ〖ジ
Market Video, "TeraDeep's Industry-First FPGA-based AI Inference Fabric Speeds Image Recognition, Video Analytics for On-Premise Appliances", October 18, 2016, TeraDeepの悸劑弄なPress Release/Xilinx/Micron, 20181018.
XLINX, "TeraDeep's real-time video analytics run on (gasp) FPGA-based Micron/Pico Computing AC-510 platform", XILINXのDaily Blog, 20161018.
Yu-Hsin Chen, Joel Emer and Vivienne Sze, "Eyeriss: A Spatial Architecture for Energy-Efficient Dataflow for Convolutional Neural Networks", 2016 ACM/IEEE 43rd Annual International Symposium on Computer Architecture (ISCA), EyerissのFull Paper惹, 2016鉗6奉18泣.
排灰攫鼠 2016鉗10奉16泣,"Google、IBM、AMD、NVIDIAなどがより光廬な繞脫インタ〖コネクト≈Open CAPI∽券山。サ〖バを10擒光廬步にすると"
Norm Jouppi, Distinguished Hardware Engineer, Google, "Google supercharges machine learning tasks with TPU custom chip", Google Could Platform Blog, 20160518, Google, TPUの券山
排灰攫鼠, Stacey Higginbotham, "Google Takes Unconventional Route with Homegrown Machine Learning Chips", The Next Platform, May 19, 2016, TPUに簇して孺秤弄籃刨の光かった排灰攫鼠, 20160519.
Pete Warden's Blog, "How to quantize neural networks with TensorFlow", TPUに蝗われていると鱗年されている翁灰步禱窖, 20160503.
IT Media, "Google、客供夢墻炳脫のシティガイド措度≈JetPac∽を傾箭"
EETimes Europe, Peter Clarke, "IoT processor beats Cortex-M, claims startup", TPUがIPコア∈茶嚨千急∷としてIoTチップに烹很徒年∈GAP8∷, 20161104.
Quoc V. Le & Mike Schuster, "A Neural Network for Machine Translation, at Production Scale", Google Research Blog, 20160927, GNMT(Google Neural Machine Translation)に簇しての疽拆淡禍∈俠矢の券山にあたって∷
Yonghui Wu, Mike Schuster, Zhifeng Chen, Quoc V. Le, Mohammad Norouzi, Wolfgang Macherey, Maxim Krikun, Yuan Cao, Qin Gao, Klaus Macherey, Jeff Klingner, Apurva Shah, Melvin Johnson, Xiaobing Liu, Lukasz Kaiser, Stephan Gouws, Yoshikiyo Kato, Taku Kudo, Hideto Kazawa, Keith Stevens, George Kurian, Nishant Patil, Wei Wang, Cliff Young, Jason Smith, Jason Riesa, Alex Rudnick, Oriol Vinyals, Greg Corrado, Macduff Hughes, Jeffrey Dean, "Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation", GNMTの俠矢, 2016鉗10奉8泣.
Song Han, Jeff Pool, John Tran, William J. Dally, "Learning both Weights and Connections for Efficient Neural Networks", Pruning禱窖、スタンフォ〖ド絡(luò)池、2015鉗10奉30泣.
Stephen Jose Hanson and Lorien Y Pratt, "Comparing biases for minimal network construction with back-propagation", In Advances in neural information processing systems, pages 177-185, 1989, 介袋のPruning禱窖.
Yann Le Cun, John S. Denker, and Sara A. Solla, "Optimal brain damage", In Advances in Neural Information Processing Systems, pages 598-605. Morgan Kaufmann, 1990, 介袋のPruning禱窖∈儡魯眶を負らした∷.
Babak Hassibi, David G Stork, et al, "Second order derivatives for network pruning: Optimal brain surgeon", Advances in neural information processing systems, pages 164-164, 1993, 介袋のPruning禱窖.

ご罷斧ˇご炊鱗

久久成人18免费_日韩欧美网址_无遮挡1000部拍拍拍免费观看_一区二区在线免费视频

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(4-3)

Breaking News

2025鉗10奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

久久成人18免费_日韩欧美网址_无遮挡1000部拍拍拍免费观看_一区二区在线免费视频

ニュ〖ロチップ車棱 ×いよいよ染瞥攣の叫戎(4-3)

Breaking News

2025鉗10奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

ニュ〖ロチップ車棱　×いよいよ染瞥攣の叫戎(4-3)