久久精品国产亚洲av黄站-亚洲激情三级视频在线看-日韩v国产v亚洲v精品Tv-国产区一区二区三区四在线免费看-人妻中文字幕高清无码-91精品91精品91精品-亚洲av色婷婷精品久久-色综合国产一区二区三区-国产91一区二区三区在线

歡迎進(jìn)入廣州光橋通信官網(wǎng),我們的產(chǎn)品有:光纖收發(fā)器,工業(yè)交換機(jī),電話光端機(jī),工業(yè)4G路由器.

他們都在找: 工業(yè)PoE交換機(jī)、光纖收發(fā)器、視頻光端機(jī)電話光端機(jī)、工業(yè)以太網(wǎng)交換機(jī)

當(dāng)前位置首頁 » 行業(yè)資訊 » 半定制人工智能芯片-FPGA芯片是最佳選擇

半定制人工智能芯片-FPGA芯片是最佳選擇

返回列表 來源:光橋 查看手機(jī)網(wǎng)址
掃一掃!半定制人工智能芯片-FPGA芯片是最佳選擇掃一掃!
瀏覽:- 發(fā)布日期:2018-01-03 10:14:29【

 一項(xiàng)深度學(xué)習(xí)工程的搭建,可分為訓(xùn)練(training)和推斷(inference)兩個(gè)環(huán)節(jié)。推斷(inference)環(huán)節(jié)指利用訓(xùn)練好的模型,使用新的數(shù)據(jù)去“推斷”出各種結(jié)論,如視頻監(jiān)控設(shè)備通過后臺(tái)的深度神經(jīng)網(wǎng)絡(luò)模型,判斷一張抓拍到的人臉是否屬于黑名單。雖然推斷環(huán)節(jié)的計(jì)算量相比訓(xùn)練環(huán)節(jié)少,但仍然涉及大量的矩陣運(yùn)算。在推斷環(huán)節(jié),除了使用CPU或GPU進(jìn)行運(yùn)算外,F(xiàn)PGA以及ASIC均能發(fā)揮重大作用。

3

FPGA(可編程門陣列,F(xiàn)ield Programmable Gate Array)是一種集成大量基本門電路及存儲(chǔ)器的芯片,可通過燒入FPGA配置文件來來定義這些門電路及存儲(chǔ)器間的連線,從而實(shí)現(xiàn)特定的功能。而且燒入的內(nèi)容是可配置的,通過配置特定的文件可將FPGA轉(zhuǎn)變?yōu)椴煌奶幚砥鳎腿缫粔K可重復(fù)刷寫的白板一樣。因此FPGA可靈活支持各類深度學(xué)習(xí)的計(jì)算任務(wù),性能上根據(jù)百度的一項(xiàng)研究顯示,對于大量的矩陣運(yùn)算GPU遠(yuǎn)好于FPGA,但是當(dāng)處理小計(jì)算量大批次的實(shí)際計(jì)算時(shí)FPGA性能優(yōu)于GPU,另外FPGA有低延遲的特點(diǎn),非常適合在推斷環(huán)節(jié)支撐海量的用戶實(shí)時(shí)計(jì)算請求(如語音云識(shí)別)。

FPGA和GPU內(nèi)都有大量的計(jì)算單元,因此它們的計(jì)算能力都很強(qiáng)。在進(jìn)行神經(jīng)網(wǎng)絡(luò)運(yùn)算的時(shí)候,兩者的速度會(huì)比CPU快很多。但是GPU由于架構(gòu)固定,硬件原生支持的指令也就固定了,而FPGA則是可編程的。其可編程性是關(guān)鍵,因?yàn)樗屲浖c終端應(yīng)用公司能夠提供與其競爭對手不同的解決方案,并且能夠靈活地針對自己所用的算法修改電路。

在平均性能方面,GPU遜于FPGA,F(xiàn)PGA可以根據(jù)特定的應(yīng)用去編程硬件,例如如果應(yīng)用里面的加法運(yùn)算非常多就可以把大量的邏輯資源去實(shí)現(xiàn)加法器,而GPU一旦設(shè)計(jì)完就不能改動(dòng)了,所以不能根據(jù)應(yīng)用去調(diào)整硬件資源。

目前機(jī)器學(xué)習(xí)大多使用SIMD架構(gòu),即只需一條指令可以平行處理大量數(shù)據(jù),因此用GPU很適合。但是有些應(yīng)用是MISD,即單一數(shù)據(jù)需要用許多條指令平行處理,這種情況下用FPGA做一個(gè)MISD的架構(gòu)就會(huì)比GPU有優(yōu)勢。 所以,對于平均性能,看的就是FPGA加速器架構(gòu)上的優(yōu)勢是否能彌補(bǔ)運(yùn)行速度上的劣勢。如果FPGA上的架構(gòu)優(yōu)化可以帶來相比GPU架構(gòu)兩到三個(gè)數(shù)量級的優(yōu)勢,那么FPGA在平均性能上會(huì)好于GPU。

在功耗能效比方面,同樣由于FPGA的靈活性,在架構(gòu)優(yōu)化到很好時(shí),一塊FPGA的平均性能能夠接近一塊GPU,那么FPGA方案的總功耗遠(yuǎn)小于GPU,散熱問題可以大大減輕。 能效比的比較也是類似,能效指的是完成程序執(zhí)行消耗的能量,而能量消耗等于功耗乘以程序的執(zhí)行時(shí)間。雖然GPU的功耗遠(yuǎn)大于FPGA的功耗,但是如果FPGA執(zhí)行相同程序需要的時(shí)間比GPU長幾十倍,那FPGA在能效比上就沒有優(yōu)勢了;反之如果FPGA上實(shí)現(xiàn)的硬件架構(gòu)優(yōu)化得很適合特定的機(jī)器學(xué)習(xí)應(yīng)用,執(zhí)行算法所需的時(shí)間僅僅是GPU的幾倍或甚至于接近GPU,那么FPGA的能效比就會(huì)比GPU強(qiáng)。

另外,F(xiàn)PGA的靈活性,很多使用通用處理器或ASIC難以實(shí)現(xiàn)的下層硬件控制操作技術(shù)利用FPGA可以很方便的實(shí)現(xiàn),從而為算法的功能實(shí)現(xiàn)和優(yōu)化留出了更大空間。同時(shí)FPGA一次性成本(光刻掩模制作成本)遠(yuǎn)低于ASIC,在芯片需求還未成規(guī)模、深度學(xué)習(xí)算法暫未穩(wěn)定需要不斷迭代改進(jìn)的情況下,利用具備可重構(gòu)特性的FPGA芯片來實(shí)現(xiàn)半定制的人工智能芯片是最佳選擇。

    【本文標(biāo)簽】:光纖交換機(jī) 工業(yè)交換機(jī) 以太網(wǎng)交換機(jī) 光纖收發(fā)器 電話光端機(jī) 光電轉(zhuǎn)換器 光端機(jī)
    【責(zé)任編輯】:光橋版權(quán)所有:轉(zhuǎn)載請注明出處