欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

地平線黃暢:BPU為什么比CPU/GPU更適合自動(dòng)駕駛?

2018-03-15 09:38:16 來源:車東西 熱度:
3月9日,上周五,由車東西兄弟單位智東西主辦的GTIC 2018全球AI芯片創(chuàng)新峰會(huì)在上海召開,大會(huì)邀請(qǐng)到來自芯片、安防、汽車和消費(fèi)電子等領(lǐng)域的近40位業(yè)界翹楚到場(chǎng)分享研發(fā)AI芯片的經(jīng)歷與思考。
 
整場(chǎng)大會(huì)有超過1萬(wàn)人報(bào)名,并且有數(shù)千名觀眾到場(chǎng),乃至于出現(xiàn)了大量觀眾因?yàn)闆]座而不得不站在大廳外面觀看電視直播的情況。
 
在大會(huì)下午場(chǎng)的自動(dòng)駕駛加速落地,AI芯片引領(lǐng)計(jì)算平臺(tái)”板塊,地平線公司的聯(lián)合創(chuàng)始人、算法副總裁黃暢做了主題為《AI芯片在自動(dòng)駕駛的應(yīng)用實(shí)踐》的主題演講,就地平線公司的產(chǎn)品研發(fā)歷程、AI芯片與傳統(tǒng)計(jì)算芯片的區(qū)別等關(guān)鍵問題進(jìn)行了分享,下面為黃暢演講的要點(diǎn)精析。

▲黃暢

一、AI算法與AI芯片齊頭并進(jìn)
地平線由前百度百度研究院副院長(zhǎng)、百度深度學(xué)習(xí)實(shí)驗(yàn)室主任余凱創(chuàng)辦于2015年7月,致力于為B端用戶提供涉及算法和硬件在內(nèi)完整的嵌入式人工智能解決方案(機(jī)器人大腦),說白一點(diǎn)就是其完整方案里既包含有AI算法,又有AI芯片,還有工具鏈和云服務(wù)。
 
黃暢表示,機(jī)器人大腦需要做的不僅僅包括圖像和視頻感知,還包括語(yǔ)音、語(yǔ)義處理,以及決策、規(guī)劃等比較復(fù)雜比較高階的人工智能程序,同時(shí)也需要非常關(guān)注解決方案的性能、成本、功耗的平衡,因此地平線在研發(fā)之初,也遇到了一些困難。
 
那么地平線為什么要選擇這樣一條看上去比較復(fù)雜比較困難的路徑呢?黃暢解釋稱是受到圖靈獎(jiǎng)獲得者、現(xiàn)代計(jì)算機(jī)的奠基人Alan Kay的影響。
 
據(jù)黃暢介紹,Alan Kay不僅提出了面向?qū)ο缶幊淘O(shè)計(jì)的概念,還曾說過一句對(duì)目前IT產(chǎn)業(yè)影響深遠(yuǎn)的名言——“如果你真的關(guān)注軟件,就應(yīng)該做自己的硬件”。正是這句名言,也促使喬布斯一直堅(jiān)持軟硬件一體的產(chǎn)品開發(fā)策略,打造出了蘋果這樣的頂級(jí)科技巨頭。
 
同樣的,Alan Kay這句名言,也激勵(lì)了包括余凱、黃暢等人在內(nèi)的地平線團(tuán)隊(duì)走上了軟硬結(jié)合的道路。
 
二、地平線的3代AI芯片架構(gòu)
黃暢在GTIC現(xiàn)場(chǎng)講到,如果按照智能決策處理順序,AI可以分成感知、建模、決策和規(guī)劃三個(gè)階段,基于這種分類,地平線也對(duì)應(yīng)規(guī)劃了名為高斯、伯努利和貝葉斯的三代BPU架構(gòu)。
 
▲地平線3代BPU架構(gòu)
2017年12月,地平線正式推出了兩款A(yù)I芯片——征程1.0和旭日1.0。雖然兩者都基于高斯架構(gòu)打造而來,但是用處卻大相徑庭,征程面向的是智能駕駛后裝市場(chǎng),而旭日則主攻智能攝像頭領(lǐng)域。
 
黃暢稱,從AI處理器的發(fā)展變革可以看出,越是面向?qū)iT計(jì)算的芯片架構(gòu)越能達(dá)到更好的功耗性能比,因此地平線就在高斯架構(gòu)的基礎(chǔ)上同時(shí)推出了這兩款芯片,每款芯片都針對(duì)相應(yīng)的領(lǐng)域進(jìn)行專門設(shè)計(jì),從而有利于發(fā)揮出最大運(yùn)算效能。
 
性能上,征程1.0處理器能夠處理攝像頭拍攝的1080P@30幀的視頻流,并最多對(duì)其中200+個(gè)物體進(jìn)行實(shí)時(shí)的跟蹤和識(shí)別,涉及行人、機(jī)動(dòng)車、非機(jī)動(dòng)車、車道線、交通標(biāo)志牌、紅綠燈等多類交通元素,可實(shí)現(xiàn)FCW前部碰撞預(yù)警、LDW車道偏離預(yù)警等駕駛輔助功能。此外,地平線還推出了基于征程1.0芯片的量產(chǎn)后裝ADAS產(chǎn)品。
 
黃暢表示,地平線做第一代芯片還是比較順利的,但是也存在約束和限制。在第二代BPU架構(gòu)伯努利中,地平線增加了其圖像識(shí)別的細(xì)粒度,并加入了建模的能力。在基于FPGA進(jìn)行驗(yàn)證的階段,伯努利架構(gòu)就已經(jīng)可同時(shí)處理來自攝像頭、雷達(dá)、激光雷達(dá)等傳感器的最多8路數(shù)據(jù),以期能在其上做無人車所必須的傳感器數(shù)據(jù)融合功能。
 
由于細(xì)粒度得以提升,黃暢稱其第二代BPU架構(gòu)能夠在像素級(jí)別進(jìn)行感知,能夠更精確地分辨出路面、人體、汽車、建筑、樹木等物體,進(jìn)行圖像分割。此外,更精準(zhǔn)、更多路的感知結(jié)果將最終為環(huán)境的建模服務(wù),可以從各個(gè)角度進(jìn)行觀測(cè)。
 
▲二代BPU感知能力演示
從黃暢在現(xiàn)場(chǎng)通過視頻演示了基于伯努利架構(gòu)的早期產(chǎn)品(FPGA)在高速公路、城市道路上進(jìn)行感知測(cè)試的視頻來看,第二代BPU架構(gòu)的計(jì)算能力確實(shí)較強(qiáng),不管是識(shí)別、追蹤還是語(yǔ)義分割,都有不錯(cuò)的效果。
 
三、用BPU提升AI計(jì)算效率
黃暢在進(jìn)行完視頻演示后講到,其利用BPU給自動(dòng)駕駛提供感知能力的核心理念是在不同尺度的空間中進(jìn)行信息的融合,利用了非常底層的配準(zhǔn)對(duì)齊,利用冗余度降低復(fù)雜度等軟件技術(shù)。
 
但他同時(shí)也強(qiáng)調(diào)道,僅有算法的進(jìn)步是不夠的,“如果只有算法的進(jìn)步,而計(jì)算的原器件(處理器)不相應(yīng)進(jìn)行迭代,就無法體現(xiàn)新技術(shù)的優(yōu)勢(shì)。即使經(jīng)過精密設(shè)計(jì)過的CPU、GPU通用處理器也遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)今的計(jì)算需求,使得器件利用率變得相當(dāng)?shù)汀?rdquo;
 
為此,地平線才推出了自主設(shè)計(jì)研發(fā)的BPU架構(gòu)。據(jù)黃暢介紹,地平線的BPU是一款典型的異構(gòu)多指令多數(shù)據(jù)的系統(tǒng),架構(gòu)中心處理器是完整的系統(tǒng),存儲(chǔ)器架構(gòu)設(shè)計(jì)進(jìn)行了特別優(yōu)化,能使數(shù)據(jù)自由傳遞,進(jìn)行多種計(jì)算,讓不同部件同時(shí)運(yùn)轉(zhuǎn)起來,提高AI運(yùn)算的效率。
 
▲BPU架構(gòu)
那么為什么通用處理器的算理就不如BPU呢?
除了上述異構(gòu)多指令多數(shù)據(jù)流計(jì)算架構(gòu)對(duì)多種算法的支持,黃暢解釋道,“如果按照通用處理器的方法去做的話會(huì)非常難取舍,如果脫離開應(yīng)用場(chǎng)景、算法不斷迭代以及對(duì)算法的預(yù)估,其實(shí)你對(duì)每個(gè)東西的取舍以及規(guī)模大小是無從下手的。而恰恰我們更加關(guān)注應(yīng)用,關(guān)注算法的取舍,因此其在對(duì)芯片架構(gòu)的取舍、規(guī)模以及元器件的掌握都比較準(zhǔn)確。”
 
結(jié)語(yǔ):AI芯片時(shí)代開啟
近兩年,已經(jīng)有幾十年歷史的老技術(shù)——人工智能迅速躥紅,不僅出現(xiàn)在了科技圈,還出現(xiàn)在了電視、手機(jī)、音箱、APP,甚至是政府工作報(bào)告里,其火熱程度可見一斑。而這輪人工智能熱潮的崛起,又與深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等底層技術(shù)密切相關(guān)。
 
在深度學(xué)習(xí)框架、AI算法等軟件技術(shù)演進(jìn)的同時(shí),AI相關(guān)硬件也在發(fā)生變化。
 
2011年,谷歌等AI先行者主要使用CPU來推進(jìn)AI項(xiàng)目,2012年,百度深度學(xué)習(xí)實(shí)驗(yàn)室引入了業(yè)內(nèi)比較前沿的通過GPU來運(yùn)行深度學(xué)習(xí)算法的玩法。
 
但需要指出的是,雖然適合并行計(jì)算的GPU天生比CPU更適合做深度學(xué)習(xí)運(yùn)算,但GPU與CPU本質(zhì)上也都屬于通用處理器,因此其在深度學(xué)習(xí)這種單一領(lǐng)域,其單位計(jì)算性能不如ASIC這種特定用途的處理器那么強(qiáng),乃至也不如可編程的FPGA。
 
而隨著深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等底層技術(shù)的持續(xù)演進(jìn)與AI技術(shù)在自動(dòng)駕駛、智慧城市、智慧金融等領(lǐng)域的落地與部署,人工智能技術(shù)對(duì)計(jì)算能力的需求繼續(xù)快速提升。
 
因此,百度深度學(xué)習(xí)實(shí)驗(yàn)室在2014年又將FPGA引入了AI運(yùn)算中;地平線在2015年推出了BPU架構(gòu);谷歌在2016年又推出了TPU等專用的AI芯片,進(jìn)而正式拉開了AI芯片時(shí)代的大幕。

責(zé)任編輯:王維