欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

清華微電子所團隊提出AI芯片的存儲優(yōu)化新方法

6月2日 ~ 6日,第45屆國際計算機體系結(jié)構大會(International Symposium on Computer Architecture,簡稱ISCA)在美國洛杉磯召開。清華大學微電子所博士生涂鋒斌在會上做了題為《RANA:考慮eDRAM刷新優(yōu)化的神經(jīng)網(wǎng)絡加速框架》(RANA: Towards Efficient Neural Acceleration with Refresh-Optimized Embedded DRAM)的報告。該研究成果大幅提升了人工智能計算芯片的能量效率。
 
清華微電子所團隊提出AI芯片的存儲優(yōu)化新方法-DVBCN
 
ISCA是計算機體系結(jié)構領域的頂級會議。本次大會共收到378篇投稿,收錄64篇論文,錄用率僅為16.9%。本文是今年中國唯一被收錄的署名第一完成單位的論文。尹首一副教授為本文通訊作者,論文合作者還包括清華大學微電子所魏少軍教授和劉雷波教授等。
 
清華微電子所團隊提出AI芯片的存儲優(yōu)化新方法-DVBCN
 
隨著人工智能應用中神經(jīng)網(wǎng)絡規(guī)模的不斷增大,計算芯片的大量片外訪存會造成巨大的系統(tǒng)能耗,因此存儲優(yōu)化是人工智能計算芯片設計中必須解決的一個核心問題??芍貥嬔芯繄F隊提出一種面向神經(jīng)網(wǎng)絡的新型加速框架:數(shù)據(jù)生存時間感知的神經(jīng)網(wǎng)絡加速框架(RANA)。RANA框架采用了三個層次的優(yōu)化技術:數(shù)據(jù)生存時間感知的訓練方法,混合計算模式和支持刷新優(yōu)化的eDRAM存儲器,分別從訓練、調(diào)度和架構三個層面優(yōu)化整體系統(tǒng)能耗。實驗結(jié)果顯示,RANA框架可以消除99.7%的eDRAM刷新能耗開銷,而性能和精度損失可以忽略不計。相比于傳統(tǒng)的采用SRAM的人工智能計算芯片,使用RANA框架的基于eDRAM的計算芯片在面積開銷相同的情況下可以減少41.7%的片外訪存和66.2%的系統(tǒng)能耗,使人工智能系統(tǒng)的能量效率獲得大幅提高。
 
可重構計算團隊近年來基于可重構架構設計了Thinker系列人工智能計算芯片(Thinker I,Thinker II,Thinker S),受到學術界和工業(yè)界的廣泛關注。可重構計算團隊此次研究成果,從存儲優(yōu)化和軟硬件協(xié)同設計的角度大幅提升了芯片能量效率, 為人工智能計算芯片的架構演進開拓了新方向。
相關文章
廣電視聽智能體(AI Agent)開發(fā)工具在短視頻創(chuàng)作領域得到應用
廣電視聽智能體(AI Agent)開發(fā)工具在…
注意!9月1日起,AI生成合成內(nèi)容必須添加標識
注意!9月1日起,AI生成合成內(nèi)容必須添…
全國人大代表、南京郵電大學校長葉美蘭:加快推進6G等新技術創(chuàng)新發(fā)展 培養(yǎng)“AI+x”復合型人才
全國人大代表、南京郵電大學校長葉美蘭…
華數(shù)全面部署DeepSeek,探索“AI+廣電”生態(tài)新路徑
華數(shù)全面部署DeepSeek,探索“AI+廣電”生…
廣東廣電網(wǎng)絡完成DeepSeek私有化部署,實現(xiàn)首批AI應用升級換“腦”
廣東廣電網(wǎng)絡完成DeepSeek私有化部署,…
吉林廣電「整活兒」AI深夜搞事情!DeepSeek全鏈平臺灰度跑通
吉林廣電「整活兒」AI深夜搞事情!DeepS…
我還沒有學會寫個人說明!