隨著深度學(xué)習(xí)對(duì)人工智能的巨大推動(dòng),深度學(xué)習(xí)所構(gòu)建的多層神經(jīng)網(wǎng)絡(luò)模型的參數(shù)空間已從百萬(wàn)級(jí)上升到百億級(jí),這對(duì)計(jì)算能力提出了新的挑戰(zhàn)。相比CPU,GPU更適合深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,可進(jìn)行高度統(tǒng)一、相互無(wú)依賴的大規(guī)模并行計(jì)算。
阿里云發(fā)布的最新一代異構(gòu)計(jì)算通用GPU實(shí)例GN5規(guī)格族就是一款用于搭建深度學(xué)習(xí)加速平臺(tái)的云端利器。
“品學(xué)兼優(yōu)”的GN5采用了NVIDIA Pascal架構(gòu)旗艦級(jí)P100 GPU,可在云端按需構(gòu)建敏捷彈性、高性能和高性價(jià)比的深度學(xué)習(xí)平臺(tái),讓用戶以最簡(jiǎn)便地方式享用阿里云遍布全球的高效、穩(wěn)定的云基礎(chǔ)設(shè)施資源。
與上一代相比,GN5的單實(shí)例性能拓展了5倍,單實(shí)例最多可提供8個(gè) NVIDIA P100 GPU,提供2萬(wàn)多個(gè)并行處理核心,最高75TFLOPS FP32單精度浮點(diǎn)、150 TFLOPS FP16半精度浮點(diǎn)和38 TFLOPS FP64雙精度浮點(diǎn)運(yùn)算能力。
自建GPU物理服務(wù)器經(jīng)常會(huì)遇上擴(kuò)容難、適配難的難題,GN5規(guī)格族提供了靈活彈性的系列化配置,可以根據(jù)深度學(xué)習(xí)計(jì)算力的要求,按需選擇合適的規(guī)格,分鐘級(jí)即可完成實(shí)例的創(chuàng)建,并可根據(jù)運(yùn)算力需求進(jìn)行GPU實(shí)例的“Scale-out”水平擴(kuò)容或“Scale-up”垂直變配。
為了更好地發(fā)揮GN5多GPU卡并行計(jì)算效率,GN5支持GPUDirect,通過(guò)GPU卡之間點(diǎn)對(duì)點(diǎn)通信,可讓GPU之間在無(wú)需CPU干預(yù)下,直接通過(guò)PCIe的總線進(jìn)行高帶寬低時(shí)延的互聯(lián)通信,極大地提升了深度學(xué)習(xí)訓(xùn)練中模型參數(shù)交換效率。
除了GPU外,深度學(xué)習(xí)還需要有海量的數(shù)據(jù)存儲(chǔ)能力、業(yè)務(wù)服務(wù)能力、監(jiān)控能力等,這在傳統(tǒng)模式下復(fù)雜度高、工作量大、費(fèi)時(shí)費(fèi)力。而GN5實(shí)現(xiàn)了與ECS彈性計(jì)算生態(tài)的完美結(jié)合,可與OSS對(duì)象存儲(chǔ)、NAS文件存儲(chǔ)等打通,滿足深度學(xué)習(xí)海量訓(xùn)練數(shù)據(jù)的低成本存儲(chǔ)和訪問要求;通過(guò)EMR服務(wù)進(jìn)行預(yù)處理;通過(guò)云監(jiān)控服務(wù)進(jìn)行GPU資源的監(jiān)控與告警;通過(guò)負(fù)載均衡、彈性伸縮、資源編排等快速在云端搭建完整彈性GPU服務(wù);并可搭配容器服務(wù)使用,簡(jiǎn)化部署和運(yùn)維的復(fù)雜度,提供資源調(diào)度服務(wù)等。
GN5實(shí)例支持靈活的使用支付方式,用戶可以按年支付以獲得最高的使用折扣;也支持按月周期付費(fèi),以降低用戶的計(jì)算資源使用一次性投入成本,并且具有相對(duì)較低的單位小時(shí)使用價(jià)格;同樣支持按小時(shí)的付費(fèi)方式使用戶以最低的單次使用成本來(lái)應(yīng)對(duì)臨時(shí)性的短期使用需求。