7月9日,全球人工智能與機器人峰會(CCF-GAIR)在深圳舉辦。商湯科技執(zhí)行研發(fā)總監(jiān)林倞出席峰會CV+專場,并發(fā)表題為“深度驅(qū)動的人工智能:從學(xué)術(shù)創(chuàng)新到產(chǎn)業(yè)落地”的演講。林倞在演講中表示,深度學(xué)習(xí)將帶來將各項人工智能技術(shù)的突破,新一輪的科技革命蓄勢待發(fā),而商湯科技希望通過原創(chuàng)技術(shù),用AI推動產(chǎn)業(yè)升級。
商湯科技執(zhí)行研發(fā)總監(jiān)林倞
同時,林倞進一步表示,技術(shù)研發(fā)應(yīng)走出實驗室,在產(chǎn)品落地的實踐中發(fā)現(xiàn)問題、定義問題、解決問題,例如商湯科技兩年前在業(yè)內(nèi)率先推出的106點位原創(chuàng)技術(shù),該技術(shù)能夠讓人臉面部輪廓及各個部位的定位更加精確。同時,商湯科技迅速將技術(shù)轉(zhuǎn)化為產(chǎn)品解決方案,驅(qū)動了人臉識別在娛樂、拍照、商業(yè)等多場景中的大范圍應(yīng)用,進而推動該技術(shù)成為業(yè)內(nèi)標(biāo)準(zhǔn)。另一方面,技術(shù)在行業(yè)的落地,能夠帶來大量的數(shù)據(jù)反哺,令算法突破與應(yīng)用場景循環(huán)打通形成閉環(huán),通過不斷實踐實現(xiàn)技術(shù)演進。
深度學(xué)習(xí)三大核心要素打造關(guān)鍵性技術(shù)創(chuàng)新
林倞介紹,商湯科技一直以來都在圍繞算法研究、高性能計算和大數(shù)據(jù)三個深度學(xué)習(xí)的核心要素進行關(guān)鍵性技術(shù)創(chuàng)新,專注打造深度學(xué)習(xí)平臺,進而構(gòu)建人工智能、大數(shù)據(jù)分析行業(yè)解決方案。
在高性能算法層面,商湯科技提出高效、可拓展、靈活性的框架,覆蓋從算法、硬件平臺到軟件框架的設(shè)計能力;同時商湯科技還建設(shè)大規(guī)模GPU計算集群,“我們的超算能力來自于超過 2600 塊NVIDIA GPU的計算芯片,是國內(nèi)新銳AI公司規(guī)模最大的。”林倞介紹道。
此外,商湯科技極為強調(diào)深度學(xué)習(xí)能力,為此自主研發(fā)的深度學(xué)習(xí)庫PPL,在X86、ARM或者CUDA等不同的處理器架構(gòu)上,相比第三方開源平臺庫都有較明顯的優(yōu)勢。
大數(shù)據(jù)如今已經(jīng)成為現(xiàn)代科技的基礎(chǔ)設(shè)施,“我們在大數(shù)據(jù)方面有著深厚的積累,為技術(shù)創(chuàng)新提供了基礎(chǔ)保障”,林倞表示,“判斷一家企業(yè)是否為真正的人工智能企業(yè),需要看其是否有專門的團隊進行數(shù)據(jù)標(biāo)注,而商湯科技在這方面擁有超過300人的全職數(shù)據(jù)結(jié)構(gòu)化標(biāo)注團隊。”
基于以上高性能算法和深厚的大數(shù)據(jù)能力,商湯科技在新一代深度學(xué)習(xí)、人物關(guān)鍵點定位算法、文字檢測與識別、視頻標(biāo)注與內(nèi)容理解、幾何與深度估計、強化學(xué)習(xí)與機器人等幾個方面取得了算法研究的突破性進展。
林倞還特別提到,在人臉識別領(lǐng)域,標(biāo)注點的數(shù)量是數(shù)據(jù)質(zhì)量的一個關(guān)鍵指標(biāo)。“一般來說,數(shù)據(jù)中的特征點越多,識別率越準(zhǔn)確。”林倞表示,通過106人臉關(guān)鍵點,可以獲取細微的面部結(jié)構(gòu)信息,并在復(fù)雜的交互場景中供面部特效和美顏等功能調(diào)用,106點的識別準(zhǔn)度到達99%,目前已被認為是行業(yè)標(biāo)準(zhǔn)方案。
人工智能產(chǎn)業(yè)化落地 促進成熟產(chǎn)業(yè)效率提升
經(jīng)濟學(xué)家曾指出,幾十年來,依靠資源投入的數(shù)量型增長,受資本邊際收益遞減規(guī)律的作用,已現(xiàn)乏力;依靠技術(shù)投入的效率型增長,才是經(jīng)濟可持續(xù)發(fā)展的保障。未來中國經(jīng)濟的大發(fā)展必將依賴于科學(xué)技術(shù)與成熟產(chǎn)業(yè)疊加所帶來的效率提升。
在技術(shù)與產(chǎn)業(yè)結(jié)合方面,林倞介紹,目前商湯科技人工智能各項技術(shù)的觸角延伸至智慧安防、智慧金融、智慧商業(yè)、智慧家居、機器人以及無人駕駛、虛擬增強現(xiàn)實等領(lǐng)域,正在逐步加快推動學(xué)術(shù)與產(chǎn)業(yè)的結(jié)合。
在安防-智慧城市領(lǐng)域,商湯科技實現(xiàn)了在監(jiān)控環(huán)境下對精細化的人車屬性、層次結(jié)構(gòu)、運動信息的分析并且進行結(jié)構(gòu)化存儲,讓大量的視頻數(shù)據(jù)和圖像數(shù)據(jù)能夠有效檢索查詢。林倞認為,安防行業(yè)也將對交通行業(yè)產(chǎn)生廣泛深刻的影響,將會推動下一個變革。
以商湯科技的SenseFace系統(tǒng)為例,它能夠通過預(yù)測跟蹤可疑目標(biāo),實現(xiàn)“人臉天網(wǎng)”。商湯科技的SenseVideo,能夠在視頻監(jiān)控以及輔助駕駛場景中,準(zhǔn)確找出行人和車輛并分析其屬性。
在金融領(lǐng)域,商湯科技主要針對金融行業(yè)實名認證的難點進行了布局,通過精確的算法,實現(xiàn)智能、自動化認證。以中國移動為例,接入商湯團隊的人臉識別技術(shù)后,為數(shù)億人提供了實名認證服務(wù)。
在移動互聯(lián)網(wǎng)領(lǐng)域,通過人臉關(guān)鍵點定位、SLAM等技術(shù)的應(yīng)用,商湯科技實現(xiàn)增強現(xiàn)實和3D增強現(xiàn)實、雙攝拍照增強,提高了產(chǎn)品實用性及娛樂性。當(dāng)前非常流行的Faceu應(yīng)用,就是源于商湯自主研發(fā)的增強現(xiàn)實感引擎,實現(xiàn)了易用、精準(zhǔn)的面部特效,并在發(fā)布后取得了AppStore免費榜第一名的好成績。
身為商湯科技執(zhí)行研發(fā)總監(jiān),林倞最希望看到的就是通過人工智能技術(shù)研發(fā)創(chuàng)新與產(chǎn)品落地,不斷推動產(chǎn)業(yè)升級,為人們的生活與社會進步帶來更多的價值,而這也是商湯科技一直以來努力的方向。業(yè)內(nèi)人士認為,正是這樣的理念,驅(qū)動著商湯科技在人工智能領(lǐng)域飛速馳騁,快速成長為機器視覺領(lǐng)域的標(biāo)桿企業(yè)。