【特稿】人工智能年度人物——地平線機器人科技創(chuàng)始人兼CEO余凱

不斷成熟的“人工智能”(AI)技術,讓學術領域和企業(yè)家們更加意識到高效利用這項技術的重要性。如何在日新月異的當下不斷挖掘人工智能的深度、拓寬應用廣度是必須思考的問題。恰逢2017年開春之際,DVBCN&DVBCN推出了人工智能年度人物專欄,聚焦當前人工智能領域,本期分享地平線機器人科技創(chuàng)始人兼CEO余凱對人工智能的真知灼見。

余凱 在慕尼黑大學獲得計算機科學博士學位,曾在微軟、西門子和NEC工作。余凱是南京大學、北京郵電大學、北京航空航天大學的兼職教授,以及中科院計算所客座研究員。余凱博士被授予中關村高端領軍人才,北京市“海聚計劃”海外高層次人才,以及中組部“千人計劃”國家特聘專家。前百度研究院副院長,深度學習實驗室主任。2015年5月22日,余凱已經(jīng)從百度離職,已正式完成離職手續(xù),離開百度創(chuàng)業(yè),建立地平線機器人科技公司。
“傳統(tǒng)人工智能系統(tǒng)”多以科學演繹的方式發(fā)展
余凱指出,人工智能首先應具有感知的能力,通過傳感器能夠感知到環(huán)境的變化;其次是理解力,從感知階段上升到對世界的理解;第三是決策能力,通過理解之后做出決策。

人工智能最簡單的形式是通過觀測到的現(xiàn)象、數(shù)據(jù)、知識,映射成預測、判斷。余凱用了一些比喻來梳理了這個過程:輸入圖像輸出“物體”的名字的映射,就是圖像識別;輸入語音訊號輸出“文本序列”,就是語音識別;輸入一段話輸出“解析的樹狀結構”,就是云儲;輸入車輛行使周邊路況情況輸出“控制決策”,就是自動駕駛。
關于過去基于規(guī)則的人工智能系統(tǒng),余凱指出過去多以演繹的方式來建立系統(tǒng),其概念類似“一生二,二生三,三生萬物”。從一個基本法則出發(fā),推導出一個紛繁復雜的系統(tǒng)。這種方法主要受自然科學的方法論的影響,通常從不言自明的公理出發(fā),但從這一思維出發(fā)所得到的人工智能系統(tǒng),常常會過于簡單。

傳統(tǒng)基于規(guī)則的人工智能系統(tǒng),沒有取得積極的成果,但卻得到了很多教訓。余凱說到,其一是這個世界是紛繁的,存在著很多因素和要素,彼此之間有復雜的影響,形成復雜的網(wǎng)絡和系統(tǒng),難以用一個公式來描述;其二是有很多因素和參量不能觀測到,所以系統(tǒng)具備不確定性;如果用確定性的規(guī)則,無法掌握這樣的復雜系統(tǒng),要采用基于統(tǒng)計的概念;其三是現(xiàn)實世界紛繁復雜很難完整描述,只有從數(shù)據(jù)中不斷地學習、加深對問題的理解,同時跟隨數(shù)據(jù)的演化和進化,才是關鍵。這也是“大數(shù)據(jù)”的重要意義,數(shù)據(jù)在本質(zhì)上,為人提供了了解世界的可能。
驅(qū)動人工智能進展的三大因素
余凱認為驅(qū)動人工智能的進展主要有三個因素:

大數(shù)據(jù):線下的數(shù)據(jù)不斷線上化。
大算法:深度學習和增強學習的發(fā)展,深度學習用來感知、處理信號,增強學習則做于決策。二者相輔相成。
大計算:按照摩爾定律,2030 年一千美金買到的計算資源跟人腦相似。當然,現(xiàn)在英特爾宣布摩爾定律開始變慢。所以預測沒法這樣下去,另外一方面,從宏觀上講,對處理器架構的改版不僅僅是工藝層面,架構的變化也為計算帶來變化。
具備人工智能的機器人將替代手機成為新媒介
今天手機在連接人和世界這件事情上扮演的地位相當于PC時代的瀏覽器,幾乎是唯一的連接人和服務、連接人和世界的節(jié)點。
但是展望未來,可以看到汽車、家電、玩具都變得越來越智能,在家只需要掏出手機來操控某個家電、洗衣機或者空調(diào)。余凱表示,智能家電、汽車、玩具的人機交互功能越來越強,處理信息的能力越來越強,它們表達信息的能力也會越來越強。比如說,在不遠的將來,大家就會看到很多家居產(chǎn)品上會有個大屏幕,展現(xiàn)非常豐富的信息。在這種情況下,用戶應該更多的是直接和這些產(chǎn)品進行交流、交互,而不會再掏出手機,找到APP,然后開始操作。

余凱表示這里面蘊含著硬件形態(tài)的連接結點會更加適應這種分散化場景。比如,今天能看到的一個例子就是汽車。汽車的屏幕越來越大,中控平臺現(xiàn)在可以針對汽車做的語音交互。這些都是更直觀的展示,追求的是讓你進了汽車之后,完全不再需要手機。
所有的這些硬件的智能化,都會具有感知,交互,和控制的能力,都會成為廣義的機器人。在各自的垂直場景中,它們都成為連接人和世界的節(jié)點。自動駕駛汽車就是一個具體的例子。
人工智能初創(chuàng)公司與未來發(fā)展
余凱表示,從目前來講,絕大部分人工智能創(chuàng)業(yè)公司都是在基于 GPU 這樣的計算平臺和在基于Caffe、TensorFlow 這樣的開源平臺,用比較成熟的模型結構來訓練,然后做一些解決性問題和 Demo,差異化確實不明顯。基于現(xiàn)在的開源模式來做創(chuàng)新,在算法方面壁壘確實也不高。所以這就導致在一些標準問題里,各創(chuàng)業(yè)公司的效果都差不多,技術差距也并不大。這里面的核心原因之一就是中國人工智能原創(chuàng)性技術太少。

最近大家在說中國 AI 的人才、技術儲備、研究、創(chuàng)新都有優(yōu)勢,余凱表示這個觀點他不太認同。實際上,國內(nèi)學生在已經(jīng)討論出解決辦法的情況下去做拿競賽、刷分,這方面我們很擅長。但真正做出 AlpahGo 這樣的創(chuàng)新,確實還差些火候,而且國內(nèi)也缺乏孵化這種創(chuàng)新的土壤。
余凱認為實際上,人工智能產(chǎn)業(yè)仍處于早期階段,重大應用場景還在不斷摸索,產(chǎn)出的確非常低。“但如果回到‘.com’時代,你會發(fā)現(xiàn)當時的商業(yè)模式也是探索了很長時間。資本市場確實有追逐短期回報的現(xiàn)象,所以明年下半年到后年,即便整個 AI 投資市場趨冷也并不奇怪。”他說,“AI 行業(yè)與‘.com’時代一樣,即便是趨冷,但也不會影響到整體的趨勢。”因為 AI 確實在推動產(chǎn)業(yè)發(fā)展,實實在在創(chuàng)造價值,它不會進入一個萬劫不復的寒冬。

實事求是地說,如果按照投資機構的計算方法,AI 泡沫是一定存在的。AI 創(chuàng)業(yè)公司確實估值比較高,而且市場進展也并不盡如人意,但是到 2017 年或后年一定會有所變化。余凱還十分風趣地打了一個比喻說:“從長期趨勢來看,適當泡沫純屬正常,就像啤酒有泡沫味道才更好,正是因為泡沫才讓各公司都有機會去登上舞臺。不論怎樣,大家亮個嗓子,在舞臺上唱一下。”

最后,余凱表示他對 2017 年充滿了期待,希望未來人工智能處理器硬件行業(yè)會有大的突破;同時相關算法上繼續(xù)持續(xù)創(chuàng)新;在某些應用場景上出現(xiàn)重大突破,如醫(yī)療、自動駕駛、智能家居等。