“全世界在經(jīng)歷第三波人工智能浪潮,這波AI新浪潮跟互聯(lián)網(wǎng)浪潮有很大不同。互聯(lián)網(wǎng)的重點在于商業(yè)模式的驅(qū)動,而AI則是由技術(shù)驅(qū)動的。”
在6月28日舉辦的2017商業(yè)新生態(tài)峰會上,源碼資本投資合伙人張宏江博士解析了這一波人工智能熱浪的實質(zhì),并分享了會帶來哪些挑戰(zhàn)與機(jī)會。
張宏江博士認(rèn)為,人工智能技術(shù)的核心機(jī)器學(xué)習(xí)已經(jīng)從傳統(tǒng)的數(shù)學(xué)建模向依賴大數(shù)據(jù)學(xué)習(xí)轉(zhuǎn)移了。這波人工智能浪潮會帶來更多的可能,有賴于行業(yè)的大數(shù)據(jù)和AI的人才儲備,中國有望在技術(shù)上引領(lǐng)世界,這對于中國的創(chuàng)業(yè)公司來說是一個機(jī)會。
在AI如何影響人類的生活上,張宏江博士表示,我們應(yīng)該做好準(zhǔn)備,未來人工智能不光能夠輔助人,而且能夠代替人或者超越人,因為新的AI算法已經(jīng)具備了“上帝的視角”。而目前,凡是跟感知相關(guān)的語音識別、圖像識別,AI已經(jīng)超過了人類。凡是跟理解認(rèn)知相關(guān)的,AI還是有很長的路要走。
張宏江博士還在現(xiàn)場提醒創(chuàng)業(yè)者和投資人,目前,任何一家公司都敢說自己是AI公司,所以泡沫非常非常嚴(yán)重。如果說這個公司只有算法,只有幾個牛人,沒有數(shù)據(jù)或很難拿到數(shù)據(jù)、沒有應(yīng)用場景,這樣的公司做不大。
以下是張宏江博士演講實錄整理的內(nèi)容
馮總、各位嘉賓,各位早上好。非常高興今天參加這個論壇。
我想今天花點時間跟大家聊一聊這一波人工智能熱浪的實質(zhì)以及會給我們帶來哪些挑戰(zhàn)與機(jī)會。
這一波人工智能的浪潮跟以前的有什么區(qū)別?我認(rèn)為中國這波來人工智能的熱浪比世界上任何地方都猛。原因也許是AlphaGo第一次在圍棋上戰(zhàn)勝了人類,使得我們對人工智能刮目相看。
但我們從人工智能過去60年來的發(fā)展來看,我們今天談的人工智能的核心是人工智能的一個分支—機(jī)器學(xué)習(xí),更具體地說是機(jī)器學(xué)習(xí)中用神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)的技術(shù),即深度學(xué)習(xí)的技術(shù)。
80年代中期到90年代初是AI的第二波浪潮,很迅速地就消失了,以至于我們很長一段時間都不好意思說自己是學(xué)人工智能的,很重要的原因是當(dāng)時神經(jīng)網(wǎng)絡(luò)非常非常熱,但很快就冷下去了。原因有兩個:一是那個時候的神經(jīng)網(wǎng)絡(luò)沒有大數(shù)據(jù)的支持;二是沒有巨大的計算資源支持。
今天,我們不光有深度學(xué)習(xí)非常新的算法,更重要我們有了高質(zhì)量的已標(biāo)注的大數(shù)據(jù),有了非常強的計算資源,從技術(shù)上來看,今天的深度學(xué)習(xí)跟以前的人工智能的方法,尤其是與專家系統(tǒng)的方法有根本的區(qū)別。
我們今天的算法實際上是基于數(shù)據(jù)驅(qū)動的,而不是僅僅依賴于經(jīng)驗規(guī)則。
我們來看看這波AI浪潮的兩大驅(qū)動:第一:計算資源在過去30年突飛猛進(jìn)。在過去的幾十年發(fā)展中,我們看到人類的超級計算機(jī)的性能的指數(shù)增長和單位價格的指數(shù)下降。第二:AI的另一重要支撐數(shù)據(jù)開始大爆發(fā)。
根據(jù)IDC的調(diào)查,整個人類所創(chuàng)造的數(shù)據(jù)在2013年至2020年間會有十倍的增長,相當(dāng)于每年增長率在40%左右。我們每天所產(chǎn)生的數(shù)據(jù)已經(jīng)超過了10的19次方Byte。
今天大量的數(shù)據(jù)是由互聯(lián)網(wǎng)產(chǎn)生,這些數(shù)據(jù)不光是數(shù)據(jù)量大,而且是被標(biāo)記過的,比如你的手機(jī)會記錄下你所拍的照片的時間、地點等等信息。正是因為這些數(shù)據(jù)的爆炸,使得我們能夠為人工智能提供更多更好的訓(xùn)練數(shù)據(jù)。
講一個我自己的經(jīng)歷,今天的智能手機(jī)都能拍照片和識別人臉,不只是給人臉做一些美化,還能告訴你這張照片都有多少人,什么人。這是我20年前的夢想,有一個移動設(shè)備能夠告訴你拍攝的照片里面都有什么人。
經(jīng)過了20年的發(fā)展,在手機(jī)上這件事情可以做成了。為什么今天能夠做成,主要是因為剛剛提到的兩點:計算資源和大數(shù)據(jù),加上最新的學(xué)習(xí)算法。在我們90年代開始做這個題目的時候,整個的數(shù)據(jù)庫只有幾百張照片,100多個人。
五年前當(dāng)谷歌、Facebook、微軟,這些工業(yè)的巨頭開始利用上百萬張、上億張照片開始訓(xùn)練深層的神經(jīng)網(wǎng)絡(luò)時,用深度學(xué)習(xí)的方法來進(jìn)行識別時,我們才真正的把識別率提高了,在上億張照片里準(zhǔn)確識別出人。所以我想強調(diào)的是,當(dāng)你的訓(xùn)練數(shù)據(jù)規(guī)模開始呈現(xiàn)增長的時候,你的學(xué)習(xí)精度也開始有非常非常大的成長。訓(xùn)練所用的資源和數(shù)據(jù)越大,訓(xùn)練的精度也同樣得到線性提高。
今天這些AI公司所做的產(chǎn)品,背后所用的訓(xùn)練數(shù)據(jù)已經(jīng)不是再幾千萬,而是幾億,覆蓋了面非常廣,包括不同的場景、不同的環(huán)境、不同的側(cè)面。這也是今天為什么曠視科技這樣的公司,不只是中國人臉識別技術(shù)的巨頭,也是世界人臉識別的領(lǐng)先者。
所以我想在這兒總結(jié)一下,這次的人工智能技術(shù)的核心在于機(jī)器學(xué)習(xí),而機(jī)器學(xué)習(xí)已經(jīng)從經(jīng)典的理論建模往大數(shù)據(jù)驅(qū)動轉(zhuǎn)移了。
在人類的科技發(fā)展史里總是有一些先知者,今天我想跟大家介紹原來微軟研究院的一個杰出的學(xué)者Jim Gray,他十年前提出一個概念“人類科學(xué)研究的四個范式”:從一開始純粹的觀察,到牛頓的數(shù)學(xué)理論方式描述整個世界,到五六十年前開始用計算方法模擬世界,到今天第四范式用數(shù)據(jù)來驅(qū)動整體的研究。
正是因為這些技術(shù)的發(fā)展、大數(shù)據(jù)的普及,使得我們今天看到在全球各地的公司里面,已經(jīng)有很大一部分公司,開始把他們的業(yè)務(wù)建在大數(shù)據(jù)的基礎(chǔ)上,包括,IT公司、傳統(tǒng)制造業(yè)公司。
數(shù)據(jù)成為了我們一個新的宗教,這也是為什么像英特爾這樣做芯片的公司,在過去大手筆并購做人工智能的公司,因為數(shù)據(jù)是一個新的燃料。
剛剛談到了AI這撥的發(fā)展背后的兩大驅(qū)動力,計算和數(shù)據(jù), 下面跟大家分享一下AI的未來對于我們產(chǎn)業(yè)、對于我們生活到底有什么影響。
第一個角度是說AI能夠做的人能夠做的事情,但是會以最快的速度、更大的規(guī)模,人類能不能像AlphaGo一樣下一百萬盤棋,這是不可能的。
第二人類是否能像特斯拉那樣,每天從路上跑的幾十萬輛車?yán)飳W(xué)習(xí)它們的數(shù)據(jù)。再一個就是人類能否瞬間比較出所有攝像頭拍出的人臉的數(shù)據(jù),顯然我們也不如機(jī)器。所以無論從速度上,從群體學(xué)習(xí)的能力上,還是從規(guī)模上,我們都比不上制造出來的機(jī)器。
人工智能的機(jī)器在未來不光是能夠輔助人,而且能夠代替人或者超越人,我們對這點不應(yīng)該懷疑。
我們原來說機(jī)器在有邏輯的,有數(shù)學(xué)表達(dá)的應(yīng)用上可能會很快超過人,代替人。是不是在人類能夠做,但是不能夠用數(shù)學(xué)公式描述出來,比如說怎么開車、怎么騎自行車、怎么畫畫,今天我們從AlphaGo的表現(xiàn)已經(jīng)很清楚的看到,正是在這些無法用數(shù)學(xué)明確的描述的場景下,機(jī)器也開始超過人了。
那么機(jī)器其實無論是在自動駕駛這塊還是在畫畫這塊,都已經(jīng)表現(xiàn)出非常出色的能力,而且柯杰在和AlphaGo下棋之后說了一句話,“人類圍棋幾千年的發(fā)展我們只看到了冰山一角,而AlphaGo則有了上帝的視角。”AlphaGo經(jīng)過了這么幾年的訓(xùn)練,它爬的山比我們高得過,所以它看到整個的布局比我們廣泛得多,而我們?nèi)祟愔豢吹搅酥虚g很小一部分,相當(dāng)于它具備了“上帝的視角”。
這時候我們想想AlphaGo所代表的未來,也就是說智能系統(tǒng)、智能機(jī)器,未來會超過人、替代人。其實在人類發(fā)展的歷史上,或者在整個地球發(fā)展的歷史上,我們可以看到有很多生物,當(dāng)人類從一開始的猿人變成智人的時候我們的能力遠(yuǎn)遠(yuǎn)超過了它們,所以圖靈在很多年前就說過,說當(dāng)上帝創(chuàng)造了人類之后,很多動物已經(jīng)覺得自己的命運很悲哀了。
今天當(dāng)我們看到人工智能超越人類的時候,也許我們應(yīng)該想一下,當(dāng)初上帝創(chuàng)造了人之后,這些高級動物的感覺。今天其實我們已經(jīng)到了這種轉(zhuǎn)折點。
顯然,未來有很多行業(yè)會被AI所取代,翻譯、新聞記者的寫作、投行的分析師,今天美國政府已經(jīng)在組織一個團(tuán)隊來應(yīng)對未來十年中,自動駕駛?cè)〈丝ㄜ囁緳C(jī)后對美國就業(yè)率的沖擊。美國有800多萬人的工作與卡車相關(guān),而整個美國的就業(yè)人口是1.2億。可見這個影響之大。
未來我們希望是從人工智能變成智能輔助,但這是我們?nèi)祟惖囊粠樵福覀兿M斐鲆粋€機(jī)器能輔助我們,而不是代替我們。實際上,我們看到的是未來AI在很多很多場景下會取代我們。
如果大家看過《人類簡史》這本書,大家喜歡這個作者的話,不妨看一下他另外一本書叫《未來簡史》,他提出了一個觀點,說未來AI的發(fā)展可能讓世界上產(chǎn)生兩種人,一種叫神人,一種叫閑人。
可怕的是神人可能只有1%,99%的閑人。當(dāng)這個世界上90%的工作被計算機(jī)所取代的時候,這時候才會帶來一系列的社會問題。
也有人說有三種人可以替代AI的沖擊,一個是資本家,在座的做投資、做VC的,顯然大家不用擔(dān)心,你只要能夠融到錢,投準(zhǔn)項目就沒錯。還有明星和手藝人。但這三種人都不會超過人口總數(shù)的1%。所以技術(shù)進(jìn)步的加速給我們帶來的不光是對工作的影響,更深層次的是對文化、價值、倫理的影響,其實今天很難預(yù)測。
深度學(xué)習(xí)還有另外一個問題,就是說當(dāng)它的性能不斷地提高的時候,尤其被大數(shù)據(jù)驅(qū)動的時候,我們可能不得不接受一個現(xiàn)實,很多情況下深度學(xué)習(xí)所做出的決定,它是不能夠自我解釋的。
我們還是應(yīng)該清醒的認(rèn)識到我們今天談的是智能的機(jī)器,而不是機(jī)器的智能,或者說機(jī)器的智能跟人的智能還是有很大的距離。今天我們看到中國市場上對于AI充滿幻想,投資方面有很多的泡沫。根本的一點就是人們沒有認(rèn)清楚,到底AI今天很強的地方在哪兒,做不到的地方在哪兒。
不過,我想告訴大家,凡是跟感知相關(guān)的語音識別、圖像識別,今天的AI算法許多情況下已經(jīng)超過了人類。但凡是跟理解認(rèn)知相關(guān)的,AI還是有很長的路要走。所以有任何人跟你說,他做出一個能夠模擬人類思維的AI體系,基本上就可以打一個非常大的折扣了。
既然這波AI浪潮跟以前不一樣,那么作為從業(yè)人員和投資人員,我們應(yīng)該怎么來判斷AI這個機(jī)會,判斷投資機(jī)會呢?
互聯(lián)網(wǎng)女王Mary的報告有一點總結(jié)的非常好,就是說在18世紀(jì)之前農(nóng)耕社會的時候人們是靠種植收割來生存的,靠手工做的。到19世紀(jì)、20世紀(jì)工業(yè)革命的時候人們靠機(jī)器,靠工業(yè)。21世紀(jì)的話人們靠的是計算機(jī)的能力和人的能力的結(jié)合。
我們投資的時候一定要想的是,AI哪些方面,能夠讓人的潛力得到更高的發(fā)揮。過去這幾波科技浪潮,每波科技浪潮總會出現(xiàn)平臺的公司。
我們要看到哪些應(yīng)用規(guī)模特別大,而它又能夠產(chǎn)生大量的數(shù)據(jù),當(dāng)你有數(shù)據(jù),規(guī)模又大的時候,自然人工智能就能夠被引進(jìn)來,改善整體效率,從而使得生產(chǎn)率有進(jìn)一步的提高,創(chuàng)造出新的應(yīng)用,從而能夠產(chǎn)生一些有規(guī)模的企業(yè)。
我們在判斷AI投資的時候有一點要想清楚:AI這波新的浪潮,跟上一波互聯(lián)網(wǎng)的浪潮有很大的不一樣?;ヂ?lián)網(wǎng)重點在于商業(yè)模式的驅(qū)動,而AI是技術(shù)驅(qū)動的。AI是從顛覆現(xiàn)有的行業(yè)開始,不是會把這個行業(yè)消失,而是讓這個行業(yè)變得非常有效,所以說和垂直的應(yīng)用要結(jié)合的非常緊密。
大家做投資應(yīng)該很清楚,現(xiàn)在任何一家公司都說自己是AI公司,所以泡沫非常非常嚴(yán)重。這塊我們有幾點要把握?。喝绻f這個公司只有算法,只有幾個牛人,沒有數(shù)據(jù)、沒有應(yīng)用場景,或者說他未來依然很難拿到數(shù)據(jù)的話,這樣的公司做不大,很難持久。
在你看這些AI企業(yè)的時候,要想清楚這家公司今天有沒有數(shù)據(jù),能不能夠持續(xù)的生產(chǎn)、獲取、控制數(shù)據(jù),能不能對數(shù)據(jù)的占有程度比別人高,這些都是最根本的。只有當(dāng)技術(shù)和獲取數(shù)據(jù)的能力結(jié)合的時候,它才有一個非常強的護(hù)城河。
我這兒舉個例子,大家知道今日頭條過去五年迅速的成長,背后的原因在哪兒?其實背后的原因就是解決了人們非常根本的需求,把人和信息連在一塊。我們幾千年前就以在繩子上打結(jié)的方式記錄一些事件。活字印刷,造紙術(shù)出現(xiàn)以后,信息的傳遞就變得更加的方便。到了PC互聯(lián)網(wǎng)時代,我們知道互聯(lián)網(wǎng)實際上是把所有的信息連接在一起,用互聯(lián)網(wǎng)的方式呈現(xiàn)出來。
到了智能手機(jī)和移動時代,我們知道這時候你的信息終端永遠(yuǎn)在你手上。人們獲取信息就比以前方便多了,同時也產(chǎn)生了信息爆炸。信息產(chǎn)生的速度比你看的速度快得多,這時候PC互聯(lián)網(wǎng)時代的搜索已經(jīng)變得不能夠滿足人們的需求了,你不能夠再讓人去找信息了,而是你知道這個人需要信息的時候把信息推給他。這恰恰是今日頭條的核心的商業(yè)模式,其核心是技術(shù)。今日頭條通過對人工智能的算法,通過大數(shù)據(jù)的算法,通過你手機(jī)上所產(chǎn)生的數(shù)據(jù),對你需要什么樣的信息,何時需要信息了如指掌。
今日頭條大數(shù)據(jù)的能力也非??膳?,月活躍超過兩億,日活躍超過1億,每個人使用時長超過76分鐘。今日頭條通過技術(shù),通過數(shù)據(jù),建立起了一個天然的屏障。在世界上所有的移動互聯(lián)網(wǎng)應(yīng)用中,只有一個應(yīng)用時長超過了它,那就是微信,90分鐘。
當(dāng)我們意識到這波AI的潛力時,當(dāng)我們知道這波AI所能帶來的價值時,我們創(chuàng)業(yè)的時候要記住三點,第一點是人工智能是我們未來的一個核心的競爭力,這點是毫無疑問的。第二個,AI的產(chǎn)業(yè)現(xiàn)在有三種模式,一個是自主開發(fā),一個是賣技術(shù),一個是人工智能即服務(wù)。
目前大多數(shù)的公司屬于第二類,基本上就是有技術(shù),有幾個人,這些人很強,但是沒有數(shù)據(jù),然后應(yīng)用場景也不屬于他,所以基本是做咨詢服務(wù),這不可能做到非常大的規(guī)模。
最后一點,AI是中國創(chuàng)業(yè)公司的一個機(jī)會,是中國引領(lǐng)世界潮流的機(jī)會。在移動互聯(lián)網(wǎng)時代,中國的微信、今日頭條,已經(jīng)在引領(lǐng)世界的潮流,在AI場景里,兩個競爭門檻——數(shù)據(jù)和人才,中國都是不缺的。在世界上所有的學(xué)術(shù)刊物里,中國的機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)的論文作者在2014年就超過了美國。此外,在中國的已經(jīng)標(biāo)注的數(shù)據(jù)量是世界上最大的,基數(shù)大,而且數(shù)據(jù)量大。