臉書首席科學(xué)家Yann LeCun:實現(xiàn)AI缺的是這些!
2018-04-27 19:27:31
來源: 長城會 熱度:

聽楊樂坤講述關(guān)于深度學(xué)習(xí)的最新研究成果,描述深度學(xué)習(xí)的未來及機(jī)器智能所要面臨的的
挑戰(zhàn)
挑戰(zhàn)

如今的 AI 系統(tǒng)都是使用的監(jiān)督學(xué)習(xí),所有的 AI 應(yīng)用,不管是圖像識別、聲音識別還是人臉識別,或者機(jī)器翻譯等等,這些都是監(jiān)督學(xué)習(xí)的應(yīng)用。訓(xùn)練監(jiān)督學(xué)習(xí)模型需要向它展示各種例子,并告訴它正確答案,如果你想讓機(jī)器學(xué)會將汽車和飛機(jī)區(qū)分開來,比如你給它展示一輛車的圖像,它說這不是一輛車,然后你可以對參數(shù)進(jìn)行調(diào)整,下次再向機(jī)器展示同一張圖像的話,你就會得到接近正確的答案。

我們可以對機(jī)器進(jìn)行端到端的訓(xùn)練,來完成特定的任務(wù),feeding 原始的 inputs,就會自動給出 outputs。機(jī)器學(xué)習(xí)這個任務(wù)的過程是端到端的學(xué)習(xí)過程。通過這種方式機(jī)器,計算機(jī)能更好地了解這個世界。

比如卷積網(wǎng)絡(luò),實際上這個想法是可以回溯到上個世紀(jì)八十年代。它可識別圖像,同時也有很多其他的應(yīng)用,比如說可以用于語言處理、語言識別和其他很多的應(yīng)用。我們知道對于神
經(jīng)網(wǎng)絡(luò)是非常大的,只有在非常強(qiáng)大的計算機(jī)上才可以運用,需要有 GPU 加以輔助。
經(jīng)網(wǎng)絡(luò)是非常大的,只有在非常強(qiáng)大的計算機(jī)上才可以運用,需要有 GPU 加以輔助。

在深度學(xué)習(xí)變得比較普遍之前,我們首先要確保這樣的一些系統(tǒng)可以用于這些情況,比如一個例子是我們在 2009 年、2010 年在紐約大學(xué)合作的一個實驗,可以看到它可以識別馬路上的建筑、天空以及路上的車和人等等,這個在當(dāng)時并沒有被稱為最好的系統(tǒng)。再過幾年之后,越來越多人相信深度學(xué)習(xí)是可以奏效的,可以發(fā)揮作用的。

在這里大家可以看到在網(wǎng)絡(luò)當(dāng)中使用的幾個層,比如說有 100 層或者 180 層的一些人工神經(jīng)網(wǎng)絡(luò),在 Facebook 當(dāng)中我們就會廣泛使用。這上面大家可以看到錯誤率是在不斷下降的,有的時候表現(xiàn)的甚至要比人還要好。它的性能非常好,已經(jīng)成為了一種標(biāo)桿。

這是 Facebook 人工智能部門所做的研究,叫做 Mask R-CNN,可以看到它的結(jié)果,它可以標(biāo)記這樣的圖像,就像我剛才給大家展示的例子,展示出非常好的性能。它不僅僅可以識別出每個人,同時它會為每個人加一個標(biāo)記,所以可以很容易區(qū)分出是一個人還是一只狗。

在這里大家可以看到這個系統(tǒng)可以識別電腦、酒杯、人、桌子,也可以數(shù)出來到底有多少,而且也可以識別出道路、汽車。如果五年之前問系統(tǒng)這些問題的話,我們當(dāng)時可能認(rèn)為需要 10-20 年時間才能達(dá)到今天呈現(xiàn)的效果。

這也是 Facebook 所做的一些研究,叫做 Detectron。大家可以下載上面的代碼,它可以探測 200 多種不同的類別,這也是 Facebook 在 AI 方面的一些研究,我們不僅僅發(fā)布了一些論文,同時連代碼也都發(fā)布出來了,這樣的話世界各地都可以更好的熟知這種技術(shù)。

當(dāng)然還包括其他很多項目,在 Facebook 我們利用 DensePose 這樣的技術(shù),預(yù)測人類的行為。我們現(xiàn)在有一個系統(tǒng)能夠?qū)崟r的運行,在一個單一的 GPU 上運行。它可以跟蹤很多人的行為,生成視頻,非常的準(zhǔn)確,可以實時地生成一些相應(yīng)的數(shù)據(jù)和信息,并且相應(yīng)的代碼也是可以用的,這些都是一些最新的應(yīng)用。

當(dāng)然利用的這樣的技術(shù)不僅僅可以進(jìn)行識別圖像,面部識別,也可以識別人的行動,也可以用來翻譯,這是 Facebook 在加州所做的研究(FairSeq)。我們可以用這個系統(tǒng)進(jìn)來行翻譯的工作。
我覺得對于行業(yè)說進(jìn)行這樣的開發(fā)研究將是會是一個非常有用的過程,同時我們也希望自己所開發(fā)的技術(shù)能夠引導(dǎo)整個社區(qū),解決我們所感興趣的問題。我們認(rèn)為 AI 不僅僅會幫助我們解決問題,同時還會幫助我們解決很多人類自己無法解決的挑戰(zhàn),所以我們會與科學(xué)團(tuán)隊一起朝這方面努力。

這里是在過去的幾年里,F(xiàn)AIR 所發(fā)布的一些開源項目,包括像深度學(xué)習(xí)網(wǎng)絡(luò),還有深度學(xué)習(xí)框架等等。

我剛才講到每天都會有一些新的應(yīng)用發(fā)布,而深度學(xué)習(xí)的廣泛應(yīng)用也進(jìn)一步推動科學(xué)方面的研究。在接下來幾年里深度學(xué)習(xí)會發(fā)生更大的革命。

接下來為大家舉一個例子,這段視頻表現(xiàn)出來的是一種加速過程,它可以訓(xùn)練車去進(jìn)行駕駛,而且可以調(diào)整車輪的方向。這樣可以讓車自己去進(jìn)行駕駛,而不需要有人去進(jìn)行校正。

可微分編程
接下來我們再來看一下可微分編程,這個編程可以用人工神經(jīng)網(wǎng)絡(luò)解釋。

我們通過研究可以實現(xiàn)這樣的一種編程,可以利用這樣的系統(tǒng)或者培訓(xùn)系統(tǒng),來完成某一個具體的任務(wù)。

這是幾年前所開展的工作,是由 Facebook 和紐約大學(xué)一起合作做的項目。這個項目是訓(xùn)練模型,讓它能夠回答相關(guān)的問題。在自然語言處理過程中,也可以看到人工神經(jīng)網(wǎng)絡(luò)是動態(tài)的,在不斷變化的。

這是另外一個例子,如果你要建立一個能夠回答復(fù)雜問題的系統(tǒng),比如說關(guān)于圖像的復(fù)雜問題等。為了回答這個圖片是不是有更多的立體形狀,之后我們就會讓系統(tǒng)來進(jìn)行計算。比如說這里有多少是方形體,或者有多少顏色,最后告訴你具體的答案是什么。通過這么做我們可以建立起一個端到端的解答的途徑,而且也允許你提出更多新的問題。根據(jù)你輸入的數(shù)據(jù)不同,它會有所變化。
大家看到這里是我們最近開發(fā)所得到的一些深度學(xué)習(xí)最新的成就,之后我們來看一下關(guān)于 AI 有沒有我們觸及到的。

機(jī)器學(xué)習(xí)需要常識
對于新技術(shù),我覺得可以進(jìn)入到更多的領(lǐng)域,比如進(jìn)行更多的影像分析。在一定程度上,我們覺得機(jī)器可能確實擁有一定的人工智能,但具體細(xì)節(jié)上,我們還需要進(jìn)行更多探討。
比如在機(jī)器學(xué)習(xí)方面,我們怎么做呢?在這兒可以看到有一些具體的圖像,我們有些新的方法。在實際的生活當(dāng)中其實這種方式不太成功,因為關(guān)于深度學(xué)習(xí)方面我們要進(jìn)行深入的挖掘,因為對于機(jī)器本身它會有不同的解決方案,比如在實際生活中是不能夠去實施的。

有時候讓機(jī)器學(xué)習(xí)很長時間才能玩游戲。所以在核心功能方面,現(xiàn)在確實還沒有觸及到。但這些機(jī)器是能做到的,只是我們還沒有挖掘出來。我們也可以對機(jī)器本身進(jìn)行更深入的訓(xùn)練,比如我們要讓系統(tǒng)進(jìn)行成千上萬次的訓(xùn)練之后,它們才能夠進(jìn)行學(xué)習(xí)。

有些學(xué)習(xí)它是與力學(xué)相關(guān)的,但是在實際的生活當(dāng)中不可能實時進(jìn)行,所以我們只能夠進(jìn)行模擬,但它也需要我們進(jìn)行很多的嘗試才能夠讓機(jī)器學(xué)到。

嬰兒們是怎么學(xué)習(xí)的呢?比如就像右下角這幅圖向他們所展示的,六個月以下的嬰兒可能不太了解物理運動,可當(dāng)他們滿了八個月之后,他們已經(jīng)知道自由落體這個動作了。

所以像右下角的這個小女孩非常了不起,我的一位朋友她給我們展示了嬰兒怎么學(xué)會一些概念,而且他們也能夠了解一些最基本的物理原理,這是他們在生活中最初學(xué)到的一些概念,這是憑借人們常識獲得的,嬰兒們所學(xué)會的是就是一些常識。

另外我們向動物展示這樣的情景,比如大家看一下這個大猩猩,它們在幼年的時候由培訓(xùn)員給它們進(jìn)行展示一些東西,所以大猩猩面對這樣的魔術(shù)會笑出來,而人們會把這當(dāng)做世界最初的原型。

但我們希望機(jī)器能夠建立一些樣本,使得系統(tǒng)運行,最終機(jī)器就能進(jìn)行一些預(yù)測,像人一樣有效運行。我們有這樣的監(jiān)督或者學(xué)習(xí)就能夠使得機(jī)器得到訓(xùn)練和規(guī)劃,這是我們所需要建立的一個系統(tǒng)。

不管下次的變革出現(xiàn)在哪里,我覺得它們應(yīng)該是自我監(jiān)督或者無監(jiān)督學(xué)習(xí),而且在這樣的變革當(dāng)中也會出現(xiàn)一些常識性的學(xué)習(xí)。

我總結(jié)一下,這是我們最近做的一些非常有意義的事情,這是一些預(yù)測性的模型,來由機(jī)器進(jìn)行規(guī)劃,根據(jù)它們的嘗試進(jìn)行預(yù)測。

我們進(jìn)行了對抗性訓(xùn)練,比如說我們可以訓(xùn)練機(jī)器來了解哪個分項是更可能的,或者在實際生活中會產(chǎn)生什么樣的結(jié)果。對于發(fā)生的可能性它也會來做出預(yù)測,可能有的時候有的結(jié)果是虛假的,不是真實的。通過這么做我們就能夠得到不同機(jī)器產(chǎn)生的結(jié)果,之后得到了很多的影像和圖片。

我們的系統(tǒng)在進(jìn)行訓(xùn)練之后,生成了一系列的人臉,大家看看這些名人的面孔,里面有一些是假的圖像,是由機(jī)器生成的,但看起來是真實的。
我們將在下周會議上向大家展示最新的結(jié)果,得到的成果非常好??傊?,我們希望把這個工具之后能夠融入到我們的機(jī)器學(xué)習(xí)當(dāng)中。

最后,我想做一下總結(jié),我覺得監(jiān)督學(xué)習(xí)是不能夠被替代的,不管是無監(jiān)督學(xué)習(xí)還是其他的學(xué)習(xí)方式都不能夠替代它,這點已經(jīng)引起了很多人的興趣,我們也要進(jìn)行更多嘗試。還有一點我需要強(qiáng)調(diào)的是,我們要讓機(jī)器能夠推理,來看深深度學(xué)習(xí)能帶給我們什么樣的推理能力,同時也要了解在AI時代,機(jī)器的推理能力有多高,邏輯性有多強(qiáng)。
接下來我們也要來朝著可微分編程的智能學(xué)習(xí)的方向持續(xù)發(fā)展,這就需要進(jìn)行做更多對抗性訓(xùn)練的研究。當(dāng)然,還會出現(xiàn)更多的有關(guān)深度學(xué)習(xí)的變革,比如一些多渠道發(fā)展或者是復(fù)雜的架構(gòu),在這個領(lǐng)域也會出現(xiàn)更多的理論。

關(guān)于技術(shù)監(jiān)督的趨勢很顯然是不斷的弱化,甚至監(jiān)督會消失,這就會導(dǎo)致出現(xiàn)一些新理論的產(chǎn)生,比如新語言,或者是一些新的并行文本,我相信之后應(yīng)該有多維度的可能性??赡軙霈F(xiàn)一些新框架,包括了一些動態(tài)影像。我們會和微軟,和亞馬遜會進(jìn)行更多合作,我們也會不斷進(jìn)行開源。
當(dāng)然,現(xiàn)在我們的工作量很大,但是關(guān)于我們的移動工具和其他工具越來越流行了,F(xiàn)acebook 的用戶他們每天能夠推出大概 20 億張不同的影像,所以我們希望能充分發(fā)揮這方面的能力,它可能是一種很強(qiáng)的驅(qū)動力。另外,我們也要不斷強(qiáng)化硬件,以使用戶需求能夠得到專業(yè)化的處理。
下一篇:創(chuàng)新工場董事長李開復(fù)GMIC演講:要抓住AI浪潮,還得抓住這些行業(yè)!上一篇:小鵬汽車G3于GMIC首日正式開放預(yù)訂 首批2000位用戶尊享終身質(zhì)保和意向金翻番
責(zé)任編輯:向宜芳
相關(guān)推薦
中央電視臺和中央電臺節(jié)目榮獲AIBD獎項
7月20日,亞太廣播發(fā)展機(jī)構(gòu)(AIBD)第35次年會暨第8次全體會議在斐濟(jì)楠邊開幕。中央電視臺選送的紀(jì)錄片《水問》獲得AIBD2009年電視大獎---水源問題最佳電視紀(jì)錄片獎。中央電臺選送的《農(nóng)村婦女健康教育服務(wù)》節(jié)目獲得AIBD2009年廣播大獎---最佳健康關(guān)懷教育類廣播節(jié)目獎。斐濟(jì)總理姆拜尼馬拉馬出席大會開幕式并在頒獎儀式上為獲獎?wù)哳C獎。
視頻聊天服務(wù)Airtime6月上線 獲830萬美元融資
北京時間5月9日消息,Napster聯(lián)合創(chuàng)始人、Facebook首任總裁西恩帕克(SeanParker)的最新產(chǎn)品社交視頻聊天服務(wù)Airtime將于6月5日正式啟動。帕克與其在Napster的合作伙伴肖恩范寧(ShawnFanning)已經(jīng)為該項目募得830萬美元的支持。至于Airtime的具體功能目前尚不得知。據(jù)了解,該產(chǎn)品是受到隨機(jī)視頻聊天網(wǎng)站Chatroulette的啟發(fā),Airtime在其網(wǎng)站上就明確表示“Airtime是一家實時社交視頻公司”。另有報道稱,Airtime將專注于移動終端領(lǐng)域,由此引發(fā)外界猜想,Airtime將可能發(fā)展為視頻版的Instagram。