欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

周志華:機器學習技術是AI應用的關鍵

6月1日上午,2018中新人工智能高峰論壇在南京舉行。會上,南京大學計算機科學與技術系主任、人工智能學院院長、歐洲科學院外籍院士周志華發(fā)表了演講,闡述了他對于機器學習前沿思考。周志華表示,機器學習無所不在,很多AI應用背后關鍵支撐就是機器學習技術。
周志華:機器學習技術是AI應用的關鍵-DVBCN

周志華稱,從技術上看,神經網絡其實是個簡單的數(shù)學函數(shù),通過迭代嵌套得出的系統(tǒng)。在一些圖像視頻處理任務中,深度神經網絡有時候并不是最佳的選擇。

“當我們重新審視神經網絡模型的時候,提出是不是可以基于不可微構件進行深度學習?”周志華介紹說,他的團隊最近提出了一個叫做“深度森林”的模型,這是一個“非神經網絡”,且不使用BP算法訓練的深度學習模型。周志華透露,這個模型目前已經與螞蟻金服合作,應用在反套現(xiàn)的檢測上,目前性能表現(xiàn)很好。

關于機器學習能夠解決的任務,周志華認為,圍棋屬于封閉靜態(tài)環(huán)境的任務,他不是“最難的任務”,以往的機器學習就可以解決這種封閉靜態(tài)環(huán)境任務。“我們今天面對的是動態(tài)開放環(huán)境下的機器學習挑戰(zhàn),最關鍵的就是魯棒性。”周志華稱,這就要求AI必須很好的應對未知環(huán)境,是通往魯棒人工智能的核心環(huán)節(jié)。

在AI產業(yè)發(fā)展方面,周志華認為,目前AI廣泛應用的代表是互聯(lián)網行業(yè),因為后者擁有大量的數(shù)據(jù)。但是,未來在一些數(shù)據(jù)量小的領域可能應用前景更大。

周志華在最后表示,AI產業(yè)發(fā)展真正需要的是人才,“與一般軟件產業(yè)相比,AI產業(yè)將更凸顯個人英雄主義”。(小羿)

以下是演講內容:

周志華:王部長、李院士,各位領導、各位朋友,大家上午好!

首先剛才主持人報到的這個題目和我實際講的題目有一點點差別,我今天跟大家匯報的這個題目是“關于機器學習前沿的一點思考”,因為我本人主要是從事機器學習方面的研究。

前段時間我們經常都聽說現(xiàn)在我們處于一個大數(shù)據(jù)的時代,但是我想現(xiàn)在我們所有人都非常清楚,這個大數(shù)據(jù)并不意味著真正大的價值,要得到數(shù)據(jù)里面的價值,我們就必須要進行有效的數(shù)據(jù)分析,而今天我們要通過計算機來進行數(shù)據(jù)分析,就必須要進行機器學習。前面很多嘉賓講到的人工智能的應用里面,最關鍵的支撐原因就是機器學習。

今天我想談一談關于機器學習方面的一些思考,首先因為我是從學術研究出發(fā),所以我先談一談關于技術上的一些考慮。

今天我們談到人工智能的熱潮也好,還是人工智能的產業(yè)也好,其實很大程度上就是因為機器學習技術,尤其是里面的深度學習技術取得了巨大的進展。所以我們可以看到各種各樣的應用中,特別是在圖像、視頻、語音,包括我們現(xiàn)在用到的訊飛這么一個實時的翻譯器,其實背后都有很多深度學習的技術在起作用。

但是如果我們今天問到一個問題,深度學習是什么呢?我想絕大部分人的回答,通常都說深度學習就是深度神經網絡。我給大家看一個例子,有一個很著名的學會叫siam,它有一個旗艦的報紙叫《Siam News》,它里面談到機器學習深度學習就是一個子女。當我們要談深度,這里面每一個節(jié)點是什么東西呢?以往我們從生理學上得到一點基本的啟發(fā),如果一個細胞得到很多的信號,這個簡單的現(xiàn)象在1943年就被兩位學者總結成了這么一個簡單的數(shù)學公式,非常的簡單,就是幾個加和,再減掉一個數(shù),再用函數(shù)處理一下,這個公式一直到今天我們還在使用。今天我們看到這么復雜的深度學習系統(tǒng),它的奧秘是什么呢?最基本的單元就是它。所以我們可以看到所謂的神經網絡也好,深度神經網絡也好,就是一個簡單的函數(shù)。

在2012年的時候,在這個著名的比賽獲勝的網絡用了8層,在2016年的時候用到了1207層,所以這是一個非常巨大非常龐大的系統(tǒng),我們怎么樣讓這些系統(tǒng)工作起來呢?這里面用到很多技巧。但是非常重要的,我們可以看到這個里面最基本的單元就是我們剛才說到的這個函數(shù),是連續(xù)可為的。今天深度神經網絡的成功和它最后使用的基礎構建是使用了可為的構建,這個是密不可分的。

現(xiàn)在很多的學者在反思,第一個就是太多超參數(shù),我們現(xiàn)在大量的時間都花在調參數(shù)上,甚至大家覺得這件事情好像不應該是科學技術的事情,好像是一個體力活。另外有的結果我們還很難重復,此外還有很多很多的問題。

另外我們就算不從學術上考慮的話,因為大家有的時候會說你們學術上做什么我不關心,能給我提高性能就好。其實就算從這個角度來看,我們可以看一看今天深度神經網絡所獲勝,有好的效果的,主要是哪些應用呢?主要涉及到圖像、視頻、語音這樣的任務。但我們其實有大量的任務不是這些,比如說我們在電商里面做圖像推薦,就不是這些任務。這里面有大量買機票的,有訂旅館的等等,可以看到即使在今天絕大多數(shù)獲勝的模型還不是深度神經網絡。

今天的深度神經網絡是多層的,可參數(shù)化的可微分的非線性模塊構建的,需要用BP算法來訓練的這樣一種模型。今天我們認為有一個很前沿的問題,就是能不能基于不可微構建來進行深度學習?比如說深度學習是不是就等于深度神經網絡?我們有沒有可能在圖像、視頻、語音之外更多的任務,得到更好的性能?

最近我們自己的研究,在這方面做了一點點工作,我們提出了一個新的模型,叫做深度森林,這不是一個基于深度神經網絡的模型,但是在很多任務上已經取得了深度神經網絡的模型。

這件事情最近也有一些反響,如果大家關注最近的新聞可以看到我們和螞蟻金服公司合作,做到螞蟻金服反套現(xiàn)的技術上,這還是一個開頭,是一個非常初的技術,未來再發(fā)展下去會有更多的機會。

在我們提出深度森林之后,國際上有很多學者也在反思深度學習這個領域,比如說Keras的創(chuàng)始人說可微層是當前模型的根本弱點。以往我們知道深度學習很有效,但其實深度學習這個屋子里面只有一種是叫深度網絡學習模型。但是還有其他的模型,今天我們可以看到深度學習的效用在大多數(shù)領域里面已經應用得相當充分了,當我們有了新的模型之后,有沒有可能在更多的領域重新得到一種更多的價值呢?可能這是一個值得探討的方向。

第二個部分,我想談一談機器學習技術新的任務。人工智能學界很早就知道對這種規(guī)則明確的棋類游戲,機器學習一定會超過人類。我們說圍棋棋盤361個點,每個點上有三種可能,所以它的可能性是3的361次方。我們宇宙中現(xiàn)在所有知道的原子的個數(shù)是10的80次方,這實際上告訴我們什么呢?如果你靠強力計算,一個狀態(tài)一個狀態(tài)去評估,哪怕量子計算機做出來,或者更強大的計算機做出來,圍棋問題也是解決不了的,所以這不是一個單單靠強力計算能解決的事情,必須要有聰明的算法。但是聰明的算法現(xiàn)在已經有了。

從另外一個角度,其實比圍棋更困難的問題很多,因為圍棋有一個很基本的假設或者說共性的條件,就是精確感知,我下圍棋的時候棋子落在什么地方大家都看得很清楚,不會把你遮起來,而且大家對什么獲勝這一點也有共識。

有很多問題不是這樣的,我們平時打麻將,就是不完備信息,你只能看到桌上的牌,看到自己的牌,其他幾家牌看不到,實際上打麻將這件事情就比圍棋更難。大家可能覺得現(xiàn)在有些打麻將的游戲已經打得很好了,這是為什么?很多程序背后是作弊的,你看不到大家的牌,他能看得到。另外麻將的牌張數(shù)只有136張,張數(shù)比較少,如果張數(shù)達到361張,和圍棋棋盤一樣,我們就可以有嚴格的數(shù)據(jù)證明它比圍棋復雜得多。

總的來說,它屬于一種封閉環(huán)境、靜態(tài)環(huán)境的任務。我們以往的機器學習其實主要就在解決這樣的任務,我們假定很多東西不變的,我們假設評價目標恒定等等,但是今天我們解決的任務目標變了,比如說我們一條破冰船開到兩極去,它看到的險情在變的,目標還會多樣化等等,所以我們今天的任務是在開放環(huán)境下怎么樣更好地做機器學習,這時候好的時候要好,壞的時候也不能太壞。

如果我們看看國際上對于人工智能發(fā)展的討論,國際人工智能大會有一個主席的報告,就是由學會的主席來對未來做一個判斷,他的題目就是說“通往魯棒的AI”,隨著人工智能技術取得巨大發(fā)展,我們越來越多地面對高風險應用。這個魯棒的人工智能怎么來呢?就要求我們的系統(tǒng)必須要能夠很好地應對未知環(huán)境,實際上用我們的話來說就是開放環(huán)境,所以開放環(huán)境下的機器學習是我們這個領域特別要關注的事情。

第三方面,我想簡單地談一談關于人工智能產業(yè)發(fā)展的一點粗淺的想法。

今天我們可以看到人工智能技術在很多產業(yè)廣泛應用,但是如果大家問到底什么產業(yè)是代表性的呢?我想主要就是互聯(lián)網行業(yè)。人是什么?很基本的一個原因是他們積累了大量的數(shù)據(jù),我們的機器學習技術也好,人工智能技術也好,是提供了利用數(shù)據(jù)的方法。其實我們馬上就可以看到,經過十多年的努力,我們所有的行業(yè)可以說都有很多的數(shù)據(jù)。事實上人工智能技術可以進入所有這些領域,所以今天我們應該問的不是說人工智能技術在哪些領域可能能用得好,而是應該問的是下面人工智能技術會在哪些領域取得更大的提高。

我想現(xiàn)在人工智能技術已經用得很好的領域反倒不太容易取得更大的提高,現(xiàn)在用得比較少的領域用進去之后可能進展會更大。未來的話人工智能技術確實就應該像電力一樣,遲早會進入所有的行業(yè)。

人工智能產業(yè)發(fā)展到底需要什么呢?是不是需要設備呢?其實不是的,我們基本不需要什么特殊精密設備,是不是需要數(shù)據(jù)呢?現(xiàn)在數(shù)據(jù)遍地都是。真正需要的是什么呢?其實真正需要的是人才。

特別是和一般的軟件產業(yè)比,人工智能產業(yè)應該是一個非常凸現(xiàn)個人英雄主義的行業(yè)。前幾天如果大家關注新聞,可能看到有一件,我們組里面一個還沒有畢業(yè)的學生被一個研究企業(yè)聘請去做創(chuàng)業(yè)指導,高校畢業(yè)出來的人才一定要在企業(yè)里面經過兩三年的打磨以后才能做這個事。以往我們做軟件的話,一個軟件一定要有很多人來做。今天人工智能這個行業(yè)它的代表性就是它是軟件業(yè)里面的一個明珠,個別人的聰明才智在哪個方面取得算法上的突破,可能就真的帶來生產力。所以今天這個行業(yè)的特點,就決定我們人工智能的人才培養(yǎng)是特別重要,所以現(xiàn)在可以說進入了一個全球增強人工智能人才的年代。

但是高水平人工智能人才培養(yǎng)的造血能力,我們認為它真的會導致產業(yè)核心競爭力的差別,而且人工智能人才培養(yǎng)基地會直接促進人工智能產業(yè)人才急劇形成。

最近我們南京大學成立了一個人工智能學院,我們也希望從源頭做起,為國家培養(yǎng)高水平人工智能人才。南京政府也非常支持我們這個學院的成立,我也歡迎各位以各種方式來支持我們南京大學人工智能學院,謝謝!

推薦閱讀:HGX-2:Nvidia推出的集AI和高性能計算于一身的平臺

相關文章
廣電視聽智能體(AI Agent)開發(fā)工具在短視頻創(chuàng)作領域得到應用
廣電視聽智能體(AI Agent)開發(fā)工具在…
華數(shù)發(fā)布智慧廣電AI+升級方案
華數(shù)發(fā)布智慧廣電AI+升級方案
廣西廣電網絡與多家單位確定合作關系
廣西廣電網絡與多家單位確定合作關系
湖北廣電網絡荊門分公司開發(fā)的智能問答助手“小荊”上線
湖北廣電網絡荊門分公司開發(fā)的智能問答…
注意!9月1日起,AI生成合成內容必須添加標識
注意!9月1日起,AI生成合成內容必須添…
東莞智媒AI產業(yè)賦能基地揭牌成立
東莞智媒AI產業(yè)賦能基地揭牌成立
我還沒有學會寫個人說明!

24小時排行

  • 暫無文章