
本期嘉賓為伊恩·古德費洛(Ian Goodfellow),他因提出了生成對抗網(wǎng)絡(luò)而聞名,他被譽為“GAN之父”,甚至被譽為人工智能領(lǐng)域的頂級專家。
資料顯示,古德費洛等人于2014年10月在Generative Adversarial Networks中提出了一個通過對抗過程估計生成模型的新框架,框架中同時訓(xùn)練兩個模型:捕獲數(shù)據(jù)分布的生成模型G,和估計樣本來自訓(xùn)練數(shù)據(jù)的概率的判別模型D。G的訓(xùn)練程序是將D錯誤的概率最大化,這個框架對應(yīng)一個最大值集下限的雙方對抗游戲??梢宰C明在任意函數(shù)G和D的空間中,存在唯一的解決方案,使得G重現(xiàn)訓(xùn)練數(shù)據(jù)分布,而D=0.5。在G和D由多層感知器定義的情況下,整個系統(tǒng)可以用反向傳播進行訓(xùn)練。在訓(xùn)練或生成樣本期間,不需要任何馬爾科夫鏈或展開的近似推理網(wǎng)絡(luò),實驗通過對生成的樣品的定性和定量評估證明了本框架的潛力。
通過讓神經(jīng)網(wǎng)絡(luò)互相攻擊,伊恩·古德費洛(Ian Goodfellow)創(chuàng)造出強大的人工智能(AI)工具,賦予機器以想象的能力,現(xiàn)在,他和我們其他人必須面對這種工具帶來的后果。
2014年的的某個晚上,古德費洛和一名剛剛畢業(yè)的博士生共同喝酒慶祝。在的蒙特利爾頗受歡迎的酒吧Les 3 Brasseurs,許多朋友請求他的幫助,因為他們正在開發(fā)一個棘手的項目,即可以自己創(chuàng)作圖片的電腦。
生成對抗網(wǎng)絡(luò)的誕生
這些研究人員已經(jīng)在使用神經(jīng)網(wǎng)絡(luò),即模仿人腦神經(jīng)網(wǎng)絡(luò)建立的松散模型算法,作為“生成”模型來創(chuàng)建自己的新數(shù)據(jù)。但結(jié)果往往并不如人意:電腦生成的人臉圖像往往是模糊的,或者出現(xiàn)像丟失耳朵這樣的錯誤。
古德費洛的朋友們提出的計劃,是對構(gòu)成照片的元素進行復(fù)雜的統(tǒng)計分析,以幫助機器自己創(chuàng)作圖像。這就需要大量的數(shù)字運算,而古德費洛告訴他們,這根本行不通。
但當(dāng)他邊喝啤酒邊思考這個問題時,突然想出了一個主意。如果讓兩個神經(jīng)網(wǎng)絡(luò)對抗會產(chǎn)生什么樣的結(jié)果?朋友們都對此持懷疑態(tài)度,所以當(dāng)他回到家,女朋友已經(jīng)睡熟后,他決定試一試。古德費洛在最初的幾個小時里進行編碼,然后測試了他的軟件,沒想到第一次就取得了成功。
古德費洛在那個夜晚開發(fā)出的技術(shù)現(xiàn)在被稱為“生成對抗網(wǎng)絡(luò)”(GAN)。這一技術(shù)已經(jīng)在機器學(xué)習(xí)領(lǐng)域引發(fā)了巨大的興奮,并將其開發(fā)者變成了AI領(lǐng)域的名人。
在過去的幾年里,AI研究人員使用一種叫做深度學(xué)習(xí)的技術(shù)取得了令人印象深刻的進展。提供足夠圖像給深度學(xué)習(xí)系統(tǒng),它會從中學(xué)習(xí),比如識別一個即將穿越馬路的行人。這種方法使得無人駕駛汽車和能驅(qū)動Alexa、Siri以及其他虛擬助手的對話技術(shù)成為可能。
可是,雖然深度學(xué)習(xí)可以學(xué)會識別事物,但他們并不擅長創(chuàng)造它們。GAN的目標(biāo)就是賦予機器這種類似于想象的天賦。將來,計算機將會更好地享受原始數(shù)據(jù),并計算出它們需要從中學(xué)到什么。這樣做不僅能讓它們繪畫或作曲,還將使它們減少對人類的依賴,可以自行學(xué)習(xí)了解世界及其運作方式。
如今,AI程序員們經(jīng)常需要告訴機器,在訓(xùn)練數(shù)據(jù)中到底有什么東西,比如數(shù)百萬張圖片中都有行人過馬路的場景。這種方法不僅成本高昂,而且勞動強度相當(dāng)大。此外,哪怕是稍微偏離了所接受的培訓(xùn),AI系統(tǒng)處理圖像數(shù)據(jù)時都會遭遇挫折。而在將來,電腦將會更好地處理原始數(shù)據(jù),并在不被告知的情況下計算出它們需要學(xué)習(xí)的內(nèi)容。
這將標(biāo)志著AI“無監(jiān)督學(xué)習(xí)”的巨大進步。無人駕駛汽車可以在不離開車庫的情況下了解許多不同的道路狀況,機器人可以預(yù)見到繁忙倉庫中可能遇到的障礙,而不需要再繞過它。
GAN的魔力在于兩個神經(jīng)網(wǎng)絡(luò)之間的競爭
我們想象和思考許多不同情景的能力是我們身為人類的重要組成部分。將來當(dāng)科技?xì)v史學(xué)家回顧現(xiàn)在時,他們很可能會將GAN看作是創(chuàng)造具有人類意識的機器的重要進步。Facebook首席AI科學(xué)家雅恩·樂坤(Yann LeCun)把GAN稱為“過去20年里深度學(xué)習(xí)領(lǐng)域最酷的想法”。另一位AI大咖、百度前首席科學(xué)家吳恩達(Andrew Ng)也說,GAN代表著“重要的、根本性的進步”,這會為不斷壯大的全球研究者社區(qū)提供靈感。
古德費洛現(xiàn)在是谷歌Google Brain的研究科學(xué)家,該團隊位于加州山景城的谷歌總部中。當(dāng)我最近在那里見到古德費洛時,他似乎仍然對他的“巨星”地位感到驚訝,稱其“有點兒不敢相信”。也許同樣令人感到驚訝的是,他發(fā)現(xiàn)自己現(xiàn)在的大部分時間都要用來對付那些想用GAN作惡的人。
GAN的魔力在于兩個神經(jīng)網(wǎng)絡(luò)之間的競爭。它模仿了繪畫偽造者和藝術(shù)偵探之間的反復(fù)交鋒,他們反復(fù)嘗試互相欺騙。這兩個網(wǎng)絡(luò)都是使用相同數(shù)據(jù)集進行訓(xùn)練的,第一個系統(tǒng)被稱為“發(fā)電機”,負(fù)責(zé)生成像照片或筆跡這樣盡可能逼真的人工輸出。第二個系統(tǒng)被稱為“鑒別器”,它將發(fā)電機生成的東西與原始數(shù)據(jù)集中的真實圖像進行比較,并試圖確定哪些圖像是真的,哪些是假的。在這些結(jié)果的基礎(chǔ)上,發(fā)電機調(diào)整其參數(shù)以創(chuàng)建新的圖像。這個過程反復(fù)持續(xù),直到鑒別器再也無法分辨真假。

接受過真人秀明星照片訓(xùn)練的GAN自己生成了想象中的明星照
去年,在一個廣為宣傳的例子中,芯片巨頭英偉達公司的研究人員對AI進行了大量投資,通過研究真實的明星訓(xùn)練了一個GAN系統(tǒng),以生成虛構(gòu)的名人照片。雖然并不是所有虛構(gòu)的假名星都是完美的,但有些卻非常逼真。與其他需要成千上萬訓(xùn)練圖像的機器學(xué)習(xí)方法不同,GAN只需幾百張照片就會變得“技藝精通”。
盡管這種想象的力量仍然有限,但是只要接受過很多狗狗照片的訓(xùn)練,GAN就能產(chǎn)生令人信服的假狗圖像,比如身上會有不同的斑點圖案,但它不能想象出全新的動物。原始訓(xùn)練數(shù)據(jù)的質(zhì)量對結(jié)果也有很大的影響。有這樣一個生動的例子,GAN開始將隨機字母融入到其組合的貓圖中。因為訓(xùn)練數(shù)據(jù)中包含了來自互聯(lián)網(wǎng)的貓圖,這臺機器通過自學(xué),認(rèn)為單詞也是貓圖的一部分。

讓GAN好好工作是件棘手的事,如果出現(xiàn)故障,結(jié)果可能會很奇怪
華盛頓大學(xué)機器學(xué)習(xí)研究員佩德羅·多明戈斯(Pedro Domingos)說,GAN也喜怒無常。如果鑒別器太容易被愚弄,發(fā)電機的輸出看起來就不太真實。而且,對兩種決斗的神經(jīng)網(wǎng)絡(luò)進行校正是很困難的,這也可以解釋為何GAN有時會吐出許多奇怪的東西,比如有兩個頭的動物。
不過,這些挑戰(zhàn)并沒有讓研究人員卻步。自從古德費洛及其同伴在2014年發(fā)表了關(guān)于他的發(fā)現(xiàn)首份研究之后,已經(jīng)有數(shù)百篇與GAN相關(guān)的論文發(fā)表。該技術(shù)的一個粉絲甚至創(chuàng)建了一個名為“GAN zoo”的網(wǎng)頁,專門用來跟蹤已經(jīng)開發(fā)出的各種版本技術(shù)。
GAN最明顯的即時應(yīng)用是在涉及大量圖像的領(lǐng)域,比如視頻游戲和時尚行業(yè):比如,游戲角色在雨中會如何奔跑?但是展望未來,古德費洛認(rèn)為GAN將推動更大的進步。他說:“有很多科學(xué)和工程領(lǐng)域需要我們?nèi)?yōu)化一些東西。舉例來說,我們需要更有效的藥物,或者需要更高效的電池。這將是下一個大浪潮。”
在高能物理學(xué)中,科學(xué)家們使用強大的計算機來模擬數(shù)百個亞原子粒子的相互作用,比如歐洲核子研究中心的大型強子對撞機。這些模擬是緩慢的,需要巨大的計算能力支持。耶魯大學(xué)和勞倫斯伯克利國家實驗室的研究人員已經(jīng)開發(fā)出一種GAN,在利用現(xiàn)有模擬數(shù)據(jù)進行訓(xùn)練后,它能夠?qū)μ囟W拥男袨樽龀鰷?zhǔn)確的預(yù)測,而且速度要快得多。

古德費洛的發(fā)現(xiàn)可以用來想象各種事物,包括新的室內(nèi)設(shè)計
此外,醫(yī)學(xué)研究是另一個非常有前景的應(yīng)用領(lǐng)域,隱私問題意味著,研究人員有時無法獲得足夠的真實病人數(shù)據(jù),分析為什么藥物不起作用。賓夕法尼亞大學(xué)的凱西·格林(Casey Greene)說,GAN可以通過生成幾乎和真實情況一樣好的假病人記錄來幫助解決這個問題。這些數(shù)據(jù)可以被更廣泛地分享,有助于推進研究,而真正的記錄則受到嚴(yán)格的保護。
GAN擁有黑暗的一面 它們使問題變得更糟
然而,GAN也有黑暗的一面。對于那些想要影響股票價格、選舉結(jié)果等制造虛假新聞的人來說,被用于設(shè)計逼真假圖的機器堪稱是一件完美武器。這種AI工具已經(jīng)被用來將其他人的頭像安放在色情明星的身體上,并將某些言論強加在特定的政客嘴上。GAN沒有制造這個問題,但是它們會使問題變得更糟。
在達特茅斯學(xué)院研究數(shù)字取證問題的哈尼·法里德(Hany Farid)正在研究更好的方法來識別假視頻,比如探測因吸入和呼出氣體而導(dǎo)致的臉部顏色發(fā)生細(xì)微變化,GAN很難精確模仿這些。但他警告說,GAN將會反過來適應(yīng)這種情況。法里德說:“我們基本上處于弱勢。”
這種“貓捉老鼠”的游戲也將在網(wǎng)絡(luò)安全領(lǐng)域發(fā)揮影響。研究人員已經(jīng)在強調(diào)“黑盒”攻擊的風(fēng)險,在這種攻擊中,GAN用來找出大量安全程序發(fā)現(xiàn)惡意軟件的機器學(xué)習(xí)模式。通過推測某個防御者的算法工作原理,攻擊者可以躲開它并插入流氓代碼。同樣的方法也可以用來躲避垃圾郵件過濾器和其他防御。
古德費洛深知其中的危險。現(xiàn)在,作為谷歌專注于讓機器學(xué)習(xí)安全的團隊負(fù)責(zé)人,他警告說,AI社區(qū)必須吸取以往創(chuàng)新浪潮的教訓(xùn),技術(shù)專家需要提前思考安全和隱私問題。以往,當(dāng)他們意識到風(fēng)險的時候,“壞人”已經(jīng)確立了明顯的優(yōu)勢。古德費洛稱:“很明顯,我們已經(jīng)超越了起點,但希望我們能在安全問題上取得重大進展。”
盡管如此,古德費洛并不認(rèn)為會有一個純粹的技術(shù)解決方案。相反,他認(rèn)為,我們將不得不依賴于社會,比如教孩子們養(yǎng)成批判性思維,讓他們接受諸如演講和辯論課之類的東西。他說:“在演講和辯論中,你是在和另一個學(xué)生競爭,而你在思考如何制造誤導(dǎo)的言論,或者如何正確地制造那些具有說服力的聲明。”他很可能是對的,但他的結(jié)論是,技術(shù)不能解決假新聞問題,這不是很多人想聽到的。
責(zé)任編輯:吳一波
相關(guān)推薦
巴帝電信夢想成真:107億美元收購Zain非洲資產(chǎn)
這筆交易將為巴帝電信在15個非洲國家?guī)?200萬用戶,意味著其躋身新興市場頂尖運營商的夢想終于成真。Zain出售非洲資產(chǎn)套現(xiàn)90億美元在雙方約定的107億美元中包括90億美元的股份收購,支付方式將為現(xiàn)金。其中83億美元將在交易結(jié)束后支付,7億美元將在交易結(jié)束一年后支付。此外,巴帝電信還須代替Zain承擔(dān)起17億美元的綜合債務(wù)。據(jù)稱,Zain可分派儲備和40億美元循環(huán)貸款償付的規(guī)模須經(jīng)股東批準(zhǔn),它打算以股息的形式向股東分配前期大部分凈收入。Zain集團董事長阿薩德·艾爾·班萬(AsaadAlBanwan)評價該交易時相當(dāng)?shù)靡猓骸白?005年收購Celtel以來,我們大幅增長成為非洲主要的移動運
蘋果CEO庫克暗示不會推ARM芯片MacBook Air
北京時間2月4日消息,據(jù)國外媒體報道,蘋果首席執(zhí)行官蒂姆庫克(TimCook)和首席財務(wù)官彼得奧本海默(PeterOpenheimer)近日與花旗分析師會談時指出,由于iPad發(fā)展前景廣闊,所以不太可能去開發(fā)基于ARM芯片的MacBookAir;中國市場蘊含著巨大的增長潛力;AppleTV前景仍不明朗;而iCloud發(fā)展迅速且非常重要。iPad將繼續(xù)發(fā)展,不會推出基于ARM芯片的Mac。庫克重申了他在季度財報電話會議上所說的話,他認(rèn)為平板電腦市場將繼續(xù)發(fā)展,最終將超過傳統(tǒng)PC市場的規(guī)模。蘋果并未將iPad看作是PC產(chǎn)品,而是將它看作一款后PC產(chǎn)品,因此基于ARM芯片的平板電腦將不會與基于英特爾