AI不僅學會了說謊 還發(fā)明了人類不能理解的新語言
最近,F(xiàn)acebook 在實驗中讓兩個 AI 聊天機器人互相對話,發(fā)現(xiàn)機器人竟逐漸發(fā)展出人類無法理解的獨特語言。
其實,F(xiàn)acebook這個實驗的主要目的,是想讓機器學會談判。
實驗中,雙方選手語言通過談判“瓜分”一堆物品(比如兩本書、一個帽子和三個球),而每種物品對于不同選手的價值是不一樣的,也就是談回來的物品,對于兩位選手帶來的分值是不一樣的。
從人類的角度理解,這個分值就意味著,你有多想要這個物品。有趣的是,研究人員設置的場景,就跟生活中一樣,存在信息不對稱——你知道自己多在意這個東西,但是你不知道對方有多想要,所以,你必須從對話中推斷對方的想法。

游戲界面
每一句話,都經(jīng)過計算
Facebook的AI團隊(簡稱FAIR)還設置了其他的限制,讓其更接近現(xiàn)實中的談判場景,比如,要確保兩個選手不可能同時拿到最好的結(jié)果。生活中往往無法盡如人意,我們總是要學會妥協(xié)。
其次,如果放棄談判,或者談了10輪還沒談好,雙方都只能拿零分,也就是一拍兩散。因此,想要利益最大化,你必須擁有杰出的談判技能。
在訓練過程中,AI學會減少說廢話和意思模糊的話,提高談判的效率。談判顯然不是一件如此簡單的事,而是一個關于語言和推理的藝術,既包括合作也包括對抗,選手必須學會適當?shù)睦斫夂捅磉_,以達到自身目的。
FAIR研發(fā)了一個對話推斷模型框架,模擬未說出的對話可能性,然后根據(jù)每種對話最后可能的得分,計算自己應該說什么。

對話推測模
AI學會了偽裝與欺騙
FAIR團隊會讓AI跟人或者另一個AI一起玩游戲,讓AI逐漸學習應該怎么談判。經(jīng)過一輪學習之后,研究團隊發(fā)現(xiàn)了以下現(xiàn)象:
人類比AI更難捉摸、也更任性:新入局的選手在面對人類對手時,明顯談判耗費的對話時間更長,接受交易更慢。人類與AI另一不同,人類有時候會拒絕繼續(xù),直接一拍兩散,而實驗中的AI會一直談判,直到達成共識與結(jié)果。
從下面的表格中可以看出,相比起人與AI談判,兩個AI談判達成一致的概率更高,而且結(jié)果也更接近最優(yōu)解。

機機對戰(zhàn)與人機對戰(zhàn)的對比
AI學會耍手段:某些案例中,AI選手會先假裝自己很想要某個物品,其實這個東東對他而言毫無價值。為什么要這么做?原來是為了之后假裝“妥協(xié)”,因為它發(fā)現(xiàn)了對方很想要,如此一來就能騙得對方放出一些更有價值的物品——人類平時的慣用伎倆,沒有人教AI,但它自己學會了。
下面三個對話,分別展示了堅持要最大化分數(shù)的AI、學會妥協(xié)的AI和學會假裝不在意的AI。



AI會說未見過的句子:雖然神經(jīng)網(wǎng)絡傾向于訓練AI重復數(shù)據(jù)庫里面的話語,但結(jié)果是,AI自己學會組織和生成新的句子和說法。
AI發(fā)展出人類不能理解的新話
實驗還出現(xiàn)了更多讓實驗人員意想不到的情況,比如“不說人話”。
如前所及,F(xiàn)acebook的文章提到,在強化學習期間,AI選手會嘗試通過與另一個選手的對話來改進自己的參數(shù),對手可能是一個人也可能是另一AI。
除了這個模型之外,F(xiàn)AIR還使用了一個監(jiān)督訓練模型來訓練AI模仿人講話,這個模型是后來加入的,同時參數(shù)不能被修改。因為研究人員發(fā)現(xiàn),當兩個AI一起聊天,相互改進、升級自身參數(shù)的同時,會逐漸偏離人類日常交流的語言,發(fā)展出自己的語言。
有些人可能覺得,AI居然發(fā)展出了人類理解不了的獨立語言,簡直細思極恐。要是以后AI在密謀什么,人類都聽不懂怎么辦?
細心一想,難道動物們說的話人類又能聽懂嗎?(當然,人類一直擁有一種自負,認為語言是人類獨有的能力。)既然AI那么聰明,懂得見人說人話,見AI說AI話,未來說不定能學會跟動物溝通……
況且別忘了,只要工程師加入一個模型,就能“撥亂反正”,人類暫時還不需要那么雞凍吧。Facebook 研究員在報告中很淡定地寫:
" 未來的工作還有很多潛在可能,特別是讓機器理解更多推理策略,以及在不偏離人類語言的情況下提高表達的多樣性。"
相關推薦
DVBCN消息2010年7月7日電--Telairity卓越的H.264編碼技術是為全球近十億人觀看2010年世界杯足球賽提供支持的“秘密要素”。整個亞洲、南太平洋以及世界杯主辦國南非的觀眾都是依靠Telairity的H.264/AVC編碼器來收看高清(HD)和標清(SD)比賽轉(zhuǎn)播的。有了Telairity的H.264現(xiàn)代技術,世界各地的網(wǎng)絡運營商和廣播、衛(wèi)星及有線電視公司可以更換掉舊的MPEG-2壓縮系統(tǒng),為客戶提供更出色的視頻質(zhì)量并顯著降低對帶寬的依賴,從而大幅減少傳輸成本。泰國國營電信公司CATTelecomPublicCompanyLimited安裝了Telairity高清和標清編碼器
意法半導體(STMicroelectronics,簡稱ST)宣布,其先進的高清電視系統(tǒng)級芯片(SoC)平臺取得了巨大進步,此項成果將意法半導體推向能夠運行基于Adobe®AIR®的游戲和其它應用軟件的下一代互聯(lián)網(wǎng)電視技術的最前沿。意法半導體已成功移植AdobeAIR®2.5forTV軟件至第三代先進互動高清機頂盒系統(tǒng)芯片平臺,并通過Adobe產(chǎn)品認證。AdobeAIR軟件是AdobeFlash平臺的一個重要組件,原始設備制造商(OEM)、原始設計制造商(ODM)、服務開發(fā)人員以及應用開發(fā)人員能夠在這個平臺開發(fā)豐富的網(wǎng)絡應用軟件和游戲,專門為機頂盒和數(shù)字電視等嵌入式設備和
TriplePlayIntegration銷售副總裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供數(shù)字家庭視頻平臺解決方案的專業(yè)軟件服務公司。TPI公司還是官方Adobe的“ScalingPartner”,為消費電子平臺提供FlashPlayer10、AIR和舞臺美術技術提供優(yōu)化的端口。我們有25名具有專業(yè)的項目管理和質(zhì)量保障經(jīng)驗的高級工程師團隊,平均具有24年的工作經(jīng)驗.你們能夠提供什么樣的
DVBCN數(shù)字電視中文網(wǎng)訊(敖瑞),2012年6月15日(周五),由ARM主辦的“跨界、變革、多贏——ARM移動智能終端研討會暨應用開發(fā)者大會”在上海舉行。本次約有20名廠商代表上臺演講;參會并參與展示會的廠商超過30家,均為ARM在各個領域的合作伙伴。ARM亞太市場開發(fā)經(jīng)理AlanTsai做出了“移動終端GPU之趨勢與迷思”的精彩演講。Alan表示:在用戶體驗上來說,分辨率已經(jīng)可以高達人眼都無法辨析的地步了。公允的說,業(yè)界對GPU的評判標準存在太多的分歧:從三角形的角度來看,涉及到生成率、裁切率等指標,不同類型的GPU產(chǎn)品根本沒法比;從填充率的角度上