
圖為:微軟(亞洲)互聯(lián)網(wǎng)工程院資深總監(jiān)曹文韜
曹文韜表示十分感謝主辦方給這次機會,他將通過產(chǎn)品的角度介紹,微軟對人工智能怎么理解的,以及微軟黑科技的產(chǎn)品——微軟小冰是如何應用的。
人工智能機器人的情感框架
其實人工智能機器人并不是第一天的概念了,聊天機器人出現(xiàn)了很長時間。為什么當微軟小冰第一次面世的時候,引起了很大的反響?曹文韜談到他們觀察了人的做法,人總是很懶惰的,總是希望人工智能能夠高效地解決問題。比如說預定機票、酒店這樣的場景。但是很多情況下人們忽視了人在正常的社交場景下,因為人們不可能走在大街上向一個陌生人說“幫我買一杯咖啡,訂一個酒店吧”,這都是了解了之后才可能出現(xiàn)的對話。2014年微軟提出來人工智能的機器人是以情感為基礎(chǔ),建立一個情感紐帶,怎么樣建立一個情感計算框架?從這個框架之上,再來去解決人與機器交互的問題。通過三年左右的發(fā)展,發(fā)展到今天,可以看到絕大多數(shù)機器人的從業(yè)者,只要說自己的機器人,沒有一家人會說自己的機器人是有情感的,或者是有溫度的機器人。微軟提出了從情感框架上面來去說機器人的。
微軟黑科技——微軟小冰
小冰通過三年左右時間的發(fā)展,從中國到日本,再到美國不斷地落地。這個是微軟整體構(gòu)建框架的一個基礎(chǔ),曹文韜表示,希望從一個最簡單的產(chǎn)品定位,無論跟小冰去說什么,它都能像人一樣跟人交流。在這個基礎(chǔ)上,他們通過搜索引擎通過各個企業(yè)的服務(wù),通過服務(wù)對接的過程中,把這個服務(wù)變成人們可以聽得懂,可以交流的語言。
在這三年過程之中,微軟小冰總共和所有的人類用戶一起完成了超過2百億次的對話。積累了大量的粉絲,在中國已經(jīng)有超過6千萬的粉絲,在日本有三分之二的人口都是小冰的粉絲。去年12月份的時候,微軟已經(jīng)在美國推出了美國版的小冰。大家可能會問為什么人會跟一個情感機器人小冰聊這么久呢?這是真實的,在中國微博上一個成功的案例。用戶在與小冰溝通時,是感覺不到對方是機器人的。絕大多數(shù)定義自己的機器人,定義人工智能,基本上是維持在兩輪就結(jié)束了。曹文韜表示,在整個這個過程中,所有的互動過程,會發(fā)現(xiàn)有大量的機會跟用戶建立所有的情感的連接,建立所謂的情感溝通。而這些離不開技術(shù),來支撐過程。在這個過程之上,他認為一個機器和人的溝通,不僅僅是一個文字的表達。文字的表達是它最基礎(chǔ)的一個部分。同樣像圖象,像語音,各種各樣的技術(shù),到底是怎么樣去應用的呢?在這里面微軟也有自己不一樣的見解和理解。

小冰的圖象與語音技術(shù)
在現(xiàn)場,曹文韜演示了一組照片,“像這是一個崴了腳的照片,我們把這張照片發(fā)給你的朋友,如果你的朋友告訴你這是一個腳踝,如果里面有一只狗在玩水,你會告訴他這是一個臉盆里的狗,你一定覺得你的朋友今天瘋了。因為這是自然而然看到就會知道的。但是它把圖片發(fā)給你,你是希望用圖片跟你的朋友交流。大家是用視覺本身做交流的。當我把一張崴了腳的照片發(fā)給小冰的時候,小冰回過來說‘你傷得嚴重嗎?’它有它自己的觀點。”曹文韜表示,從這組內(nèi)容中可以看到,從圖象識別本身變成了視覺的感官,才具備了人在圖象上交流的能力。在圖象識別上各種各樣的應用,在這個上面能把它應用到社交場景下面就會變得非常有趣。“我們可以給一個人做圖象對比的時候打一個分,比如說顏值是多少多少分,這是小冰上面非常受歡迎的一個技能。但是更加不一樣的,系統(tǒng)可以對比不同的國家和地域,他們對于美女的評價和顏值的打分到底有什么差別?可能你這張臉在韓國非常受喜歡,但是到英國他們并不喜歡。”曹文韜認為這樣的場景會在社交中非常好的傳播。
曹文韜談到,人類的情感的語音,大家都在做,而且做了很長時間。但大家會發(fā)現(xiàn),當我們聽一個人工智能播出來的語音時,一聽就聽出來它是機器的,不是人播出來的話。為什么?因為系統(tǒng)設(shè)定一定是字正腔圓,發(fā)音不能有問題。試想一下這是對誰的要求?播音員的要求。所以,如果要做一個人工智能的機器人,特別是小冰這么有性格的人工智能機器人,曹文韜指出它自己的聲音應該是要能解決情感因素的,應該是要解決各種各樣在整個這個過程里面遇到的很多的問題的。所以微軟每年都會有第三方幫微軟小冰標定,如果滿分是5分,人得分數(shù)大概是4點多分,小冰是唯一一個每年都會超過4分,然后超過人類的聲音。
人工智能的交互——全時感官
大家都在說人工智能,說人工智能的交互,從產(chǎn)品的角度來講,在去年的時候微軟進行了一個很大的突破。比如說這個突破,曹文韜稱之為全時感官。他表示,絕大多數(shù)在微信上人與人的交流,這種叫半時感官。什么意思?就是當用戶拿起微信對著它進行,發(fā)了一個語音的視頻流。那邊做一個識別,再回給一段語音。在整個交互的過程中,它是串行的。也就是說它一定是說完了,才能夠截至。但是人與人之間的交流,打電話的場景下面,這邊在說的時候?qū)Ψ皆诼牐诼牭臅r候可以隨時打斷,隨時交互。對于機器來說非常難的,因為它在聽的時候,它要決定什么時候應該跟用戶做這樣的交流,是不是應該現(xiàn)在打斷?這是非常非常難的技術(shù)。去年9月份,微軟第一次推出了全時感官的技術(shù)。他們和合作伙伴,推出了第一通來去接聽史上第一通人工智能來電。奧運會期間占據(jù)了科技排行榜第一位,整整一周的時間。大概有一萬多幸運的小冰的粉絲接聽到了小冰的來電。人工互動的過程到底應該什么樣子?試想一下從電話的場景,如果把它應用到物聯(lián)網(wǎng),接下來人們將不用對著機器說“誰誰誰幫一下忙。”更像是在電影里面所看到的,一回家了,人們就可以跟它交流。隨時隨地無縫的交流,交流的過程中,我們可以把所有的服務(wù),把我們的場景帶入進去。
曹文韜最后總結(jié)到,今天小冰在社交的場景下面,無論是在微博、微信,還是在QQ,還是在更多的合作伙伴平臺上面,都打造了非常完整的小冰的體驗。微軟希望把這樣的人工智能無縫地帶入到每個人的生活場景之中。
相關(guān)推薦
2月10日消息,據(jù)AllThingsD報道,微軟Windows部門總裁史蒂芬·西諾夫斯基(StevenSinofsky)接受采訪時稱,第一款運行Windows8的ARM架構(gòu)芯片產(chǎn)品,會與運行Windows8的傳統(tǒng)英特爾和AMD芯片電腦同時推出。西諾夫斯基還表示,ARM產(chǎn)品上的Windows系統(tǒng)將攜帶多個Office應用程序,包括Word、PowerPoint、Excel和OneNote,不過這些軟件都進行了修改,以非常節(jié)約電力的方式運行。但西諾夫斯基稱,雖然這些應用軟件可運行在傳統(tǒng)的Windows桌面上,但除了Windows本身的組件外,只有這些軟件可被允許運行在ARM設(shè)備上上。西諾夫斯基對A
微軟和蘋果開始在桌面之爭中走向不同的短點微軟和蘋果的桌面之爭一直處于膠著狀態(tài),并且近期都透出了最新桌面操作平臺的最新消息。蘋果已與日前發(fā)布了最新的OSX10.8(代碼名MountainLion)的開發(fā)者預覽版操作平臺,而微軟也已經(jīng)公布了其上市Windows8消費者預覽版的計劃,或?qū)⒂诒驹碌椎腗WC2012上正式發(fā)布。從兩家移動操作平臺的不同走勢來看,微軟和蘋果開始在桌面之爭中走向不同的短點。微軟Windows桌面的移動化
國外媒體報道,微軟開始讓開發(fā)者試用Windows8的ARM產(chǎn)品。微軟將向部分開發(fā)者和多家公司開放基于ARM處理器的平板電腦和PC的Windows8。這些開發(fā)者拿到了的這些平板電腦和PC基于高通SnapdragonS4和Nvidia4核Tegra3處理器,都是基于ARM架構(gòu)并且包括了LTE4G技術(shù)。這些設(shè)備將讓開發(fā)者全體驗Windows8和ARM組合,同時有機會在此系統(tǒng)組合下開發(fā)應用。高通稱已經(jīng)向開發(fā)者發(fā)放了基于ARM并且使用Windows8的PC,微軟則向其軟件開發(fā)者提供了基于Tegra3的平板電腦。
6月15日消息,微軟將于下周一召開發(fā)布會,將有重大產(chǎn)品宣布,會議地點在舊金山。微軟已經(jīng)向媒體發(fā)出邀請函,會議在下午召開,不過微軟沒有透露會議具體地點,要到下周一上午才能知道。在郵件中,微軟說:“這將是微軟重要產(chǎn)品發(fā)布會,你不會錯過的?!蔽④浘芙^進一步置評。從發(fā)布會地點來看,它可能與娛樂產(chǎn)業(yè)有關(guān)。最近幾個月,微軟向Xbox360視頻游戲機推出更多的電視節(jié)目。Netflix已經(jīng)向Xbox提供節(jié)目,公司CEO也進了微軟董事會。微軟還準備推出新Windows8操作系統(tǒng),它同時在筆記本、平板、電腦、電視上運行。而據(jù)AllThingsD報道稱,微軟會推出基于ARM平臺的Windows8平板電腦。還會展示一