解密 | 百度為何全資收購KITT.AI

這家KITT.AI有何來頭?
這家名叫KITT.AI的初創(chuàng)公司來自美國西雅圖,專注語音喚醒和自然語音交互技術(shù)。開發(fā)的可定制熱詞檢測器(hotword detector)和對話引擎 ChatFlow 可以為任何基于語音或文本的設(shè)備/bot提供在線多回合對話功能。
它最初是作為艾倫人工智能研究所(AllenInstitute for Artificial Intelligence,簡稱AI2,由Paul Allen創(chuàng)辦)的一個內(nèi)部孵化項目在去年正式成立。此后,在今年1月又獲得西雅圖風(fēng)險投資公司Founders’ Co-op與Amazon Alexa項目的種子輪投資。而在最近,它又收到了來自創(chuàng)投機構(gòu)Madrona Venture Group的一大筆錢。目前,KITT.AI的主要產(chǎn)品研發(fā)基地位于西雅圖市中心。
KITT.AI的聯(lián)合創(chuàng)始人姚旭晨本科畢業(yè)于南京大學(xué),在美國約翰.霍普金斯大學(xué)獲得博士學(xué)位后,于去年加入了由計算機科學(xué)家Oren Etzioni領(lǐng)導(dǎo)的AI2孵化器。據(jù)悉,他在2012年到2016年期間,在自然語言理解和機器學(xué)習(xí)的6大會議(ACL, EACL, NAACL, EMNLP, NIPS, ICML)上,姚旭晨的論文發(fā)表數(shù)位居前10位。
該公司的另一名聯(lián)合創(chuàng)始人陳果果是一名資深語音識別專家。在創(chuàng)立KITT.AI之前,他曾為安卓系統(tǒng)開發(fā)了一個名叫“OK Google”的熱詞探測軟件雛形。
此外,美國南加州大學(xué)前自然語言處理技術(shù)教授與自然語言解析和對話系統(tǒng)專家Kenji Sagae也作為合伙人加入了KITT.AI。
他們做了什么?
Kitt.AI最早是做一個“熱詞檢測”的產(chǎn)品Snowboy人工智能軟件工具包起家,并受到了廣泛認可。
“熱詞”也就是“喚醒詞”,通過這個軟件,開發(fā)人員可以在一些硬件設(shè)備上添加“語音熱詞探測”功能。比如在Iphone上用“Hey Siri”來喚醒Siri,然后可以和Siri進行進一步的互動。“Hey Siri”這個詞一般叫做熱詞或者喚醒詞。相應(yīng)的,Google有“Ok-ay Google”,Amazon有“Alexa”。熱詞檢測系統(tǒng)一般不需要網(wǎng)絡(luò)連接。只有當(dāng)相應(yīng)的詞被說出來以后,計算機才會被喚醒進行接下來有可能需要在服務(wù)器端完成的操作(語音識別,語義理解,信息搜索等等),所以熱詞檢測系統(tǒng)保證了用戶的隱私。同時,熱詞檢測系統(tǒng)需要足夠準確。Snowboy是一個可以讓用戶自定義的熱詞檢測系統(tǒng),用戶可以定義除了“Hey Siri”, “Okay Google”, “Alexa”以外的詞匯。
接下來做的產(chǎn)品叫做NLU,是自然語言理解(Natural Language Understanding)的縮寫。顧名思義,這個產(chǎn)品就是讓計算機理解用戶說的話是什么意思。比如說,在“wake me up at 6am tomorrow”這個例子里面,計算機就需要理解到用戶的意圖是使用鬧鐘(因為用戶需要被叫醒)。計算機需要進一步理解到鬧鐘的時間是“6am tomorrow”而不是其他時間??傮w上來說都是讓計算機理解單個句子。
在這之后,他們在聊天機器人上又有所建樹。
由這三位研究人工智能的博士組建的創(chuàng)業(yè)公司Kitt.AI幫助開發(fā)者解決了在聊天界面中如何進行上下文的多輪對話的難題。
他們開發(fā)出對話引擎ChatFlow,ChatFlow是一款給開發(fā)者用來開發(fā)對話系統(tǒng)的工具,集成了開發(fā)聊天機器人的各個模塊,實現(xiàn)人機對話。ChatFlow有非常簡潔的圖形界面,開發(fā)者的編程造詣哪怕不是特別深,也可以用ChatFlow來開發(fā)和計算機的對話系統(tǒng)。同時,ChatFlow可以幫助開發(fā)者把自己的聊天機器人部署到Facebook Messenger、Telegram和亞馬遜Alex等各個平臺。
百度為何要收購KITT.AI?
百度度秘事業(yè)部總經(jīng)理景鯤在百度開發(fā)者大會現(xiàn)場說,喚醒萬物的核心三要素是要做好聽清、聽懂、滿足。聽懂是人工智能時代用數(shù)據(jù)和技術(shù)解決的關(guān)鍵問題。在這個時代,只有百度在中國市場是唯一具備聽清、聽懂、滿足的實力,打造一個開放賦能的生態(tài)系統(tǒng)。”
而在這個生態(tài)系統(tǒng)中,KITT.AI基于其強大的語音能力和自然語言處理能力可能會對百度平臺起到非常大的作用。
在現(xiàn)場,KITT.AI聯(lián)合創(chuàng)始人、CTO陳果果先生演示了如何使用KITT.AI語音喚醒技術(shù)快速打造一個語音喚醒設(shè)備。
根據(jù)陳果果先生演示,進入Snowboy的喚起詞庫并新建喚起詞“你好景鯤”后,接著只需要說三遍“你好景鯤”,即可完成喚起詞的訓(xùn)練。在測試環(huán)節(jié),設(shè)備只會對喚起詞“你好景鯤”進行響應(yīng)。
Snowboy的產(chǎn)品概念很明了:讓用戶通過與移動設(shè)備進行對話,“喚醒”或“命令”它們?nèi)プ鲆恍┦虑椤T谶@個過程中,設(shè)備會通過主人的“語音控制”變身為一個智能化機器人。
從技術(shù)角度來看,Snowboy采用先進的深度神經(jīng)網(wǎng)絡(luò)技術(shù),可以學(xué)習(xí)并識別不同的聲音模板;與此同時,它還擁有復(fù)雜的音頻處理技術(shù),也可以在沒有網(wǎng)絡(luò)連接的情況下進行工作。
曾拒絕Facebook的KITT.AI為何要投入百度懷抱
姚旭晨和陳果果表示,人工智能現(xiàn)在越來越火,尤其今年NLU(理解),Dialogue (對話)和 Usability (可用性)領(lǐng)域的參與者越來越多,競爭越來越大。蘋果的Siri更多地局限在NLU這一塊,亞馬遜的Echo偏向NLU和Dialogue。三大塊能做到兩塊的公司很多,但是KITT.AI在有NLU和Dialogue的同時,也有Usability這個非常吸引開發(fā)者的地方。
他們介紹說,相比其他公司,KITT.AI開始得比較早,wit.ai在去年年初被Facebook收購了。還有另外一個公司,api.ai,最近也剛剛被Google收購。而KITT.AI不想被很快收購,我們有著更大的目標。我們希望未來能成為一家成功的SaaS (Software as a Service,軟件即服務(wù),如iCloud, Office 365)公司,做好自己的品牌。
而到了今天,百度伸出的橄欖枝也許正如他們的意。
一方面,陸奇加入百度之后,就開始了大刀闊斧的改革。對于AI,百度集團總裁兼COO陸奇宣布百度將All-In。
在會上,陸奇表示,AI平臺將是社會的巨大的推動力,是中國的歷史性機遇,是百度的機會。
目前百度已經(jīng)積累了大量的人才、技術(shù)和數(shù)據(jù)資源,讓百度成為最有能力、最有機會來推動AI的發(fā)展的一個公司。
技術(shù)方面,百度擁有全球最大規(guī)模的神經(jīng)網(wǎng)絡(luò);人才方面,百度目前有超過2000多個AI研發(fā)人員,有一流的AI研發(fā)中心;數(shù)據(jù)方面,百度有百億級的定位數(shù)據(jù)和萬億級的搜索數(shù)據(jù)。
另一方面,也許會與陸奇的背景有關(guān)。KITT.AI出自艾倫人工智能研究所(AllenInstituteforArtificialIntelligence),而艾倫研究院的捐助人是微軟的另一位創(chuàng)始人,陸奇在微軟里有自己的勢力和影響力,有這層關(guān)系加持,對這起收購案的成功應(yīng)該會加分不少。
再者,通過知情人士透露,本次收購的價格也在億元之上。
而英雄都會惺惺相惜,作為一家國際巨頭公司,百度將調(diào)轉(zhuǎn)艦頭深耕AI領(lǐng)域,這與KITT.AI創(chuàng)立之初的抱負是吻合的。此次的合作,也許可以說是KITT.AI找了個好婆家,百度也找到個好媳婦兒。
另外,此前,百度還曾于今年4月13日于全資收購硅谷AI公司xPerception。xPerception是硅谷一家專注于機器視覺軟硬件解決方案的科技公司,面向機器人、AR/VR、智能導(dǎo)盲等行業(yè)客戶提供以立體慣性相機為核心的機器視覺軟硬件產(chǎn)品,即為人工智能產(chǎn)品裝上“眼睛”。
從這兩起收購案來看,對于AI這條路,百度是走定了。
相關(guān)推薦
盡管更換ARM架構(gòu)服務(wù)器,在百度內(nèi)部并不算最重要的項目,但對整個數(shù)據(jù)中心領(lǐng)域來講,卻是大事件,這在某種程度上意味著,此前英特爾x86...