智能音箱賽道搶跑:一場關(guān)于未來家庭入口的爭奪戰(zhàn)
2017-07-11 10:18:02 來源:TechWeb 熱度:
百度AI開發(fā)者大會上除了智能駕駛,另一個重頭戲就是語音交互。在現(xiàn)場的演示中基于自然語言的交互平臺DuerOS,百度工程師羅興通過十七行代碼,用1分鐘的時間,讓原本只會英文的音箱馬上變得能“聽懂”中文。
語音加速人機(jī)交互方式的變革,搭建智能語音生態(tài)早已不約而同地成為諸如百度、谷歌、微軟等的AI發(fā)展戰(zhàn)略。Google Assistant,蘋果Siri、百度DuerOS、微軟小冰和小娜等等智能語音服務(wù)早已在各類機(jī)器設(shè)備中得到了廣泛的應(yīng)用。在語音交互技術(shù)商業(yè)化探索方面,亞馬遜Echo是佼佼者。來自調(diào)研機(jī)構(gòu)CIRP的數(shù)據(jù)顯示,截止2016年底,Echo總共賣出了820萬臺。
eMarketer在報告中指出,在美國語音激活揚(yáng)聲器市場,亞馬遜Echo占據(jù)的份額超過70%,Alphabet的谷歌Home排在第二位,份額24%。
Echo在國外市場的火爆與中國的智能音箱市場恰好形成強(qiáng)烈對比,無論是阿里、京東還是聯(lián)想、小米的智能音箱銷量均未達(dá)到Echo這樣的體量。除了技術(shù)方面的原因,更多的仍然是用戶接受度尚未培養(yǎng)。
搶先布局
7月5日,百度AI開發(fā)者大會當(dāng)天下午,天貓發(fā)布智能音箱天貓精靈。據(jù)其官方介介紹,天貓精靈使用了阿里人工智能實(shí)驗室自主研發(fā)的中文語音理解引擎——AliGenie,在自然語言理解的基礎(chǔ)上加入了“決策引擎”機(jī)制,能夠理解上下文語境,支持多輪對話。并且針對常用的定時、提醒、天氣、家居控制、購物等領(lǐng)域進(jìn)行了特別優(yōu)化。
從其功能演示來看,這又是一款亞馬遜Echo的追隨者。早在2015年,京東就與科大訊飛成立合資公司推出了首款智能音箱叮咚。其旗艦版被命名為A1,整體交互方式在家庭5米遠(yuǎn)程范圍內(nèi),可以與這款音箱進(jìn)行語音交互。當(dāng)然這款產(chǎn)品同樣可以實(shí)現(xiàn)語音購物功能。據(jù)京東智能音響產(chǎn)品負(fù)責(zé)人鐘博透露,目前這款產(chǎn)品已經(jīng)迭代多次累積用戶達(dá)到了100萬。
從銷量的對比可以發(fā)現(xiàn),國內(nèi)的智能音箱產(chǎn)品遠(yuǎn)不如亞馬遜Echo在國外市場的歡迎程度。鐘博認(rèn)為主要原因還在于消費(fèi)者對智能音箱這一產(chǎn)品的接受度還沒有培養(yǎng)起來。
今年7月,叮咚TOP智能音箱上線京東商城其價格僅為399元,制定這樣價格的原因在于,降低獲得門檻讓智能音箱可以進(jìn)入更多的家庭。
智能音箱所代表的是一種全新的人工智能交互方式,代表著未來人工智能在家庭應(yīng)用場景中的落地。巨頭搶奪的并未是智能音箱市場,而是有關(guān)未來家庭入口的進(jìn)場券。
技術(shù)優(yōu)化
一個不容忽視的發(fā)展趨勢是,未來我們的生活將從工業(yè)時代完全過渡到一個全新的智能時代。人工智能會受人類的控制而更好地服務(wù)于人類,擁有更多的功能,應(yīng)用到更廣泛的領(lǐng)域。而這里有一個重要的課題需要解決:人類怎樣才能順暢的與機(jī)器進(jìn)行交流,讓機(jī)器真正能與人類實(shí)現(xiàn)對話。
事實(shí)上,就目前的技術(shù)而言,人類與人工智能實(shí)現(xiàn)如同科幻電影里的順暢交流并非易事。因為機(jī)器現(xiàn)在的智能語音停留在對關(guān)鍵詞的內(nèi)容識別和上下文分析,而機(jī)器是沒有“語感”的,也不懂得什么語法。要將人類的語言用數(shù)學(xué)邏輯的形式解析并讓機(jī)器理解、學(xué)習(xí)這中間存在的問題就是,語言是不是能夠被數(shù)學(xué)化?語言如何能被數(shù)學(xué)化?
盡管國內(nèi)智能音箱設(shè)備眾多,但有一個問題是目前它們都未能完美解決的:智能音箱未能100%對用戶提出的需求進(jìn)行精準(zhǔn)的響應(yīng)。
叮咚智能音箱研發(fā)中心負(fù)責(zé)人周正友對TechWeb解釋稱,機(jī)器對于人類語言的識別會隨著深度學(xué)習(xí)的加深不斷改進(jìn),足夠大的數(shù)據(jù)量會讓機(jī)器越來越智能。智能音響的推出并不是生產(chǎn)出來就完了,它是處于一個不斷迭代與學(xué)習(xí)完善的過程中,這也是人工智能時代產(chǎn)品與工業(yè)時代產(chǎn)品的不同。
在理想化中的狀態(tài)中,智能音箱在家庭中的角色更多是智能語音助手。它無法取代生活中的家用電器,但它能夠讓家電更快捷的對人們的需求作出反饋。
但是基于目前的智能語音交互技術(shù),這種理想化的狀態(tài)想要實(shí)現(xiàn)并非易事。鐘博表示,“在特定語式下智能音箱與家電之間是打通的,特別自然的可以隨便去理解的話,其實(shí)還都是非常大的難度。這個需要通過時間、大量的用戶數(shù)據(jù),大量的方式不斷深化它,逐漸把中文的語音方式和音響對于這個用戶的說話的方式屬性慢慢建立起來,所以并不是一個點(diǎn)狀的。如果是打造一個自然,業(yè)界上還沒有攻克到這種程度,需要一定的時間。”
巨頭游戲
讓人類和機(jī)器對話是人機(jī)交互領(lǐng)域長久以來的夢想。語音正在成為人類和機(jī)器互動中越來越重要的手段。企業(yè)在這個領(lǐng)域的競爭無疑也是激烈的。目前無論是科大訊飛、云之聲還是思必馳等都瞄準(zhǔn)了語音交互與智能硬件相結(jié)合的場景。
在周正友看來,產(chǎn)品的研發(fā)背后最重要的其實(shí)是交互體驗,而交互體驗的順暢與否其實(shí)是需要大數(shù)據(jù)的支持與訓(xùn)練??萍季揞^們擁有這場語音爭奪戰(zhàn)的先天優(yōu)勢——海量數(shù)據(jù)。
在百度AI開發(fā)者大會上,百度工程師羅興用 DuerOS 的智能硬件開放平臺,在短短的一分鐘之內(nèi),用十七行代碼,讓搭載了 Alexa、只會講英文的 Anker 音箱聽懂了中國話。這被許多自媒體解讀為“百度DuerOS開放平臺,讓你一分鐘擁有中國版Echo”。
但其實(shí)問題遠(yuǎn)沒有這么簡單,周正友在與TechWeb對話中談到,欽佩百度能夠開放到如此程序,將一個具體智能音響內(nèi)部結(jié)構(gòu)都開放出來。但他表示,僅僅依靠這個開放平臺,中小開發(fā)者并不能打造出一個智能音響,“智能音響牽扯因素比較多,譬如說整個麥克風(fēng)和搭配尺寸上的關(guān)系,幾毫秒的差別引起的變化。這需要長期的設(shè)計和生產(chǎn)積累經(jīng)驗,并不是一個開放平臺就能解決所有問題。”
智能音箱的硬件設(shè)計需要技術(shù)與經(jīng)驗的積累,另一方面,其搭載的服務(wù)則需要海量數(shù)據(jù)供其學(xué)習(xí)。在周正友看來,擁有數(shù)據(jù)的大企業(yè)在智能音箱的設(shè)計與迭代方面有著巨大的優(yōu)勢。
但是在人工智能初創(chuàng)公司驀然認(rèn)知CEO戴帥湘此前在與TechWeb對話中表示,這個市場其實(shí)并不是特別激烈,因為用戶使用語音交互的習(xí)慣并沒有完全培養(yǎng)起來,另外就是,這個領(lǐng)域其實(shí)沒有真正的巨頭。
但不可否認(rèn)的是,對于語音交互的需求是很大的,一款語音交互體驗好的產(chǎn)品必然會得到更多服務(wù)商的親睞。目前比拼的就是誰的產(chǎn)品交互體驗更好。
責(zé)任編輯:黃焱林