自從計算機誕生以來,人機交互的媒介一直在演進,短短幾十年從鍵盤和鼠標到觸屏時代,2014年亞馬遜的Echo橫空出世,宣示著一個新時代到來:智能語音。
兵家必爭之地
在中新天津生態(tài)城里有這樣一家入駐企業(yè)——艾聽科技,通過揚聲器的革命,他們重新定義了聲音的傳播方式——定向傳播。即使在醫(yī)院、酒吧這樣的嘈雜環(huán)境里,通過揚聲器的定向傳播,在指定的區(qū)域里會清晰地聽到播放的內(nèi)容,而站在旁邊的人則完全不受干擾。艾聽科技的創(chuàng)始人有著多次創(chuàng)業(yè)的經(jīng)歷,而最終選定了聲音作為變革的領(lǐng)域。
在漫長的時間里,“聽”這個重要的人體感知上面的技術(shù)裹足不前,進展緩慢。艾聽科技COO王劍解釋,從技術(shù)角度看,因為聲音本身的物理特性導(dǎo)致可測量、可計算非常難;另一方面,就是人自身的聽覺有很多主觀感受在里面,甚至所謂人們聽到的音量大小,實際并不是一個簡單的物理量,而是不同環(huán)境下,人耳對聲音強度的一種感知。不過,近年來越來越多的創(chuàng)業(yè)隊伍開始將聲音作為創(chuàng)業(yè)的對象,與艾聽科技的定向傳播不同的是,他們的目光瞄準了智能語音。
自2014年亞馬遜的智能音箱Echo橫空出世以后,智能語音迅速成為巨頭爭奪的戰(zhàn)場,各式各樣的智能語音產(chǎn)品開始出現(xiàn),以智能音箱為例,除了Echo,蘋果推出了HomePod,微軟有invoke,谷歌推出Google home ,國內(nèi)則有京東聯(lián)手科大訊飛(002230,股吧)推出叮咚,阿里推出天貓精靈X1,小米、聯(lián)想等也相繼推出智能音箱,用硝煙四起形容智能音箱市場并不為過。表現(xiàn)最為出色的Echo截止到2016年年底銷量已經(jīng)達到600萬臺,預(yù)計2017年將會突破千萬臺。
用比較極客的語言來描述,智能音箱產(chǎn)品大多是指通過定向麥克風,進行用戶語音信息的收集,通過語音識別及NLP技術(shù),對用戶的語音進行反饋。“大家都知道智能音箱不賺錢,可是又都不敢不做”,一位業(yè)內(nèi)人士形容當下的市場。王劍認為,巨頭之所以紛紛在智能語音上投入,是因為未來智能家居可能都會以語音控制作為入口,有別于傳統(tǒng)的智能家居需要通過專門應(yīng)用程序或者平板進行控制,智能音箱在操作門檻上更低,所以必然會成為更好的一個入口,就像之前都去搶占所謂的PC端入口,移動端入口一樣。
從基礎(chǔ)層面的語音識別,到人工智能層面的深度學習,再到智能硬件,加上云計算的龐大計算能力,智能音箱為代表的智能語音是各種互聯(lián)網(wǎng)技術(shù)的集大成者,這也是為何直到現(xiàn)如今人機交互才進入語音時代的重要原因,它需要一系列的技術(shù)準備。思必馳市場部高級市場經(jīng)理陳輝龍對記者表示,目前語音技術(shù)實現(xiàn)了重要突破,識別率通常能達到百分之90%以上,在以前這是不可想象的,運算能力的提高又能夠為技術(shù)廠商提供很大的空間,再加上人工智能的突飛猛進,都為智能音箱的出現(xiàn)做出了鋪墊。
技術(shù)是軟肋
盡管不論是初創(chuàng)公司還是巨頭,都紛紛重金投入智能語音產(chǎn)品,但是仔細觀察周圍,就會發(fā)現(xiàn)使用智能音箱的消費者寥寥。如果去相關(guān)的論壇上看看消費者對產(chǎn)品的測評,就會發(fā)現(xiàn)槽點滿滿:“聽不懂"人話"、“距離稍微遠一點就要扯著嗓子喊”、“希望越大,失望越大”等等。智能音箱是否會像可穿戴設(shè)備一樣,過了新鮮勁,就被消費者扔在儲物柜里蒙塵?
核心技術(shù)上的硬傷仍然是軟肋,這包括麥克風陣列技術(shù)、遠場語音識別等等。“Echo之所以能夠大火,是因為其采用了6+1的麥克風陣列,具備遠場識別功能,如果沒有麥克風陣列,單純一兩個麥克風識別率就會差很多。”陳輝龍解釋說。
亞馬遜強大的平臺資源是Echo能夠受歡迎的另一大法寶。Echo只是一個設(shè)備,而它的語音助手Alexa才是設(shè)備的大腦,ALexa所具有的強大的資源和海量的計算能力讓任何一個智能語音產(chǎn)品都望塵莫及。通過合作更多的家居設(shè)備,亞馬遜正在為Alexa構(gòu)建更完善的生態(tài)鏈,對著電視說一聲,“Alexa,打開電視”,就能打開電視的酷炫場景已經(jīng)可以實現(xiàn)。
今年7月份BAT中的兩家百度和阿里在同一天召開發(fā)布會,前者在發(fā)布會上宣布duerOS開放平臺發(fā)布,后者則發(fā)布了天貓精靈X1,在智能語音領(lǐng)域,兩家采用不同的競爭策略,擅長營銷的阿里選擇了賣產(chǎn)品,而骨子里透露著技術(shù)基因的百度則選擇了建立開放平臺,企圖建立智能語音的大生態(tài)。
事實上,這也是當前智能語音市場的兩大競爭策略。但是要想做出一款完美的智能語音產(chǎn)品,還是離不開開放平臺的支持。畢竟,智能音箱只是一個入口,最終的夢想是智能家居。“夢想的具體實現(xiàn)需要每個家居設(shè)備具備智能性,而實現(xiàn)智能性和集中控制,又需要所有的設(shè)備遵守一個相互間進行通信的協(xié)議,有了協(xié)議,每個智能終端才能理解控制端發(fā)來的指令,才能做出正確的響應(yīng)。”王劍解釋說。
從早年間海爾做智能家居,到后面日本三洋強勢提出自己的協(xié)議,再到后來小米不斷推出各種米家智能電器。因為沒有大家共同遵守的協(xié)議,就變成每個廠家都需要組建足夠強大的產(chǎn)品線聯(lián)盟,或者自己完全做獨立的一套產(chǎn)品。不解決智能家居設(shè)備之間互聯(lián)互通的問題,就會導(dǎo)致即便用戶買了智能音箱,可能也沒有想象中那么美好。
當然,任何技術(shù)的進步都需要時間,智能語音也是如此,它需要不斷從各種生活化的場景中學習,不斷更新迭代,這就是當前深度學習的主流方式,誰能在這個平臺中建立最廣泛的人脈,讓其平臺接觸到最多的開發(fā)者和應(yīng)用,誰的學習速度就更快,也就能在這場競賽中跑在前頭。