欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

人機(jī)交互新時(shí)代 無人駕駛最后門檻竟是它?

2018-01-03 10:05:25 來源:厚勢(shì) 人機(jī)交互 熱度:
隨著無人駕駛快速的發(fā)展,用戶對(duì)駕駛體驗(yàn)的需求越來越高,良好的人機(jī)交互有助于提升駕駛體驗(yàn),并且加速無人駕駛市場(chǎng)化的進(jìn)程。清華大學(xué)汽車工程系副教授李升波博士認(rèn)為,「人機(jī)交互是無人駕駛汽車市場(chǎng)化的最后門檻」。
 
文章從以人為中心的「人」的角度出發(fā),探討了無人駕駛領(lǐng)域涉及的兩類主要人群駕駛者(車內(nèi)人和車外人)與汽車的人機(jī)交互方式(車內(nèi)人與汽車的交互主要以語音和手勢(shì)交互為主;車外人與車的交互方式目前仍處于概念性的研發(fā)階段),梳理了語音交互與手勢(shì)交互在無人駕駛領(lǐng)域的進(jìn)展以及車與車外人的交互方式,分析了各交互現(xiàn)有的問題并提出了相應(yīng)的建議。
 
1. 引言
隨著新一代信息技術(shù)的發(fā)展,汽車智能化、網(wǎng)聯(lián)化的趨勢(shì)豐富了無人駕駛的范疇與深度,極大地推動(dòng)了無人駕駛商業(yè)化的進(jìn)程。無人駕駛在今天看來不算是一個(gè)全新的概念,部分車企巨頭已經(jīng)紛紛完成了無人駕駛的路測(cè),并且各大汽車企業(yè)將無人駕駛初步商用化的時(shí)間點(diǎn)預(yù)估在 2025 年,不出 10 年,無人駕駛會(huì)成為現(xiàn)實(shí) 。從無人駕駛理念的提出到發(fā)展至今的智能網(wǎng)聯(lián)化趨勢(shì),無人駕駛本質(zhì)上都是解決人的出行需求。
 
隨著各大汽車、互聯(lián)網(wǎng)及科技巨頭企業(yè)在 ADAS(高級(jí)輔助駕駛系統(tǒng))、通信等方面的深入研究,無人駕駛作為一種出行方式,其在車輛安全駕駛的技術(shù)上有很大進(jìn)展。但目前各車企關(guān)于汽車與人的交互研究還不夠深入,情緒檢測(cè)、自適應(yīng)人機(jī)交互、眼球追蹤、語境語音等提升汽車智能化、差異化的 HMI 技術(shù)還不夠成熟,需要進(jìn)一步優(yōu)化。人機(jī)交互是無人駕駛市場(chǎng)化的關(guān)鍵,良好的人機(jī)系統(tǒng)有助于推動(dòng)無人駕駛商用的進(jìn)程,正如清華大學(xué)汽車工程系副教授、智能交通學(xué)者李升波所說「人機(jī)交互是無人駕駛汽車市場(chǎng)化的最后門檻」。
 
人機(jī)交互是以「人」為核心,無人駕駛涉及到的直接「人」有兩種,車內(nèi)人與車外人,車內(nèi)人主要以駕駛員為核心,車外人主要以行人為核心。本文將從「人」的角度出發(fā),探討不同身份的人與車的交互方式:
 
對(duì)于車內(nèi)人,目前各企業(yè)研究的熱點(diǎn)集中在語音識(shí)別、手勢(shì)控制這兩種交互技術(shù)上;
對(duì)于車外人,目前與之相關(guān)的研究較少,人為駕駛模式的時(shí)候,行人通常會(huì)與司機(jī)有目光的交流以增加安全感;而無人駕駛階段,這一互動(dòng)就尤為困難,那么對(duì)行人開發(fā)新的信息反饋方式顯得尤為必要,所以對(duì)車外人來說,車與人的交互方式是以信息反饋為目標(biāo)進(jìn)行研究。
 
2. 車內(nèi)人與車的交互方式
2.1 語音交互
語音交互最基本的目的是輔助行車安全,在安全性保障的基礎(chǔ)上被用于提升車內(nèi)的體驗(yàn)樂趣。根據(jù)車載市場(chǎng)語音調(diào)查報(bào)告顯示,40% 的車企已將語音交互技術(shù)搭載在自己的產(chǎn)品上、50% 的車企正在開發(fā)語音交互系統(tǒng),可見語音交互將逐漸成為車聯(lián)網(wǎng)交互方式的主流,預(yù)計(jì)其將會(huì)成為無人駕駛領(lǐng)域排名第一的人機(jī)交互方式。
 
語音交互的模式為語音系統(tǒng)置入智能手機(jī)或語音系統(tǒng)配置在車載終端上兩種方式,車企中采用用智能手機(jī)為語音操作端的解決方案以寶馬、福特、通用、現(xiàn)代等企業(yè)為代表,語音系統(tǒng)搭載車載終端的企業(yè)以奧迪、通用、現(xiàn)代、特斯拉、吉利、長安等為代表,主要的功能以撥打電話、導(dǎo)航、娛樂系統(tǒng)命令下達(dá)等為主。
圖 1  Nuance 聲龍駕駛(Dragon Drive)系統(tǒng)
 
汽車領(lǐng)域現(xiàn)有的代表性的語音交互系統(tǒng)有 Nuance 通信公司的 Dragon Drive 語音助手、奇瑞和科大訊飛聯(lián)合開發(fā)的 Cloudrive2.0 系統(tǒng):
 
Dragon Drive 語音助手可以實(shí)現(xiàn)撥打電話、閱讀信息、智能導(dǎo)航、車輛保養(yǎng)維修預(yù)約等功能,具有自然語音識(shí)別及語言語境學(xué)習(xí)的能力,并且能夠與駕駛員進(jìn)行簡(jiǎn)單的對(duì)話;
 
Cloudrive2.0 系統(tǒng)的亮點(diǎn)在于自然語言的識(shí)別,可以識(shí)別 16 種方言,以及強(qiáng)大的降噪能力使得語音交互更加智能、精準(zhǔn)。
 
語音交互在實(shí)際的運(yùn)用過程中其實(shí)并不是很成熟,根據(jù)美國 J.D. Power 機(jī)構(gòu)發(fā)布 2016 汽車新車質(zhì)量調(diào)查顯示,在眾多交互的問題中,語音交互故障率高達(dá) 23%。語音交互主要的問題有:
 
交互的自然性低:現(xiàn)階段語音命令主要以固定的搭配為主,可以接收的命令有限,而且受到地方口音與專有名詞以及特殊語義的限制,大大降低了語音系統(tǒng)的識(shí)別性;
 
靈活性不夠:系統(tǒng)對(duì)駕駛者發(fā)出的命令不能做出靈活性的修正,在駕駛?cè)藛T口誤的情況下,即使提高了識(shí)別的準(zhǔn)確率,也無法獲得正確的交互;
 
抗噪性:部分情況下車內(nèi)不是單獨(dú)只有駕駛員,還有其它乘客,語音交互系統(tǒng)如何正確區(qū)分駕駛員的命令、乘客之間的交流也是要解決的問題。
 
在無人駕駛車輛中,駕駛員對(duì)安全行駛的注意力會(huì)減弱,更多精力會(huì)投入到其它事情當(dāng)中,對(duì)車內(nèi)交互深度與智能度要求會(huì)更高,全自然的語音交流將成為用戶真正渴望的交互方式,未來的語音交互不單單是命令式交互,更多的是場(chǎng)景化的應(yīng)用。
 
2.2 手勢(shì)交互
正確理解人類的手勢(shì)語言,同樣是汽車領(lǐng)域人機(jī)交互的研究熱點(diǎn) [2]。相比較語音控制和觸摸屏,手勢(shì)交互的技術(shù)門檻更高,交互形式復(fù)雜,現(xiàn)階段的成熟度較低,手勢(shì)控制實(shí)現(xiàn)起來更加困難。手勢(shì)交互現(xiàn)階段只能完成一些簡(jiǎn)單的交互,比如打電話、調(diào)節(jié)音量等操作。如表 1 為各巨頭企業(yè)在汽車手勢(shì)交互領(lǐng)域的研究。
表 1  各公司手勢(shì)識(shí)別技術(shù)
 
從表可看出,各企業(yè)在交互方式與交互內(nèi)容上各有差異,其中大陸基于減少駕駛員分心的理念將手勢(shì)識(shí)別集中在方向盤上,不同于其它企業(yè)將識(shí)別集中在中央扶手附近。此外,從技術(shù)角度來看, ToF 技術(shù)(Time of Flight)、結(jié)構(gòu)光技術(shù)、毫米波雷達(dá)技術(shù)為汽車領(lǐng)域手勢(shì)識(shí)別的主要技術(shù):
 
ToF 技術(shù)是利用光線傳播的時(shí)間來識(shí)別手的位置及手的姿勢(shì) [3];
 
結(jié)構(gòu)光技術(shù)采用點(diǎn)、線、面的光獲得圖像,并利用三角原理得到手的位置及姿勢(shì) [4];
 
毫米波雷達(dá)技術(shù)利用雷達(dá)波收發(fā)的時(shí)間差確定手的位置及手勢(shì) [5]。
 
從技術(shù)難度及計(jì)算效率來說, ToF 技術(shù)較為簡(jiǎn)單,不需要任何計(jì)算機(jī)視覺方面的計(jì)算,這也是目前大部分公司青睞 ToF 技術(shù)的原因。
 
對(duì)汽車行業(yè)內(nèi)的手勢(shì)交互應(yīng)用進(jìn)行研究,總結(jié)出目前手勢(shì)交互存在的問題有:功能單一,缺乏統(tǒng)一的規(guī)劃,人與車的自然交互匱乏,多數(shù)企業(yè)的手勢(shì)交互系統(tǒng)識(shí)別準(zhǔn)確率不高,識(shí)別速度緩慢,這些問題使得人機(jī)體驗(yàn)質(zhì)量下降?,F(xiàn)有的手勢(shì)交互難點(diǎn)有:
 
手勢(shì)識(shí)別技術(shù)的成熟度不夠,難以高質(zhì)量地完成手勢(shì)控制;
 
手勢(shì)可表達(dá)的內(nèi)容有限:相比較語音交互來說,手勢(shì)交互難以表達(dá)清楚具體的任務(wù)內(nèi)容,但在表達(dá)任務(wù)的執(zhí)行對(duì)象上來說比語音交互更有優(yōu)勢(shì);
 
不同手勢(shì)之間的相似性以及手勢(shì)范圍的模糊性造成系統(tǒng)的誤判。
 
未來手勢(shì)交互除了要解決上述的難點(diǎn),手勢(shì)的設(shè)計(jì)也符合人的習(xí)慣,因?yàn)槭謩?shì)的交互需要投入一定的學(xué)習(xí)成本,未來人們更希望獲得學(xué)習(xí)成本低、交互自然的體驗(yàn)。手勢(shì)的設(shè)計(jì)也應(yīng)盡可能簡(jiǎn)單,接近日常生活中人們自然交流的姿勢(shì),同時(shí)也應(yīng)考慮不同人群的文化、習(xí)慣對(duì)手勢(shì)交互進(jìn)行相應(yīng)的定制。
 
3. 車外人與車的交互方式
行人過馬路的安全感往往來自與駕駛員的眼神交流或揮手動(dòng)作,人為駕駛時(shí),很容易實(shí)現(xiàn)與車外行人的交流,而當(dāng)路面上無人駕駛的比例上升時(shí),駕駛員與行人的交流就顯得尤為困難。無人駕駛階段,駕駛員對(duì)路面的注意力不那么高,那么為保障行人安全感,駕駛員與行人的交互轉(zhuǎn)化為車與行人的交互是一種必然趨勢(shì)。關(guān)于車與行人的交互方式各研究機(jī)構(gòu)也有不同的解決方案:
 
Semcon 研發(fā)出 The Smiling Car 概念汽車,汽車前端布置有一塊顯示屏,顯示屏以顯示微笑的圖案告知行人可以通過馬路;
 
Drive.ai 初創(chuàng)公司關(guān)注于無人駕駛車與路上行人、司機(jī)的交流,其解決方案是在車子頂部安裝公告牌發(fā)送信息給行人,或者適當(dāng)?shù)匕l(fā)出聲音提醒行人;
 
Google 公司致力于打造更安全的汽車,申請(qǐng)了一項(xiàng)「可與行人溝通」的無人駕駛技術(shù)專利,專利描述了利用電子顯示屏向行人顯示交通標(biāo)志信號(hào),同時(shí)發(fā)出例如「安全行駛」的聲音提醒,甚至通過安裝電子眼或機(jī)械手臂向行人示意。
 
無人駕駛汽車與行人的交互現(xiàn)處于概念性的研發(fā)階段,并沒有實(shí)際地應(yīng)用,對(duì)此方面進(jìn)行研究的公司也比較少。現(xiàn)階段主要的交互以視覺交互和聽覺交互為主:
 
視覺交互除了要考慮各情況下展示的信息內(nèi)容外,還應(yīng)考慮車速對(duì)行人視覺的影響;
 
同樣地,聽覺交互除了考慮發(fā)出的信息內(nèi)容外,聲音的大小以及不同道路環(huán)境的干擾也是要研究的方向。
 
未來無人駕駛或許會(huì)出現(xiàn)更先進(jìn)的與行人交互方式,但無論是采取什么樣的交互方式,汽車所發(fā)出的信息要保證能為行人所識(shí)別及理解。車與行人自然地交互是未來無人駕駛必須要解決的問題,無人駕駛不應(yīng)只考慮駕駛員的需求,對(duì)道路上所有人員包括行人、交警的需求考慮在內(nèi)是十分有必要的。
 
4. 結(jié)語
由于汽車本身生產(chǎn)的周期性長,目前部分無人駕駛與人交互的實(shí)現(xiàn)仍處于概念階段。從交互的角度來說,人與車最自然的交互方式是沒有交互,縱觀目前市場(chǎng)的發(fā)展,現(xiàn)階段的人機(jī)交互距離自然的交互還有很大的差別。目前人機(jī)交互的主要方式是人下達(dá)命令,由機(jī)器去執(zhí)行,在這個(gè)過程中,人的命令是不能有失誤,否則就無法實(shí)現(xiàn)正確的操作,這對(duì)于人的安全和體驗(yàn)有一定的隱患。
 
未來自然的人機(jī)交互應(yīng)是以情景識(shí)別為主,即機(jī)器通過環(huán)境來預(yù)知人的需求,比如車輛燃料不夠可以自動(dòng)規(guī)劃路線補(bǔ)充燃料、下雨時(shí)自動(dòng)關(guān)閉窗戶等更加智能地滿足人的需求,以減少人的操作。
 
汽車的人機(jī)交互是無人駕駛最后的門檻,未來汽車的人機(jī)交互系統(tǒng)需要更安全、更穩(wěn)定的技術(shù),以實(shí)現(xiàn)更智能、更人性化的需求。這不是任何單方可以完成的事情,需要集合汽車、人工智能、心理學(xué)等不同領(lǐng)域的知識(shí)來完成這這一復(fù)雜的系統(tǒng)。

責(zé)任編輯:王維