人機交互新時代無人駕駛最后門檻竟是它？

2018-01-03 10:05:25 來源：厚勢人機交互熱度:

隨著無人駕駛快速的發(fā)展，用戶對駕駛體驗的需求越來越高，良好的人機交互有助于提升駕駛體驗，并且加速無人駕駛市場化的進程。清華大學(xué)汽車工程系副教授李升波博士認(rèn)為，「人機交互是無人駕駛汽車市場化的最后門檻」。

文章從以人為中心的「人」的角度出發(fā)，探討了無人駕駛領(lǐng)域涉及的兩類主要人群駕駛者（車內(nèi)人和車外人）與汽車的人機交互方式（車內(nèi)人與汽車的交互主要以語音和手勢交互為主；車外人與車的交互方式目前仍處于概念性的研發(fā)階段），梳理了語音交互與手勢交互在無人駕駛領(lǐng)域的進展以及車與車外人的交互方式，分析了各交互現(xiàn)有的問題并提出了相應(yīng)的建議。

1. 引言

隨著新一代信息技術(shù)的發(fā)展，汽車智能化、網(wǎng)聯(lián)化的趨勢豐富了無人駕駛的范疇與深度，極大地推動了無人駕駛商業(yè)化的進程。無人駕駛在今天看來不算是一個全新的概念，部分車企巨頭已經(jīng)紛紛完成了無人駕駛的路測，并且各大汽車企業(yè)將無人駕駛初步商用化的時間點預(yù)估在 2025 年，不出 10 年，無人駕駛會成為現(xiàn)實。從無人駕駛理念的提出到發(fā)展至今的智能網(wǎng)聯(lián)化趨勢，無人駕駛本質(zhì)上都是解決人的出行需求。

隨著各大汽車、互聯(lián)網(wǎng)及科技巨頭企業(yè)在 ADAS（高級輔助駕駛系統(tǒng)）、通信等方面的深入研究，無人駕駛作為一種出行方式，其在車輛安全駕駛的技術(shù)上有很大進展。但目前各車企關(guān)于汽車與人的交互研究還不夠深入，情緒檢測、自適應(yīng)人機交互、眼球追蹤、語境語音等提升汽車智能化、差異化的 HMI 技術(shù)還不夠成熟，需要進一步優(yōu)化。人機交互是無人駕駛市場化的關(guān)鍵，良好的人機系統(tǒng)有助于推動無人駕駛商用的進程，正如清華大學(xué)汽車工程系副教授、智能交通學(xué)者李升波所說「人機交互是無人駕駛汽車市場化的最后門檻」。

人機交互是以「人」為核心，無人駕駛涉及到的直接「人」有兩種，車內(nèi)人與車外人，車內(nèi)人主要以駕駛員為核心，車外人主要以行人為核心。本文將從「人」的角度出發(fā)，探討不同身份的人與車的交互方式：

對于車內(nèi)人，目前各企業(yè)研究的熱點集中在語音識別、手勢控制這兩種交互技術(shù)上；

對于車外人，目前與之相關(guān)的研究較少，人為駕駛模式的時候，行人通常會與司機有目光的交流以增加安全感；而無人駕駛階段，這一互動就尤為困難，那么對行人開發(fā)新的信息反饋方式顯得尤為必要，所以對車外人來說，車與人的交互方式是以信息反饋為目標(biāo)進行研究。

2. 車內(nèi)人與車的交互方式

2.1 語音交互

語音交互最基本的目的是輔助行車安全，在安全性保障的基礎(chǔ)上被用于提升車內(nèi)的體驗樂趣。根據(jù)車載市場語音調(diào)查報告顯示，40% 的車企已將語音交互技術(shù)搭載在自己的產(chǎn)品上、50% 的車企正在開發(fā)語音交互系統(tǒng)，可見語音交互將逐漸成為車聯(lián)網(wǎng)交互方式的主流，預(yù)計其將會成為無人駕駛領(lǐng)域排名第一的人機交互方式。

語音交互的模式為語音系統(tǒng)置入智能手機或語音系統(tǒng)配置在車載終端上兩種方式，車企中采用用智能手機為語音操作端的解決方案以寶馬、福特、通用、現(xiàn)代等企業(yè)為代表，語音系統(tǒng)搭載車載終端的企業(yè)以奧迪、通用、現(xiàn)代、特斯拉、吉利、長安等為代表，主要的功能以撥打電話、導(dǎo)航、娛樂系統(tǒng)命令下達(dá)等為主。

圖 1 Nuance 聲龍駕駛（Dragon Drive）系統(tǒng)

汽車領(lǐng)域現(xiàn)有的代表性的語音交互系統(tǒng)有 Nuance 通信公司的 Dragon Drive 語音助手、奇瑞和科大訊飛聯(lián)合開發(fā)的 Cloudrive2.0 系統(tǒng)：

Dragon Drive 語音助手可以實現(xiàn)撥打電話、閱讀信息、智能導(dǎo)航、車輛保養(yǎng)維修預(yù)約等功能，具有自然語音識別及語言語境學(xué)習(xí)的能力，并且能夠與駕駛員進行簡單的對話；

Cloudrive2.0 系統(tǒng)的亮點在于自然語言的識別，可以識別 16 種方言，以及強大的降噪能力使得語音交互更加智能、精準(zhǔn)。

語音交互在實際的運用過程中其實并不是很成熟，根據(jù)美國 J.D. Power 機構(gòu)發(fā)布 2016 汽車新車質(zhì)量調(diào)查顯示，在眾多交互的問題中，語音交互故障率高達(dá) 23%。語音交互主要的問題有：

交互的自然性低：現(xiàn)階段語音命令主要以固定的搭配為主，可以接收的命令有限，而且受到地方口音與專有名詞以及特殊語義的限制，大大降低了語音系統(tǒng)的識別性；

靈活性不夠：系統(tǒng)對駕駛者發(fā)出的命令不能做出靈活性的修正，在駕駛?cè)藛T口誤的情況下，即使提高了識別的準(zhǔn)確率，也無法獲得正確的交互；

抗噪性：部分情況下車內(nèi)不是單獨只有駕駛員，還有其它乘客，語音交互系統(tǒng)如何正確區(qū)分駕駛員的命令、乘客之間的交流也是要解決的問題。

在無人駕駛車輛中，駕駛員對安全行駛的注意力會減弱，更多精力會投入到其它事情當(dāng)中，對車內(nèi)交互深度與智能度要求會更高，全自然的語音交流將成為用戶真正渴望的交互方式，未來的語音交互不單單是命令式交互，更多的是場景化的應(yīng)用。

2.2 手勢交互

正確理解人類的手勢語言，同樣是汽車領(lǐng)域人機交互的研究熱點 [2]。相比較語音控制和觸摸屏，手勢交互的技術(shù)門檻更高，交互形式復(fù)雜，現(xiàn)階段的成熟度較低，手勢控制實現(xiàn)起來更加困難。手勢交互現(xiàn)階段只能完成一些簡單的交互，比如打電話、調(diào)節(jié)音量等操作。如表 1 為各巨頭企業(yè)在汽車手勢交互領(lǐng)域的研究。

表 1 各公司手勢識別技術(shù)

從表可看出，各企業(yè)在交互方式與交互內(nèi)容上各有差異，其中大陸基于減少駕駛員分心的理念將手勢識別集中在方向盤上，不同于其它企業(yè)將識別集中在中央扶手附近。此外，從技術(shù)角度來看， ToF 技術(shù)（Time of Flight）、結(jié)構(gòu)光技術(shù)、毫米波雷達(dá)技術(shù)為汽車領(lǐng)域手勢識別的主要技術(shù)：

ToF 技術(shù)是利用光線傳播的時間來識別手的位置及手的姿勢 [3]；

結(jié)構(gòu)光技術(shù)采用點、線、面的光獲得圖像，并利用三角原理得到手的位置及姿勢 [4]；

毫米波雷達(dá)技術(shù)利用雷達(dá)波收發(fā)的時間差確定手的位置及手勢 [5]。

從技術(shù)難度及計算效率來說， ToF 技術(shù)較為簡單，不需要任何計算機視覺方面的計算，這也是目前大部分公司青睞 ToF 技術(shù)的原因。

對汽車行業(yè)內(nèi)的手勢交互應(yīng)用進行研究，總結(jié)出目前手勢交互存在的問題有：功能單一，缺乏統(tǒng)一的規(guī)劃，人與車的自然交互匱乏，多數(shù)企業(yè)的手勢交互系統(tǒng)識別準(zhǔn)確率不高，識別速度緩慢，這些問題使得人機體驗質(zhì)量下降?，F(xiàn)有的手勢交互難點有：

手勢識別技術(shù)的成熟度不夠，難以高質(zhì)量地完成手勢控制；

手勢可表達(dá)的內(nèi)容有限：相比較語音交互來說，手勢交互難以表達(dá)清楚具體的任務(wù)內(nèi)容，但在表達(dá)任務(wù)的執(zhí)行對象上來說比語音交互更有優(yōu)勢；

不同手勢之間的相似性以及手勢范圍的模糊性造成系統(tǒng)的誤判。

未來手勢交互除了要解決上述的難點，手勢的設(shè)計也符合人的習(xí)慣，因為手勢的交互需要投入一定的學(xué)習(xí)成本，未來人們更希望獲得學(xué)習(xí)成本低、交互自然的體驗。手勢的設(shè)計也應(yīng)盡可能簡單，接近日常生活中人們自然交流的姿勢，同時也應(yīng)考慮不同人群的文化、習(xí)慣對手勢交互進行相應(yīng)的定制。

3. 車外人與車的交互方式

行人過馬路的安全感往往來自與駕駛員的眼神交流或揮手動作，人為駕駛時，很容易實現(xiàn)與車外行人的交流，而當(dāng)路面上無人駕駛的比例上升時，駕駛員與行人的交流就顯得尤為困難。無人駕駛階段，駕駛員對路面的注意力不那么高，那么為保障行人安全感，駕駛員與行人的交互轉(zhuǎn)化為車與行人的交互是一種必然趨勢。關(guān)于車與行人的交互方式各研究機構(gòu)也有不同的解決方案：

Semcon 研發(fā)出 The Smiling Car 概念汽車，汽車前端布置有一塊顯示屏，顯示屏以顯示微笑的圖案告知行人可以通過馬路；

Drive.ai 初創(chuàng)公司關(guān)注于無人駕駛車與路上行人、司機的交流，其解決方案是在車子頂部安裝公告牌發(fā)送信息給行人，或者適當(dāng)?shù)匕l(fā)出聲音提醒行人；

Google 公司致力于打造更安全的汽車，申請了一項「可與行人溝通」的無人駕駛技術(shù)專利，專利描述了利用電子顯示屏向行人顯示交通標(biāo)志信號，同時發(fā)出例如「安全行駛」的聲音提醒，甚至通過安裝電子眼或機械手臂向行人示意。

無人駕駛汽車與行人的交互現(xiàn)處于概念性的研發(fā)階段，并沒有實際地應(yīng)用，對此方面進行研究的公司也比較少?，F(xiàn)階段主要的交互以視覺交互和聽覺交互為主：

視覺交互除了要考慮各情況下展示的信息內(nèi)容外，還應(yīng)考慮車速對行人視覺的影響；

同樣地，聽覺交互除了考慮發(fā)出的信息內(nèi)容外，聲音的大小以及不同道路環(huán)境的干擾也是要研究的方向。

未來無人駕駛或許會出現(xiàn)更先進的與行人交互方式，但無論是采取什么樣的交互方式，汽車所發(fā)出的信息要保證能為行人所識別及理解。車與行人自然地交互是未來無人駕駛必須要解決的問題，無人駕駛不應(yīng)只考慮駕駛員的需求，對道路上所有人員包括行人、交警的需求考慮在內(nèi)是十分有必要的。

4. 結(jié)語

由于汽車本身生產(chǎn)的周期性長，目前部分無人駕駛與人交互的實現(xiàn)仍處于概念階段。從交互的角度來說，人與車最自然的交互方式是沒有交互，縱觀目前市場的發(fā)展，現(xiàn)階段的人機交互距離自然的交互還有很大的差別。目前人機交互的主要方式是人下達(dá)命令，由機器去執(zhí)行，在這個過程中，人的命令是不能有失誤，否則就無法實現(xiàn)正確的操作，這對于人的安全和體驗有一定的隱患。

未來自然的人機交互應(yīng)是以情景識別為主，即機器通過環(huán)境來預(yù)知人的需求，比如車輛燃料不夠可以自動規(guī)劃路線補充燃料、下雨時自動關(guān)閉窗戶等更加智能地滿足人的需求，以減少人的操作。

汽車的人機交互是無人駕駛最后的門檻，未來汽車的人機交互系統(tǒng)需要更安全、更穩(wěn)定的技術(shù)，以實現(xiàn)更智能、更人性化的需求。這不是任何單方可以完成的事情，需要集合汽車、人工智能、心理學(xué)等不同領(lǐng)域的知識來完成這這一復(fù)雜的系統(tǒng)。

下一篇：無人駕駛汽車“跑得”太快？上一篇：車聯(lián)網(wǎng)爆發(fā)前夕，車音智能如何在巨頭口中搶食？

責(zé)任編輯：王維

無人駕駛

欧美色图亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

人機交互新時代無人駕駛最后門檻竟是它？

相關(guān)推薦

欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

人機交互新時代 無人駕駛最后門檻竟是它？

相關(guān)推薦

欧美色图亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

人機交互新時代無人駕駛最后門檻竟是它？