這項(xiàng)成果象征著業(yè)界正朝著讓機(jī)器人了解視覺世界的未來更邁進(jìn)了一步。今天,人類專家通常以一種相對較緩慢的兩步驟過程訓(xùn)練廠房中的機(jī)器人重復(fù)幾個(gè)動作,但這有時(shí)還需要人類編寫客制軟件。
Embodied Intelligence共同創(chuàng)辦人兼執(zhí)行長Peter Chen表示:「我們提供的工具并非編程每一步驟,而是證實(shí)機(jī)器人并不需要人類專家的協(xié)助……它也能從嘗試與錯(cuò)誤中學(xué)習(xí)?!?/span>
「我們的機(jī)器人軟件并不限于固定的動作。當(dāng)今的機(jī)器人一遍又一遍地重復(fù)執(zhí)行相同的機(jī)械式任務(wù)。透過我們的軟件,能夠賦予機(jī)器人經(jīng)由攝影機(jī)真正『看』到的能力,并因而進(jìn)行調(diào)整?!?/span>
除了更迅速且便宜地訓(xùn)練機(jī)器人之外,該軟件工具還為教授新的任務(wù)開啟了大門。例如,這套系統(tǒng)能教導(dǎo)機(jī)器人如何將線穿過機(jī)械組件。由于追蹤與編程彈性化對象極其復(fù)雜性,使得大多數(shù)計(jì)算機(jī)視覺系統(tǒng)都無法順利實(shí)現(xiàn)這一類的應(yīng)用。
Embodied Intelligence采用虛擬現(xiàn)實(shí)(VR)頭戴式裝置來訓(xùn)練機(jī)器人。目前使用的是HTC Vive頭戴式裝置及其動作控制器,但任何VR裝置都適用。
他說:「你可以看機(jī)器人『看』到什么了,并根據(jù)機(jī)器人『看』到的對象做決定,而機(jī)器人也會加以模仿?!?/span>
Peter Chen曾經(jīng)是美國加州大學(xué)柏克萊分校(UC Berkeley)的研究人員,他和其他2位研究人員在今年初發(fā)表其采用機(jī)器學(xué)習(xí)與VR連結(jié),教導(dǎo)機(jī)器人10項(xiàng)基本任務(wù)的實(shí)驗(yàn)結(jié)果。「在進(jìn)行3分鐘的VR展示中,機(jī)器人解決了以往可能需要由博士編寫算法的所有任務(wù)?!?/span>
該途徑使用了Google和Facebook等網(wǎng)絡(luò)巨擘用于辨識影像和其他任務(wù)的相同深度神經(jīng)網(wǎng)絡(luò)技術(shù)。VR展示就像訓(xùn)練一樣,設(shè)定神經(jīng)網(wǎng)絡(luò)路徑或策略,并讓機(jī)器人能在執(zhí)行推論后加以改善。