DeepMind發(fā)表博客文章,提出一種稱為SAC-X(計(jì)劃輔助控制)的新學(xué)習(xí)范式,旨在解決讓AI以最少的先驗(yàn)知識(shí),從頭開(kāi)始學(xué)習(xí)復(fù)雜控制問(wèn)題的挑戰(zhàn)。
這在真實(shí)環(huán)境中成功讓機(jī)械臂從頭開(kāi)始學(xué)習(xí)拾放物體。SAC-X 是基于從頭開(kāi)始學(xué)習(xí)復(fù)雜的任務(wù)這種想法,即一個(gè)智能體首先應(yīng)該學(xué)習(xí)并掌握一套基本技能。就像嬰兒在爬行或走路前必須具有協(xié)調(diào)能力和平衡能力,為智能體提供與簡(jiǎn)單技能相對(duì)應(yīng)的內(nèi)在目標(biāo)(具有輔助作用),這會(huì)增加它理解和執(zhí)行更復(fù)雜任務(wù)的可能性。研究者認(rèn)為,SAC-X是一種通用的強(qiáng)化學(xué)習(xí)方法,未來(lái)可以應(yīng)用于機(jī)器人以外的更廣泛領(lǐng)域。