智能體競(jìng)爭(zhēng)資源的多代理環(huán)境是實(shí)現(xiàn)通用人工智能(AGI )的絆腳石。多智能體環(huán)境有兩個(gè)特性:第一,環(huán)境的困難取決于你的競(jìng)爭(zhēng)對(duì)手的技能。 第二,多元化環(huán)境沒有穩(wěn)定的平衡。 這些環(huán)境與傳統(tǒng)環(huán)境非常不同,還需要更多的研究。
Open AI 今天宣布,他們開發(fā)了 一個(gè)新的算法,名為MADDPG。用于在多智能體環(huán)境中進(jìn)行集中學(xué)習(xí),并將執(zhí)行過(guò)程“去中心化”,這將允許智能體學(xué)習(xí)相互學(xué)習(xí)合作和競(jìng)爭(zhēng)。