去年,由創(chuàng)新工場、搜狗、頭條聯(lián)合主辦的AI Challenger(以下簡稱AIC)全球AI挑戰(zhàn)賽吸引了來自65個國家近萬團(tuán)隊參賽。今年,AIC預(yù)熱賽零樣本學(xué)習(xí)(zero-shot learning)競賽即日起開始比賽。
據(jù)了解,零樣本學(xué)習(xí)競賽同樣發(fā)布大規(guī)模圖像屬性數(shù)據(jù)集,包含78017張圖片、230個類別、359種屬性。與目前主流的用于zero-shot learning的數(shù)據(jù)集相比,圖片量更大、屬性更豐富、類別與ImageNet重合度更低。
創(chuàng)新工場AI工程院運營副總裁吳卓浩表示,因為在很多情況下人們難以獲得足夠的有標(biāo)注的數(shù)據(jù)來訓(xùn)練識別或預(yù)測模型。受人類學(xué)習(xí)能力的啟發(fā),零樣本學(xué)習(xí)(zero-shot learning)希望借助輔助知識(如屬性、詞向量、文本描述等),在沒有任何訓(xùn)練樣本的情況下學(xué)會從未見過的新概念。這具有重要的研究意義和廣泛的應(yīng)用場景,被認(rèn)為是實現(xiàn)大規(guī)模物體識別的一個重要方式。瞄準(zhǔn)這個國際前沿課題,AI Challenger帶來了目前世界最大的零樣本學(xué)習(xí)數(shù)據(jù)集、以及國內(nèi)首次零樣本學(xué)習(xí)競賽。
資料顯示,零樣本學(xué)習(xí)是當(dāng)前最具挑戰(zhàn)的AI識別方法之一。簡單來說就是識別從未見過的數(shù)據(jù)類別,即訓(xùn)練的分類器不僅僅能夠識別出訓(xùn)練集中已有的數(shù)據(jù)類別,還可以對于來自未見過的類別的數(shù)據(jù)進(jìn)行區(qū)分。這是一個很有用的功能,使得計算機(jī)能夠具有知識遷移的能力,并無需任何訓(xùn)練數(shù)據(jù),很符合現(xiàn)實生活中海量類別的存在形式。
傳統(tǒng)的“零樣本學(xué)習(xí)”方法首先是讓智能體(Agent)對類別進(jìn)行語義理解。將類別標(biāo)簽利用輔助知識(如屬性)嵌入到語義空間中,再利用訓(xùn)練集中的數(shù)據(jù)學(xué)習(xí)這種從圖像到語義的映射關(guān)系。此后,即使遇到新的類別,只要提供了該類別的語義知識,模型即可識別該類別,這就是零樣本學(xué)習(xí)。
例如識別一張斑馬的圖片,但在訓(xùn)練時沒有訓(xùn)練過斑馬的圖片。那么我們可以通過比較這張斑馬圖片中包含的屬性和各個類別的屬性定義,進(jìn)而在屬性空間中找到與該測試圖片相近標(biāo)簽,即為該圖片的標(biāo)簽。
而零樣本學(xué)習(xí)的意義也顯而易見:在傳統(tǒng)圖像識別任務(wù)中,訓(xùn)練階段和測試階段的類別是相同的,但每次為了識別新類別的樣本需要在訓(xùn)練集中加入這種類別的數(shù)據(jù)。一些類別的樣本收集代價大,即使收集到足夠的訓(xùn)練樣本,也需要對整個模型進(jìn)行重新訓(xùn)練。這都會加大識別系統(tǒng)的成本,零樣本學(xué)習(xí)方法便能很好的解決這個問題。