去年,由創(chuàng)新工場、搜狗、頭條聯(lián)合主辦的AI Challenger(以下簡稱AIC)全球AI挑戰(zhàn)賽吸引了來自65個國家近萬團隊參賽。今年,AIC預熱賽零樣本學習(zero-shot learning)競賽即日起開始比賽。
據(jù)了解,零樣本學習競賽同樣發(fā)布大規(guī)模圖像屬性數(shù)據(jù)集,包含78017張圖片、230個類別、359種屬性。與目前主流的用于zero-shot learning的數(shù)據(jù)集相比,圖片量更大、屬性更豐富、類別與ImageNet重合度更低。
創(chuàng)新工場AI工程院運營副總裁吳卓浩表示,因為在很多情況下人們難以獲得足夠的有標注的數(shù)據(jù)來訓練識別或預測模型。受人類學習能力的啟發(fā),零樣本學習(zero-shot learning)希望借助輔助知識(如屬性、詞向量、文本描述等),在沒有任何訓練樣本的情況下學會從未見過的新概念。這具有重要的研究意義和廣泛的應用場景,被認為是實現(xiàn)大規(guī)模物體識別的一個重要方式。瞄準這個國際前沿課題,AI Challenger帶來了目前世界最大的零樣本學習數(shù)據(jù)集、以及國內首次零樣本學習競賽。
資料顯示,零樣本學習是當前最具挑戰(zhàn)的AI識別方法之一。簡單來說就是識別從未見過的數(shù)據(jù)類別,即訓練的分類器不僅僅能夠識別出訓練集中已有的數(shù)據(jù)類別,還可以對于來自未見過的類別的數(shù)據(jù)進行區(qū)分。這是一個很有用的功能,使得計算機能夠具有知識遷移的能力,并無需任何訓練數(shù)據(jù),很符合現(xiàn)實生活中海量類別的存在形式。
傳統(tǒng)的“零樣本學習”方法首先是讓智能體(Agent)對類別進行語義理解。將類別標簽利用輔助知識(如屬性)嵌入到語義空間中,再利用訓練集中的數(shù)據(jù)學習這種從圖像到語義的映射關系。此后,即使遇到新的類別,只要提供了該類別的語義知識,模型即可識別該類別,這就是零樣本學習。
例如識別一張斑馬的圖片,但在訓練時沒有訓練過斑馬的圖片。那么我們可以通過比較這張斑馬圖片中包含的屬性和各個類別的屬性定義,進而在屬性空間中找到與該測試圖片相近標簽,即為該圖片的標簽。
而零樣本學習的意義也顯而易見:在傳統(tǒng)圖像識別任務中,訓練階段和測試階段的類別是相同的,但每次為了識別新類別的樣本需要在訓練集中加入這種類別的數(shù)據(jù)。一些類別的樣本收集代價大,即使收集到足夠的訓練樣本,也需要對整個模型進行重新訓練。這都會加大識別系統(tǒng)的成本,零樣本學習方法便能很好的解決這個問題。