創(chuàng)新工場(chǎng)、搜狗和今日頭條三方聯(lián)合宣布發(fā)起“AI Challenger全球AI挑戰(zhàn)賽”。三年內(nèi),三方將投入千萬(wàn)元打造中國(guó)最大的科研數(shù)據(jù)集與世界級(jí)AI競(jìng)賽平臺(tái)。發(fā)布會(huì)現(xiàn)場(chǎng),官方透露,大賽第一年將開放超過1000萬(wàn)條中英文翻譯數(shù)據(jù)、70萬(wàn)個(gè)人體動(dòng)作分析標(biāo)注數(shù)據(jù)、30萬(wàn)張圖片場(chǎng)景標(biāo)注和語(yǔ)義描述數(shù)據(jù)。
在人工智能領(lǐng)域,數(shù)據(jù)的數(shù)量與質(zhì)量是科學(xué)研究與產(chǎn)品技術(shù)研發(fā)的核心。不止一次,創(chuàng)新工場(chǎng)董事長(zhǎng)曾經(jīng)公開表示過諸如百度、蘋果、IBM、谷歌、Facebook等頂尖公司壟斷了數(shù)據(jù),阻礙AI行業(yè)發(fā)展。李開復(fù)表示,AI Challenger就是通過提供免費(fèi)海量數(shù)據(jù)解決數(shù)據(jù)集缺失問題,為科研機(jī)構(gòu)和創(chuàng)業(yè)公司提供更多可能性。
DoNews記者了解到,AI Challenger數(shù)據(jù)集將涵蓋人體骨骼關(guān)鍵點(diǎn)數(shù)據(jù)集(用于無(wú)人駕駛、安防、體感游戲等場(chǎng)景)、圖像中文描述數(shù)據(jù)集、中英翻譯數(shù)據(jù)集等。
對(duì)于這次提供數(shù)據(jù)集的今日頭條和搜狗來(lái)說(shuō),今日頭條將算法、工程、產(chǎn)品、運(yùn)營(yíng)在AI應(yīng)用層面的結(jié)合已經(jīng)得到了市場(chǎng)的肯定。同時(shí)在產(chǎn)品中同樣積累了大量文本、圖像、視頻等數(shù)據(jù)集和計(jì)算機(jī)視覺、自然語(yǔ)言理解、數(shù)據(jù)挖掘等方面AI技術(shù)。
搜狗CEO王小川則在發(fā)布會(huì)上再次強(qiáng)調(diào),搜狗不是轉(zhuǎn)型做AI,從始至終它就是一家AI公司。除文本數(shù)據(jù)集外,搜狗還積累了大量語(yǔ)音、圖像視頻等數(shù)據(jù)集,他透露搜狗語(yǔ)音輸入頻次每日可達(dá)到2.6億次。除此次開放數(shù)據(jù)集外,其實(shí)已經(jīng)與清華合作9年,進(jìn)行產(chǎn)學(xué)研結(jié)合。