欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

聽音識圖?DeepMindAI產(chǎn)生圖、音概念并識別關(guān)聯(lián)

對于一個未經(jīng)訓(xùn)練的人工智能來說,世界不過是一個模糊的數(shù)據(jù)流。大多數(shù)人類都可以無障礙地理解周圍的畫面和聲音,但只有這些畫面和聲音被明確地標(biāo)記出來,算法才能掌握這一技能。
 
如今,人工智能公司DeepMind開發(fā)了一種新的AI技術(shù),通過讓其觀察短小的視頻片段,AI就能學(xué)會一系列視覺和聽覺的概念并將其識別區(qū)分。例如,這種人工智能可以理解草坪修剪或撓癢癢的概念,但它還沒有掌握如何用語言來描述它感受到的畫面或聲音。
 
對此,加州大學(xué)伯克利分校教授皮利特·阿格拉沃爾說:“我們想要制造一種機(jī)器,它能以自主的方式不斷從自身所處的環(huán)境中學(xué)習(xí)進(jìn)步。”阿格拉沃爾說,這個項目讓我們更接近創(chuàng)造真正人工智能的目標(biāo),通過自學(xué)來觀察和傾聽周圍的世界。
 
大多數(shù)計算機(jī)視覺算法需要輸入大量的標(biāo)簽圖像,這樣它就能區(qū)分不同的物體。通過展示成千上萬張貓咪的照片,它很快就能學(xué)會識別貓,即使是之前從未見過的圖片。
 
但DeepMind的項目負(fù)責(zé)人Relja Arandjelovic表示,這種被稱為“監(jiān)督學(xué)習(xí)”的教學(xué)算法是不可擴(kuò)展的。它的算法不再依賴于人標(biāo)記的數(shù)據(jù)集,而是通過將所看到的與所聽到的內(nèi)容相匹配,從而學(xué)會識別圖像和聲音。
 
聽音識圖?DeepMindAI產(chǎn)生圖、音概念并識別關(guān)聯(lián)-DVBCN
 
像人一樣學(xué)習(xí)
 
“人類尤其擅長這種學(xué)習(xí),”瑞士伯爾尼大學(xué)的教授保羅·法瓦羅說道。他說:“我們身邊可沒有人到處跟著我們,告訴我們一切都是什么。”
 
據(jù)悉,他是通過兩個網(wǎng)絡(luò)來創(chuàng)建算法的:一個專門識別圖像的網(wǎng)絡(luò),以及一個識別音頻的網(wǎng)絡(luò)。他展示了從短片中截取的圖像識別網(wǎng)絡(luò),而音頻識別網(wǎng)絡(luò)則從每段視頻中截取的1秒的音頻片段中進(jìn)行了訓(xùn)練。
 
第三個網(wǎng)絡(luò)將靜態(tài)圖像與音頻片段進(jìn)行對比,以了解視頻中哪些聲音與哪些視頻中的圖像相符合??傊@個系統(tǒng)是經(jīng)過40萬個視頻中截取的6000萬個靜態(tài)音頻訓(xùn)練的。
 
該算法學(xué)會了在沒有單一概念的特定標(biāo)簽的情況下,如何識別音頻和視覺概念,包括人群、踢踏舞和水。舉個例子,當(dāng)你看到某人拍的照片時,大多數(shù)時候它知道哪個聲音與哪個圖像有關(guān)。
 
視覺與聽覺
 
“這種合作學(xué)習(xí)方法還可以延伸到除了視覺和聽覺之外的感官,”他說。“比如,同時學(xué)習(xí)視覺和觸覺功能,可以讓人工智能在黑暗中搜索物體,并學(xué)習(xí)諸如摩擦力等物體屬性。”
 
消息稱,DeepMind將在10月下旬在意大利威尼斯召開的計算機(jī)視覺國際會議上展示這項研究。
 
雖然DeepMind項目中的人工智能與現(xiàn)實世界沒有互動,但研究人員表示,完善自我監(jiān)督學(xué)習(xí)最終會讓我們創(chuàng)造出能夠在現(xiàn)實世界中運行的人工智能,并從它所看到和聽到的東西中學(xué)習(xí)。
 
但在我們達(dá)到這一目標(biāo)之前,自我監(jiān)督式學(xué)習(xí)可能是一種很好的方式,這樣可以訓(xùn)練圖像和音頻識別算法,而無需輸入大量人類標(biāo)記的數(shù)據(jù)。DeepMind的算法可以將80%的音頻剪輯按照時間的順序正確地歸類,這使得它在音頻識別方面比許多在標(biāo)簽數(shù)據(jù)上訓(xùn)練的算法更出色。這些可喜可賀的成果表明,類似的算法或許能夠通過分析YouTube上數(shù)百萬個在線視頻等海量未標(biāo)記的數(shù)據(jù)集來學(xué)習(xí)更多的知識。“世界上的大多數(shù)數(shù)據(jù)都沒有被標(biāo)記出來,因此開發(fā)從未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)的系統(tǒng)是有意義的,”阿格拉沃爾教授這樣說道。
相關(guān)文章
廣電視聽智能體(AI Agent)開發(fā)工具在短視頻創(chuàng)作領(lǐng)域得到應(yīng)用
廣電視聽智能體(AI Agent)開發(fā)工具在…
注意!9月1日起,AI生成合成內(nèi)容必須添加標(biāo)識
注意!9月1日起,AI生成合成內(nèi)容必須添…
全國人大代表、南京郵電大學(xué)校長葉美蘭:加快推進(jìn)6G等新技術(shù)創(chuàng)新發(fā)展 培養(yǎng)“AI+x”復(fù)合型人才
全國人大代表、南京郵電大學(xué)校長葉美蘭…
華數(shù)全面部署DeepSeek,探索“AI+廣電”生態(tài)新路徑
華數(shù)全面部署DeepSeek,探索“AI+廣電”生…
廣東廣電網(wǎng)絡(luò)完成DeepSeek私有化部署,實現(xiàn)首批AI應(yīng)用升級換“腦”
廣東廣電網(wǎng)絡(luò)完成DeepSeek私有化部署,…
吉林廣電「整活兒」AI深夜搞事情!DeepSeek全鏈平臺灰度跑通
吉林廣電「整活兒」AI深夜搞事情!DeepS…
我還沒有學(xué)會寫個人說明!