系統(tǒng)會自動將所有的鏡頭,包括多個角度拍攝的畫面,按照我們意愿的腳本進行組織,然后還可以根據(jù)需求找到指定的內(nèi)容。
然后,這套程序就可以準確的識別出這些剪輯的內(nèi)容,系統(tǒng)利用面部識別和情緒識別系統(tǒng),對每一幀畫面進行分析。比如程序會標記某個鏡頭是廣角鏡頭還是特寫鏡頭,以及鏡頭中都包含了哪些人物和角色。
在所有的元素都可以被組織之后,系統(tǒng)會按照不同的風格和習慣對視頻進行剪輯和處理,并且對某種風格貼上標簽。而如果某個風格是最常用的,那么下一次再自動剪輯的時候,只要貼上這個標簽,就會自動按照事先設定好的風格剪輯。
另外視頻編輯器還可以自動對廣角鏡頭、特寫鏡頭以及一些節(jié)奏比較快的鏡頭進行分類和穿插,并且能夠保持鏡頭的風格擁有一致性。
這些編輯的風格都可以被保存下來,然后隨之時間的推移會自動完善,同時通過預設的編輯按鈕來生成視頻。如果對某些部分不滿意,還可以手動快速調(diào)整。
這套程序通過人工智能技術(shù)加速了視頻編輯的過程,同時還可以人為的設定編輯環(huán)境,達到某種風格的特殊要求。不過研究人員也承認目前這套系統(tǒng)還存在明顯的缺點,比如整個系統(tǒng)都是基于對話而設計,未來還需要進一步的完善,能夠根據(jù)動作來進行組織。同時該套系統(tǒng)目前還不能防止連續(xù)性的剪輯錯誤。
這項研究由斯坦福大學和Adobe研究院共同研發(fā),成果將發(fā)表在7月份ACM圖形雜志上。