在9月24日下午舉行的視頻分發(fā)&融合創(chuàng)新論壇上,北京美攝網(wǎng)絡(luò)科技有限公司產(chǎn)品總監(jiān)王軼做了題為《美攝智能視音頻解決方案》的主旨演講。
美攝起源于廣電行業(yè)的一家知名龍頭企業(yè)——新奧特集團,長期來一直為各大電視臺、電影制作公司、廣告公司提供相關(guān)服務(wù)。自2014年起將其技術(shù)下移到移動互聯(lián)網(wǎng),服務(wù)上百家企業(yè),覆蓋的用戶終端數(shù)量已經(jīng)過億。
美攝的客戶基礎(chǔ)分布圖
其相關(guān)的服務(wù)涉及到了多個領(lǐng)域:包括廣電行業(yè),如移動新聞采編、智能機頂盒、電視客戶端;通訊運營商,與國內(nèi)三大通訊運營商均有視音頻技術(shù)相關(guān)的合作;移動互聯(lián)行業(yè),如短視頻與移動直播;其他的還有智能設(shè)備、教育行業(yè)等等。
隨著5G時代的來臨,未來還將在新場景應(yīng)用下,建立起與更多行業(yè)的合作。
北京美攝網(wǎng)絡(luò)科技有限公司產(chǎn)品總監(jiān)王軼表示,美攝現(xiàn)在所有的方案基本上都是以獨立的SDK形式來進行輸出的,可以概括為六大組成部分:
1、視頻拍攝和編輯模塊,主要是滿足各類移動視頻拍攝和制作需求,能提供高效的移動端短視頻解決方案;
2、人臉特效模塊,基于人臉關(guān)鍵點檢測,實現(xiàn)3D面部貼紙瘦臉、大眼、人臉變形等功能;
3、粒子特效模塊,電影級粒子特效方案,結(jié)合人臉、手勢等實現(xiàn)電影級的逼真特效;
4、VR視頻編輯模塊,國內(nèi)獨家實現(xiàn)移動端360°VR視頻實時編輯處理功能;
5、AI智能視頻處理模塊,基于深度學(xué)習(xí)的視頻識別、分析技術(shù)實現(xiàn)視頻分類、背景分割、智能裁剪等功能;
6、特效定制設(shè)計,專業(yè)電影包裝團隊,提供相關(guān)藝術(shù)類的定制化設(shè)計工作。
美攝產(chǎn)品的特點和優(yōu)勢
1、實現(xiàn)4K級別實時高清處理,支持4K級別的視頻編輯,無需預(yù)處理,所有特效隨時添加隨時預(yù)覽、順暢極致的視頻制作體驗;
2、全流程視音頻處理功能,豐富全面的視頻處理相關(guān)功能,涵蓋從拍攝、人臉貼紙、美顏、濾鏡到主題、字幕、貼紙、轉(zhuǎn)場、配音、專業(yè)剪輯等數(shù)十種功能,一站式滿足各類相關(guān)需求;
3、靈活的技術(shù)架構(gòu),美攝SDK的核心優(yōu)勢是一套非編級別的視頻處理架構(gòu),提供了極其簡單的接口,同時通過功能相互組合的方式,開發(fā)者可以根據(jù)實際需求,快速自定義一套全新的玩法;
4、移動芯片組深度優(yōu)化,獨有的CPU+GPU的圖形處理方式,并針對ios和Android進行了深度優(yōu)化,以保證了在優(yōu)秀的兼容性、穩(wěn)定性前提下,擁有更快的處理速度及更小的CPU及內(nèi)存占用;
5、優(yōu)異的SDK體積,美攝SDK通過大量的優(yōu)化工作,精簡代碼、讓壓縮后的SDK包達到IOS為3.9M,Android約3.2M的體積,如果去除FFmpeg話更可以進一步壓縮SDK體積;
6、更完善的服務(wù),美攝SDK不僅僅提供標(biāo)準(zhǔn)的SDK產(chǎn)品以及技術(shù)支持服務(wù),同時我們還提供視頻特效定制,功能定制開發(fā)、以及產(chǎn)品整包開發(fā)等服務(wù),滿足各類客戶的需求。
美攝AI智能視音頻剪輯方案即將亮相
王軼在本次大會上提前介紹了即將發(fā)布的“AI智能視音頻剪輯方案”。
據(jù)介紹,這套方案主要以AI識別為基礎(chǔ)的一套視頻智能剪輯處理框架,只要導(dǎo)入一系列的視頻或者圖片,通過AI的智能檢測,識別內(nèi)容要素,分析剪輯手法,進行AI智能包裝,進而快速形成一段高質(zhì)量的視頻。
其主要具備以下的特點:
1、降低了制作門檻,使得人人都可以制作優(yōu)質(zhì)視頻;
2、讓積累的大量視頻內(nèi)容可以產(chǎn)生更大的價值;
3、快速生產(chǎn)視頻,進而降低制作成本。
據(jù)介紹,AI智能剪輯方案是一套全平臺覆蓋的方案,以便滿足的各種類型場景用戶的需求。因此,包Android智能設(shè)備、IOS智能設(shè)備、服務(wù)器方案、小程序方案、智能硬件、PC設(shè)備都能涉及的到。
其應(yīng)用領(lǐng)域也涵蓋了多個方面:
整套AI識別框架擁有非常好的擴展性、不論是當(dāng)前的生活、旅行類視頻還是一些體育、游戲類等視頻、都可以通過更精確的定制化形成各具特色的方案、服務(wù)各類視頻的制作要求。
其整個方案框架基于AI智能檢測識別為基礎(chǔ),通過六步完成整個制作功能,包括選擇導(dǎo)入、智能粗篩、檢測識別、智能剪輯、AI包裝、預(yù)覽輸出六個步驟。
選擇導(dǎo)入:可進行按需選擇素材,進行視頻、圖片混編,其對于時長、數(shù)量、格式均無限制;
智能粗篩:可實現(xiàn)自動去重、去模糊、去低質(zhì)量、去截圖;
AI識別檢測:基于剪輯片段匯聚信,處理速度高達5倍速,支持NPU加速;
智能剪輯:具備專業(yè)剪輯師思維,可實現(xiàn)智能素材排序、智能匹配轉(zhuǎn)場、智能匹配音樂節(jié)奏;
AI包裝:支持智能匹配片頭片尾、AI視頻字幕、智能匹配濾鏡;
預(yù)覽編輯:能完整保留時間線內(nèi)容,支持二次編輯制作(精編),實時預(yù)覽效果;
王軼表示這套方案可以完美解決許多視頻制作中的痛點,預(yù)計今年底會有幾款最新的安卓機型使用到這一方案,屆時可以讓許多用戶體驗到智能剪輯帶來的快感。