近年不少科技公司都聚焦于人工智能技術(shù)的開(kāi)發(fā),最近微軟(Microsoft)就公開(kāi)了他們一項(xiàng)最新的技術(shù)成果。人工智能系統(tǒng)單純透過(guò)文字描述就能夠創(chuàng)作圖像,該技術(shù)在文字描述中尋找關(guān)鍵字詞,然后再用來(lái)創(chuàng)作高畫質(zhì)的圖像,據(jù)悉這個(gè)關(guān)注重點(diǎn)的技巧讓圖像的畫質(zhì)較之前提升 3 倍。
負(fù)責(zé)研發(fā)的 Microsoft 深度學(xué)習(xí)技術(shù)首席研究員 Xiaodong He 表示,圖像是人工智能由零開(kāi)始,逐像素逐像素創(chuàng)作。他以一幅人工智能創(chuàng)作的黃色雀鳥圖像做解說(shuō),表示人工智能分析文字后,再透過(guò)一項(xiàng)名為 Generative Adversarial Network(GAN,生成對(duì)抗性網(wǎng)絡(luò))的技術(shù)將文字轉(zhuǎn)化成圖像,人工智能創(chuàng)作的黃色雀鳥并不一定在現(xiàn)實(shí)世界存在,只是電腦的一種想像。
GAN 技術(shù)由兩組機(jī)器學(xué)習(xí)模型組成,一組負(fù)責(zé)以文字制作圖像,另一組則以文字去判斷制作出圖像的真確性,兩者結(jié)合去制作完美的圖像。研究員指人工智能系統(tǒng)能夠創(chuàng)作出任何類型的形象,例如飄浮的雙層巴士、放牧中的牲畜等,而且在文字中欠缺的一些細(xì)節(jié),系統(tǒng)會(huì)在影像中自行補(bǔ)完。