微軟研發(fā)人工智能，單憑文字就可以作畫

5G寬帶 dvbcn編輯 2018-01-22 17:09 閱讀 4,504 來(lái)源：DVBCN 　

近年不少科技公司都聚焦于人工智能技術(shù)的開(kāi)發(fā)，最近微軟（Microsoft）就公開(kāi)了他們一項(xiàng)最新的技術(shù)成果。人工智能系統(tǒng)單純透過(guò)文字描述就能夠創(chuàng)作圖像，該技術(shù)在文字描述中尋找關(guān)鍵字詞，然后再用來(lái)創(chuàng)作高畫質(zhì)的圖像，據(jù)悉這個(gè)關(guān)注重點(diǎn)的技巧讓圖像的畫質(zhì)較之前提升 3 倍。

負(fù)責(zé)研發(fā)的 Microsoft 深度學(xué)習(xí)技術(shù)首席研究員 Xiaodong He 表示，圖像是人工智能由零開(kāi)始，逐像素逐像素創(chuàng)作。他以一幅人工智能創(chuàng)作的黃色雀鳥圖像做解說(shuō)，表示人工智能分析文字后，再透過(guò)一項(xiàng)名為 Generative Adversarial Network（GAN，生成對(duì)抗性網(wǎng)絡(luò)）的技術(shù)將文字轉(zhuǎn)化成圖像，人工智能創(chuàng)作的黃色雀鳥并不一定在現(xiàn)實(shí)世界存在，只是電腦的一種想像。

GAN 技術(shù)由兩組機(jī)器學(xué)習(xí)模型組成，一組負(fù)責(zé)以文字制作圖像，另一組則以文字去判斷制作出圖像的真確性，兩者結(jié)合去制作完美的圖像。研究員指人工智能系統(tǒng)能夠創(chuàng)作出任何類型的形象，例如飄浮的雙層巴士、放牧中的牲畜等，而且在文字中欠缺的一些細(xì)節(jié)，系統(tǒng)會(huì)在影像中自行補(bǔ)完。

人工智能