來源:澎湃新聞
將2D圖像轉(zhuǎn)換為3D圖像,對(duì)于視頻游戲開發(fā)人員,、電子商務(wù)公司、動(dòng)畫公司來說,至關(guān)重要,,但這并不容易。包括Facebook,,英偉達(dá)等科技巨頭的人工智能(AI)研究實(shí)驗(yàn)室,,以及一些初創(chuàng)公司都在這個(gè)領(lǐng)域里不斷探索。
近日,,微軟研究院(Microsoft Research)的研究團(tuán)隊(duì)發(fā)表了一篇預(yù)印論文,,他們?cè)谡撐闹性敿?xì)介紹了一個(gè)新的AI框架,該框架采用“可縮放”訓(xùn)練技術(shù),,可將2D圖像進(jìn)行3D形狀的模擬生成,。研究人員表示,在使用2D圖像進(jìn)行訓(xùn)練時(shí),,該框架始終可以比現(xiàn)有的模型生成效果更好的3D形狀,,這對(duì)于游戲開發(fā)、視頻制作,、動(dòng)畫等領(lǐng)域是一個(gè)極佳的自動(dòng)化工具,。
f603918fa0ec08fa7bfbdaa4ef2a696b54fbda01.jpg (19.6 KB, 下載次數(shù): 328)
下載附件
2020-3-11 09:00 上傳
微軟AI模型生成的3D沙發(fā)、椅子和浴缸
通常來說,,一個(gè)模型框架要將2D轉(zhuǎn)換為3D圖像,,需要通過柵格化處理來進(jìn)行微分步驟渲染,因此,,過去研究人員在該領(lǐng)域的努力都專注于開發(fā)定制渲染模型,。然而,通過此類模型處理的圖像會(huì)顯得不夠真實(shí)自然,,也不適合用于生成游戲以及圖形產(chǎn)業(yè)的工業(yè)效果圖,。
微軟團(tuán)隊(duì)則是使用了工業(yè)渲染器,這個(gè)渲染器可以根據(jù)顯示數(shù)據(jù)來生成圖像,。此外,,研究人員還訓(xùn)練了3D形狀生成模型,以便渲染形狀,,并生成與2D數(shù)據(jù)集分布相匹配的圖像,。換句話說,這是一種新穎的代理神經(jīng)渲染器,,可以直接渲染由3D形狀生成模型生成的連續(xù)體素網(wǎng)格,。
在實(shí)驗(yàn)過程中,研究團(tuán)隊(duì)在上述3D形狀生成模型中采用了3D卷積GAN架構(gòu),。GAN又稱為生成式對(duì)抗網(wǎng)絡(luò),,是一個(gè)由兩部分組成的AI模型,,它可以基于3D模型生成的數(shù)據(jù)集和真實(shí)的數(shù)據(jù)集,合成來自不同對(duì)象類別的圖像,,并在整個(gè)訓(xùn)練過程中從不同角度進(jìn)行渲染,。
9f2f070828381f304425e43114c5180e6f06f0b1.jpg (35.7 KB, 下載次數(shù): 299)
下載附件
2020-3-11 09:00 上傳
微軟AI模型生成的3D蘑菇圖像
此外,研發(fā)人員在論文中表示,,它們的新方法還充分利用了2D照片中光照和陰影的信息,具體而言,,是利用表面之間的曝光差值,,進(jìn)行檢測(cè)凹面和凸面,以及內(nèi)部結(jié)構(gòu),,從而判斷物體三維物體的中心,,從而實(shí)現(xiàn)更好的模擬訓(xùn)練,生成更逼真的3D模型,。
據(jù)研究人員介紹,,他們的下一步計(jì)劃是將整套方法整合出一個(gè)相對(duì)完整的系統(tǒng),將顏色,、材料,、光照等細(xì)節(jié)統(tǒng)統(tǒng)加入進(jìn)來,從而打造一個(gè)“更為全面”真實(shí)照片轉(zhuǎn)換三維模型的數(shù)據(jù)集,。
|