4月16日,英偉達(dá)研究人員推出了Lyra2.0系統(tǒng),這一技術(shù)能夠從單張照片生成跨度約90米的連貫3D環(huán)境,有效解決了現(xiàn)有AI模型在長(zhǎng)距離漫游中的畫(huà)面扭曲與遺忘問(wèn)題。Lyra2.0系統(tǒng)通過(guò)存儲(chǔ)每一幀的3D幾何數(shù)據(jù)來(lái)解決記憶問(wèn)題,當(dāng)攝像機(jī)返回舊地時(shí),系統(tǒng)能夠調(diào)取歷史空間信息作為參考,避免重復(fù)生成。此外,針對(duì)誤差累積問(wèn)題,研究團(tuán)隊(duì)在訓(xùn)練中讓模型暴露于自身有缺陷的輸出,使其學(xué)會(huì)識(shí)別并糾正質(zhì)量下降,而非傳遞錯(cuò)誤。
Lyra2.0系統(tǒng)在圖像質(zhì)量、風(fēng)格一致性和攝像機(jī)控制等幾乎所有指標(biāo)上擊敗了GEN3C、Yume-1.5、CaM等6種競(jìng)品。其Fast版本在質(zhì)量相當(dāng)?shù)那闆r下,視頻生成速度提升了約13倍。生成的3D場(chǎng)景支持交互式探索,并可導(dǎo)出為網(wǎng)格格式用于NvidiaIsaacSim等物理引擎,這意味著訓(xùn)練機(jī)器人無(wú)需采集真實(shí)世界3D數(shù)據(jù),可以在完全生成的虛擬環(huán)境中進(jìn)行訓(xùn)練。



來(lái)源:一電快訊
返回第一電動(dòng)網(wǎng)首頁(yè) >
以上內(nèi)容由AI創(chuàng)作,如有問(wèn)題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.22xuexi.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。