3月1日 消息:在Google DeepMind的最新研究中,他們推出了名為Genie的模型,該模型能夠從圖像中生成類似于超級馬里奧兄弟游戲的2D視頻游戲。Genie是Generative Interactive Environments的縮寫,經(jīng)過在互聯(lián)網(wǎng)視頻上的培訓(xùn),它能夠從圖像、視頻,甚至以前未見過的草圖中創(chuàng)建可玩的游戲場景。
該模型不僅僅是一個有趣的AI模型,Google DeepMind認(rèn)為它具有潛在的通用代理(Generalist Agents)影響,這是專為處理各種AI任務(wù)設(shè)計(jì)的AI系統(tǒng)。Genie的設(shè)計(jì)理念是通過學(xué)習(xí)從視頻等媒體中提取的潛在動作,并將其轉(zhuǎn)移到人工設(shè)計(jì)的環(huán)境中,從而實(shí)現(xiàn)對其他領(lǐng)域的應(yīng)用,而無需額外的領(lǐng)域知識。
團(tuán)隊(duì)表示,Genie項(xiàng)目只是“剛剛觸及未來可能性的表面”。該模型通過對其輸入的20萬小時的互聯(lián)網(wǎng)視頻進(jìn)行訓(xùn)練,包括2D平臺游戲(如超級馬里奧)和機(jī)器人數(shù)據(jù)(RT-1)。盡管互聯(lián)網(wǎng)視頻通常沒有標(biāo)簽,但它學(xué)到了細(xì)粒度的控制,包括可控制輸入的哪些部分,還能推斷在生成的環(huán)境中一致的潛在動作。
Genie的體積達(dá)到了110億參數(shù),Google DeepMind將其稱為“基礎(chǔ)世界模型” - 一個從世界運(yùn)作中學(xué)習(xí)的系統(tǒng)。Genie能夠從觀看數(shù)千個互聯(lián)網(wǎng)視頻中學(xué)到動作,理解像跳躍這樣的動作,并將其應(yīng)用于類似游戲的環(huán)境中。與人類從視頻中學(xué)習(xí)的方式相似,Genie也能理解人類繪制的草圖,并將其轉(zhuǎn)化為類似游戲的表現(xiàn)形式。
對于Genie模型是否將提供給公眾,或者是否會在未來的Google產(chǎn)品中應(yīng)用,目前尚無消息。但感興趣的讀者可以在Genie展示頁面上查看示例生成。這一創(chuàng)新展示了深度學(xué)習(xí)在創(chuàng)造性領(lǐng)域的潛在應(yīng)用,也許為實(shí)現(xiàn)通用人工智能邁出了一步。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們