最近,Adobe與密歇根大學(xué)合作研發(fā)的MultiFoley人工智能系統(tǒng),標志著音效生成技術(shù)的一次重大突破。
該系統(tǒng)能夠通過文字提示、參考音頻或視頻示例生成高質(zhì)量的音效,音頻輸出質(zhì)量達到48kHz,且與視頻的同步精度高達0.8秒,顯著優(yōu)于傳統(tǒng)系統(tǒng)。
MultiFoley系統(tǒng)通過文字、音頻和視頻輸入生成音效,音質(zhì)達到48kHz。
平均同步精度為0.8秒,顯著優(yōu)于傳統(tǒng)音效系統(tǒng)的表現(xiàn)。
用戶研究顯示,85.8%的參與者認為其語義一致性優(yōu)于其他系統(tǒng)。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們