在近期舉辦的 Axios AI + 峰會上,谷歌 DeepMind 的首席執(zhí)行官德米斯?哈薩比斯(Demis Hassabis)分享了他對未來一年 AI 領(lǐng)域的展望。他指出,2026 年將是多模態(tài)模型、互動視頻世界和更可靠的 AI 代理迅速發(fā)展的關(guān)鍵一年。
哈薩比斯強(qiáng)調(diào),DeepMind 的最新 AI 模型 “Gemini” 已在多模態(tài)能力方面取得了顯著進(jìn)展。他提到,該模型不僅能夠描述情節(jié),還能深入理解場景的深層含義。例如,在影片《搏擊俱樂部》中,AI 將一個角色摘掉戒指的動作解讀為對日常生活的哲學(xué)性放棄。這種深度理解使得 AI 能夠生成更復(fù)雜的輸出,比如信息圖表等,之前的技術(shù)無法實(shí)現(xiàn)這一點(diǎn)。
他還提到,AI 代理將在一年內(nèi)能夠 “接近” 自主處理復(fù)雜任務(wù)的能力。這一進(jìn)展符合他在 2024 年 5 月時提出的時間表。DeepMind 的目標(biāo)是創(chuàng)建一個跨設(shè)備的通用助手,幫助用戶管理日常生活。為實(shí)現(xiàn)這一目標(biāo),DeepMind 還在研發(fā)名為 “Genie 3” 的 “世界模型”,這種模型能夠生成可互動的可探索視頻空間,讓用戶沉浸于虛擬世界中。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們