谷歌DeepMind的機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)聲稱,他們已經(jīng)證明人工智能可以通過類似于人類和其他動(dòng)物的社會(huì)學(xué)習(xí)過程來獲取技能。
社會(huì)學(xué)習(xí)——即一個(gè)個(gè)體通過模仿另一個(gè)個(gè)體來獲取技能和知識(shí)——對(duì)于人類以及大部分動(dòng)物界的發(fā)展過程至關(guān)重要。DeepMind 團(tuán)隊(duì)聲稱他們是首個(gè)在人工智能中展示此過程的團(tuán)隊(duì)。
該團(tuán)隊(duì)由谷歌 DeepMind 的首席研究工程師 Edward Hughes 帶領(lǐng),旨在解決 AI 智能體獲取新技能的一些限制。從人類數(shù)據(jù)中教授它們新能力,依賴于從大量第一人稱人類示范中進(jìn)行監(jiān)督學(xué)習(xí),這可能會(huì)耗費(fèi)大量實(shí)驗(yàn)室時(shí)間和資金。
受人類學(xué)習(xí)的啟發(fā),研究人員試圖展示 AI 智能體如何能夠以類似于人類的效率從其他個(gè)體那里學(xué)習(xí)。在一個(gè)名為 GoalCycle3D 的物理仿真任務(wù)空間(類似于帶有人行道和障礙物的計(jì)算機(jī)動(dòng)畫游樂場(chǎng))中,他們發(fā)現(xiàn) AI 智能體可以從人類和 AI 專家那里學(xué)習(xí)許多導(dǎo)航問題,盡管它們從未見過人類,或者我們認(rèn)為,它們對(duì)人類一無所知。
本周發(fā)表在同行評(píng)審的開放獲取期刊《自然》上的一篇論文稱,該團(tuán)隊(duì)能夠使用強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)能夠識(shí)別新專家、模仿其行為,并在幾分鐘內(nèi)記住所獲得知識(shí)的智能體。
研究表示:「我們的智能體在沒有使用任何預(yù)先收集的人類數(shù)據(jù)的情況下,成功地實(shí)時(shí)模仿了一個(gè)在新環(huán)境中的人類。我們確定了一組出人意料的簡(jiǎn)單成分,足以生成文化傳播,并為其進(jìn)行了嚴(yán)格評(píng)估的評(píng)估方法。這為文化進(jìn)化在人工通用智能發(fā)展中發(fā)揮算法角色鋪平了道路。」
研究人員期待 AI 領(lǐng)域的其他人更廣泛地應(yīng)用這些發(fā)現(xiàn),展示如何在 AI 中發(fā)展文化進(jìn)化——即在一個(gè)社區(qū)中跨越多個(gè)世代的技能發(fā)展。
論文說:「將所有這些組件結(jié)合起來,驗(yàn)證或反駁這樣一個(gè)假設(shè)將是非常有趣的,即在一個(gè)智能體群體中的文化進(jìn)化可能導(dǎo)致解決越來越廣泛的人類相關(guān)的現(xiàn)實(shí)世界問題的行為積累。」
「人們可能考慮一系列實(shí)驗(yàn),調(diào)查了人類和 AI 在實(shí)驗(yàn)環(huán)境中的幾代文化積累,比較不同群體之間的差異或分析將人類和 AI 參與者混合在一個(gè)群體中的效果。我們期待未來 AI 領(lǐng)域與文化進(jìn)化心理學(xué)領(lǐng)域之間的富有成果的跨學(xué)科互動(dòng),」研究人員表示。


產(chǎn)品與服務(wù)
聯(lián)系站長(zhǎng)
關(guān)于我們