當(dāng)全球AI競(jìng)賽仍聚焦于語(yǔ)言模型的參數(shù)與上下文長(zhǎng)度時(shí),人工智能先驅(qū)李飛飛(Fei-Fei Li)發(fā)出振聾發(fā)聵的警示:真正的智能,從來(lái)不只是“會(huì)說(shuō)話”——而是理解并駕馭物理世界的能力,即“空間智能”(Spatial Intelligence)。在最新博客中,她明確指出:若AI無(wú)法掌握空間推理、物體關(guān)系與動(dòng)態(tài)預(yù)測(cè),所謂的“通用人工智能”終將是空中樓閣。
空間智能:人類(lèi)智能的原始引擎
李飛飛強(qiáng)調(diào),空間智能是人類(lèi)認(rèn)知的基石,遠(yuǎn)早于語(yǔ)言出現(xiàn)。從嬰兒伸手抓握玩具,到科學(xué)家通過(guò)X射線衍射圖推演出DNA雙螺旋結(jié)構(gòu);從古希臘人用影子測(cè)算地球周長(zhǎng),到工程師設(shè)計(jì)自動(dòng)駕駛路徑——這些突破無(wú)不依賴(lài)對(duì)空間、形狀、運(yùn)動(dòng)與因果關(guān)系的深刻理解。而當(dāng)前主流大模型雖能流暢生成文本,卻對(duì)“杯子放在桌子邊緣是否會(huì)掉落”這類(lèi)基礎(chǔ)物理常識(shí)頻頻出錯(cuò)。
超越“下一個(gè)詞預(yù)測(cè)”:構(gòu)建AI的“世界模型”
要突破這一瓶頸,李飛飛提出必須構(gòu)建新一代世界模型(World Model)——一種能對(duì)物理環(huán)境進(jìn)行生成、交互與狀態(tài)預(yù)測(cè)的多模態(tài)系統(tǒng)。該模型需具備三大核心能力:
感知三維甚至四維(含時(shí)間),而非僅處理二維圖像;
理解動(dòng)作與結(jié)果的因果鏈,例如“推倒積木塔”后的連鎖反應(yīng);
通過(guò)主動(dòng)交互學(xué)習(xí),而非被動(dòng)接受標(biāo)注數(shù)據(jù)。
實(shí)現(xiàn)這一目標(biāo)面臨三大挑戰(zhàn):新型訓(xùn)練范式(替代“下一個(gè)詞預(yù)測(cè)”)、從海量視頻中提取深層空間結(jié)構(gòu)、以及支持3D/4D推理的新神經(jīng)架構(gòu)。目前,李飛飛團(tuán)隊(duì)正全力攻關(guān),試圖將計(jì)算機(jī)視覺(jué)、具身智能與生成式AI深度融合。
三階段落地:從創(chuàng)意到科學(xué),重塑人類(lèi)生產(chǎn)力
李飛飛描繪了空間智能的演進(jìn)路徑:
近期:賦能電影、游戲與虛擬敘事,實(shí)現(xiàn)更真實(shí)的動(dòng)態(tài)場(chǎng)景生成;
中期:讓服務(wù)機(jī)器人真正理解家庭環(huán)境,安全遞送物品、協(xié)助老人;
長(zhǎng)期:推動(dòng)科學(xué)發(fā)現(xiàn)(如分子折疊模擬)、精準(zhǔn)醫(yī)療(手術(shù)路徑規(guī)劃)與沉浸式教育。
AI的使命是增強(qiáng)人類(lèi),而非取代
在技術(shù)狂熱中,李飛飛不忘重申其一貫立場(chǎng):“AI的終極目標(biāo)不是替代人類(lèi),而是擴(kuò)展人類(lèi)的能力邊界。”她呼吁學(xué)界、產(chǎn)業(yè)界共建開(kāi)放、負(fù)責(zé)任的空間智能生態(tài),確保技術(shù)紅利普惠全人類(lèi)。
AIbase認(rèn)為,李飛飛的宣言不僅是技術(shù)路線的轉(zhuǎn)向,更是對(duì)AI發(fā)展哲學(xué)的校準(zhǔn)。當(dāng)行業(yè)從“語(yǔ)言幻覺(jué)”回歸“物理現(xiàn)實(shí)”,AI才真正有望走出聊天窗口,走進(jìn)工廠、實(shí)驗(yàn)室與千家萬(wàn)戶(hù)。這場(chǎng)空間智能革命,或許正是通往真正智能機(jī)器的唯一通路。


產(chǎn)品與服務(wù)
聯(lián)系站長(zhǎng)
關(guān)于我們